Skip to content

IoT OT Security News

  • Tracking
  • In The Era
  • CISA KEV
  • Security by Design
  • Statistics
  • About
IoT OT Security News

Google が公表した RETVec:Gmail からスパムや敵対行為を取り除くベクタラーザーとは?

Google Unveils RETVec – Gmail’s New Defense Against Spam and Malicious Emails

2023/11/30 TheHackerNews — Google が公開したのは、RETVec (Resilient and Efficient Text Vectorizer の略) と呼ばれる新たな多言語テキスト・ベクタライザーである。それにより、Gmail 内のスパムや悪意のメールなどの、有害と推定されるコンテンツの検出が推進される。GitHub 上のプロジェクト説明には、RETVec は、挿入/削除/タイプミス/ホモグリフ/ LEET 置換などなどの、文字レベルでの悪意の操作に対して、回復力を持つように訓練されている。RETVec モデルは、すべての UTF-8 文字と単語を効率的に変換するための、新たな文字エンコーダー上で学習される」と記されている。

Gmail や YouTube のような巨大なプラットフォームが、テキスト分類モデルに依存することで、フィッシング攻撃/不適切なコメント/詐欺などを発見しようとする一方で、それらの防御策を回避する脅威アクターたちは、常に対抗策を考案し続けている。

脅威アクターたちは、同形異義語の悪用から、キーワードの詰め込み、見えない文字の使用などにいたるまでの、敵対的なテキスト操作を用いることが観察されている。

RETVec は、直ちに 100以上の言語で動作するものである。そして、サーバ・サイドおよびデバイス上で、より堅牢で効率的であると同時に、より弾力的で効率的なキスト分類を支援することを目的としている。

ベクトル化という手法は、自然言語処理 (NLP) において、感情分析/テキスト分類/名前付きエンティティ認識などの分析を行うために、語彙から単語やフレーズを対応する数値表現にマッピングするものである。

Google RETVec

Google の Elie Bursztein と Marina Zhang は、「RETVec は、その新しいアーキテクチャにより、テキストの前処理を必要とせずに、すべての言語と、すべての UTF-8 文字を、瞬時に処理する。デバイスや Web での、大規模なテキスト分類の導入において最適な候補となる」と述べている。

Google は、ベクタライザーを Gmail に統合することで、スパム検出率がベース・ラインと比べて 38% も向上し、誤検出率が 19.4% も減少したと述べている。また、この種のモデルにおける Tensor Processing Unit (TPU) 使用量を 83% も削減したという。

Bursztein と Zhang は「RETVec で訓練されたモデルは、そのコンパクトな表現により、より高速で推論している。モデルが小さくなることで、計算コストが削減され、レイテンシが減少する。それは、大規模なアプリケーションやオンデバイス・モデルにとって極めて重要なことである」と付け加えている。

不要なメールをバシバシと切り捨ててくれる Gmail ですが、悪意のメールに対してもチェックを強化してくれるということで、嬉しい限りです。また、UTF-8 についても言及されていますが、訳していて思い出したのは、2023/03/23 の「Python の Unicode を悪用:新たな情報スティーラーは巧妙に検出を回避する」での解説です。そして、Unicode と UTF-8 の違いが気になり、調べてみたら Qiita に素晴らしいマトメがありました。

Share this:

  • Tweet
Like Loading...
Unknown's avatarAuthor AiototsecPosted on November 30, 2023December 7, 2023Categories CyberAttack, Malware, Resilience, TTP, Zero Trust, _AI/MLTags AI/ML, Cyber Attack, eMail, Gmail, Google, NLP, Resilient and Efficient Text Vectorizer, RETVec, Spam Email, Tensor Processing Unit, TPU

Post navigation

Previous Previous post: CISA の Secure-by-Design 第一弾:安全な Web 管理インターフェイスのために
Next Next post: RedLine マルウェアと ScrubCrypt 難読化ツール:脅威アクターたちの最新テクニックを解析

Categories Dropdown

  • Twitter
  • Facebook
November 2023
M T W T F S S
 12345
6789101112
13141516171819
20212223242526
27282930  
« Oct   Dec »

Top Posts & Pages

  • Chrome/Edge のエクステンションを悪用:430万人を感染させた ShadyPanda のキャンペーンとは?
  • Microsoft Office ログイン時の Something Went Wrong:改善の第一弾とは?
  • CodeRabbit 本番環境サーバにおける RCE 脆弱性:100 万件以上のリポジトリに影響が生じた可能性
  • 70種類のペンテスト・ツールを統合:NETREAPER が提供するシンプルなメニュー・ベースの環境とは?
  • Apache Tika Core の脆弱性 CVE-2025-66516 が FIX:悪意の PDF を介した情報漏洩
  • Microsoft 2025-12 月例アップデート:3件のゼロデイを含む 57件の脆弱性に対応
  • LockBit 5.0 のインフラが漏洩:判明した IP アドレスとドメインのブロックが必須
  • React2Shell の悪用試行の拡大を観測:中国に支援される脅威アクターによる攻撃キャンペーン
  • CISA KEV 警告 25/12/09:D-Link ルータの脆弱性 CVE-2022-37055 を登録
  • NVIDIA DGX Spark の 14件の脆弱性が FIX:任意のコード実行や DoS 攻撃の可能性

Categories

API APT Asia AuthN AuthZ BruteForce BugBounty CyberAttack DarkWeb DataBreach DataLeak DDoS DoubleExtortion Exploit Literacy LOLbin MageCartAttack Malware MCP MisConfiguration NHI Outage ParadigmShift Privacy Protection RaaS Ransomware RAT Repository Research Resilience Scammer SecTools SocialEngineering SupplyChain TTP Uncategorized Vulnerability WateringHoleAttack Zero Trust _AI/ML _CDN _Cloud _Container _CryptCcurrency _Defence _Education _Finance _Government _HealthCare _Human _ICS _IDS/IPS _Industry _Infrastructure _Mobile _OpenSource _PLC _Regulation _Retail _RTOS _Space _Statistics _Storage _Telecom _Transportation

Archives

  • December 2025 (46)
  • November 2025 (156)
  • October 2025 (177)
  • September 2025 (172)
  • August 2025 (165)
  • July 2025 (176)
  • June 2025 (192)
  • May 2025 (216)
  • April 2025 (192)
  • March 2025 (208)
  • February 2025 (181)
  • January 2025 (185)
  • December 2024 (172)
  • November 2024 (166)
  • October 2024 (184)
  • September 2024 (171)
  • August 2024 (183)
  • July 2024 (188)
  • June 2024 (156)
  • May 2024 (156)
  • April 2024 (155)
  • March 2024 (151)
  • February 2024 (131)
  • January 2024 (132)
  • December 2023 (116)
  • November 2023 (131)
  • October 2023 (124)
  • September 2023 (101)
  • August 2023 (111)
  • July 2023 (110)
  • June 2023 (113)
  • May 2023 (129)
  • April 2023 (127)
  • March 2023 (129)
  • February 2023 (118)
  • January 2023 (138)
  • December 2022 (106)
  • November 2022 (114)
  • October 2022 (120)
  • September 2022 (118)
  • August 2022 (133)
  • July 2022 (97)
  • June 2022 (117)
  • May 2022 (94)
  • April 2022 (112)
  • March 2022 (132)
  • February 2022 (105)
  • January 2022 (128)
  • December 2021 (111)
  • November 2021 (100)
  • October 2021 (110)
  • September 2021 (131)
  • August 2021 (105)
  • July 2021 (105)
  • June 2021 (103)
  • May 2021 (72)
  • April 2021 (58)

Categories

  • API (238)
  • APT (523)
  • Asia (398)
  • AuthN AuthZ (789)
  • BruteForce (66)
  • BugBounty (73)
  • CyberAttack (3,201)
  • DarkWeb (228)
  • DataBreach (550)
  • DataLeak (194)
  • DDoS (164)
  • DoubleExtortion (15)
  • Exploit (1,361)
  • Literacy (2,281)
  • LOLbin (57)
  • MageCartAttack (14)
  • Malware (1,421)
  • MCP (16)
  • MisConfiguration (57)
  • NHI (8)
  • Outage (106)
  • ParadigmShift (181)
  • Privacy (240)
  • Protection (649)
  • RaaS (121)
  • Ransomware (721)
  • RAT (777)
  • Repository (325)
  • Research (1,210)
  • Resilience (133)
  • Scammer (614)
  • SecTools (210)
  • SocialEngineering (47)
  • SupplyChain (404)
  • TTP (1,001)
  • Uncategorized (11)
  • Vulnerability (4,503)
  • WateringHoleAttack (4)
  • Zero Trust (382)
  • _AI/ML (306)
  • _CDN (4)
  • _Cloud (364)
  • _Container (73)
  • _CryptCcurrency (40)
  • _Defence (162)
  • _Education (8)
  • _Finance (160)
  • _Government (1,037)
  • _HealthCare (47)
  • _Human (51)
  • _ICS (85)
  • _IDS/IPS (182)
  • _Industry (221)
  • _Infrastructure (129)
  • _Mobile (162)
  • _OpenSource (1,385)
  • _PLC (39)
  • _Regulation (158)
  • _Retail (76)
  • _RTOS (6)
  • _Space (26)
  • _Statistics (415)
  • _Storage (70)
  • _Telecom (77)
  • _Transportation (56)
  • Tracking
  • In The Era
  • CISA KEV
  • Security by Design
  • Statistics
  • About
IoT OT Security News Blog at WordPress.com.
  • Reblog
  • Subscribe Subscribed
    • IoT OT Security News
    • Join 170 other subscribers
    • Already have a WordPress.com account? Log in now.
    • IoT OT Security News
    • Subscribe Subscribed
    • Sign up
    • Log in
    • Copy shortlink
    • Report this content
    • View post in Reader
    • Manage subscriptions
    • Collapse this bar
 

Loading Comments...
 

You must be logged in to post a comment.

    %d