Google の進化する機械学習:Android の PCC 機能によりプライバシーを保護

Google: How Android’s Private Compute Core protects your data

2022/12/08 BleepingComputer — Google は、Android 上のPrivate Compute Core (PCC) 機能のフローと、保護されたデバイス上でローカルに処理される機密ユーザー・データの保持について、より詳細な技術情報を開示した。Android 12で導入されたPCC は、GPS/センサー/マイク/カメラ/スクリーンからのデータを保存/処理し、ユーザーに機械学習機能を提供する、オペレーティング・システム内の安全で分離された信頼できる環境である。


それらのインテリジェントな機能の例として挙げられるのは、マイクを使用して音声認識を行う Live Caption や、楽曲を認識する Now Playing、メッセージング・アプリで返事を提案する Smart Reply などである。

PCC の仕組み

この保護されたサンドボックスで処理される、環境/OS レベルのデータは、ASI システムを介して Android 端末のインテリジェント機能を有効にするために使用される。ただし、それらのデータは、アプリケーションやリモートサーバから手の届かないところに置かれるため、ユーザーのプライバシーは保護される。

PCC とアプリとの分離は、すべての PCC データの入出力に Android Framework API を使用することで達成され、OS のインストール時に付与される権限により、容易に実現される。

この許可の変更は、OS のアップデートのみに限定されるため、いかなるアプリやリモートサーバ接続であっても、その再変更は不可能である。

Android 端末に侵入したマルウェアに対するデータ保護について、PCC が与える影響について Google に問い合わせたところ、以下のコメントが得られた。

Google は、「PCC が機能することで、マルウェアによる OS の悪用は難しくなる。PCC はデバイスの機能に対して、必要以上に長くデータを保存しないなど、ベスト・プラクティスに従ったデータ処理を保証するため、本質的にマルウェアのリスクを低減する。ただし、PCC はユーザーのデータ・プライバシーに特化して設計され、マルウェアに対する追加のセキュリティ保護を担うものではない」と述べている。

このデータ・シーリングには、Google も対象として含まれる。すべてのユーザー・データ処理が、デバイス上の PCC 飛び地内でローカルに処理されるためである。もし ML 機能が、外部エンドポイントとの間で、それらのデータをやり取りする場合には、Google の Private Compute Services が暗号化されたやり取りを可能にする。

Functional diagram of PCC
Functional diagram of PCC (Google)

Private Compute Services (PCS) とは、PCC とクラウドの間にプライバシーを保護するリンクを提供する、サービスの集合体のことである。Google による透明性へのコミットメントの一環として、最近にオープンソース化された PCS だが、そのソースコードは GitHub リポジトリで公開されている。

Google によると、PCC の改善は使用状況に基づく学習と分析を活用するかたちで行われ、機械学習モデルのパフォーマンスはプライベート情報検索を用いて監視されるという。

Google はセンタライズされたデータ収集に依存せずに、統合的な分析学習により MLモデルを訓練し、ユーザーのデバイス上でデータ分析計算をローカルに実行できる。この PCC の機械学習機能は、Android OS のシステムの一部であるため、引き続きアップデート可能であり、独自に進化し続けることも可能だ。

とはいえ、PCC はユーザーのコントロールの外に存在するわけではない。たとえば、センサーのトグルを OFF にすると、PCC を含む OS 全体でのデータの生成/送信が停止される。

さらにユーザーは、Settings > Google > Personalize using shared data でアプリ・データをパーソナライズし、ML 機能をサポートするアプリのトグルを OFF に設定することで、PCC とのデータ共有を制限できる。

Android setting to disable ML features
Android setting to disable ML features

なお、PCC の動作や機能特性の詳細については、Google のエンジニアが Arxiv.org で技術論文を発表している。

機械学習でプライバシー保護と言っても、データを Google に送ってしまうのでは、プライバシーが担保されないと思ってしまいますが、「Google はセンタライズされたデータ収集に依存せずに、統合的な分析と学習により MLモデルを訓練し、ユーザーのデバイス上でデータ分析計算をローカルに実行できる」と文中に記されています。昨今のスマフォの計算能力の凄さに、驚くばかりです。ちなみに、自分の Pixel 3a で Personalize using shared data を開けてみたら、10個以上のアプリがリストに出てきました。 どれを ON/OFF すれば良いのやらという感じです。

%d bloggers like this: