アップル、ライブビデオ会議でセンシティブな画像を自動的にぼかす技術を開発中

アップル、ライブビデオ会議でセンシティブな画像を自動的にぼかす技術を開発中

Appleは、ビデオフレーム内の機密またはセンシティブな要素を識別し、自動的にぼかしたり静止画像に置き換えたりしてプライバシーを保護する技術を研究している。

新型コロナウイルスによるロックダウン以降、ビデオ会議の利用が劇的に増加し、私たちは皆、機密保持の問題を意識するようになりました。実際にビデオ会議を経験したことがある人も、話を聞いたことがある人も、Zoom会議がうまくいかなかった事例は誰もが知っています。そしてAppleは、その問題を解決したいと考えています。

同僚たちがオフィスで本に集中しているだけのことであろうと、裸の同僚が後ろを歩いていたことでスペイン人ジャーナリストとその妻の情事が世界に暴露されたことであろうと、それはたいてい背景に関係している。

「ピクセル単位のフィルター」は、Zoom や Skype でユーザーが使用できるぼかしや置き換えの背景の特定の動的バージョンのようなものです。

特許出願によれば、ビデオ会議は非常に便利であり、「音声データを送受信するだけよりも優れたユーザーエクスペリエンスを提供する」という。

「しかし、一部のユーザーは、特定の情報(例えば、望ましくない情報)を送信するリスクを回避するために、ビデオを送信しないことを選択します」と報告書は続けている。「例えば、機密情報のある地域にいるユーザーは、機密情報の漏洩リスクを軽減するために、ビデオ通話中にビデオを送信しないことを選択することが多い。」

また、この問題により「一部のユーザーは動画の受信を控える」という問題も発生しています。また、「一部の企業は、機密情報漏洩のリスクを軽減するため、従業員による動画の送受信を禁止している」という問題もあります。

Appleの提案では、ビデオストリーム技術は各フレームの異なる要素を識別することになる。ZoomやSkypeは現在、話している人物と背景を区別できるが、この技術では話者の周囲の個々の要素をよりインテリジェントに特定できるようになる。

「[この]方法は、画像データフレームを取得することを含みます」と続きます。「[これは]複数のピクセルのそれぞれについて、それぞれのピクセル特性ベクトルを生成することを意味します。」言い換えれば、システムはオブジェクトを表すピクセルを効果的に接続してラベル付けし、その後、そのグループ化を処理できます。

特許から削除されたオブジェクトの詳細

特許から削除されたオブジェクトの詳細

オブジェクトまたはオブジェクトの一部を識別できることを前提として、「この方法は、最初の修正された画像データフレームを合成することを含む」。グループ化されたオブジェクトごとに異なるピクセルを作成するが、これはユーザーが望むものなら何でも構わない。

「(この)オブジェクトの表現を難読化する処理には、オブジェクトに対応するピクセルをぼかす処理が含まれます」とAppleは続ける。「オブジェクトの表現を難読化する処理には、ピクセルの値を特定の色(例えば、黒、白など)に設定する処理も含まれます。(あるいは)オブジェクトの表現を別のオブジェクトの表現に置き換える処理も含まれます。」

例えば、Appleのシステムは、あるオブジェクトを、同じ元のピクセルのぼかしバージョンに置き換えることができます。また、オブジェクト全体を黒、白、あるいは他の色に変えることで、画像の一部を加工することも可能です。

あるいは、発言者やその所属する会社が決定した別のものに、事実上、オブジェクトを置き換えることも可能です。「例えば、企業が管理する表示ポリシーでは、表示される情報を会社のロゴに置き換えることが規定されています。」

このアプリケーションの発明者はジャック・グリースリー氏で、同氏は以前、別の会社と共同で、画像のビットマップ上の照明効果を操作する特許を取得していた。