アップルは火曜日、深度マップ情報を活用してデジタルビデオフィード内の人間の顔を検出する特許を取得した。この技術は、今年のiPhoneでデビューすると噂されている顔ベースの生体認識システムの基礎となる可能性がある。
米国特許商標庁により付与された Apple の米国特許番号 9,589,177「深度情報を使用した強化された顔検出」は、特殊なハードウェアおよびソフトウェア システムを物体認識タスク、特に人間の顔が関係するタスクに適用するコンピューター ビジョン テクノロジの派生について説明しています。
この発明は、Appleが2013年にイスラエルのモーションキャプチャー専門企業PrimeSenseを買収した際に獲得した特許の一部です。PrimeSenseの知的財産は、3Dマッピング、3Dバーチャルキーボードなど、その後も米国特許商標庁(USPTO)に着実に提出されてきました。
本日公開された文書に記載されているように、顔検出アルゴリズムは、デジタル画像をスキャンし、その一部、つまり「ウィンドウ」に顔が含まれているかどうかを推定できるソフトウェアと定義できます。動的なシーン、あるいは場合によってはライブビデオに適用すると、顔は異なる場所や異なる奥行きに現れる可能性があるため、処理はますます複雑になります。
従来のシステムでは、特定のシーンを適切に監視するために、異なるサイズの複数の候補ウィンドウを同時にサンプリングします。複数のウィンドウを処理する必要があるため、より多くの計算能力が必要になるだけでなく、誤検出率も増加する可能性があります。
処理オーバーヘッドと誤認識の可能性を削減するため、Appleは既存の顔検出アルゴリズムに深度情報を適用することを提案しています。いくつかの実施形態で概説されているように、深度マップを使用することで、「標準的な」顔のサイズに基づいて、深度座標に応じてウィンドウサイズをインテリジェントに調整できます。
特許文言によれば、特殊な赤外線発光システムが、被写体に光放射のパターンを投影します。パターン化された光は捕捉され、処理され、対応する深度マップに変換されます。
本日の特許で言及されている深度マッピング システムは、PrimeSense が開発した赤外線モーション トラッキング テクノロジに基づいており、その類似バージョンは、Microsoft のオリジナルの Xbox Kinect センサーなどのハードウェアですでに使用されています。
デバイスから見ると、人間の顔は、搭載カメラの対物レンズに対する相対的な位置に応じて大きくなったり小さくなったりします。例えば、通常サイズの顔を捉えるには、デバイスから2フィート離れた場所にあるサンプルウィンドウは、5フィート離れた場所にあると判断されるウィンドウよりもはるかに大きくする必要があります。
各ウィンドウの位置の深さはわかっているため、処理する必要があるテスト サンプルは 1 つだけとなり、計算負荷が軽減されます。
本日付与された特許は、人間の顔を検出するための一般的な解決策を提示していますが、より詳細な識別のための条件が欠けています。言い換えれば、詳細な発明では、人間の顔がフレーム内に収まっているかどうかを判断できますが、その顔が誰のものであるかを特定することはできません。しかしながら、顔検出は生体認識技術における不可欠な第一歩であり、より複雑な画像処理へのきっかけとなることがよくあります。
Appleがこの発明を将来の製品に搭載する予定があるかどうかは不明ですが、同様のソリューションが今年後半にiPhoneに登場する可能性があります。KGI証券のアナリスト、ミンチー・クオ氏の最新の予測によると、Appleは今年のOLED iPhoneモデルに「革新的な」前面3Dカメラシステムを搭載すると噂されています。通常のFaceTimeカメラに加えて赤外線送受信モジュールを統合することで、生体認証からゲームまで、様々なタスクを実行できると言われています。
Appleの顔検出特許は2015年3月に初めて申請され、発明者はYael Shor、Tomer Yanir、Yaniv Shakedの3名とされている。