マイキー・キャンベル
· 2分で読めます
出典: USPTO
アップルは木曜日、米国特許商標庁に提出した特許の中で、画像の被写体の特徴を分析し、そのデータを使って「顔認証」を作成し、それを他の写真と照合して人物の身元を判定できるシステムの概要を明らかにした。
不思議なことに、Apple の「注目すべきオブジェクトの自動認識」に関する特許出願の特許用語のほとんどは、ユーザーの友人や家族ではなく、「有名人や象徴的な画像」に焦点を当てています。
本発明は、デジタル画像管理アプリケーションを用いて、特定の写真に写っている被写体を分析し、顔認識を用いて特定の特徴を特定することで、その人物の「顔紋」を作成することを要求している。出願書類には、顔紋は「物体認識に使用可能な特徴ベクトルのサブセット」であり、したがって構造物などの顔以外の物体にも使用できると記載されている。
申請の背景から:
デジタル画像で検出された人物の顔を自動的に認識するために、顔検出/認識ソフトウェアは、人物の顔の特徴を示す特徴セットまたは特徴ベクトル(「顔紋」と呼ばれる)を生成します。生成された顔紋は他の顔紋と比較され、生成された顔紋が他の顔紋の1つ以上と一致するか(または十分に類似しているか)が判断されます。一致する場合、顔検出/認識ソフトウェアは、生成された顔紋に対応する人物が、「一致した」顔紋に対応する人物と同一人物である可能性が高いと判断します。
写真が分析された後、管理アプリケーションは、その顔画像をローカルまたはリモートに保存されている他の生成された顔画像と比較します。一致が見つかった場合、ソフトウェアはその人物をトム・ハンクスなどのIDでタグ付けします。この段階では、顔画像に信頼性スコアを割り当てる顔認識技術が活用されており、これによりより正確な照合が可能になります。スコアが一定の閾値を下回った場合、システムはその一致を拒否します。
このフェーズでは、緑のチェックボタンまたは赤の「X」ボタンを押して、添付されたメタデータを強化するためにユーザーからのフィードバックも含めることができます。
データベースに関しては、この特許により、iPhoneのようなデバイスが顔認証情報をローカルで作成・保存したり、オフサイトのキャッシュから取得したりすることが可能になります。このリモートで生成された顔認証情報はクラウド上で動作し、デバイスに送信したり、デバイスに同梱したりすることも可能です。顔認証の高速化のため、画像を前処理してメタデータをタグ付けすることも可能ですが、リモートシステムはクラウドに統合されているため、この手順はシステムの機能に必須ではありません。
メタデータを含むリモート顔認証データベースの図。
追加機能には、メタデータと信頼性スコアを用いて複数の顔写真をグループ化する機能が含まれます。特許では、数十年にわたって撮影されたポール・マッカートニーの写真が例として挙げられています。彼の顔は40年前とは大きく異なっていますが、画像プールに割り当てられた精査済みのメタデータは、伝説のアーティストの写真を解析し、10年ごとの回顧録を作成するのに役立ちます。
さらに、メタデータは、Facebook ページ、Twitter フィード、または音楽への iTunes Store リンクなど、主題に関する情報を提供するために使用できます。
本発明の正確な目的は不明だが、このソリューションは有名人や場所を超えて、ユーザーの写真ライブラリ内の被写体をインテリジェントに識別し、素早く簡単にタグ付けしたり、ファイルを管理したりするために使用できる可能性がある。