マイキー・キャンベル
· 1分で読めます
'383特許の運用手順を示すフローチャート。| 出典: USPTO
アップルは火曜日、音声コマンドをコンテキスト情報とともに外部のコンピュータに転送して処理する技術の特許を取得した。この技術は、同社の仮想アシスタント「Siri」の動作を可能にする主要機能の1つである。
米国特許第8,296,383号の「音声コマンドおよびコンテキストデータ処理機能を備えた電子デバイス」には具体的には記載されていないが、この発明はSiriの動作と密接に関連しており、少なくとも部分的には音声認識アシスタントに力を与えている可能性がある。
この特許は、Appleが2010年にSiriを買収するずっと前の2008年に最初に出願されたもので、iPhoneのような携帯型電子機器が音声コマンドとそれに対応するコンテキスト情報を記録する方法とシステムについて記述されています。iPhoneはデータを外部サーバーに送信して処理し、サーバーは音声コマンドに応答するか、デバイスがコマンドを実行できるように情報を端末に送り返します。
当時、AppleのiDevice製品の一部は、音楽の再生、時刻の確認、あるいはiPhoneの場合は連絡先への通話に音声コマンドを使用していました。このシステムは便利ではありましたが、高度なユーザーコマンドに対応するには処理能力とストレージ容量の要件が大きかったため、一部の操作しか実行できませんでした。
高速データネットワークの出現により、Apple の特許により、より高度なコマンドをデバイスからオフロードし、ほぼリアルタイムでリモートで実行できるようになりました。
本発明の鍵となるのは、デバイスの動作状態に関するメタデータと呼ばれるコンテキスト情報です。例えば、ユーザーは「これと似た曲をもっと探して」と発声することで、現在端末で再生中の曲に似た曲をもっと探す操作を実行できます。また、位置情報データも活用でき、「近くのアメリカンレストランを探して」といった類似のコマンドを実行することができます。
'383特許の技術がSiriの基盤として利用されているかどうかは不明ですが、このバーチャルアシスタントはSiriとほぼ同じように動作することが知られています。Appleは最近、会話入力の認識機能を含むSiriの基盤となる機能に関する特許を出願しました。