Apple、iPhoneのハンズフリー音声コントロールとオーディオフィードバックの高度化を検討

Apple、iPhoneのハンズフリー音声コントロールとオーディオフィードバックの高度化を検討

アップルは、iPhoneなどのモバイル機器向けに堅牢なハンズフリーソフトウェアを開発することに引き続き関心を示しており、新たな申請書類には、同社がどのようにしてそうしたシステムを現在のオプションよりも応答性と効率性を高められるかが詳述されている。

詳細は、米国特許商標庁が今週公開した数件の特許出願から明らかになった。AppleInsiderが木曜日に発見したこれらの特許出願は、Appleが噂する音声制御システム(今年後半にiOS 5に搭載される予定の秘密の未発表機能かもしれない)の仕組みを垣間見せてくれる。

最初の申請「適応型音声フィードバックシステムおよび方法」では、現在の音声フィードバックシステムは、特に大量の情報を含む可能性のある項目を扱う際に非効率的であると指摘されています。ユーザーに音声で大量の情報を提示すると、圧倒され、ネガティブな体験につながる可能性があります。

さらに、ユーザーインターフェースを音声プロンプトに頼ると、特定の情報が適切に伝わらない可能性があります。例えば、音声フィードバックでは、重要度の高いプロンプトとそれほど重要でないプロンプトを適切に区別できない場合があります。

Appleのソリューションは、音声フィードバックシステムの冗長性、つまり「冗長さ」を削減し、より効率的でユーザーのストレスを軽減することを目指しています。一つの方法としては、ユーザーに音声で提示される楽曲のセレクションなどのデータリストに、アーティスト名やアルバム名などの繰り返し情報が含まれているかどうかをシステムが認識するというものです。

このようなシステムは、ユーザーが特定の情報をどのような状況においても既に提示されていることをインテリジェントに認識し、それを再度聞く必要性をなくします。これは、メニューナビゲーション、アラート、プロンプトなど、「ステップダウン」と呼ばれる手法で適用できます。

「ユーザー インターフェース イベントの次の発生が、前のユーザー インターフェース イベントの発生と比較的近い間隔で発生した場合、オーディオ ユーザー インターフェースは、反復的で非常に冗長な情報でユーザーを圧倒することを回避するため、オーディオ フィードバックを分散させる場合があります (たとえば、冗長性を減らすことによって)」とアプリケーションには記載されています。

提供されている具体的な例では、「Geniusは利用できません」という音声プロンプトが、より短く、より効果的な「Geniusは利用できません」に置き換えられています。これは、否定的なトーンやビープ音などの音声キューの形で、さらに効果的なものにすることができます。

このようなシステムは逆方向にも機能する可能性があります。iPhoneは、ユーザーの好みに基づいて項目の冗長性を「強化」し、より重要な情報や警告をユーザーに伝えるといったことも可能です。

このダイナミックシステムにより、特にiPhoneで既に使い慣れた操作を行っている場合、ユーザーは同じ音声プロンプトを繰り返し聞く必要がなくなります。プロンプトが短くなることで、ユーザーの煩わしさが軽減されるだけでなく、ハンズフリー操作の高速化にもつながります。

Appleは今週公開された2つ目の特許出願で、ハンズフリーシステムの音声制御機能にも言及しました。「音声入力の処理」と題されたこの特許は、音声制御システムの使用時にしばしば生じるユーザーの不満に対処することを目的としています。

申請書には、システムがユーザーの音声コマンドを処理・解釈するのに時間がかかりすぎる場合があると記載されています。この遅延はシステムの効率を低下させるだけでなく、ユーザーに他の不満をもたらす可能性があります。例えば、タイミングの問題により、システムとユーザーが互いに話し合ってしまう可能性があります。

「音声入力全体を受信し、処理し、音声入力の内容を判断するには時間がかかるため、ユーザーが最初のプロンプトに応答して入力した特定の音声入力は、最初のプロンプトが終了し、2番目のプロンプトが提示されている間に処理・理解される可能性があります」と申請書には記載されています。「その結果、デバイスは受信した音声入力にどのプロンプトを関連付けるかを判断するのが困難になる可能性があります。」

Appleのソリューションでは、システムプロンプトに動的なタイムスタンプまたは時間範囲が関連付けられ、ユーザーの音声入力に適したウィンドウが提供されます。システムによって表示されるプロンプトには、タイムスタンプまたは時間範囲を任意の組み合わせで設定できます。

「タイムスタンプまたは時間範囲は、プロンプトの終了後に処理される音声入力が以前のプロンプトに関連付けられるように定義できます」とアプリケーションは述べています。

これらの入力ウィンドウは、様々な要因に基づいて動的に増減できます。例えば、システムは、ユーザーのシステム使用履歴や個々の音声特性に基づいて、プロンプトへの応答時間を増減させることができます。

プロンプトの種類も、システムの入力ウィンドウに影響を与える可能性があります。例えば、ユーザーが入力したり処理したりするのに時間がかかるようなプロンプトの場合、入力時間の範囲が自動的に拡張されることがあります。

両出願はAppleによって2010年1月に出願されました。音声フィードバックに関する提案発明は、Benjamin Andrew Rottler、Aram Lindahl、Allen Paul Haughay Jr.、Shawn A. Ellis、Policarpo Woodの功績とされています。WoodとLindahlは音声入力アプリケーションについても功績とされています。

特許2

ウォール・ストリート・ジャーナルニューヨーク・タイムズは今年初め、AppleがiPhoneやiPadの基盤となるモバイルOS「iOS」の次期メジャーアップデートで音声ナビゲーションの改良に取り組んでいると報じました。また、その後の報道では、音声コマンドがiOS 5に「深く統合」されると主張しました。

Appleが音声コマンドに大きく依存するiPhoneパーソナルアシスタントアプリ「Siri」を買収したことで、Appleが期待していた音声コマンドの刷新の土台が築かれました。Siriを使えば、ユーザーは「今週末、この辺りで何が起こっているの?」といった完全な文章でiPhoneにタスクを指示できます。

先月、噂されていた音声機能はAppleの年次開発者会議(WWDC)ではまだ発表されていないと報じられました。しかし、この機能は今秋発表される可能性があり、期待されている第5世代iPhoneに搭載されるのではないかとの憶測が飛び交っています。