新しい特許によると、Apple は、ユーザーがダンスをしたり、手を振ったり、ジェスチャーをしたり、あるいは単に部屋に出入りしたりすることで、HomePod のようなスマート デバイスに思い通りに動作させようとしているようです。
AppleのHomePodはすでに、設置時に部屋の音響に合わせて自動調整する。しかしAppleは今後、スキャンと部屋の認識をさらに正確に、そして常時オンにしたいと考えているようだ。
新たに取得された「ユーザーの存在と活動に応答するマルチメディアコンピューティングまたはエンターテインメントシステム」という特許によると、Appleは室内のユーザーの活動も監視しているという。そして、ユーザーが声をかけなくても、デバイスがユーザーの望む動作を実行できるようにしているのだ。
Appleの特許には、最後の人が部屋を出るといった基本的な例が含まれています。このような状況では、デバイスは部屋に誰もいないことを検知し、音楽の再生を停止することができます。
あるいは、例えば、片方の端にキッチンがあるような広い部屋であれば、そこにある HomePod が他のデバイスで再生されている音楽を拾うこともできるかもしれない。
「このインテリジェントシステムは、システム周囲のシーンの深度画像を取得します」とAppleは述べている。「深度画像からシーンの形状を抽出し、シーンの要素を監視することも可能になります。」
「(その後)シーン内のユーザーアクティビティを監視・分析して、システムに関するユーザーの願望や意図を推測します」と特許は続ける。
HomePodが周囲の音を感知して音響を変えるのと同じように、将来のデバイスは部屋の雰囲気をマップするかもしれない。
Appleによると、「インテリジェントシステム」はユーザーの「手振りで表現された」要望を認識できるようになるという。例えば、HomePodに向かって手を振るだけで、音量を変えるように指示できるかもしれない。
そのためには、「そのようなジェスチャーの動きは、例えば光学式または非光学式の深度センサーから得られるリアルタイムの深度情報に基づいて解釈できる」ことが必要だと Apple は述べている。
「システムがユーザーとユーザーを取り巻く物理的環境を理解している場合、システムは文字通りに表現されるか暗黙的に表現されるかに関係なく、ユーザーの要望をより正確に近似し、満たすことができます」と特許は続けている。
例えば、手を振るだけで音量を変えたり、軍隊式の拳を突き上げるジェスチャーで音楽を消したりといったことが可能です。聴衆にプレゼンテーションを行うようなプロフェッショナルな場面では、プレゼンターが「一貫性がなく不正確な」リモコンに頼ることなく、手を振るだけで次のスライドに進むことができるとAppleは示唆しています。
ジェスチャー認識以上のもの
しかし、Apple は、システムが設定されたコマンドに従うことだけに興味があるのではなく、特に要求されていない場合でも正しい結果を生成できるように、システムが知っていることすべてを活用することを望んでいます。
「例えば、ユーザーが高齢であると検知され、そのユーザーが明示的に音量を上げるよう要求した場合、システムは、ユーザーがシステム出力において音声ダイアログをより明確に区別する必要があると判断する可能性があります」とアップルは述べている。
手のジェスチャーを識別する方法を示した特許の詳細。
「したがって、システムは平均音量を上げるのではなく、システム出力の相対的なスペクトル分布を変更する(音声を相対的に増幅する)」と続けます。
この特許は、ジェスチャー、動き、または存在をどのように検出し解釈するかに主眼を置いており、デバイスがその情報をどのように活用するかについては必ずしも言及していません。そのため、Appleは明言していませんが、このようなシステムは、人が踊っていることを検知し、適切な音楽を提供するといったことが考えられます。
この特許は現在Appleに付与されていますが、同社は毎年数百件の特許を申請しています。付与されるかどうかに関わらず、特定の技術が製品化されるという保証はありません。