HomePodは2月9日の発売と同時に、オーディオファンにとって理想的なスピーカーとなることが確実視されています。これは、Appleがこのデバイスのオーディオ処理に注力してきた多大な努力によるところが大きいでしょう。iZotopeのオーディオ専門家、マット・ハインズ氏が、Appleをはじめとするスマートスピーカーメーカーが、様々な環境で高品質なオーディオ体験を提供するために克服しなければならない技術的なハードルをいくつか解説します。
Appleや類似企業がHomePodのようなインテリジェントスピーカーを開発する際に直面する最初の課題は、ユーザーが部屋のどこにいても最適なオーディオ体験を提供することです。今週のAppleInsiderポッドキャストにゲスト出演したSpire by iZotopeのプロダクトマネージャー、Hines氏は、ユーザーの正確な位置が通常のスピーカーの音質に劇的な影響を与える可能性があり、その問題は周囲の音響特性によってさらに複雑化すると述べています。
ハインズ氏によると、スピーカーを部屋の中を移動すると、音の反射が劇的に変化するという。例えば、部屋の隅に近づくと低音域が失われるなどだ。反射音は部屋の中を跳ね返る際に、様々な方法で音を増幅させ、共鳴周波数の一部が不規則に大きくなる可能性がある。この効果は特に波長が長い場合に顕著である。
「耳の位置によって、周波数レベルの突然の激しい変化が聞こえます。そのため、部屋の隅では低音が消えてしまうことがあります」とハインズ氏はアドバイスします。「また、部屋の中で隣り合った場所に座っているだけで、家族とテレビの音が小さすぎるか小さすぎるかで言い争うのも、このためです。そして、全員が正しい場合もあります。」
周囲の環境によっても音質は変化します。柔らかい家具はノイズを吸収しますが、硬い表面はノイズを反射する傾向があります。そのため、レコーディングスタジオや高級ホームシアタールームなど、オーディオ制作やオーディオの視聴に関わる場所では、ユーザーのニーズに合わせてサウンドを整えるために、壁、床、天井に貼る素材を慎重に選定します。
Appleの場合、6つのマイクアレイとデジタル信号プロセッサ(DSP)を用いて、音響特性に基づいて環境を理解し、デバイスの出力を物理的な位置と部屋の音響プロファイルに合わせて調整しています。複数のスピーカーとマイクアレイを考慮すると、このようなシステムでは各スピーカーの出力をカスタマイズし、環境空間の可能な限り広い範囲で同様の音が聞こえるようにすることが可能です。
HomePodが、デバイスの7つのツイータースピーカーそれぞれから発せられる音を調整できるリアルタイムDSPを搭載している場合、リスナーの体重が同じエリア内で別の場所に移動するなど、環境自体が変化しても、プロファイルを常に変更することができます。体験は位置に関係なく一貫しており、ハインズ氏は、この一貫性によって音楽鑑賞が「よりシームレスで没入感が高まる」と付け加えています。
DSP とこの適応型音響処理システムは、HomePod が将来のアップデートでステレオ オーディオ機能に対応し、2 つの HomePod 間でステレオ オーディオを分割して提供できるようになる場合にも役立ちます。
一般的なステレオオーディオシステムでは、「リスニングポジションを1インチでも調整すると、音が耳に届く時間に大きな影響が出ます」とハインズ氏は強調する。「スピーカー間のクロストークも変化し、室内の反射音も変化します。」
HomePodを何の調整もせずにストレートステレオで再生すると、ユーザーの姿勢によって音質がほぼ確実に影響を受けるため、問題が発生します。「HomePodに真のステレオ設定を施すとユーザーエクスペリエンスが悪くなりますが、Appleはそのようなサービスを提供するつもりはありません。」
Apple が特許を取得しようとしているこのオーディオ適応技術を使用すると、HomePod が互いの音を考慮できるため、部屋の他のエリアでもオーディオを聞きながら、HomePod の近くにいる人にはステレオ体験が引き続き存在し、楽しめます。
マイクアレイ、DSP、そしてスピーカー群は、オーディオ再生以外にもHomePodの様々な機能をサポートします。HomePodにはSiriなどの音声対応機能が搭載されているため、このシステムはユーザーの音声認識にも役立ちます。
ビームフォーミング技術により、HomePodはデバイスに対するユーザーの位置を特定し、その方向からの音声をより正確に拾えるようにマイクの設定を調整します。つまり、アレイ内のすべてのマイクからの音声フィードを分析し、アレイが拾った余分なノイズを除去することで、音声から不要な音を取り除き、より明瞭な音声を実現します。
「ビームフォーム マイク アレイとは、あらゆる方向に複数のマイクを向けながら、相関マトリックスのようなものに応じて各マイクが受信した信号を異なる重み付けで処理できることを意味します」とハインズ氏は説明し、この処理により「周囲の環境音を排除し、より瞬間的で望ましい音声素材のみを強調するのに役立ちます」と続けます。
ハインズ氏は、一般的なスピーカーフォンシステムを例に挙げ、音質の違いを説明しています。スピーカーフォンシステムは単一のマイクを使用しており、ユーザーが離れたり、別の方向に話したりすると音質が低下します。あらゆる方向に向けたマイクアレイを使用すれば、部屋のどこにいてもユーザーの声を拾うのに十分な広さを確保できますが、部屋の周囲から不要な音も拾ってしまうため、除去処理が必要になります。
「この重み付けは継続的に計算されるプロセスなので、HomePodの周りを歩くと、マイクがそれを認識し、音声が同じように明瞭になるようにします。」
このシステムは音響エコーキャンセルも可能にし、フィードバックの可能性を大幅に低減します。フィードバックは、スピーカーが接続されたマイクに近すぎる場合によく発生する問題で、結果として生じるオーディオループによって高音のノイズが発生することがよくあります。ハインズ氏によると、HomePodは、壁や近くの平らな面からの反射音など、自ら発する音がフィードバックしている状況を認識し、オーディオ信号からその音をキャンセルできるほどインテリジェントです。
エコーキャンセレーションとビームフォーミング技術は、iPhoneからHomePodへの通話ハンドオフ機能以上の機能を提供します。可能な限りクリーンな音声フィードを提供することで、Siriの音声認識精度が向上し、コマンドやクエリの誤認識の可能性が低くなります。
「簡単に言えば、家の中のどこにいても良い音質で快適に動作するスマートスピーカーを提供するために、たくさんのことが自動的に行われているのです」とハインズ氏は断言する。「エレガントなシンプルさを実現するのは、間違いなく最も難しいことです。」
ハインズ氏は、このオーディオ処理のすべて、およびAirPlay 2、Siri、HomeKitなどの他の機能が、iPhone 6で使用されているのと同じA8プロセッサを使用して実行されると指摘している。これらすべての機能とそれ以上を実行するためにAppleがこれほど強力なチップを使用する必要があることは、ユーザーにとってはiPhoneの通常の作業負荷よりも「少ない」ように見えるかもしれないが、これはHomePodの「内部で実際にどれだけ多くのことが行われているかの証拠」だとハインズ氏は示唆している。