Siriは将来のiPhoneやiPadでユーザーの音声パターンを認識する可能性がある

Siriは将来のiPhoneやiPadでユーザーの音声パターンを認識する可能性がある

Appleは、できるだけ使いやすくしながらもデバイスのセキュリティを確保する方法を模索し続けている。その1つのコンセプトは、iPhoneやiPadのロックを解除してSiriのリクエストを実行するというものだが、これは聞こえる声が所有者のものと一致する場合に限られる。

米特許商標庁が火曜日に認可した「音声認証を使用したデバイスアクセス」の特許は、音声リクエストの話者の声を検出し、それが主な登録ユーザーであるかどうかを判断するという、比較的単純なものだ。

特許によると、ユーザーからの音声入力を受信できるデバイスは、複数の音声例を用いて、所有者の「声紋」を作成できる可能性がある。このテキストに依存しない声紋は、ユーザーの声の特徴を判別し、デバイス上または外部サービスを介してモデルを作成し、その結果は将来の検証における比較対象となる。

声紋は、ユーザーの音素発音の「特徴の統計モデル」を用いて署名を作成することができます。理論的には、これには有声音、無音、破裂音、鼻音や流音の干渉、摩擦音などの特徴が含まれる可能性があります。

音声指紋はテキストに依存しないため、理論上は特定のパスフレーズを必要とせず、通常の発話のみから話者の身元を特定できます。これは、ユーザーが秘密にしておきたいパスフレーズを大声で言いたくない公共の場での音声認証において、より効果的な方法となるでしょう。

デバイスが音声コマンドを受信すると、発話されたフレーズに基づいてモデルを作成し、それを既存の声紋と比較します。類似度が一定の閾値に達した場合、デバイスのロックが解除され、音声コマンドが実行されます。

また、声紋照合は必ずしも電話機を完全にロック解除する必要はないものの、ユーザーの音声によるリクエストは実行できる可能性があるという意見もあります。例えば、Siriはユーザーの声を検知した場合、一般的な話題に関する音声による質問に対して音声とテキストによる応答を返すことができますが、事前に他の手段でデバイスがロック解除されていない限り、ユーザーデータに関する応答は提供しません。

ロック状態であっても、ユーザーの音声が認識された場合に限り、Siriが個人データにアクセスする可能性のある特定の機能を選択することも可能だ。この場合、データへのアクセスは許可されず、他のユーザーがユーザーを特定しない一般的なSiriクエリをデバイスで実行できるようになる。

ユーザーが音声だけでデバイスに自分の身元を証明できない場合は、他の種類の生体認証セキュリティやパスコードなどの二次的な認証方法が提供されます。

Appleは毎週多数の特許を申請していますが、すべてのアイデアが製品化されるわけではありません。Touch IDやFace IDといった生体認証セキュリティに関するAppleの既存の取り組みを考慮すると、特にiPhoneのSiriとの関連で考えると、音声認証への拡張は理にかなっています。

この特許は、Appleがこの分野で出願した数多くの特許の一つであり、同社が初めて公開した特許ではありません。例えば、2011年に出願された「音声入力処理のためのユーザープロファイリング」という特許は、今回付与された特許と実質的に同じアイデアを示唆しています。

8月には、Appleが音声プリントを複数のユーザーを区別するという少し異なる目的で使用することを検討していることが明らかになった。

iPhoneのSiri以外にも、HomePodのSiriにも活用できそうです。HomePodは、視覚的または物理的な生体認証によるセキュリティを持たず、ハードウェア上で音声による応答のみを提供するデジタルアシスタントです。このスマートスピーカーは以前からマルチユーザー対応が謳われており、ユーザーの音声認識によってパーソナライズされたクエリ結果や、個人のプライベートプレイリストの再生などが可能になります。