未来のSiriは電話をかけてきた相手と会話したり、メモを取ったりできる

未来のSiriは電話をかけてきた相手と会話したり、メモを取ったりできる

Appleは、Siriに電話を操作させ、電話をかけたり受けたり、予定を調整させたり、パートナーや上司へのさまざまなボイスメールメッセージを再生させたりすることを望んでいる。

正直に言うと、これらの機能が実際に使われるようになるには、Siriの精度がもっと向上する必要があるでしょう。しかし、Appleには計画があります。新たに取得された「デジタルアシスタントと電話機能の統合」と呼ばれる特許には、Siriや他の音声アシスタントを使って、iPhoneで再び通話できるようになる仕組みが詳細に記されています。

「電話は長年、コミュニケーションを促進するための基本的な技術的機能でした」とAppleは述べています。「近年のデジタルアシスタント技術の進歩は、人間とデバイス間のインタラクションも改善しました。しかし、電話とデジタルアシスタント技術の統合が持つ潜在能力はまだ十分に発揮されていません。」

Appleの提案は、最も基本的なレベルでは、通話中でも音声でSiriを呼び出せるようになることを意味します。Siriは、相手に文句を言うのではなく、何かを頼んでいることをインテリジェントに判断できるようになります。

「例えば、ユーザーは電子機器上で動作するデジタルアシスタントに、ユーザーリクエストを含む音声入力を行うことができます」とAppleは続ける。「デジタルアシスタントは音声入力からユーザーの意図を解釈し、その意図をタスクとして実行することができます。」

たとえば、Siri は「operationalize」という単語を辞書で調べて、驚いたことに、これは実際の単語だとユーザーの耳元でささやき返すかもしれません。

あるいは、グループ通話中に誰かが「ピザ屋の営業時間は何時までか知っている人いますか?」と尋ねたら、Siri が答えを調べて会話に割り込むこともできる。

しかし、Apple の意図は、現在提供されていない通常の Siri アクセスを提供する以上のことだ。

Siri があなたの代わりに通話をスクリーニングします。

Siri があなたの代わりに通話をスクリーニングします。

「例えば、従来のデジタルアシスタントは、ユーザーに代わって着信や発信を管理することはできず、ましてや通話中の通話を円滑に進めることは不可能です」とAppleは続ける。「デジタルアシスタント技術と電話はどちらも音声ベースであるため、デジタルアシスタントと電話を統合する改良されたシステムが求められています。」

そこでAppleは、Siriに話しかけることと電話で話すことの2つを組み合わせる方法があるはずだと考えたのです。特許の約4万語の大部分は、通話中にiPhoneの画面上でジェスチャーを入力する方法に関するものですが、AppleはSiriに操作を任せているのです。

「例えば、発信者からの着信は、電子機器で受信される可能性があります」とAppleは述べています。つまり、iPhoneが鳴り、Siriが電話に出るということです。

その後の対応は、Siriが発信者を認識できるかどうか、つまり連絡先リストに登録されている人物かどうかによって決まります。もちろん、知らない発信者もいますし、AppleによるとSiriは自動通話システムも検知できるそうです。

誰から電話がかかってきたかによって、Siriが様々な行動をとったり、異なる応答をしたりできるというアイデアです。例えば、自動通話システムではSiriが電話を切るといったことも可能です。

あなたのSiriに私のSiriを呼んでもらいましょう

連絡先リストと照合するだけではありません。「場合によっては、発信者の身元を特定するために音声識別と音声認識が利用されます」とAppleは続けます。

Appleは、このようなコメントに続き、プライバシーについて多くの詳細を述べています。「声紋の生成と保存には、当該声紋を利用するために、当該声紋に対応する人物からの事前の承認が必要となる場合があります」とAppleは述べています。

しかし、この報告書は、ユーザーが「家族やその他の近しい関係者などの音声プロファイルに対応する可能性がある」音声プリントを保存できる可能性を示唆している。

Appleの特許は常に、何かをどのように達成するかに焦点を絞り、考えられる応用例をざっと説明するだけにとどまりがちです。そこで今回の特許では、Siriが「発信者に関連付けられた様々な信頼レベル」をどのように割り当てるかという点に焦点を当てています。

ああ、また彼か。

ああ、また彼か。

「例えば、既知の連絡先には『中』の信頼レベルを割り当てることができます」と特許には記載されています。「特定のグループ(例えば『家族』『VIP』など)に属する連絡先など、特定の連絡先には『高』の信頼レベルを割り当てることができます。」

「高い信頼レベルは通信頻度に基づいて割り当てられることもある」ので、「ユーザーが少なくとも 1 日に 1 回は発信者と対話する」場合、その発信者に「『高い』信頼レベルが割り当てられる」可能性がある。

同様に、「不明な発信​​者や、「ブロック」リストに追加された連絡先に関連付けられた発信者など、信頼レベルの低い発信者」も存在します。

発信者が誰なのかを「知る」能力と、割り当てられた信頼レベルがあるからこそ、Siriは上司に「会議中」という録音メッセージを流したり、パートナーに「面接中」と伝えたりできるのです。

Siriは発信者を混乱させる可能性がある

発信者が誰なのかわからないけれど、仕事柄、すべての不明な電話をブロックするわけにはいかない、そんな時、Siriは発信者にいくつか質問をし、その答えに応じて電話を繋いだり切ったりできるとAppleは述べています。

1 つの例では、質問は単に「誰に連絡を取ろうとしているのですか?」などです。

しかし、さらに進んで、発信者が実際の人間なのか、それともタイムシェアについて電話をかけようとしている別の Siri なのかを判断することもできます。

「例えば、デジタルアシスタントは発信者に対して、『いくつか質問させてください。月曜日の反対は何ですか?』といった質問を含むプロンプトを提供する可能性があります」とアップルは述べている。

もしあなたがそれを聞いて瞬きしたなら、Siri はあなたが人間だと認識します。

「この例では、質問には無意味または非論理的な質問が含まれる可能性があります」と Apple は続けます。「そのため、人間のユーザーは、一時停止の後に説明を求める質問 (例:「どういう意味ですか?」「すみません?」など) などの予測可能な応答や応答パターンで応答します。」

Apple社は、自動化システムは「このような質問を解釈するのが難しい可能性がある」と述べている。システムは「『こんにちは、スミス上院議員です』など、事前に設定されたデフォルトの録音で応答する可能性がある」という。

特許には、Siri が「上院議員」という言葉を聞いた瞬間に発信者の信頼度を低く設定するとは書かれていないが、そうである可能性はある。

Siri を仮想アシスタントにして、レストランの Siri に話しかけて予約を手配しましょう。

Siri を仮想アシスタントにして、レストランの Siri に話しかけて予約を手配しましょう。

現実世界のアプリケーション

もちろん、Siri は自動化システムなので、特許では具体的には述べられていないものの、提案されている技術は電話をかける機能も備えている必要がある。

Appleの特許の図には、レストランのテーブル予約の手順も含まれています。「Hey Siri、火曜日の夕方に、近くのピザ屋で2人分のテーブルを予約して」と言えば、想像に難くないでしょう。

あなたの Siri がピザ店の Siri を通過できれば、レストランは午後 7 時の予約を提案し、あなたに代わってそれを承認することができます。

しかし実際には、Siriをあらゆる行動に、そしてSiriが役立つあらゆる場所に統合することがコンセプトです。電話中などの問題があっても、Siriがあなたに代わって仕事をする能力を止められることはなくなります。

この特許は、以前スマートリングの開発に携わっていたマルセル・ヴァン・オス氏を含む5人の発明者によるものだ。