マングローブ・キャピタル・パートナーズによる音声認識とデジタルアシスタントに関するレポートでは、アップルは「SiriOS」を開発するはずだと示唆しているが、同社は「音声コミュニティ」が2020年までに発表されると期待していると確信しているものの、それがどのようなものになるかについては詳細がほとんど明らかにされていない。
投資会社マングローブの「Voice Tech 2019」レポートでは、今後10年間で音声ベースのコンピューティングへの移行が進み、AIや機械学習、音声認識を活用したシステムの使用によって「あらゆる分野で新世代のテクノロジー企業」が誕生する可能性が高いと予測している。
95%を超える単語認識率を備え、言語理解において人間と同等の能力を持つ音声認識は、デバイスを介したタイピングよりも「はるかに自然で、便利で、効率的なコミュニケーション手段」であり、将来的には人間と機械のインターフェースの主流となると主張されています。音声認識システムを搭載したIoTデバイスやスマート家電の台頭、そしてGoogleがサポートする幅広い言語やAlexaスキルの柔軟性についても強調されています。
AIの進化は音声アシスタントの能力をさらに向上させると謳われており、第一波のアルゴリズムと第二波の意思決定の改善に続き、センサーからデータを収集し、より複雑なプロセスを自動化できる第三波のAIが登場する。これらの進化はユーザーによるデバイス操作に影響を与えるため、企業は「ユーザーとのインタラクション方法を再考」し、予測可能なスクリプトによる応答に頼らない「コンテキストアウェアな音声ファースト・インターフェース」を採用するよう促されるだろう。
macOS内でのSiriの表示
マングローブ氏は、音声スタートアップへの投資額が2019年現在までに7億6,800万ドルに達し、2018年の5億8,100万ドル、2017年の2億9,800万ドルを上回っていると考えている。米国では10億ドル以上が音声スタートアップに投資されていると言われており、欧州でも1億1,800万ドルが投資されている。
プライバシーとエコシステム
レポートの終盤ではプライバシーの概念に触れており、マイクロソフトの調査によると、ユーザーの41%が特に受動的なリスニングに関してプライバシーを懸念しているとのことです。マングローブ氏は、Google Nestデバイスにマイクが搭載されていることや、Amazonが「部屋内のすべての会話を盗聴する」特許を取得していることに触れ、テクノロジー企業はユーザーの懸念への対応においてAppleに倣うだろうと示唆しています。Appleはこれを「特に効果的に」行っています。
例として挙げられているのは、AppleによるSilk Labsの買収です。Silk Labsは、クラウドサーバーとの通信に依存せず、iPhoneやiPad本体で処理を実行するオンデバイスAIソフトウェアを開発しています。この買収は「賢明な動き」と称賛されています。
対照的に、Appleは「音声を中心としたエコシステムの構築において、それほど効果的ではなかった」と言われています。「ナレッジナビゲーター」のビジョンは、Appleの音声戦略が「1987年の方が現在よりも明確に表現されていた」ことを示唆しています。
SiriOSの入手
さらに、レポートは「音声コミュニティは、AppleがWWDC 2020で開発者コミュニティ向けのSiriOSをリリースし、イノベーションと普及を加速させることを期待している」と述べている。Voicebot.aiのブレット・キンセラ氏がSiriOSについて「イノベーションを促進する上で望ましく、AmazonやGoogleの音声アシスタントの進歩に匹敵するために必要だと多くの人が考えている」と述べたことを引用する以外に、このSiriOSがどのような形になるかについては議論されていない。
Siriショートカットは、一部のアプリでSiriコマンドを使用するためにタップする自動化ツールです。
引用元を辿ると、これはAlexa Skills Kitを搭載したAlexaや、Actions on Google開発環境を活用したGoogleアシスタントに相当するSiriオペレーティングシステムになることが判明しました。SiriOSは、既存のオペレーティングシステムの一部ではなく、開発者がSiriKitで従うべきガイドラインやルールによって制限され、iOSとmacOSで異なるものではなく、実質的にデバイスのオペレーティングシステムから独立したソフトウェアシステムとなります。
SiriOSを独立させることで、Appleの各種OS間でSiriの機能や特徴が統一され、すべてのデバイスに同時に変更を適用できるようになります。開発者にとって、SiriOSはSiriKitの既存の多くの制約に縛られることなく、各デバイスのOSにおけるSiriの実装がどのように機能するかを詳細に理解する必要がなくなるのが理想的です。
Siriをオペレーティングシステムから分離することで、デジタルアシスタントの新たな活用方法が実現可能になるかもしれません。例えば、開発者はSiriをアプリに直接統合し、アプリの機能に応じて高度にカスタマイズされたエクスペリエンスを提供できるようになります。
詳細が不足しているため、これはMangroveの報告書でSiriOSについて言及されている内容とほぼ一致していると考えられます。要するに、MangroveはAppleにとって、Siriを現状よりもさらに開発者に開放することが最善の利益だと考えているということです。
当面、開発者はSiriKitを使用し、Siriショートカットを活用する必要があります。最終的には、SiriiOSに近いものを開発できるかどうかはApple次第であり、Appleが自社の象徴的で貴重なバーチャルアシスタントのコントロールをサードパーティに譲り渡す意思があるかどうかにかかっています。