WWDC 2018: Apple、Siri、そしてiOS 12におけるモバイル音声自動化の未来

WWDC 2018: Apple、Siri、そしてiOS 12におけるモバイル音声自動化の未来

AppleのWWDC(世界開発者会議)まであと3ヶ月余りですが、次世代モバイルデバイスを牽引するiOS 12で同社がどのような機能を披露するのか、すでにある程度の見通しが立っています。Appleの音声アシスタントSiriと自動化機能についてご紹介します。

無能な者たちの間で絶え間なく繰り広げられる政治闘争を描いた誇張された物語

新興メディアの報道によると、AppleはSiriで音声アシスタントの主導権を失い、クラウド接続マイクとの会話における新たなリーダーであるAmazonのAlexa搭載WiFiマイクとその接続デバイスのエコシステム、サードパーティのAlexaスキルのプラットフォーム、そしてAndroid、iOS、および一部のGoogleブランドの家電製品で実行されるアシスタントに関連したGoogleの追随努力に大きく遅れをとって第3位に追いやられたという。

The Informationの最近の記事では、Apple における Siri の歴史全体が、一連の基本的な間違いと脆弱なコードによる劇的な内紛の連続で、その上に新たな買収が押し付けられる形で崩壊していったと描写されている。

このプロフィールは、同サイトが以前書いた、Tizenスマートウォッチから企業目標まであらゆることに関するAndroidの友敵GoogleとSamsungの内紛、あるいはGoogle内部での戦略方向の不器用な変更やAndroid、Chrome、Motorola MobilityやNestなどの買収による内紛を描いたものとよく似ている。

シリコンバレーのドラマを鮮烈に描いた過去の暴露記事と同様、「ザ・インフォメーション」も主に不満を抱えた元従業員の情報源を引用しており、彼らの証言は他の記事と矛盾している。しかし、3つの記事の主な違いは最終的な結末にある。

GoogleとSamsungは、Android WearであれTizenであれ、スマートウォッチの販売に失敗し、企業向けプレゼンにも失敗しました。同時に、GoogleのAndroid、Chrome、Motorola、Nextハードウェアも、商業的に意味のある売上を生まないまま、莫大な費用をかけて大失敗に終わりました。こうした状況に比べれば、AppleのSiriのここ数年は、天才的なホームランと言えるでしょう。

Siriは銀行への道で失敗している

Siriを嫌う人は多いが、Siriがこれまでで最悪だったのは、iPhone 4sのモデルを大量に売ってしまったこと、Apple Watch、CarPlay、Apple TV 4、HomePodなど他のApple製品に注目が集まってしまったこと、そしてもちろん、不満を抱えたユーザーからの多くの質問を理解できなかったことだ。HomePodにネグローニの作り方を聞いても、全く役に立たない。しかし、AppleはSiriを音声ファーストのプラットフォームとして売り出しているわけではない。AppleはSiriを音声ファーストのプラットフォームとして売り出しているわけではない。

AppleはSiriを製品として販売していないため、Siriを「失敗作」と決めつける唯一の方法は、競合他社が自社の音声サービスでAppleの事業や将来の可能性を何らかの形で損なっていると主張することだろう。しかし、The Informationでさえ、Appleが依然として音声リクエストの最大のサプライヤーであり、20以上の言語(Alexaは3言語をサポート)をサポートする唯一の企業であることを認めている。Siriは最悪の場合、Appleハードウェアの収益性の高い販売に貢献しているに過ぎない。

Android が、深刻なアーキテクチャ上の問題、パフォーマンスの問題、セキュリティ上の欠陥が多数あるにもかかわらず、利益を生まないローエンドの携帯電話の大量販売に自発的に参加しているというだけでリーダーシップ成功のトロフィーを獲得するのであれば、たとえ iPhone で調べるよりも速く飲み物の成分をオンデマンドで教えられないとしても、Apple の巨大なグローバルな現金自動支払機の脇役として乗っている Siri にきっと恩恵を与えることができるはずだ。

Hey Siri、Alexaはどこ?

圧倒的な人気を誇るスマートウォッチ、Apple WatchをAlexa搭載スマートウォッチとして見過ごす人はいないでしょう。CarPlay(かつては積極的に抵抗していたトヨタなど、主要自動車メーカー全てがCarPlay対応を余儀なくされたほどの人気)を軽視する消費者は、Alexa搭載の車載ハードウェアを選ぶ傾向にあります。HomePodは発売当初、同価格帯の「スマートスピーカー」やはるかに安価なAmazon Echoデバイスよりも売上が好調でした。Apple TVでさえ、Alexa搭載というだけで同等の価格帯のハードウェアを求める競合は存在しません。

Alexa は、このように有名な企業であるにもかかわらず、あまり商業的な力を発揮していないように思われます。

Alexaと25,000のスキル

Amazon Alexaの真の力は、「スキル」と呼ばれる音声アクション拡張機能に対するサードパーティのサポートにあると言われています。これにより、アプリ開発者はAlexaの音声機能を拡張し、デバイスの制御や、例えばDominosでお気に入りのピザを注文するといったタスクをサポートできます。「Alexaスキルベスト50」のリストを見てみると、ほとんどが中身のないゴミ山です。

The Informationはこれらのスキルの価値についてはあまり触れていません。しかし、「Alexaスキルベスト50」のリストを見てみると、ほとんどが中身のない情報ばかりです。例えば、TomsGuideは50個のスキルをリストアップしていましたが、そこにはSiriが既に行っている多くの機能が含まれていました。例えば、音楽の再生、メッセージの音声入力、株価の問い合わせ、NPR、CNN、BBCなどのニュース番組の視聴、自宅の照明の自動制御、ポッドキャストの視聴、単語のスペルの問い合わせ、UberやLyftの配車を依頼するなどです。

その他の「スキル」は、猫の鳴き声や雷鳴の効果音を再生したり、今日の単語の意味や心に響く名言を尋ねたりするなど、目新しいものばかりでした。また、飲み物の作り方や応急処置のアドバイスなど、Siriがスマートフォンで調べられる内容を音声でサポートするスキルもありました。アプリの音声のみに対応したスキルもありました。「トップスキル」の中で最も多く挙げられたのは、キャピタル・ワンの銀行アプリで、銀行残高にアクセスして支払いを行うことができます。このアプリを使用するには、セキュリティPINコードを音声で入力する必要があります。これはどうも良くないアイデアのように思えます。Alexaとの連携機能も、ドアの解錠に同様の「セキュリティ」を利用することがあります。

他のスキルはデバイスと連携しており、例えば(ハイエンドモデルの)ルンバに掃除機をかけ始めるよう指示したり、デジタル真空調理器の温度を調整したりといった機能があります。また、(数少ない新型車をお持ちであれば)車をリモートで始動させたり、ワールプール社製の将来発売予定の家電製品を操作したりすることも可能です。Amazonスキルが長期的にどのような独自の優位性を発揮できるかを見極めるのと同じくらい、ここには価値ある実用性を見出すのも難しいでしょう。

WWDC 18におけるApple、アプリ、Siri、自動化

これらのスキルは、スマートフォンアプリから実行できるタスクのほぼすべてであり、スピーカーからの音声操作で起動するだけです。Appleは今後どのように追いつくのでしょうか?その答えは、同社が約1年前に買収したWorkflowアプリにあるかもしれません。

Hey Siri: ワークフローは複雑なタスクをトリガー可能なイベントに変換します

ワークフローは、多くの人がSiriの理想的な目標として思い描いているものの、音声ではなくグラフィカルなバージョンです。一連のアクションを定義し、ホーム画面、アプリ内(共有シート)、Todayウィジェットページ、さらにはApple Watchからタッチするだけでトリガーできます。トリガーを複雑なアクションに変換する仕組みを考えると、Siriのワークフローインテントは、サードパーティがあらゆる種類のスキルを作成し、ユーザーが音声またはiOSデバイスからグラフィカルに起動できるようにするでしょう。

iOSアプリ開発者がワークフロー経由でSiriの自動化機能を追加できるようになることで、Alexaの圧倒的なスキルの優位性はほぼ失われます。Alexaがピザの注文を繰り返してくれる機能は、あらゆるアプリ開発者が音声トリガーとして公開できるようになります。これは、HomeKitがSiri経由、あるいはアプリやウィジェットからの直接操作でデバイスを操作できるようにしているのとほぼ同じです。

Siriがうまく機能したり、改善したりするために、Alexaがなくなる必要はないことに注意してください。ユーザーは、Alexaマイクを使って商品を注文し、HomePodを使ってリビングルームに素晴らしいサウンドを届け、個人情報にアクセスできるようにするなど、両方を利用することも可能でしょう。しかし、Amazonが過去数年間で数千万台のAlexaマイクを販売してきたからといって、Appleが消滅に向かっているという見方は、全くの誤りです。

驚くべき情報不足

Siriに関する最近の報道の多くに付きまとう大きな論理の矛盾を、The Informationは強調するかのように、重要な事実を省略して「音声認識業界の他の全員」がSiriに割って入ってきたり、何らかの形でSiriを妨害したりしているという物語をでっち上げているように見受けられました。記事では、Appleが元Siri従業員(Viv Labを設立するために退職)に対し、社内でのバスケットボールを禁止したことを指摘しています。これは、AppleにはいないとされるSiriの才能を持つ人材が流出する懸念があったためです。

Viv の従業員 (Dag Kittlaus、Adam Cheyer、Chris Brigham) が Siri に対抗するプロジェクトを立ち上げただけでなく (2016 年初頭に公開デモを行った)、その年の終わりに自らを Samsung に売却し、Bixby となる予定のものを開発していたという事実については何も触れられていない。

Viv LabsはSiriを殺す会社として話題になったが、Siriを殺すことには失敗した。| 出典:ワシントン・ポスト

Vivチームは、AppleのSiriよりも会話的で複雑な音声インタラクションを可能にすると自社製品を宣伝していました。しかし、最終的には実現できませんでした。ウォール・ストリート・ジャーナルによると、サムスンは停滞していた社内S Voiceプロジェクトの既存のコードに戻らざるを得ませんでした。

昨年、サムスンは差別化を図るはずだった主力製品へのBixby音声サービス搭載を延期せざるを得ませんでした。そして翌年も、レビューでは「許しがたい」や「今のところ最も控えめな表現で言っても、全く感銘を受けない」といった評価が続きました。

Vivの「Siriより優れている」機能を、想定上の4億台のデバイスに搭載するどころか、BixbyはサムスンのフラッグシップモデルGalaxy S8の邪魔者となり、今年の最新S9にも全くプラスに働かない機能となってしまった。「Bixbyは、今のところS9で最もイライラさせられる部分だ」と、ブライアン・ヒーター氏は先週 TechCrunchに記した。

世界最大のスマートフォン出荷元が持つ市場力にもかかわらず、過去3年間にわたりVivが「より優れたSiri」を提供できなかった大失敗は、AppleがViviに自社の社員を自社のキャンパスに引き抜かれたくないという逸話よりも、音声アシスタント市場を理解する上で重要ではないだろうか。

音声機器を世界に販売するには、3 つ以上の言語のサポートと、世界最大の 2 つの市場の両方で少なくとも何らかの存在感が必要であるという事実を無視して、Alexa のほとんどが取るに足らないスキルを純金の山のように描写する選択的な報道は、実際には良い情報ではありません。

音声の有用性について語る実在の人々

Apple の Siri の苦境に関するドラマチックな描写に応えて、The Informationの読者の 1 人が次のように書いている。「アーロンとケビンが、ベイ バブルの外側にも目を向けて、スマートフォンや「スマート スピーカー」の購入者の動機を理解し、デジタル アシスタントに本当に何を求めているかを探ってほしかった。」

「私の家には、Echo 'First Gen' チューブが 2 台、Echo Dot が 2 台、Google Home が 1 台、HomePod が 1 台ずつあります。これらのデバイスは、天気予報 (すべてほぼ同じくらい)、タイマー (HomePod の利点。部屋を離れても聞こえるため)、スペリング (Echo dot の利点。安価でコンピューターの横に置けるため)、音楽 (HomePod の圧倒的な利点。唯一許容できる音楽ストリームを提供するため) にほぼ完全に使用されています。

「私たちはiPhone 7、iPhone X、Samsung s8+を所有しており、これらのデジタルアシスタントを使って電話をかけたり、天気予報を聞いたり、タイマーやアラームを設定したり、道順を教えたりしています。これらの機能に関しては、SiriとGoogleアシスタントはほぼ同等だと思います。実際、SiriはApple Watchに搭載されているので、私にとってはSiriの方がはるかに便利です。Apple Watchは、他の伝声管よりもはるかに頻繁に使っています。テストではGoogleマップの方がAppleマップよりも信頼性が高いようですが、Car Playでは後者の方が十分に使えると感じています。Car PlayはAndroid Autoよりもはるかに頻繁に使っています。

IoTについては一度も触れていないことにお気づきでしょう。我が家にはAlexa対応のホームシアターとサーモスタットがあります。スキルを有効にしてコマンドを覚えることはできますが、AndroidとiOSのアプリはもっと​​シンプルで、Apple WatchにはControl4のリモコンが勝手に表示されました。どちらの機能も音声なしで操作できる方が簡単です。

HomePodは「部屋から離れた場所でも聞こえる」

WWDC 18におけるSiriの期待

したがって、Apple が Siri をいくつかの新しい Intents で拡張し、Workflow にサードパーティのタスク自動化サポートを追加する可能性はありますが、ユーザーにアプリを見ずに使うための不器用な方法しか提供していない極めて価値の低い Amazon Skills エコシステムを模倣することに、同社が大きな競争努力を費やすことは期待できません (Google が盲目的に、必死になって Alexa を模倣しようとした方法と同じです)。

一方、Appleは、AmazonやGoogleが抱えている問題ではない、同一ネットワーク上で複数のSiriデバイスが連携する機能を強化してきました。これはまだ開発段階ですが、HomePodは既に、両方のSiriデバイスが「Hey Siri」を聞き取っている時にiPhoneを消音する機能をうまく活用しています。

改善できる点は、デバイス間の継続性のハンドオフです。これにより、HomePod が質問に答えられない場合に、iPhone や Apple Watch に質問を委任できるようになり、HomePod からユーザーの話を聞きながら、携帯電話や時計に UI を提供するために連携できるようになる可能性もあります。

同様に HomePod と Apple TV が統合され、特定の番組を再生するように指示できるようになる可能性もあり、サードパーティの tvOS 開発者が HomePod の高度なマイクの配列を使用してフィードバックやコマンドを聞き取ることができる新しいタイプのアプリやゲームを構築できるようになる。

HomePodは、新しいタイプのリクエスト(「Hey Siri、iPhoneはどこ?」など)への対応能力を拡張し、ファミリー共有アカウントでアクセスできるアプリやデータの範囲も拡大するでしょう。また、Appleが「Type to Siri」機能を拡張し、音声を一切使わずにSiriのような検索機能を呼び出すことも可能になると予想されます。

WWDC 18では、Siri、Workflow、HomePod、Continuityにどのような機能が追加されると思いますか?ぜひ下記にコメントをお寄せください。