Siriの調査により、iPhone 4SのサービスがAppleとどのように通信するかが明らかになった

Siriの調査により、iPhone 4SのサービスがAppleとどのように通信するかが明らかになった

ダニエル・エラン・ディルガーのプロフィール写真ダニエル・エラン・ディルガー

· 2分で読めます

Apple の Siri 音声アシスタントを調査しているモバイル開発者が、同サービスのプロトコルを分析し、iPhone 4S 以外で同サービスを利用するためのツールを開発した。

Applidium によるテストでは、iPhone 4S は Apple のサーバーとの通信に標準の HTTPS ネットワーク リクエストを使用しているが、通常の Web GET リクエストではなく「ACE」コマンドを使用してデータを送信することが報告されています。

iPhone 4S が行う各 Siri リクエストには、ハードウェア UUID に基づいていると思われる固有のホスト識別子も含まれており、権限のないデバイスが Apple のサーバーにリクエストを送信するのを防止します。

Applidiumは、テスト用のMac環境を含む他のデバイスから送信されたリクエストにiPhone 4Sのホスト識別子をコピーすることに成功したと報告しています。開発者は、iPhone 4Sが音声認識リクエストをどのようにパッケージ化しているかを調べることで、同様にパッケージ化されたリクエストを送信し、正しい応答を得ることができました。

このテストにより、Siriがユーザーの音声をキャプチャした生の音声データを、VoIP向けに最適化されたSpeexオーディオコーデックで圧縮して送信していることが証明されました。以前は、iPhone 4Sが音声データを前処理し、その結果のみをAppleのサーバーに送信しているのではないかと推測されていました。

Siri は iPhone 4S の追加のパワーを使用する他の前処理タスクを実行する可能性がありますが、Applidium の発見は、どの iPhone でも少なくとも Siri の基本的な音声認識機能をサポートできるはずだと示唆しています。ただし、Apple は iPhone 4 や iPhone 3GS などの初期の iOS 5 モデルにそのような機能をリリースする予定はないと表明しています。

どちらのモデルもサードパーティ製の音声テキスト変換サービスに対応していますが、AppleのiOSでは、サードパーティ製のサービスをシステム全体でアプリに統合する手段が提供されていません。つまり、ユーザーは1つのアプリで音声入力し、その結果を他のアプリにコピー&ペーストする必要があります。AndroidとWindows Phone 7はどちらも、システム全体で統合された音声認識機能を提供しています。

しかし、Siriは単なる音声認識をはるかに超えています。音声をテキストに変換するだけでなく、Siriはリクエストの意味を評価し、ユーザーと特定の連絡先との関係、位置情報などのリクエストの詳細に関するコンテキストセッションを維持します。

これまでのところ、Applidium の調査により、Siri がリクエストを圧縮されたプロパティ リストにパッケージ化していることが明らかになっていますが、リクエストの複雑さ、リクエストがハードウェア キーに関連付けられているという事実、リクエストが変更される可能性があるなど、いくつかの問題により、プロトコルのさらなる調査は妨げられています。

Apple は、特定のハードウェア キーが自社のサーバーを悪用するために使用されていると疑った場合、いつでもそのハードウェア キーへの応答を停止することができます。また、Siri サービスは Apple 独自のサービスであるため、クライアント アップデートを送信するだけで、データの送信方法を迅速に変更できます。

Applidium は、「誰でも本物の Siri を使用する Android アプリを作成できるようになりました。または、iPad で Siri を使用することもできます」と述べています。ただし、Siri にアクセスするには、ユーザーは実際の iPhone 4S の一意のユーザー キーを嗅ぎ分け、そのキーが期限切れになるか Apple によってブロックされるまでそのキーを再利用する必要があります。

AppleはiPhone 4S専用の「ベータ」機能としてSiriサービスの開発に取り組んできましたが、最新iPhoneモデルの購入者数百万の需要に応えるため、サービスの拡充に時間を要しました。この新サービスは、iPhone 4S専用のハードウェアも利用しています。

Siri は、最終的には iPod touch、iPad、そしておそらく Mac の新モデルにも搭載されると予想されており、最終的には Apple TV に採用されるリビングルームのインターフェースとして機能し、テレビ番組を操作するためのボタンやタッチベースのリモコンの必要性がなくなるのではないかと推測する人もいます。