台湾の大学がSiriをめぐってAppleを提訴、音声認識特許2件を主張

台湾の大学がSiriをめぐってAppleを提訴、音声認識特許2件を主張

マイキー・キャンベルのプロフィール写真マイキー・キャンベル

· 2分で読めます

台湾の国立成功大学(NCKU)は先週金曜日、テキサス州東部地区連邦地方裁判所に提訴し、アップルのiPhone 4SへのSiriの実装が2つの音声認識特許を侵害していると主張し、問題製品の永久販売禁止と損害賠償を求めている。

NCKUは、Appleと同社のSiri仮想アシスタントに対して、「音声データをマッチングする方法とシステム」に関する米国特許第7,707,032号と「音声認識システム」に関する米国特許第7,266,496号を主張している。

訴状の中で、NCKUは、Appleによる'032特許と'496特許の両件の故意侵害により金銭的損害を被っており、今後も損害を被る可能性があると主張し、侵害製品の差し止め命令に加え、損害賠償金と弁護士費用の回収を求めている。損害賠償額は「未定」となっている。

NCKUの特許032号は2005年に申請され、2010年に付与されました。この特許は、「音声の断片間の類似性を判定する」基本的な音声認識アルゴリズムを説明しています。基本的に、この特許は入力音声データとサンプル音声データを比較するシステムについて説明しています。

'032特許概要より:

入力音声データとサンプル音声データとの類似度を判定するための方法およびシステムが提供される。まず、入力音声データを複数の入力音声フレームに分割し、サンプル音声データを複数のサンプル音声フレームに分割する。次に、入力音声フレームとサンプル音声フレームを用いてマッチング行列を構築する。マッチング行列は、各入力音声フレームと各サンプル音声フレームとの間の距離値を含む。次に、この距離値を用いてマッチングスコアを算出する。最後に、このマッチングスコアに基づいて、入力音声データとサンプル音声データとの類似度を判定する。

'032特許における音声データのフローチャート。| 出典: USPTO

'496特許は2002年に出願され、約6か月後の2003年7月に付与されました。NCKUが主張する2番目の発明はより複雑で、特定用途向け集積回路(ASIC)アーキテクチャに基づく完全な音声認識システムに関するものです。このシステムはさらに4つのモジュールに分割され、特許によれば、これらのモジュールは「設計の再利用のために、様々な製品やアプリケーション要件とのインターフェース」に役立ちます。

'036 特許と同様に、'496 プロパティは音声フレームのタイミングとマッチングを使用して音声を「認識」しますが、電気コンポーネントとソフトウェアの導入によってさらに深いレベルに到達します。

'496特許の概要より:

本発明は、トレーニングボタンと認識ボタンを備えた完全な音声認識システムを開示する。システム全体は、特定用途向け集積回路(ASIC)アーキテクチャを用いて設計され、さらにモジュール設計を用いて音声処理を4つのモジュール(システム制御モジュール、自己相関および線形予測係数モジュール、ケプストラムモジュール、DTW認識モジュール)に分割する。各モジュールは、それ自体がIP(Intellectual Product)コンポーネントを形成する。各IPコンポーネントは、様々な製品やアプリケーション要件に対応し、設計の再利用が可能であるため、市場投入までの時間を大幅に短縮できる。

音声認識特許
'496特許の図解。| 出典: USPTO

Appleは2011年10月にiPhone 4Sで初めて音声認識仮想アシスタントSiriを導入し、今秋iOS 6でiPadにも導入する予定だ。

金曜日の訴訟は今月Siriに対して起こされた2件目の訴訟であり、2006年に「Xiaoi Bot」と呼ばれる音声認識アシスタントの特許を取得した中国企業Zhi Zhenによる同様の訴訟に続くものとなっている。