アップル、障害者向け音声認識機能向上プロジェクトに参加

アップル、障害者向け音声認識機能向上プロジェクトに参加

マルコム・オーウェンのプロフィール写真マルコム・オーウェン

· 1分で読めます

イリノイ大学(UIUC)は、アップルや他のテクノロジー大手と共同で、音声アクセシビリティ・プロジェクトに取り組んでいる。このプロジェクトは、現在のバージョンでは理解が難しい発話パターンや障害を持つ人々のために、音声認識システムを改善することを目指している。

Siriなどのデジタルアシスタントの音声認識システムは、ユーザーのリクエストを聞き間違えることが多いと揶揄されることが多いものの、デバイス上での認識機能の開発を含め、長年にわたって精度が向上してきました。新たな取り組みとして、発話障害や障がいのある人々を対象に、精度をさらに向上させることを目指すプロジェクトが始動しています。

UIUCの音声アクセシビリティ・プロジェクトは、Apple、Amazon、Google、Meta、Microsoft、そして非営利団体と提携し、音声認識システムが理解できる発話パターンの範囲を拡大することを目指します。これには、ルー・ゲーリック病、筋萎縮性側索硬化症、パーキンソン病、脳性麻痺、ダウン症候群といった疾患や障害による発話への影響も含まれています。

場合によっては、音声認識システムは、動作が制限される病気を持つユーザーの生活の質を向上させることができますが、ユーザーの声に影響を与える問題がその有効性に影響を及ぼす可能性があります。

音声アクセシビリティ・プロジェクトでは、「多様な発話パターンを代表する」個人からサンプルを収集し、非公開かつ匿名化されたデータセットを作成します。このデータセットは当初アメリカ英語に焦点を当て、その後、音声への対応能力を向上させる機械学習モデルの訓練に活用されます。

バーチャルアシスタントや音声認識機能を備えたツールを提供する幅広いテクノロジー企業の参加は、プロジェクトの開発スピード向上に貢献する可能性があります。別々のチームで作業を進め、他者の成果を重複させるのではなく、プロジェクトを通じて直接連携することが可能になります。

「音声インターフェースは誰もが利用できるものでなければなりません。障がいのある人も例外ではありません」と、イリノイ大学カリフォルニア大学(UIUC)のマーク・ハセガワ=ジョンソン教授は述べています。「この課題は、多くのインフラ、理想的には大手テクノロジー企業がサポートできるインフラを必要とするため困難でした。そこで私たちは、言語学、音声、AI、セキュリティ、プライバシーの専門知識を持つ、独自の学際的なチームを結成しました。」