Appleは今年後半に、多くのデバイスでシステム全体でリアルタイムの音声文字変換と要約機能を提供する予定であり、iPhoneメーカーはAIの力を活用していくつかのコアアプリケーションの効率性を高めたいと考えていることがAppleInsiderの調べで分かった。
事情に詳しい関係者によると、Appleは次世代OSのいくつかにおいて、AIを活用した要約機能と音声文字変換機能の大幅な強化に取り組んでいるという。これらの新機能により、定番のメモアプリやボイスメモアプリなどのユーザーの作業効率が大幅に向上すると期待されている。
Appleは現在、2024年後半にリリースされるiOS 18に合わせて予定されている複数のアプリアップデートへの機能追加としてこれらの機能をテストしている。また、macOS 15およびiPadOS 18の対応するアプリにも導入される予定だ。
Appleが全デバイスに標準搭載しているボイスメモアプリは、最初に機能強化を受けるものの一つです。初期バージョンでは、各音声録音の文字起こし機能が備わっており、同社の最近のライブボイスメール機能と同様に動作します。
文字起こしはアプリケーション ウィンドウの中央領域を占め、アプリの既存バージョンにある録音されたオーディオの大きなグラフィック表現に代わるものです。
次期バージョンのNotesには、文字起こし機能も搭載されます。両アプリのプレリリース版には、吹き出し型の文字起こし専用ボタンが搭載されていると、関係者は述べています。この新しい吹き出しをタップすると、アプリ内で録音された音声の文字起こしが表示されます。
iOS 18のメモアプリにおけるボイスメモの書き起こしの再現
この文字起こしツールは、4月にAppleInsiderで初めて詳細が発表されたメモアプリの今後の音声録音機能と連携し、新たな文脈を提供します。具体的には、録音された音声をAIで要約するオプションが追加され、主要な焦点とアクション項目の基本的なテキスト要約が即座に提供されます。
AIによる要約機能と、アプリ内音声録音およびリアルタイム文字起こし機能を組み合わせることで、Appleの標準搭載メモアプリは真のパワーアップを果たすことが期待されています。この3つの機能は、膨大なデータから重要なポイントを絞り込むという重労働を担い、幅広い実用的なアプリケーションにメリットをもたらします。これらはすべて、ユーザーにとって利便性と一目でわかる明瞭性をもたらします。
学生はサードパーティ製のツールに頼ることなく、講義や授業を簡単に録音できるようになります。新しいメモアプリから録音する場合は、画像、リンク、表などのデータ構造に加え、書き起こしや要約をメモに含めるオプションがあります。
これらの機能は、業務の一環として電話会議、バーチャルビジネスミーティング、セミナーなどに定期的に参加するプロフェッショナルにも大きなメリットをもたらします。こうしたイベントでは、大量の情報、様々な統計情報、詳細な事業計画、日程、スケジュールなどが明らかになることが多く、AppleのAIテクノロジーがそれらを分析し、適切に構成された要約へと再構成します。
同じことは、定義、複雑な概念や理論的原則の説明、実例など、さまざまな情報が含まれることが多い上級レベルの授業や講義にも当てはまります。
一方、ジャーナリストは長時間のインタビューの書き起こしと要約を非常に効率的に行えるようになります。作家や脚本家などのクリエイティブな仕事に携わる人は、重要なアイデアを簡単に録音し、後で確認できるようになります。重要なデータポイントを見つけるために録音の大部分を再生して聞く必要がなくなります。
Appleは、書き起こし機能と要約機能が正確な結果を生成するよう多大な努力を払っていますが、間違いは避けられません。そのため、書き起こしとAI生成の要約と並行して元の音声を保存することで、書き起こしや要約のプロセスで元の情報が失われることはありません。
要約機能はAppleのAIの取り組みの一部に過ぎない
新しい文字起こし機能と要約機能は、Appleが今年展開するAI活用の拡大の一環です。同様の要約機能は、インテリジェントブラウジング機能を介してSafari 18に、そしてAppleのデバイス内AIソフトウェアとの統合により内蔵メッセージアプリにも搭載される予定です。
SafariとメッセージのAIによる要約機能のユースケースと全体的な目的は全く異なります。メモアプリでは会議、電話会議、講義の要約を作成できるのに対し、Safariではウェブページの要約を作成でき、メッセージアプリではメッセージ内容の要約版を提供します。
AppleのAIソフトウェアは、一部のAI機能がデバイス上で完全に機能すると予想されるため、ユーザーのプライバシー保護にも役立つ可能性があります。ただし、音声文字起こしや高度なAI要約機能については、当面はサーバー側での処理が必要になる可能性があります。
要約と音声文字起こし機能をシステムアプリケーションに組み込むことで、AppleはAIを現実世界のシナリオに活用することによる優れたユースケースのメリットを実証しようとしています。AppleのAIへの取り組みの目標は、顧客が日々の業務をより効率的かつ成功裏に遂行できるよう支援する開発者向け機能を提供することです。
同時に同社は、AI 技術を活用した競合サードパーティ製アプリケーションの急増に対して、より有利な立場に立つことを望んでいる。こうしたアプリケーションの中には、消費者がデジタル生活に AI 技術を取り入れるにつれて、健全な導入率を達成しているものもある。
例えば、OtterアプリケーションはAppleのエディターズチョイスアワードを受賞したもう1つのアプリです。この記事で紹介した機能と同様の機能を備えており、ユーザーは生成AIを使用して会議の録音、文字起こし、要約をすべて1つのアプリで行うことができます。
Microsoft の OneNote も音声メモの形式でのオーディオ録音をサポートしており、Apple の Notes および Voice Memos アプリケーションの潜在的なライバルとして機能します。
ただし、Appleがソフトウェアのプレリリースビルドでテストするすべてのソフトウェア機能が、既存のリリースサイクルに組み込まれるわけではないことを強調しておく必要があります。Appleはプロジェクトを中止したり、機能を次のOSリリースやアプリに延期したりすることがあるため、リリース時期や提供開始時期については最終的に保証できません。
とはいえ、新しいAI要約機能とリアルタイム文字起こし機能は、6月に開催されるAppleの世界開発者会議(WWDC)で、次世代OSとともに発表される見込みで、順調に進んでいるようだ。カレンダーアプリや電卓アプリなどの機能も改良される見込みだ。