iOS 18プロジェクトGreymatterはAIを活用して通知や記事などを要約します

iOS 18プロジェクトGreymatterはAIを活用して通知や記事などを要約します

Appleの次世代OSにはProject Greymatterが搭載され、AI関連の様々な機能強化がもたらされます。Siri、メモ、メッセージに予定されているAI機能に関する新たな詳細情報をお届けします。

iOS 18のAI関連の機能強化に関する幅広い主張と報告を受けて、AppleInsiderはAI分野におけるAppleの計画についての追加情報を入手した。

事情に詳しい関係者によると、同社は毎年恒例のWWDCに先立ち、社内で様々なAI関連の新機能をテストしているという。「Greymatter」というコードネームで知られるこのプロジェクトのAI改良は、エンドユーザーにとっての実用的なメリットに重点を置くものとなる。

Appleは、OSのプレリリース版において、「Greymatter Catch Up」と呼ばれる通知要約機能の開発に取り組んできました。この機能はSiriと連携しており、ユーザーはSiriを通じて最近の通知の概要をリクエストし、受け取ることができるようになります。

Siriは、新しいスマートレスポンスフレームワークとAppleのデバイス内LLMを通じて、応答生成機能が大幅にアップデートされる予定です。Siriは、返信や要約を生成する際に、人物や企業、カレンダーの予定、場所、日付など、様々なエンティティを考慮できるようになります。

AppleInsiderは、Safari 18、Ajax LLM、アップデートされたボイスメモアプリに関する以前のレポートで、AppleがAIを活用したテキスト要約と文字起こし機能を内蔵アプリに導入する計画を明らかにしました。その後、Appleがこれらの機能をSiriにも導入する予定であることがわかりました。

これは最終的に、Siriがデバイス上で質問に答えたり、長文の記事の要約を作成したり、アップデートされたメモやボイスメモアプリのように音声を書き起こしたりできるようになることを意味します。これらはすべて、Ajax LLM、またはより複雑なタスクにはクラウドベースの処理によって実行されます。

また、Apple は強化された「より自然な」音声や、テキスト読み上げ機能の改善をテストしており、最終的にはユーザー エクスペリエンスが大幅に向上するはずだとも伝えられています。

Appleは、Siriによるデバイス間のメディアおよびテレビ操作にも取り組んでいます。この機能により、例えばApple WatchのSiriを使って別のデバイスで音楽を再生できるようになりますが、2024年後半まで実現しないと予想されています。

同社は、様々なユースケースやタスクを想定し、複数のコアシステムアプリケーションに人工知能を組み込むことを決定しました。特に注目すべき改善点の一つは写真編集です。

Appleは画像編集を改善する生成AIソフトウェアを開発した

iOS 18とmacOS 15では、写真アプリなど、AIを活用した写真編集オプションが導入される予定です。Appleは社内で、生成AIソフトウェアを用いて画像からオブジェクトを削除できる新しいクリーンアップ機能を開発しました。

水玉模様のバンダナを着けた小さな犬が、リードにつながれ、柵で囲まれた庭で背を向けて立っています。

クリーンアップツールはAppleの現在のレタッチツールに取って代わる

Project Greymatterに関連して、同社は「Generative Playground」という名称で知られる社内用アプリケーションを開発しました。このアプリケーションに詳しい関係者がAppleInsiderに独占的に明らかにしたところによると、このアプリケーションはAppleのジェネレーティブAIソフトウェアを利用して画像の作成と編集が可能で、専用のアプリ拡張機能としてiMessageとの連携機能も備えているとのこと。

Appleのテスト環境では、人工知能(AI)を使って画像を生成し、iMessageで送信することが可能です。同社が自社OSのエンドユーザー向けにも同様の機能を計画している兆候が見られます。

この情報は、ユーザーが AI を使用して独自の絵文字を生成できるようになると主張する別のレポートと一致していますが、画像生成機能には追加の可能性があります。

事情に詳しい関係者によると、Apple の Notes アプリケーションのリリース前バージョンにも生成ツールへの参照が含まれているが、このツールが Generative Playground アプリの場合のようにテキストや画像を生成するのかどうかは不明だという。

ノートにはAIによる書き起こしと要約機能が追加され、数学ノートも搭載される。

Appleは、iOS 18およびmacOS 15でデビューする予定の組み込みNotesアプリケーションに大幅な機能強化を準備しています。更新されたNotesでは、アプリ内オーディオ録音、オーディオ文字起こし、LLMを利用した要約がサポートされます。

音声メモの録音機能と灰色の背景に「音声メモ iOS 18」というテキストが表示された iPhone 画面。

iOS 18のメモアプリは、アプリ内での音声録音、文字起こし、要約をサポートします。

音声録音、書き起こし、テキストベースの要約はすべて、ユーザーが追加した他の資料と同様に、1つのノート内で利用できます。つまり、例えば、講義や会議全体の録音を、ホワイトボードの写真やテキストも含めて1つのノートにまとめることが可能です。

これらの機能により、Notesは真のパワーアップを果たし、学生からビジネスプロフェッショナルまで、あらゆる人にとって頼りになるアプリとなるでしょう。音声文字変換や要約機能の追加により、AppleのNotesアプリは、MicrosoftのOneNoteやOtterといった競合製品に対して、より優位な立場を築くことができるでしょう。

アプリケーション レベルでのオーディオ録音のサポート、AI を活用したオーディオの書き起こしおよび要約機能により、Notes アプリは大幅に改善されますが、Apple が取り組んでいるのはそれだけではありません。

Math Notes — AIを活用してグラフを作成し、方程式を解きます

メモアプリに「Math Notes」という全く新しい機能が追加されます。これにより、正確な数学表記がサポートされ、Appleの新しいGreyParrot Calculatorアプリとの連携が可能になります。「Math Notes」の機能について、さらに詳しい情報が明らかになりました。

2台のスマートフォンには、中央に黄色のアイコンが付いたメモと電卓アプリが表示されています。1台目の画面には音声録音インターフェースが表示され、2台目の画面には64と表示された電卓が表示されています。

iOS 18のメモアプリは、AI支援による音声文字変換と数学メモのサポートを導入します。

この新機能に詳しい関係者によると、「Math Notes」は数式形式のテキストを認識し、解を提示できるようになるとのことです。また、式のグラフ化機能も開発中であるため、macOS版Grapherアプリに似た機能が「Notes」アプリ内で利用できるようになるかもしれません。

Appleはまた、「キーボード数式予測」と呼ばれる機能の形で、数学関連の入力に重点を置いた機能強化にも取り組んでいます。AppleInsider、この機能により、数式がテキスト入力の一部として認識されれば、いつでも数式を補完できるようになると聞きました。

これはつまり、Apple が現在 iOS で予測テキストやインライン補完を提供しているのと同様の方法で、Notes 内で数式を自動補完するオプションがユーザーに提供されることを意味します。この機能は今年後半には visionOS にも導入される予定です。

AppleのvisionOSは、入力時に候補を提示する予測テキストモデルであるAppleのTransformer LMとの統合も強化されます。また、音声コマンドUIも再設計されると予想されており、これはAppleが入力関連の機能強化をいかに重視しているかを示す指標となります。

同社はまた、メッセージ、メール、Siriで利用できる「スマートリプライ」と呼ばれる機能を通じて、ユーザー入力の改善も検討している。これにより、ユーザーはAppleのデバイス内Ajax LLMによって瞬時に生成される基本的なテキストベースの返信で、メッセージやメールに返信できるようになる。

AppleのAIとGoogle Geminiなどのサードパーティ製品

AIは事実上あらゆるアプリケーションやデバイスに浸透しています。OpenAIのChatGPTやGoogle GeminiといったAIに特化した製品の普及も著しく進んでいます。

青と白の線が中央で収束し、その上にダイヤモンド形、その下に「Gemini」という文字があります。

Google Geminiは人気のAIツールです

Appleは競合他社に対して優位に立つために独自のAIソフトウェアを開発したが、同社のAIはGoogle Gemini Advancedほど優れているわけではないことがAppleInsiderの調べで分かった。

Googleは5月14日に開催された年次開発者会議Google I/Oで、ユーザーがビデオ形式で質問し、AIが生成した回答や提案を受け取ることができるという、人工知能の興味深い使用例を紹介した。

イベントの一環として、GoogleのAIに壊れたレコードプレーヤーの動画を見せ、なぜ動かないのか尋ねました。すると、ソフトウェアはレコードプレーヤーのモデルを識別し、レコードプレーヤーのバランスが崩れている可能性があり、それが動かない原因であると示唆しました。

同社はまた、人工知能(AI)を用いて動画を生成できるソフトウェア「Google Veo」を発表しました。OpenAIも独自の動画生成モデル「Sora」を開発しています。

AppleのProject GreymatterとAjax LLMはビデオを生成・処理できないため、同社のソフトウェアは消費者向け製品に関する複雑なビデオに関する質問に答えることができません。これが、AppleがGoogleやOpenAIなどの企業と提携し、ライセンス契約を締結してユーザーにより多くの機能を提供しようとした理由でしょう。

明るいオレンジ色のデジタル ガジェット。画面には時刻 1:09 とバッテリー残量 98% が表示され、側面にはボタンが 2 つ付いています。

Appleは、既存のハードウェアに垂直統合されたAIソフトウェアを提供することで、Rabbit R1のような製品と競争するだろう。

Humane AI PinやRabbit R1といった物理的なAIをテーマにした製品と比較すると、AppleのAIプロジェクトは、ユーザーが既に所有しているデバイス上で動作するという大きな利点があります。つまり、ユーザーは人工知能のメリットを享受するために特別なAIデバイスを購入する必要がないということです。

Humane の AI Pin と Rabbit R1 も、未完成または部分的にしか機能しない製品であるとよく考えられており、後者はカスタム Android アプリケーションにすぎないことが明らかになっています。

AppleのAI関連プロジェクトは、iOS 18とmacOS 15の一部として、6月10日の同社の年次WWDCでデビューする予定です。カレンダー、フリーフォーム、システム設定アプリケーションのアップデートも進行中です。