GeminiとOpenAIのアップデートがAppleのAI戦略にどう影響するか

GeminiとOpenAIのアップデートがAppleのAI戦略にどう影響するか

GoogleとOpenAIはAIモデルと機能の大幅なアップデートを発表し、WWDCを前にAppleにとっての競争が激化することになる。

月曜日、OpenAIは革新的なAIモデル「GPT-4o」と全く新しいMacアプリを発表し、火曜日にはGoogleが「Gemini」ソフトウェアの大幅な改良版をプレビューしました。両社は様々な注目すべき機能を披露し、その結果、市場の競争はさらに激化しました。

AppleはAIへの取り組みにおいて大きく遅れをとっているように見えるが、GoogleやOpenAIとの提携は、ユーザーベースに生成型AI機能を提供するための容易な手段となる可能性がある。少なくとも噂では、Appleはそうした道を選ぶ意思があるようだ。

OpenAIのアップデート

OpenAI は最近、さまざまな入力タイプを処理する機能が強化された同社の GPT AI モデルの新しいマルチモーダル バージョンである GPT-4o を発表しました。

GPT-4oは、従来のニューラルネットワークとは異なり、音声、画像、テキストを1つのニューラルネットワークで処理できるため、モデルが大幅に改善されます。製品発表では、速度と言語処理能力の向上も強調されました。

OpenAIのGPT-4oは感情を理解し、伝える能力を持つようになります。同社の最近のイベントでは、チームメンバーがモデルに表情を分析しさせ、ユーザーが表現している具体的な感情を判断させることで、これを実演しました。

ローマ皇帝による主要な建築プロジェクトを比較した棒グラフが表示されたコンピューター画面。カーソルは「コンスタンティヌス」というラベルの付いた棒を指しています。

OpenAIのChatGPTがmacOSで正式に利用可能になりました

音声出力を音声形式で提供する改良された音声モード機能により、GPT-4o は音声のトーンを調整し、ユーザーの要求に応じてロボットのような音声や自然な音声にすることができます。

同社はまた、macOSで利用可能なChatGPTの新しいデスクトップアプリケーションをリリースし、開発者向けに新しいAPIを導入しました。GPT-4oは段階的な展開を通じてユーザーに提供される予定です。

GoogleのGeminiアップデート

Googleは火曜日に開催された開発者会議I/Oにおいて、Geminiモデルの多数の機能強化を発表しました。改良された新しいGoogle Geminiは、より複雑なユーザー入力や画像を、その背後にある文脈を考慮しながら理解できるようになります。

星型の下に線が引かれたGoogle Geminiのロゴ

Google Geminiは生成AIツールです

AIソフトウェアは、新しいコンテキスト認識機能を搭載し、PDF、動画、一連のテキストメッセージなど、画面上のあらゆるものを認識できます。Geminiは情報を収集し、出力を生成することができますが、対応しているのは一部のAndroidデバイスのみです。

たとえば、新しい「Circle to Search」オプションを使用すると、ユーザーは画像内の個々のオブジェクトを選択し、そのオブジェクトに関する Google 検索結果を即座に受け取ることができます。

Android限定のもう一つの機能として、Gemini Advancedを介してYouTube動画やPDFを分析するオプションが提供されます。有料サービスでは、ユーザーは具体的な質問をすることができ、動画やPDFの内容から抽出された回答を受け取ることができます。

Googleのアップデート版Geminiは、長い会話を要約し、文書、画像、動画から重要な情報を抽出する機能を備えており、エンドユーザーにとって大きなメリットとなるはずです。Appleも自社製品で同様の機能の実現を目指しています。

AppleのAI戦略についてこれまでにわかっていること

AI の提供に関しては、Apple は競合他社に明らかに遅れをとっていますが、6 月初旬の iOS 18 の発表により、すべてがすぐに変わる可能性があります。

Appleは1年以上にわたり、Ajaxとして知られる自社製の大規模言語モデル(LLM)の開発に取り組んできました。同社は、この生成AIソフトウェアによって、GoogleとOpenAIが5月初旬に発表した新機能と同様の機能を提供することを目指しています。

Appleは最近のAI推進の一環として、新しいOS全体にAIを活用した複数の機能を導入する予定です。ドキュメントやウェブページの分析、テキストの要約、画像のキャプション作成、レスポンスの生成など、現在開発が進められています。

同社は、既存のコアシステムアプリケーション群に生成AI技術を組み込むことを目指しています。その結果、メモ、Safari、メッセージ、メール、Siri、Spotlight検索といったアプリは、いずれも何らかの形でAIを活用した機能強化を受けることが期待されます。

暗い背景に、カラフルな Siri アイコン、Safari とメッセージのアイコン、Spotlight 検索バーが表示されます。

AppleのAjax LLMはSafari、Spotlight、メッセージアプリを改善する

しかし、実際の機能面では、Appleが実現できたことには限界があります。テスト中のデバイス内AIモデルは、基本的なテキスト分析とデバイス上での基本的な応答生成しかできません。

より高度な機能にはクラウドベースの処理が必要になると思われるため、AppleはOpenAIとのライセンス契約締結を検討していると報じられています。これにより、Appleは自社のデバイス内モデルでは実現できない、様々なAI関連の機能強化を提供できるようになります。

別の噂によると、AppleはユーザーがAIをテーマにしたアプリケーションや他社製品を購入できる「AI App Store」の開設を望んでいるという。理論的には、ユーザーはGemini Advancedなどの製品の有料版を利用する選択肢を持つことになる。

Appleは6月10日に開催される年次世界開発者会議で、新たな生成AI機能を初公開する予定なので、近いうちにAppleのAIへの取り組みをより深く理解できるようになるだろう。