ウェズリー・ヒリアード
· 4分で読めます
Googleの「AI」写真編集で思い通りの思い出を作ろう
水曜日のGoogle I/O基調講演で、Googleが初めて「AI」という言葉を使ったのはわずか17秒で、100を超えたところでカウントを止めました。同イベントで発表された、同社のほぼすべての製品カテゴリーを網羅するAIツールをすべてご紹介します。
生成的事前学習済みトランスフォーマー(GPT)や大規模言語モデル(LLM)といった用語はバズワードとして頻繁に使われていますが、中でも最もよく使われているのは人工知能(AI)です。投資家や株式市場の専門家にとって非常に重要な用語であり、Googleは2時間にわたるGoogle I/O基調講演で「AI」というフレーズを100回以上使用しました。
Googleは、主要製品ライン15種にわたるAI関連の最新情報を発表したと発表しました。GoogleにとってAIが具体的に何を意味するのかは議論しませんが、基調講演で発表されたAIおよびAI関連技術に関するすべての情報を以下にご紹介します。
GoogleアプリとAndroid AIのアップデートは2023年に予定
- 文章作成のサポート: 電子メール スレッド内のコンテキストの手がかりを使用して、電子メールの作成を支援します。
- Help Me Write は、Google Workspace アプリにも表示されます。ドキュメントで詳細な職務内容の説明を依頼したり、スプレッドシートで犬の散歩代行の仕事のペット名簿を作成したり、スライドのドキュメントに画像を追加して、より魅力的なドキュメントを作成したりできます。
- その他の Help Me Write の例では、架空の物語を書いたり、Gmail スレッドでポットラックを計画したり、スライドショーの発表者メモを作成したりする際にプロンプトが役立つことが示されました。
- Google マップのルート用没入型ビュー:統合された地図データを使用して、ルートの3Dプレビューを表示します。2023年末までに15都市で利用可能になります。
- Google フォト マジック エディタ: オブジェクトを編集して削除したり、部分を移動したり、元の写真には存在しなかったオブジェクトの詳細を追加したりして、写真をコントロールします。
- 生成 AI を使用して、絵文字の壁紙、映画の壁紙、またはオリジナルの AI アートを生成します。
- Pixel Call Assist は、不要な通話をフィルタリングしたり、電話ツリーのプロンプトをタッチ ターゲットとして表示したり、通話品質を向上させたりするツールによって進化し続けています。
Google BardのAIがさらに進化
バード
- コーダーは、コードに関するクエリを Bard などの PaLM 2 搭載チャットボットに入力して、さまざまな言語でメモを求めることができます。
- Bard は 20 を超えるコーディング言語を習得しており、コードの生成、デバッグ、説明を支援できます。
- 生成されたコードは、Bard への追加のクエリで微調整したり、Replit などのシステムにエクスポートしたりすることもできます。
- Bardは回答をGmailまたはGoogleドキュメントにエクスポートできます。今すぐご利用いただけます。
- バード氏は「ツール」、つまりGoogleのファーストパーティアプリとサードパーティシステムへのAPIアクセスを獲得している。一例として、バード氏はGoogleレンズを使って画像にキャプションを作成している。
- Bardは強力な検索ツールとしても機能します。例えば、Bardは特定の興味関心を持つ人が受講すべき授業を説明し、その授業を提供している近隣の大学をGoogleマップ上に表示しました。このデータは表形式に変換され、Googleスプレッドシートにエクスポートできます。
- Bardツールは、Adobe Fireflyをはじめとする多くの人気サービスから提供されます。ライセンスフリーのトレーニングデータを使用して、プロンプト付きの画像を生成します。
生成的な応答による強化された検索
Google検索
- Google 検索では、検索クエリから構築された「AI によるスナップショット」が表示されます。これは緑色でハイライト表示された、明確に区別された領域として表示されます。
- Googleのショッピングデータ、レビューコンテンツなどのウェブから収集された情報などにより、検索機能も向上します。Googleに「都市通勤用の電動自転車を希望する価格帯で」と尋ねると、AIが最適な回答を生成します。
- フォローアップクエリを使用して Google 検索結果を調整します。
- AIツールを搭載したGoogle検索は、ほぼあらゆる検索に対応できる拡張性の高いエクスペリエンスを提供します。Googleは、LLMとAIの拡張を支える強力なバックエンドとして、検索における世界的な優位性を強化しました。
Google Cloudとビジネス
- 多くのAIツールと迅速な統合はGoogle Cloudにも導入される予定です。企業は、今後展開されるGoogleの大規模モデルを活用できるようになります。
- Project Tailwind により、Google Cloud ユーザーは、PaLM 2 にフィードする大量の個人メモやデータを提供できるようになります。これにより、ユーザーが何に取り組んでいるかを認識し、提供されたデータを便利なスニペットとして出力する、パーソナライズされたチャットボットが有効になります。
- ユニバーサル翻訳ツールは、ユーザーにビデオをあらゆる言語に翻訳し、話者の唇の動きを言葉と一致させる機能を提供します。
Googleの今後の機能には、複数の言語モデルが採用されています。主要なモデルはPaLM 2ですが、より大きなデータセット、メモリ、APIを備えたGeminiなどの非公開モデルも、成熟するにつれて一般公開される予定です。
心配しないでください。Googleの「AI」があらゆることをサポートします。
Googleはまた、「世界中の情報を整理し、誰もがアクセスでき、使えるようにする」というミッションステートメントをAIによって拡大すると発表しました。「AIをすべての人にとって役立つものにする」ことで、このミッションをさらに推進します。
Googleにとって「AI」とは、膨大なデータセットで訓練された大規模モデルに基づくあらゆる計算ツールを指すようです。これは、Googleが収集したデータセットの力を活用した機械学習の進化形です。
これらのアップデートは、OpenAIとMicrosoft Bingの提携に続くものです。主要なテクノロジー企業は、「AI」の未来を掌握すべく、特にAppleを除くすべての企業で急速に動き出しています。
Appleの世界開発者会議(WWDC)は6月に開催されます。同社は「AI」のような流行語の使用は避けると思われますが、プライバシーの観点からAppleユーザー向けに何らかの大規模言語モデルやトランスフォーマーが発表されないとしたら、非常に驚きです。