Appleは、「Overton」という社内開発ツールの詳細を公開した。これは、Siriがクエリの結果を決定する方法などの機械学習アプリケーションを監視および改善するためのシステムで、低レベルのタスクを処理し、エンジニアが高レベルの概念に集中できるようにする。
人工知能と機械学習は、システムが文を完全に理解したり、画像を認識したり、Appleの「Project Titan」のような自動運転システムを支援したりするために開発されているため、管理が難しい分野となる可能性があります。機械学習開発の問題は、エンジニアがデータがどのように解析されるかを綿密に検討し、通常のデータに対する例外をどのように管理すべきかを判断しなければならないことです。この作業は、システムがより大規模で高度になるにつれて、ますます困難になるでしょう。
Appleは、 VentureBeatが報じたAppleのエンジニアによる研究論文「Overton」に基づき、その目的のために「Overton」フレームワークを開発しました。Overtonは、エンジニアが提供する高レベルの抽象化を提供することで、AIシステムのトレーニングを自動化するように設計されています。
例えば、オーバートンは「アメリカ合衆国大統領の身長は?」といった、Siri のようなデジタル アシスタントでは解析が難しい質問に対する回答を提供するモデルを生成できます。この種のクエリには複数のデータ パイプラインが必要であり、意図した回答を作成する前に確認すべき部分が多数あります。
通常、エンジニアは、通常とは異なるデータサブセットのきめ細かな品質監視と、前述のマルチコンポーネントパイプラインのサポートに多くの時間を費やします。Overtonの導入により、Appleはエンジニアの作業量を削減し、多くの作業を自動化することで、監視要素をエンジニアに代わって管理することを目指しています。
「ビジョンは、開発者を低レベルの機械学習タスクではなく、高レベルのタスクへと移行させることです」と論文には記されている。「Overtonは、ディープラーニングアーキテクチャを含む従来のモデリングの選択肢の多くを自動化し、エンジニアがデータファイルを操作することでアプリケーションを構築、保守、監視できるようにします。」
オーバートンの特徴の高レベルな図解
さらに、Overtonは「コードを一切書かずに」操作できるような方法で開発されています。Overtonは、AIモデルのトレーニングに使用される入力データを記述するデータペイロードと、モデルが実行する必要があるタスクを記述するモデルタスクからスキーマを作成します。
スキーマは、対象モデルの入力、出力、データフローも定義し、Overton はそれを TensorFlow、CoreML、PyTorch などのさまざまな AI 開発フレームワークにコンパイルして、モデル学習に最適なアーキテクチャを決定します。
Overton は、モデル スライシングなどの手法を使用してサブセットを識別し、バイアスを削減したり、マルチタスク学習を使用してモデルに必要なすべてのタスクを予測したりすることもできます。
これまでのところ、Overton は Apple の研究者にとって価値あるものとなっており、実稼働システムと比較してエラーが 1.7 倍から 2.9 倍減少しました。
「要約すると、Overtonは、アプリケーションの品質監視と改善に重点を置いた、類を見ない機械学習ライフサイクル管理システムです」と論文には記されている。「重要なアイデアは、モデルとデータを分離することであり、これはディープラーニングへのコードフリーアプローチによって実現されています。」
Appleの機械学習への取り組みは、様々な買収を通じて人員と知識基盤を拡大し、ソフトウェア事業の様々な分野に広がっています。最も注目すべきはSiriへの取り組みですが、その研究成果はiOS 13が写真に写った猫や犬を検出する機能など、他の要素にも反映されています。