Google Cloudは2018年1月17日、容易に短時間で、ユーザーがカスタム機械学習モデルを構築できるサービス、「Cloud AutoML」を発表した。第1弾として、画像認識を行う「Cloud AutoML Vision」のアルファ提供を開始した。アルファ提供とは限定ユーザーに対して先行的にサービスを提供する段階。申し込みは同社のWebページからできるようになっている。
Cloud AutoMLは、Google Cloudの既存機械学習サービスのいいところ取りをしたようなサービスだ。ユーザーは事実上、訓練用のデータをアップロードするだけで、自らのデータに基づく機械学習をGoogle Cloudに自動実行させ、結果をAPIとして活用できる。
これをあらためて説明すると、次のようになる。
Google Cloudでは現在、機械学習関連サービスで、「Cloud Machine Learning Engine(Cloud ML Engine)」と認識系を中心とした機械学習APIサービスを提供している。後者には、画像認識の「Cloud Vision API」、動画からメタデータを抽出する「Cloud Video Intelligence API」、音声テキスト変換の「Cloud Speech API」、自動翻訳の「Cloud Translation API」、テキストを分析する「Cloud Natural Language API」、求人サイトに機械学習を適用する「Cloud Jobs API」がある。
APIサービスは、文字通りAPIを呼び出すだけで使える。だが、Googleが自社で指定した認識・分類を実現するために自社で用意したデータを使って訓練したものであり、ユーザーが得られるのは汎用的な分類やメタデータにとどまる。
ユーザー/ユーザー組織が、自らのデータを用い、自らの目的のために機械学習を生かそうと思うと、現状ではTensorFlowなどの機械学習ライブラリを直接使うことになる。Google Cloud では、TensorFlowホスティングサービスとしてCloud ML Engineを提供している。Cloud ML Engineは、機械学習を実行しやすくするツールを備えているものの、「データの投入」「モデルの設計」「モデル(パラメーター)のチューニング」「評価」といった作業をユーザー自身が繰り返し実行する必要がある点は変わらない。
今回発表のCloud AutoMLは、こうした作業をほぼ全て「Google Cloudにお任せ」できるサービス。
第1弾のCloud AutoML Visionでは、ユーザーはグラフィカルインタフェースで、訓練データとして画像をアップロード(あるいはGoogle Cloud Storageにおける画像の場所を指定)し、ラベルを付けるだけでよい(一部のラベル付けは、Vision APIに任せることもできる)。あとの工程は、全てCloud AutoMLが実行する。ユーザーが提供した訓練データを使って、「最適な」モデル/パラメーターを見出し、APIとして提供する。
ユーザーはVision APIを使う場合と同様、後は学習結果をAPIとして適用しさえすればいいことになる。
なお、Cloud AutoML Visionでは、2種類の機能を提供するという。1つはシンプルな転移学習によって、「分単位で」パイロットとして使えるレベルのモデルを構築する機能。もう1つはLearning to learnと呼ばれる手法により、「1日以内」に「高精度の」モデルを構築できる機能だ。
Google CloudのAI/MLチーフサイエンティストであるフェイフェイ・リー(Fei-Fei Li)氏は、新サービスが、Google Cloudおよび同氏自身の目指してきた「AIの民主化」を大きく進展させるものだと話した。
「例えば医療診断では、一般的でない病気を的確に診断するニーズが高い」(リー氏)。Cloud AutoMLのようなサービスを使えば、ITの専門家でなくともデータさえあれば、機械学習を容易に活用し、現場で生かすことができるとする。
Cloud AutoMLでは、Google Cloudとしての「最適解」が提示される。基本的にはブラックボックスだ。モデルの精度については、Google Cloudを信じるしかない。Google Cloudは、「より少量のデータ」で「より高い精度」が実現できているとしているが、数値に基づく言及はない。
コストについても、現在のところは「Google Cloudを信じる」しかなさそうだ。課金は、利用したリソース量に基づくという。では、「最適な」モデルが自動的に構築される際に、どれくらいのリソースが使われるのか。これはやってみるまで分からない。同社は、アルファ段階であるため、料金体系については顧客と共に検討していくとも答えている。
今回提供開始したのは画像認識機能だが、今後他のサービスにつながっていくという。例えばVideo Intelligence APIに適用されれば、監視カメラ映像の分析や、映像コンテンツの(例えば番組に登場する人物の)タグ付けに、効果を発揮することが考えられる。
0 件のコメント:
コメントを投稿