2018年5月29日火曜日

人工知能(AI)インフラ製品、主要ベンダー18社の特徴をつかむ(前編)

 企業が人工知能(AI)インフラを構築しようとする場合、選択肢はたくさんある。多くのITベンダーが、幅広い分野で多種多様な製品やサービスを提供しているからだ。企業がAIアプリケーションを支えるITインフラを構築し、維持するのに役立つ。

 本稿では、企業が効果的なAIインフラを構築し、AIを活用して最大の価値を生み出すには、どのような製品が必要かを素早く大まかに把握できるように、主要なベンダーとその製品の概要をまとめた(前編では11社の製品を紹介する)。

 AIインフラ市場に関する幅広い調査を踏まえ、市場をリードする先進的なベンダーと、歴史のある有力ベンダーの両方に焦点を当てた。参考にした調査データには、TechTargetの調査結果に加え、Gartnerなど、定評のある調査会社のレポートのデータを含む。

 なお、本稿ではGoogleを取り上げていないが、これは同社の機械学習アクセラレータ「Cloud TPUTensor Processing Unit)」が、本稿執筆時点でまだβ版だからだ。

Amazon

 Amazon.comの子会社Amazon Web ServicesAWS)は、社名と同名のクラウドインフラプラットフォームで多くのAIサービスをサポートしている。注目を集めているのが、機械学習サービスの「Amazon SageMaker」だ。SageMakerは、開発者やデータサイエンティストが任意の規模の機械学習モデルを迅速かつ簡単に構築し、トレーニングし、デプロイできるように設計されたフルマネージドサービスだ。単体で、または組み合わせて使用できるモジュールが用意されている。

 SageMakerには「Jupyter」のノートブックインスタンスが含まれる(注1)。ユーザーはこのJupyterノートブックを使って、「Amazon Simple Storage ServiceS3)」に保存されたトレーニングデータの探索や可視化ができる。S3内のデータに直接接続するか、フルマネージド型ETLサービス「AWS Glue」を使用して、「Amazon Relational Database ServiceRDS)」やフルマネージド型NoSQLデータベースサービス「Amazon DynamoDB」、データウェアハウスサービス「Amazon Redshift」からAIデータをS3に移動して、それらのデータをノートブックで分析できる。

※注1Jupyterノートブックとは、ノートブックと呼ばれる形式のファイルにプログラムや実行結果などを記録して管理できる、データ分析ツールのこと。

 SageMakerでは、アルゴリズムの選択に役立つように、最も一般的な12の機械学習アルゴリズムが事前にインストールされている。このサービスは、オープンソースフレームワークの中で最も人気のある部類に入る「TensorFlow」と「Apache MXNet」を実行するよう事前に構成してある。独自のフレームワークを使用することも可能だ。

 SageMakerのユースケースには、広告のターゲティング、債務不履行の予測、産業用IoT(モノのインターネット)、サプライチェーンと需要の予測などがある。

 AWSSageMakerについて、従量制のさまざまな料金モデルを用意している。

Baidu

 中国のインターネット検索企業Baiduは、自社のAI機能をオープンプラットフォームの「ai.baidu.com」でサードパーティー開発者に開放している。このプラットフォームは、画像認識、音声認識、自然言語処理などのためのAPIとソフトウェア開発キットを提供している。同社によると、それらの大部分は無料だ。

 Baiduのオープンソースベンチマーキングツール「DeepBench」は、ディープニューラルネットワークや推論のトレーニングに含まれる基本的な演算のパフォーマンスを測定する。これらの演算は、さまざまなハードウェアプラットフォームでニューラルネットワークライブラリを使って実行される。

 DeepBenchはソースコード管理サービス「GitHub」でリポジトリを公開しており、「ディープニューラルネットワークで使用される基本的な演算で最高のパフォーマンスを発揮するのはどのハードウェアか」という問いに答えを出すことを目指している。

Cloudera

 Clouderaの「Cloudera Altus」は、機械学習とアナリティクスのためのPaaSPlatform as a Service)であり、AIデータカタログおよびデータコンテキストの共有が可能だ。

 Altusは、データエンジニアリング、SQL、ビジネスインテリジェンス(BI)ツールを含んでいる。Clouderaはデータサイエンスツールも追加する計画だ。同社によるとAltusは、さまざまなデータ分析機能において共有データエクスペリエンス(SDX)を実現する。これは、全ての機械学習および分析サービスで使用されるメタデータ(スキーマ、セキュリティ、ガバナンスポリシーなど)の信頼できるソースが1つあるということだ。

 ClouderaAltusSDXにより、分析環境の無秩序な増殖を避けながら、セルフサービスによる分析を可能にするとともに、複雑なデータドリブンアプリケーションを開発できるオンデマンドツールをビジネスユーザーに提供したい考えだ。

 Altusの課金体系はマネージドクラウドサービスの料金に基づく。この料金は、データエンジニアリングに利用する場合で1時間当たり0.08ドルとなっている。

Confluent

 「Apache Kafka」をベースにしたConfluentの「Confluent Platform」は、AIデータから価値を引き出そうする企業向けのストリーミングプラットフォームだ。組織のエッジまでをカバーし、リアルタイムイベントのストリームデータをキャプチャーする。そのため、小売り、物流、製造、金融サービス、ハイテク、メディアといった業種の企業が、オンプレミスでもクラウドでも、このストリーミングプラットフォームを使って、顧客イベントやトランザクション、ユーザーエクスペリエンス、市場の変動にリアルタイムで対応できる。

 Confluent Platformは、企業における詐欺検知、カスタマーエクスペリエンス支援、予測メンテナンスなど、スケーラブルなリアルタイムアプリケーションを構築する際の中枢を担う。このプラットフォームは、こうした特定のユースケースでは、移動中のデータを処理するという特徴がある。これにより、受け身ではなくリアルタイムの処理を実現している。

 Confluent Enterpriseはサブスクリプションで利用できる。

Databricks

 Databricksは「Apache Spark」を生み出したチームによって設立された。Apache Sparkは、ビッグデータエコシステムの中でも非常に活発なオープンソースプロジェクトだ。Databricksが提供する「Unified Analytics Platform」(統合型アナリティクスプラットフォーム)は、データサイエンスとエンジニアリングを1つのワークフローに統合し、データの専門家が生データとアナリティクスのギャップを橋渡しできるよう支援する。

 Databricksプラットフォームは、Apache Sparkアプリケーションがクラウドにおいて、統合されたコラボレーション環境として本番環境を提供する。Databricksは、データ探索、プロトタイピング、データドリブンアプリケーションの運用というプロセスを民主化し、効率化する。

 Databricksプラットフォームの料金は、利用するクラウドサービスプロバイダー、ワークロードの種類、機能によって違ってくる。

Hortonworks

 「Hortonworks Data Platform」(HDP)は、エンタープライズ対応のオープンソースビッグデータプラットフォームだ。リアルタイム顧客アプリケーションのサポートや、分析機能の提供など、保存データのさまざまなユースケースに対応している。

 HDPに含まれるデータ処理エンジンは、SQL、リアルタイムストリーミング、データサイエンス、AIユースケースなどをサポートしている。企業はテキストアナリティクス、画像検出、レコメンデーションシステム、異常検出、コホート/クラスタリング分析、リアルタイムネットワーク分析などのユースケースのために、HDPの一部としてApache Sparkを使用できる。

 そしてHDPは、「IBM Data Science Experience」(DSX)と連携して動作する。DSXは、モデルを大規模かつ迅速にデプロイできるデータサイエンティスト向けのエンタープライズAIプラットフォームだ。HDPDSXの連携の目的は、コラボレーションを容易にするとともに、エンタープライズグレード環境でオープンソースツールを活用することにある。

 DSXは次のようなオープンソースデータサイエンスツールを提供する。これらは全てDSXプラットフォームに統合されている。

  • RStudio」(統計分析用オープンソース開発言語「R」の統合開発環境)
  • Apache Spark
  • Jupyterや「Apache Zeppelin」ノートブック

IBM

 「IBM Power Systems」が提供する「Accelerated Compute Server」(AC922)は、AIやハイパフォーマンスコンピューティング(HPC)、データ分析といったワークロードで求められるパフォーマンスを実現する。

 AC922に搭載した新しいプロセッサ「POWER9」は、「PCI Express 4.0」「OpenCAPI」「NVIDIA NVLINK」といった次世代のI/O技術を提供する。これにより、AC922PCI Express 3.0ベースのx86システムと比べて、プロセッサからアクセラレータへのAIデータの転送が9.5倍高速になっている。

 POWER9プロセッサは、x86プロセッサと比べて最大5.6倍のI/O能力と2倍のスレッド数をサポートする。1620コアの構成で使用でき、AC922の最大コアは44だ。

 AC922は、「CORALプロジェクト」(オークリッジ国立研究所、アルゴンヌ国立研究所、ローレンス・リバモア国立研究所における米国エネルギー省主導のスーパーコンピュータ計画)のバックボーンだ。このスーパーコンピュータは、200ペタフロップス(PFLOPS)を超えるHPCパフォーマンスと、3エクサフロップス(EFLOPS)の"サービスとしてのAI"パフォーマンスの実現に向けて順調に開発が進んでいる。企業はAC922を、ディープラーニングフレームワークやデータベースアクセラレーションのようなデータ集約型ワークロードのデプロイに利用できる。

Informatica

 Informaticaの「Intelligent Data Platform」は、同社の「CLAIRE」(CLoud-scale AI-powered REal-time)エンジンで動作し、エンタープライズAIインフラのデータ管理基盤を提供する。

 CLAIREは、メタデータ、AI、機械学習を組み合わせてインテリジェントな提案を実現し、データ管理プロジェクトの開発とモニタリングを自動化するAI駆動エンジンだ。機械学習を用いてIntelligent Data Platformの全機能のインテリジェンスを促進し、数千のデータベースやファイルセットから類似データを検出し、データ品質の異常を発見し、データ構造を特定し、パフォーマンスの問題を予測、解決する。

 例えば、CLAIREはインテリジェントデータを使って、データを発見し、重複を検出し、個別データ項目をビジネスエンティティにまとめ、複数のデータセットにタグを適用し、ユーザーにデータセットを提案する。データベースや非構造化ファイル全体にわたって自動的にデータドメイン(人、商品、コード、雇用日、場所、連絡先情報など)を推測できる。さらに、データドメインの集合体から成るエンティティ(購入注文や健康記録など)を特定できる。

 Informaticaは価格情報を公表していない。

Information Builders

 Information Buildersの「iWay 8」の安全でスケーラブルな環境は、マイクロサービス、ビッグデータ、データ統合戦略をサポートする。アプリケーションサポートを提供し、サービスおよびイベント指向のブロックチェーンアーキテクチャの基盤を構築する。

 センサーが収集したデータなどのストリームデータ環境では、iWay 8のデータ管理技術がネイティブにビッグデータを取り込み、クリーニングし、整形し、他の情報ソースと統合する。これにより、行動につながるインサイト(洞察)に役立つコンテキストベースのインテリジェンスを企業に提供する。

 「iWay Service Manager」は既存のオペレーションインフラとの統合により、ビジネスデータを結合する。そしてコーディングなしでアプリケーション、サービス、APIを統合し、新しいAIのデータタイプやソースへのアクセスを可能にする。開発者はシンプルな接続定義からビジネスロジック全体まで、適用可能な構成コンポーネントを再利用できる。

Intel

 Intelは新型プロセッサの「Nervana Neural Network ProcessorNervana NNP)」をニューラルネットワーク専用に設計したとしており「ディープラーニングのサポートに必要な柔軟性を企業に提供するとともに、コアハードウェアコンポーネントを可能な限り効率的にすること」をこのプロセッサの目標に掲げている。

 IntelによるとNervana NNPは、処理要素内と高帯域幅メモリ(HBM)の両方でデータをローカルに直接管理できる柔軟性をソフトウェアに提供する。

 テンソルは、インメモリデータが常に、関連するコンピュート要素の最も近くに配置されるように、HBMモジュール間で分割できる。HBMは、コンピュート要素と外部メモリの間で最大1TBの帯域幅をサポートする。ソフトウェアは、どのデータブロックを処理要素内に長時間保存するかを判断できるので、外部メモリとのデータ移動を減らして消費電力を節約できる。

Microsoft

 Microsoftは「Microsoft Azure」で開発者向けにAIプラットフォームを提供している。その中にはツール、サービス、AIインフラが含まれる。このプラットフォームは、開発者が既存アプリケーションをモダナイズする場合にも、新しいAIサービスを開発するために高度な機能を求めている場合にも対応できる。

 「Microsoft Cognitive Services」など構築済みAI製品は、開発者がアプリケーションに最小限のコードで視覚、音声、言語、検索、知識に関する機能を追加するためのインテリジェントAPIの集合体だ。データサイエンスモデリングが不要であるため、アプリケーションは、ユーザーとの自然言語でのコミュニケーションや、画像内の意味のあるコンテンツの特定、声によるユーザーの認識といったタスクを実行できる。

 Microsoftが会話AIの分野で提供する「Azure Bot Service」は、Azureプラットフォームに統合されているプラットフォームであり、人とコンピュータの比較的自然なやりとりを実現できる。

 「Azure Machine Learning」は、データサイエンティストがカスタムAIおよび機械学習モデルを作成するためのクラウドサービスを提供する。

 

0 件のコメント:

コメントを投稿