2018年6月5日火曜日

分析の対象になるビッグデータの種類

 ビッグデータ分析を他の分析と明確に区別する要素がある。それは大量かつ多様なデータを分析することだ。

 従来の分析は、分析に先立って分析モデルを構築するのが一般的だった。そして非常に大規模なデータベースから取得したサンプルデータセットを使って、テストと改善を重ねることで、その分析モデルをトレーニングした。

 今は仮想化やクラウドテクノロジーの進化で、ストレージ容量もサーバの計算能力もスケーラブルになり、分析できるデータ量に制限がほとんどなくなってきた。大量かつ適切なデータに対して、リアルタイムにアクセスして予測分析をするシナリオが現実的になってきたのだ。そのことがビジネスパフォーマンスの改善につながる可能性がある。

 次に示す各種ビッグデータを混在させて分析することで、こうしたチャンスを見いだせる。

  • トランザクションデータ
    • 最新テクノロジーを活用したインフラを使えば、構造化されたトランザクションデータを長期間にわたって大量に取得できる。これにより幅広い種類のトランザクションの分析が可能になる。分析対象は販売時点管理(POS)や電子商取引(EC)の購入履歴データだけではない。インターネットのクリックストリームデータ(ページ遷移データ)をはじめとする、行動に関するトランザクションデータも含む
  • エンドユーザーが生成するデータ
    • メール、ドキュメント、画像、音声、動画ファイルといったエンドユーザーが生成するデータは、一般的に非構造化データに分類される。ブログやWikiに加え、特にソーシャルネットワーキングサービス(SNS)経由で得られるデータも、これに該当する。こうしたデータは、テキスト分析機能を使用して分析を強化する格好の材料となる
  • モバイルデータ
    • インターネット接続機能のあるスマートフォンやタブレットが普及している。これらのデバイス内のアプリケーションは、無数のイベントを追跡できる。製品検索といったアプリケーション内トランザクションに関するイベントから、エンドユーザーの属性やステータスに関するレポートイベントまで幅広い。後者の例は、エンドユーザーの現在地が変わったときに、新しい地理情報を報告することなどだ
  • マシンデータとセンサーデータ
    • 電気、ガス、水道といった社会インフラ向けの「スマートメーター」、学習機能が付いたサーモスタット(温度調節器)の「インテリジェントサーモスタット」、ネットワーク接続型の家電や工場機械設備などのデバイスは、さまざまなデータを生成する。これらのデバイスは、同一ネットワークセグメント内にある他のデバイスと自動的に通信したり、データ分析を支援するバックエンドサーバと通信をしたりするように構成できる

 マシンデータやセンサーデータは、IoT(モノのインターネット)デバイスが出力するデータの代表例だ。こうしたデータを基にした分析モデルは、デバイスが実際に故障する前に問題を特定し、エンジニアにアラートを出すといった動作を継続的に実行するために活用できる。


0 件のコメント:

コメントを投稿