覚えておきたいクラウド&データのキホン(第6回) データプラットフォームとは何か?どんなことができるのか?

クラウド・共有

公開日:2022.03.31

 「データプラットフォーム」という言葉をご存じでしょうか。データプラットフォームとは、企業が所有している顧客情報などのデータを蓄積・分析するための基盤のことです。

 データプラットフォームを活用することで、ビジネスはどう変わるのでしょうか?ここでは、データプラットフォームの仕組みや特徴について紹介します。

データプラットフォームとは何か?

 データプラットフォームとは、企業が所有するデータを蓄積・分析する基盤のことです。近年、スマートフォンの浸透やクラウドの普及、IoTの活用といった影響により、膨大な種類・容量のデータ(ビッグデータ)を取得できるようになりました。データプラットフォームを活用することによって、一般的なデータ管理ツールでは処理しきれないデータを扱いやすくなり、より複雑なデータの蓄積や分析を行えるようになります。

データプラットフォームの活用方法

 ビジネスに資するデータ活用のためには、大きく以下4つの流れでデータを取り扱っていきます。データプラットフォームでは、この4つ流れを一気通貫することができます。

分析に必要なデータを集める
 データ分析を行うためには、対象となるデータを集めることが必要です。しかし、企業が扱う多くのデータは、収集経路や取り扱うツールがさまざまです。そのため、サイトへのアクセス数はアクセス解析ツールからログを取得、購買データは販売管理システムから取得するなど、データ収集を仕組み化する必要があります。

データをためる
 収集したデータは、CSVデータのような規則性をもつデータ(構造化データ)の他にも、規則性をもたないテキストや音声、動画、各種ログなどの形式(非構造化データ)も想定されます。これらを、データフォーマットを変えずに格納できるデータレイク(データ貯蔵庫)にためていきます。

集めたデータを加工する
 データレイクに集めたデータは、ETL(Extract :抽出、Transform:変換・加工、Load :書き出し)処理で構造化データに変換・加工して、データウエアハウス(データ保管庫)に渡します。データウエアハウスに保管されたデータから、分析を行うために抽出されたデータはデータマート(データ市場)と呼ばれます。

データを分析する
 ここまでの準備を経て、データを分析していきます。分析に当たっては、データ単体では分かりづらいため、BIツールなどを用いてグラフやチャート化するなど、誰でも理解できるように表示を組み替えます。

データプラットフォームのメリット

 データプラットフォームを利用することで、以下3つのメリットが得られます。

メリット1:スムーズなデータ分析ができる
 データプラットフォームを利用していない場合、データが分析しやすいように管理されていないので、必要なデータがどこにあるか分かりづらく、データを集めるだけで時間がかかってしまいます。データプラットフォームは、分析を行うことを念頭にデータが管理されるため、分析の目的が決まれば、すぐに必要なデータを集めて分析を始めることができます。

メリット2:組織を横断したデータ分析ができる
 データプラットフォームを利用することで、企業は組織を横断したデータの収集や分析をできるようになります。例えば、実店舗での購買データとデジタルでの購買データを比較して市場の未来予測をするなどです。それによって、データに基づいた事業判断の精度をより高めることができます。

メリット3:カスタマイズができる
 データプラットフォームは、自社のデータ分析に必要なさまざまな機能をカスタマイズできます。データ管理のノウハウがない企業のトライアルでは、小規模かつ低コストでのスモールスタートも可能になります。

データプラットフォームの機能例

 データプラットフォームの機能例を大手IT企業サービスから紹介します。

Amazonのデータプラットフォーム
 インターネット通販で有名なAmazonもデータプラットフォームを提供しており、データプラットフォームで全てのステップが完結できます。

・AWS Lake Formation:データレイクを短期間で構築できるサービス
・Amazon Redshift:高速なデータウエアハウス
・Amazon QuickSight:大規模なデータ量・ユーザー数に対応するBIツール

Microsoftのデータプラットフォーム
 Microsoftのデータプラットフォームは「Microsoft Azure」を中心に用意されており、Google、Amazon同様に全てのステップを一気通貫で実行できます。

・Azure Data Lake Storage:ビッグデータの分析に最適化されたデータレイク
・Azure Synapse Analytics:データ統合、データウエアハウス、ビッグデータ分析が統合されたサービス
・Power BI:エンタープライズ規模にも対応可能なBIツール

Googleのデータプラットフォーム
 Googleのデータプラットフォームは「Google Cloud Platform(GCP)」という名称で提供されており、これまで説明をした「データの収集・蓄積・加工・分析」という流れを1つのプラットフォームで完結できます。機能としては以下のようなものがあります。

・Cloud Storage:データレイクとしても利用可能なストレージ
・BigQuery:フルマネージド型の分析データウエアハウス
・Google Data Portal:無料で使えるBIツール

まとめ

 ビジネスを進めていくうえで、各種データを収集・分析し、経営戦略に生かすことは不可欠といえます。データの収集・分析に不安を抱えている際は、データプラットフォームの導入を視野に入れましょう。

※掲載している情報は、記事執筆時点のものです

執筆= NTT西日本

【MT】

あわせて読みたい記事

連載バックナンバー

覚えておきたいクラウド&データのキホン