imott-xxx’s

Information management of the tomorrow

「ビックデータ」とデータ基盤

ビックデータとは

f:id:imott-xxx:20160802134801j:plain

 

この数年、ビックデータというキーワードをよく耳にするようになった。という人も多いと思います。

ビックデータとは、様々な定義があるようですが、簡単にいうと、

 

あるルールにのっとって、集約したデータ

 

のことである。

 

ルールにのっとって。

 

というのが、非常に重要です。

 

データ基盤とは

 

例えば、ある小学校の児童の伸長・体重のデータがあります。

身長・体重の単位・測定した時期が、全て異なっていては、意味がありません。

 

もしも、身長のデータに、

 

150・130.2・12000

 

というデータがあった場合、それらを一定のルールに沿って、変換してあげなくてはいけません。

このルールに沿ってデータを変換し、集約する仕組みを、データ基盤といいます。

 

このデータ基盤。実は、意外と厄介な問題でして、例えば、商品を比較するサイトなどをみても、各メーカー毎に、様々な単位や言葉を使用しているため、単純な比較。というものさえ、なかなか難しいのが現状です。

 

システム開発において、logを埋め込み収集する。というのは、セキュリティ・マーケティングなど、様々な目的で実施されますが、データ基盤として使用しようと思うと、

そのルールの煩雑さに、嫌気がさしてしまうケースも多々あります。

 

これらを解決するために、DMPと呼ばれるソリューションやBIといったソリューションがありますが、高価なソリューションが多く、手軽に。とはいかないようです。

 

しかし、ビックデータというのは、

 

  1. データを集める。
  2. データを見る。
  3. データを加工する。

 

この3つができて、はじめてスタート地点に立てます。

そのための第一歩である、

 

データを集める=データ基盤をつくる。

 

これは、非常に重要です。

データ基盤をつくるためには、システムの知識・データ解析の知識だけでなく、使用する業界のルールや風潮なども理解をしないといけません。

 

「とりあえず集めておけば、あとでどうにでもなる。」

 

という意見も聞きますが、私からすれば、それは「物を捨てられない人」と同じように、ただ、集める。だけで終わってしまうケースが、多いです。

 

しっかりと、目標・目的をもったデータ基盤の構築というのは、真に、データを活用とするうえで、非常に大切な事です。

 

ビックデータ=収益があがる???

f:id:imott-xxx:20160802140524p:plain

 

では、実際に、ビックデータの分析や活用を行って、収益があがるのか?

 

答えは、Noです。

 

データは、あくまで事実を表すものであり、収益をあげるには、データから導き出された結果を、次にどう活かすか?が、非常に重要です。

 

世間で言われるところの、データアナリスト。とは、この「どう活かすか?」に長けた職種であると思います。

 

 

まとめ

・ビックデータは、バズワードである。

・ビックデータそのものは、儲からない。

・ビックデータを扱うには、データ基盤が非常に重要である。

 

私が、データのお話をする際に、よく言葉にするのが、

 

「まずは、己を知る。」

 

己=現在・現実

 

という言い方をします。

 

何かを変えようと思ったとき、そこには、必ず、過去があり、現在があります。

 

そして、未来をよりよくするために、データを活用する。

 

そのためには、まずは、己を知らなくては、変えようがありません。

 

ビックデータというキーワードがよくつかわれるようになって、数年経ちますが、やっとデータ基盤を構築し、スタートに立った。というのが、日本のマーケットの現状ではないかと思われます。

 

今後は、それらをどう活かし、どう変えていくのか?が、非常に重要になってくると思われます。