EQ-道場

スポーツカートに夢中な管理人が気ままに続けるブログ

今更ビッグデータってどうなの?

既にバズワードになってしまったビッグデータですが(ビッグデータ活用をうたって成功した例は果たしてあるのか?)、政府が国民生活の実態調査に活用する方針を決めたとのこと。

headlines.yahoo.co.jp

 

バズワードは意味も分からずさも専門用語のように言葉を使うことで問題になるので、まずは言葉の定義を確認しましょう。

 

バズワード(英: buzzword)とは、定義が曖昧でありながら、権威付けする専門用語や人目を引くキャッチフレーズ(バズワード - Wikipedia

ビッグデータは、通常、収集 取捨選択、管理、および許容される時間内にデータを処理するために一般的に使用されるソフトウェアツールの能力を超えたサイズのデータ集合を含んでいる(ビッグデータ - Wikipedia

 

Wikipediaからの引用ですが、ビッグデータはちょっと分かりづらいですね。簡単にいうと「取り扱うことが困難な程膨大な量のデータ」となります。

 

膨大な量のデータを扱えたらカッコいいですよね。2012年からのビッグデータブームはただそれだけの理由であらゆる企業が「ビッグデータ」を言い出し、結局何もできずに終わったのですが、、、
結局ビッグデータは情報量が多いため、「何を目的とするか、そのためにどんなデータを集め、どのように処理し目的の情報を抽出するのか」がはっきりしていないといけない(純粋な研究目的であれば別ですが)。ビッグデータが有効に活用された例では、「ビッグデータを使う」という所からスタートするのではなく、「何らかの目的のために情報収集したらビッグデータだった」というケースだけです。
そもそもビッグデータは扱うことが困難なのです。そんな厄介なものを目の前にして「これ、どう使おう?」などと考えても良い使い道なんて見つかるはずはありません。

 

さて、それでは今回の消費実態調査はどうでしょうか?

 

複数の政府関係者によると、政府内では家計調査のデータを収集するための調査自体は残しつつ、民間のビッグデータを取り入れ、旅行やレジャーなどサービスも含め幅広い消費動向を把握することが望ましいと判断している。(上記記事抜粋)

 

 

典型的な「ビッグデータカッコいい」パターンですね。そもそも消費動向ってどうやって算出するのでしょうか。

 

消費者態度指数の作成方法

  1. 「暮らし向き」、「収入の増え方」、「雇用環境」及び「耐久消費財の買い時判断」の4項目に関し今後半年間の見通しについて5段階評価で回答してもらう。
  2. 5段階評価のそれぞれ「良くなる」に(+1)、「やや良くなる」に(+0.75)、「変わらない」に(+0.5)、「やや悪くなる」に(+0.25)、「悪くなる」に(0)の点数を与え、この点数に各回答区分の構成比(%)を乗じ、乗じた結果を合計して、項目ごとに消費者意識指標(原数値)を算出する。
  3. これら4項目の消費者意識指標(原数値)を単純平均して消費者態度指数(原数値)を算出する。なお、平成16年3月調査までは、「物価の上がり方」を加えた5項目の消費者意識指標の単純平均であったが、消費者態度指数については遡及して4項目で算出している。

消費動向調査の解説 - 内閣府

 

定性評価(アンケート)を無理やり定量化しているのですね。ということは、そもそもの問題はアンケート調査をもとに算出していること。消費者動向を、客観的な数値から算出、評価することが目標。だとすると、消費者動向の指数を何を基にどうやって算出したら良いかを研究する所から始めることになるかと思います。

 

現時点で「ビッグデータ」というキーワードがでてきてしまっているのはもうただ格好つけたいだけでしかないですね。未だにこの程度というのは残念なことです。