「データ」は21世紀の石油と呼ばれているほど重要視されています。そのデータを分析して社会やビジネスを動かしていこうというのがデータドリブンです。今回は、データサイエンスを学ぶものが知っておくべきキーワードである「データドリブン」について解説します。
データを使って社会やビジネスを動かすとは
社会やビジネスを動かすときに「データ活用」がポイントになるという考えが広がってきました。それが「データドリブン」です。それは、企業、自治体などが持つデータベースやインターネット上に存在する大量のデータをマイニング(発掘)することで、新しい知見を得て、社会やビジネスにおける意思決定、課題解決などに積極的に生かしていこうということです。
もちろんプライバシーの問題から、個人情報などを含むデータを利用する場合は匿名化などの処理を施す必要はありますが、これまで埋もれていたデータを有効活用することで、新しい価値を生み出すことができると期待されています。
ビールの売り上げに関係するのは「おむつ」?
データドリブン、データマイニングの効果を示す例としてよく用いられるのが、「ビールとおむつ」のエピソードです。
皆さん、自分がスーパーマーケットの店長だと思ってください。店長は「ビールの売り上げを伸ばしたい」と考え、売り場を眺めながら「ビールの横に何の商品を置くべきか」と悩んでいます。
最初に思い浮かぶのは、ビールと一緒に食べる「おつまみ」でしょうか。枝豆、ソーセージ、ピーナツ、スルメなどなど、ビールがおいしくなるメニューはいろいろあります。そのようなおつまみをビールの横に並べたら、ビールの売り上げも伸びるに違いないでしょう。
これは私たち人間の経験や勘に基づく判断といえます。
ところがアメリカのあるスーパーが1990年代にお店のデータを分析したところ、ビールの売り上げに関連していたのは「おむつ」だったそうです。そこから、妻から「赤ちゃんのおむつを買ってきて」と頼まれた夫がスーパーにやってきて、ついでにビールも買っていたらしいという姿が見えてきました。そこで、ビールとオムツを並べて置いたところ、売り上げが伸びたそうです。
この「ビールとおむつ」という相関関係は、データを分析したからこそ見えてきた知見です。このように、経験や勘に頼るだけではなく、データに基づいて社会やビジネスを動かしていこうという考えがデータドリブンというわけです。
データが「21世紀の石油」に例えられるわけ
データドリブンの重要性を示す言葉に「データは21世紀の石油」があります。石油は、ガソリン、灯油、経由などの燃料に使われるだけでなく、プラスチックやビニールなどの化学製品の原料、電力の発電などに用いられます。
もし石油がなかったとしたら私たちの生活はどうだったでしょう。まず自動車や電車、飛行機での移動ができません。移動手段は徒歩、馬車などに頼るしかなく、遠くまで出掛けることはできなかったでしょう。電気も使えないので、スマートフォンもパソコンもゲームもインターネットも使えません。それどころか、冷蔵庫もエアコンもテレビさえない生活になります。つまり、19〜20世紀は「石油によって社会が大きく変革した時代」だったのです。
21世紀において、その石油と同じくらい重要だと捉えられているのが「データ」なのです。これからの時代は、どれだけ多くのデータ、質の高いデータを持っているかが、ビジネスの成否を分けるといって過言ではありません。
膨大なデータが集めやすくなり、いろいろな活用が可能に
データそのものは昔から活用されてきました。では、なぜ最近になって急に重要視されるようになったのでしょうか。
まず膨大なデータが集めやすくなったことが挙げられます。かつては、社会やビジネスに役立つデータの多くは人間が手で入力していました。そのため、データ量を増やすには限界がありました。
しかし現在は、一般の人がブログやSNSなどで情報を発信し、公開されている時代です。また、文字情報だけでなく、写真、動画、音もデータ化され公開されています。
各種センサーから自動的にデータを収集
人間だけではありません。私たちの身の回りにある機器に搭載されたセンサーからも、大量のデータが送信されています。
例えば自動車。車内、車外に搭載されたセンサーからクルマの移動を記録して活用するだけでなく、交通に関する情報、道路状況や渋滞情報、天候や気温などのさまざまなデータが収集されます。
また、手首に装着する時計型のスマートウオッチも、時間を計ったりスマートフォンに到着したメッセージを表示したりするだけでなく、バイタルデータ(活動量、消費カロリー、心拍、体温、睡眠データなど)を計って健康管理に活用できます。
ほかにも、多くの人が携帯するようになっているスマートフォンから人間の移動を分析したり、インターネットの利用履歴から商品の購買活動、興味、関心を分析したりできます。このように、さまざまなデータが自動的に収集、蓄積されるしくみが作られつつあるのです。
そのようにして、日々、膨大な情報(いわゆるビッグデータ)が生み出されているわけです。
大量のデータもAIが自動解析
蓄積されたデータの処理や分析に関するテクノロジーも進歩しています。昔は、データを人間が集計して分析していましたので、データが膨大になると人間の手には負えなくなり、限界を迎えていました。
しかし、今では人工知能(AI)を駆使すれば膨大なデータも短時間で分析可能です。そこから生まれた知見は、ビジネスであれば経営の意思決定、マーケティングや新商品の開発、自治体であれば市民サービスの向上などに有効活用できるはずです。
データサイエンスが求められる時代へ
データドリブンを実現した社会を「データドリブン社会」、会社の経営を「データドリブン経営」、マーケティングを「データドリブンマーケティング」などと呼んでいます。データドリブンを直訳すると「データ駆動」になるので、データ駆動型社会、データ駆動型経営のように呼ぶこともあります。
しかし、その実現にはデータを上手に扱えることが不可欠です。例えば次のような点に注意しなくてはいけません。
- データが大量にあるだけでデータドリブンが実現できるわけではない
- 分析する前に、AIが分析しやすい形にデータを整理する必要がある
- 将来のデータ活用を見越して、データの管理や扱い方を設計する必要がある
これらの問題を解決するにはデータを適切に扱うための能力が必要です。そのためにデータサイエンスという学問があり、これからの社会にはその技術を身に着けたデータサイエンティストが求められるようになってきているのです。
ちなみに、冒頭で紹介したビールとおむつのエピソードにはいろいろなバリエーションが生まれており、どこまで事実なのかが不明な「都市伝説」というのが実際のようです。ただデータマイニングの説明として非常にわかりやすい例であり、いろいろなところで紹介されています。よく見る例ではありますが、事実とは限りませんので注意しましょう。