研究テーマ

ビッグデータを社会に生かす【データサイエンス】。AI活用にも有効なスキルを大学で習得するには?

大量のデジタル情報が行き交う社会になり、『データサイエンス』という分野が注目されています。近年コンピューターの計算能力が飛躍的に高まり、スマートフォンが普及し、ほぼすべてインターネットに接続されて利用されるようになるにつれ、人々の動向に関する膨大なビッグデータが集まるようになりました。これを解析し活用するのが、データサイエンスを駆使した分析を仕事とするデータサイエンティストです。今回はデータサイエンスの概要と、ビジネスにおける活用について解説します。

『データサイエンス』によって、社会のビッグデータを意味あるカタチにする

ビッグデータとはその名の通り、膨大な量のデータのこと。今の社会ではインターネットの利用動向、店舗の売り上げ、工場の製造データ、地球の気象データなど、多種多様な種類の巨大なデータが日々蓄積されています。

とても人間には扱いきれないような膨大なデータも、コンピューターで分析すれば、ビジネスや人々の生活に役立つような活用も可能となります。そのような利用を促進するために使われるのがデータサイエンスです。

ビッグデータ分析によって世の中を理解する

データサイエンスは、コンピューターとプログラミングを駆使して、自分の周囲にある状況をデータ分析によってより理解する手段(学問)と考えると良いでしょう。

似た名前の学問に、「コンピューターサイエンス」や「情報工学」があります。コンピューターサイエンスはより広範なコンピューターに関して学びます。情報工学もコンピューターを扱いますが、工学の“ものづくり”を起点としています。

データサイエンスでは、統計学やマーケティング理論なども駆使してデータを理解しやすく分析していきます。コンピューターは、そのビッグデータの分析作業に最大限に活用しますが、そのものを研究する分野ではありません。このデータを深掘りする作業は、データマイニングとも呼ばれています。

人工知能(AI)進化とともに注目度アップ

データサイエンスが注目されるようになった背景にはAIの進化があります。コンピューターの進化により、AIで用いられるマシンラーニング(機械学習)やディープラーニング(深層学習)という手法の精度が高まり、身近に使われるようになってきました。

AIの精度を高めるには、『データサイエンス』の知識とスキルが重要

AIとビッグデータには大きな関連があります。AIは、大量のデータを使って学習させることで、精度が高まっていきます。このとき重要なのは学習に用いるデータの品質です。

そのためには関連データを分析して確度の高いデータにする作業が必要になるのです。これはデータクレンジングと呼ばれる重要な作業であり、ここにデータサイエンスの知識とスキルが求められます。

完成したデータは、一度使えば終わりではなく、その後もさまざまな使われ方をされることがあるので、2次、3次の利用を想定したデータを作るセンスも必要になります。

クラウドを使えば手軽に『データサイエンス』を体験

コンピューターを駆使して解析する

データサイエンスでは、データを整形して活用する目的にコンピューターを駆使します。この作業に用いるデータは、パソコンでよく使われる表計算ツールでは対応できないような膨大な量になります。そこで「Python」や統計データ分析ツールの「R」といったプログラミング言語がよく使われます。大規模なデータベースも扱います。データの中から特定パターンを見つけ出す作業は、統計モデリングと呼ばれています。

機械学習を含め、データの計算や解析には高性能なコンピューター能力が必要になりますが、この計算もクラウドを使って実行するのが主流になってきています。クラウドなら、高価な高速コンピューターを自前でそろえることなく、重い計算をする作業時のみ時間単位でレンタルすることができるので、体験や学習は気軽にできるようになってます。

ちなみに、上で挙げたツールも、無償で利用できるオープンソースソフトです。このように学びやすい環境がそろっているので、学生も社会人が学ぶことも容易になっています。

今後も増えるデータサイエンス需要

ビジネスと直結するデータサイエンス

データサイエンス分野が注目され始めたのは、ビジネスに直結していることも理由のひとつです。最終的に経営者など判断する人に対して、分かりやすいデータとして見せることが求められるためビジネスセンスも問われます。

すでにデータサイエンスは、金融をIT化するフィンテック分野、株価予想、チェーン店の出店計画、気候からの店での品ぞろえ計画、気象予報、農作物生育条件の最適化、最適な広告を見てもらうためのデジタルマーケティング、工場のロボットコーチング、不良品の自動判定、インフラの異常検知、会員制交流サイト(SNS)などネットアクセスの分析、人材の採用や配置など、多様な業種で実際に使われています。

ほかにビッグデータを芸術やデザインに活用することもでき、理系文系を問わず、応用分野は大きく広がりつつあります。

増えるデータサイエンティストの需要

今後はよりIoT(モノのインターネット。あらゆるデバイスがインターネットに接続されること)機器が浸透し、5Gモバイルネットワークや短距離無線通信のZigBee(ジグビー)を使って、より多くのセンサーからデータが収集されるようになります。

それにともない優秀なデータサイエンティストの需要も増え続けるでしょう。データサイエンティストは、ひとつの深い理系知識を追求するタイプではなく、データサイエンスをベースにして広範な知識とビジネスセンスを持った人が求められます。

『データサイエンス』が学べる大学や学部

関連性の高い学部学科は多い

学部や学科の名前に、ずばりデータサイエンスと付いていなくても、分野として関連性が高い学部や学科もあります。例えばコンピューターサイエンス、情報工学、計算機科学、宇宙(地球)科学、医療科学、人工知能、機械学習、深層学習といった各研究分野から、データサイエンスに向いていくことも十分考えられます。

また、理系の研究では、データを採取しコンピューターを使って分析するという作業は日常的に行います。まずそこから入門して、データサイエンスへの興味を深めていくのも良いでしょう。

文系の知識も役に立つので、理系文系を横断した学びも必要

データサイエンスは、基本的には理系分野となるので、数式の知識が必要になります。しかし、データサイエンスが活用される現場は、マーケティングや経営などの分野であることも多く、そのため経済学、心理学、社会学といった学問、統計、金融など、文系知識も役立つ分野でもあります。

新しくデータサイエンス学部や学科が創設されているのは、この領域は「理系、文系と明確に分けずに横断的な研究をする必要性」からという考えによるものといえます。

データサイエンス学部のある大学

・横浜市立大学 データサイエンス学部データサイエンス学科
https://www.yokohama-cu.ac.jp/academics/ds/index.html

・滋賀大学 データサイエンス学部
https://www.ds.shiga-u.ac.jp/

・武蔵野大学 データサイエンス学部データサイエンス学科
https://www.musashino-u.ac.jp/academics/faculty/data_science/

・立正大学 データサイエンス学部(2021年4月設置予定)
http://www.ris.ac.jp/ds/ad/lp1/

ほかにも、新しいデータサイエンスの学部の新設を目指して、一橋大学は2021年4月に商学部に「データ・デザイン・プログラム」を開設します。さらに2021年4月に、大阪工業大学が「情報科学部」で「データサイエンス学科」を新設、中央大学が「経営システム工学科」を「ビジネスデータサイエンス学科」へと名称を変えるなど、データサイエンスの学びを強化しようという機運が高まっています。

またデータサイエンスには、数理科学、物理、生物化学、健康医療、生命農学、社会科学などといった学問も深く関係しています。多様な知識を身につけておけば、データサイエンティストとして社会に出てから役に立つ場面が多いはずです。

『データサイエンス』の活用が期待される分野

経営、統計、観光、都市計画、マーケティング戦略、通信、経済、金融、保険証券、製薬、医療、臨床検査、運輸運送業、商工業全般、研究、芸術、スポーツ

データサイエンティスト協会
https://www.datascientist.or.jp/