データサイエンティストとは?活躍分野や誕生の背景をご紹介!

皆様の企業にデータサイエンティストの方はいらっしゃいますでしょうか。

データサイエンティストという言葉が出てきて久しく、このブログを見ていただいている読者の方には耳慣れたワードになっていると思います。

そして近年大きく需要を伸ばしており、今では求める企業の6割が目標人数を確保できなかった、という調査結果も出ています(※)。

※ データサイエンティストの 採用に関するアンケート調査結果

この記事ではデータサイエンティストとは何なのか定義や活躍分野を確認し、データサイエンティストが不足する中でもデータの価値を引き出していくために企業で何ができるのかを考えていきます。

データサイエンティストとは?

データサイエンティストの定義

まず最初にデータサイエンティストについて簡単に確認しておきましょう。

2013年に設立されたデータサイエンティスト協会の定款では下記の通り定義されています。

データサイエンティスト(分析人材)とは、高度に情報化された社会において、日々複雑化及び増大化(ビッグデータ化)するデータを、利用者の利用目的に応じて情報を収集・分析する技術を有し、ビジネスにおいて実行可能な情報を作ることができる者をいう。

出典:データサイエンティスト協会 定款 第2条
https://www.datascientist.or.jp/about/statute/

データサイエンティストの活躍分野

続いてデータサイエンティストがどのような分野で仕事をしているかを見ていきましょう。

社内ではデータ管理業務、商品やサービスの企画開発などが挙げられます。全ての業務データを管理して一般ユーザに使いやすくする、膨大な売上データやユーザの声を多角的に分析して新しいモノを作り出す補助をする、といったことです。

上記のことを実施するために、データサイエンティストは業務やデータの意味についてよく知っている必要があります。

社外サービスではどうでしょうか。シンクタンクやコンサルタントではお客様の持つさまざまなデータを分析し、今後の経営の方向性や戦略を提案するという業務があります。こちらではお客様の業務や業界について深く広い見識を持っていることが重要です。

またデータサイエンティストが必ずといっていいほど貢献している分野が、機械学習深層学習です。大量データをAIに読み込ませ、人間の認知する正解、またはそれに近い結果を機械が自ら導き出すための仕組みを作成することが目的です。用途によって社内外サービスとして展開することができそうです。

データサイエンティストとデータアナリストの違いとは?

データサイエンティストに似た職業としてしばしデータアナリストが挙げられます。

両者には明確な領域の線引きがなく、ともに数学・統計・プログラミングといったスキルを用いてデータを収集・分析し、そこから得た知見を企業に提供する職業です。分けるとするならば、データサイエンティストは上記に加え機械学習を含む人工知能(AI)エンジニアの側面も持ち合わせています。

ちなみにデータサイエンティストは21世紀で最もセクシーな職業とも言われており、データ活用に注目が集まる今、業種業界にとらわれることなくあらゆる分野での重要性が高まっています。

I keep saying that the sexy job in the next 10 years will be statisticians,” said Hal Varian, chief economist at Google.

出典:「The New York Times」2009年8月5日
https://www.nytimes.com/2009/08/06/technology/06stats.html?searchResultPosition=1

データサイエンティスト誕生の背景

データサイエンティストとビッグデータ

それではどのようにしてデータサイエンティストという職務が生まれたのでしょう。それには2010年初頭から話題に上り始めたビッグデータが関係しています。

ビッグデータとはその名の通りのものです。少し具体的に言うと、社内外から集められたデータにプラスして従来は記録もされず捨てていたデータも取り込み、それまでのデータ管理システムの能力では扱いきれないほどの大きなデータのことを指します。

そしてこの巨大なデータを活用して関連性を見出し、役立つ指標を探し当てることが必要になりました。この作業には多くの情報科学の知識が必要であったため、データサイエンティストと呼ばれるようになったようです。

ビッグデータで何ができる?今後はどうなっていくの?

2020年8月24日

プログラミング言語の進化

プログラミング言語の進化もデータサイエンティストの活躍の場を広げる一因になっていると考えられます。

たとえば以前から使われていたPythonはAIやRPA開発が行われるようになってからさらに有名になりました。またRは統計分析の仕組みを構築することにかけて独自の立場を確立しています。その他にも新しい言語が次々と出てきています。

これらの言語に特徴的なのは大規模なコミュニティです。実際の利用者が互いに理解を深め、機能を増強させ続けることで使いやすく発展する仕組みができています。

自社のデータの価値を引き出すために

これまでに述べてきたようにデータサイエンティストに求められるのは、自社やお客様業務とその業界の素養やビッグデータの分析や統計を駆使できる能力、そしてプログラミングの経験と多岐に渡ります。

これらを満たす担当者を自社内で見つけることは容易ではありません。

データサイエンティストが不足する中、それでも自社が持つデータの価値を引き出していくためには、横のつながりの強化が有効と考えられます。

データサイエンティストにすべてを任せるのではなく、それぞれの能力を持つ社内の業務担当者同士がコミュニケーションを図り、役割を補い合うことでデータサイエンティストと同等か、人数が多い分それ以上の成果を上げる可能性もあるのではないでしょうか。

おわりに

今回はデータサイエンティストについて考えてみました。現在、「IoT」「DX」といったキーワードがクローズアップされ、ますますデータの活用や分析が重要視されています。今後、データサイエンティストという職務はますます重宝されていくことでしょう。

データ分析業務に役立つBIツール・WebQuery/Excellent

株式会社システムコンサルタントではBIツール・WebQuery/Excellentを扱っており、多くの企業様の分析業務でご利用いただいております。

データサイエンティストのデータ分析業務でももしかしたらお役に立てる場面があるかもしれません。 ご興味がある方は↓からツールの詳細をご確認ください。

製品ロゴ

データサイエンティストが不足する今、自社でどう対応するか?

2020年7月28日