ピックアップ
データサイエンティストとは?資格(プログラミング等のスキル)・年収・将来性を解説!

出典:PEXELS

あなたはデータサイエンティストという職業を聞いたことはありますか?

データサイエンティストとはデータを分析し、実務の場で分析結果から導かれた手法を活用することで企業に貢献する職業です。
時には利益を飛躍的に成長させることもあります。

企業にとってデータサイエンティストは重要な存在であり、その価値は計り知れません。

本記事ではデータサイエンティストに必要な資格(スキル)から、その年収と将来性についてまとめました。

本記事を読めば、データサイエンティストの全体像と具体的な内容を理解することができます。

データサイエンティストとは?

出典:PEXELS

データサイエンティストと聞いて具体的なイメージを持つことはできますか?
聞き慣れない方には難しいかもしれません。

ここではデータサイエンティストとは何をするのか?
資格は必要なのか?
その年収と将来性は?
といったデータサイエンティストの全体像をご紹介します。

データサイエンティストの仕事とは?

データサイエンティストとはこれまでにない新しいタイプのデータ分析の専門家です。

企業が保持・収集しているデータには一貫性のないことが多々あります。
それはデータを収集するまでのプロセスに戦略や一貫性がないことに起因します。

結果的に集まったデータは不完全であったり、分類にばらつきがあったりします。

しかし、このようにデータが不完全であったとしてもそこには貴重な情報が隠れていたりします。

データサイエンティストはそんな不完全かつ膨大なデータを統計解析・ITスキルを駆使して、構造化して整理します。

さらに整理したデータに意味を与え、これらのデータを活用して事業戦略の手法を導きだします。

決して簡単な仕事ではありませんが、客観的なデータの観点から事業戦略を考えられる能力は企業にとってとても大きな意味を持ちます。

データサイエンティストに必要な資格

データサイエンティストは2009年頃に登場しましたが、まだ新しい職業であるために必要な資格などの明確な決まりはまだありません。

しかし、データサイエンティストを名乗る上で世間から必要と考えられている資格はあります。これらを以下に簡単にまとめます。

統計検定

統計に関する知識や活用力を評価する全国統一試験です。

データに基づいて客観的に判断し、科学的に問題を解決する能力は、仕事や研究をするための21世紀型スキルとして国際社会で広く認められています。

日本統計学会は、中高生・大学生・職業人を対象に、各レベルに応じて体系的に国際通用性のある統計活用能力評価システムを研究開発し、統計検定として資格認定します。

引用:統計検定 Japan Statistical Society Certificate

データサイエンティストを目指す方は大学1・2年生程度の統計力が試される統計検定2級から勉強を始めることをおすすめします。

オラクルマスター(ORACLE MASTER)

オラクルマスターはOracle社が提供するリレーショナルデータベース製品「Oracle Database」に関連した資格です。

オラクルマスターを取得すると、Oracle Databaseを用いたデータベースの構築、管理、保守・運用までを行える技術者として認定されます。

また、Oracleの名からもわかる通りその知名度は非常に高く、海外でも通用します。
そのため多くの企業で評価されやすい人気資格でもあります。

オープンソースデータベース技術者認定資格(OSS-DB技術者認定資格)

特定非営利活動法人エルピーアイジャパン(LPI-Japan)が、オープンソースデータベース(OSS-DB)に関する技術力と知識を、公平かつ厳正に、中立的な立場で認定するIT技術者認定資格です。

引用:LPI-JAPAN OSS-DB

この他にも基本情報技術者試験、応用情報技術者試験、情報処理技術者試験、アクチュアリー資格試験(数学)、Verified Certificate (Machine Learning)などがあります。

データサイエンティストの年収

データサイエンティストの年収は約250万円〜1,000万円と幅があります。

なぜここまで幅に開きがあるかと言うと、まだ明確な資格がないことからも能力を測ることができないことに関係があるのかもしれません。

会計士や弁護士など高額な給与が与えられている人たちには明確な資格があります。
しかし、データサイエンティストには資格がありません。

そのためデータサイエンティストと名乗ってもその能力がどれくらいなのかが判断できません。

一方で1,000万円を上回る年収を得ている人もいるわけですが、資格がなくても過去の実績や経験からその能力を大手の企業から判断してもらい報酬を受け取っている、またはフリーランスとして企業と直接交渉している場合が多いでしょう。

データサイエンティストの将来性

21世紀において最もセクシーな職業と言われているデータサイエンティストですが、その将来性はいかがでしょうか?

後述しますが、これからその市場価値は上がるという意見もあれば、一過性のトレンドで終わるのではないかとも言われています。詳しくは「データサイエンティストはいらない?」をお読みください。

 

データサイエンティストが扱うビッグデータ

出典:PEXELS

データサイエンティストはその名前から連想できる通り、データを分析して事業戦略を考える職業です。

ではどのようなデータを、どのように分析し、どのような成果を導き出すのでしょうか?

ビッグデータの定義

狭義のIT用語としては、通常のデータベースでは扱えないほど巨大なデータのこと。
具体的なデータ量がどのくらいなのかは、新しい概念でもあり、定義されていないが、数百テラバイトペタバイト以上を指すことが多い。

ビッグデータを定義する要素として3Vがあげられる。
ペタバイトやエクサバイト級の巨大なデータ量(Volume)だけではなく、これまでと比較にならない、その発生頻度(Velocity)とデータの多様性(Variety)が揃っていることが従来との違いといわれている。

データの発生元は、フェイスブックやツィッターなどのSNS上で日々大量に発信される情報やスマートフォンのGPS情報などが挙げられる。
今後IPv6が普及し、家電製品を始めとするあらゆる製品にIPアドレスが振られるようになれば、各製品のセンサー情報、監視カメラなどの情報も含め、爆発的なデータが発生する。

これにより、人々の個別の行動パターンをこれまで以上に詳細にリアルタイムに解析することができるようになり、渋滞解消や省エネルギーなど社会的・環境的な課題の解決にも役立てることが可能となる。

引用:ITトレンド ビッグデータとは

つまり、ビッグデータとはデータ量(Volume)・データの発生頻度(Velocity)・データの多様性(Variety)が同居し、その活用次第でこれまで解決することのできなかった課題を解決するきっかけとなるデータのことです。

ビッグデータの質的側面

ビッグデータはその量よりも、どのようなデータから構成されているか、もしくはそのデータをどのように活用できるかといった質的側面が重要になってきます。
量が多い=ビッグデータではないということです。

上述のビッグデータの定義でもご説明した通り、その発生頻度(Velocity)とデータの多様性(Variety)をどう扱うかが重要です

また、ビッグデータは一部でAny Data(エニイデータ)とも呼ばれています。

直訳すれば「どんなデータ」ですが、実際には「どんな意味を持つかはデータを扱う者次第」と認識する方が適切です。

ビッグデータの活用事例

スシロー

皿にICタグをとりつけ、レーンに流れる寿司の鮮度や売上状況を管理し売上向上

スシローはすべての寿司皿にICタグをとりつけ、レーンに流れる寿司の鮮度や売上状況を管理しています。

どの店で、いつどんな寿司がレーンに流されいつ食べられたのか、どのテーブルでいつどんな商品が注文されたのかなどのデータを毎年10億件以上蓄積することで、需要を予測し、レーンに流すネタや量をコントロールしています。

スシローのケースのように需要を予測することは、ビッグデータの代表的な使い方のひとつと言えます。需要を予測するということは、機会の獲得無駄コストの削減につながるため、直接的に利益に跳ね返ります。

引用:LISKUL ビッグデータ活用事例15選| 売上向上・コスト削減方法とは

ICタグの活用によるビッグデータの活用事例です。

費用を抑え、売り上げを上げるとても効果的にビッグデータが活用されています。

ホームセンター

従業員の配置を調整して売り上げ15%アップ

ホームセンターの売り上げデータと従業員の行動データや、商品の陳列データを蓄積したところ、顧客単価の高いスポットの特定に成功しました。

そしてそのスポットに従業員を重点配備したところ、売り上げが15%もアップしたという、まさに予測通りの結果となったそうです。

引用:LISKUL ビッグデータ活用事例15選| 売上向上・コスト削減方法とは

この事例で活用されたビッグデータはホームセンターにおけるヒト(顧客と従業員の行動)とモノ(商品の陳列データ)です。

費用を抑えてはいませんが、現状の改善による売り上げ向上に繋げた事例です。

コールセンター

休憩中のスタッフ同士の雑談を増やして売り上げ27%アップ

受注率の異なるコールセンターのスタッフにセンサーを取り付けてデータを検証したところ、受注率の高いコールセンターのスタッフの方が低いコールセンターのスタッフよりも休憩中の活動が活発だということが判明しました。

また休憩中にスーパーバイザーがスタッフに声をかけていくとスタッフの雑談が盛り上がるということもわかりました。

そこで休憩中にコミュニケーションを活性化させるような施策を1年間実施したところ、コールセンターの売り上げが27%増加したとのことです。

引用:LISKUL ビッグデータ活用事例15選| 売上向上・コスト削減方法とは

こちらはヒト(コールセンターのスタッフ)のビッグデータ活用事例です。

売り上げの向上もさることながら、コミュニケーションの活性化によるスタッフの仕事に対する満足度の向上にも繋がっているかもしれません。

農業

石川県羽咋市:農業で人工衛星の画像データを活用して収益アップ

石川県の中部に位置する羽咋市は、地場の民間企業とともに人工衛星の画像データから米の味の計るシステムを開発しました。

そして画像からタンパク質の含有量を測定することで、一般的に美味いと言われる量のタンパク質を含有した米を安定して収穫できるようになり、低タンパク米をブランド化して販売したところ、収益も増加したとのことです。

引用:LISKUL ビッグデータ活用事例15選| 売上向上・コスト削減方法とは

アグリテックにおけるビッグデータの活用事例です。

この他にも世界のアグリテック・スタートアップ5選によると、天気や環境、トラック、人などのビッグデータがアグリテックで活用されています。

以上の他にもこちらの記事(今更聞けないビッグデータの基礎と活用事例10選)は業界別に事例が紹介されているので参考になります。

データサイエンティストはいらない?


出典:PEXELS

データサイエンティストの発端はビッグデータが登場したことに関係します。

ビッグデータによりこれまで解決することのできなかった課題が解決されるようになりました。
この課題解決に繋がるビッグデータを扱っていたのがデータサイエンティストです。

誇大な言い方ですが、逆説的に言うならデータサイエンティストしかビッグデータを扱えませんでした。

それゆえにデータサイエンティストは、21世紀において最もセクシーな職業と言われるまでになりました。

データサイエンティストは一般に、高度な統計解析ツールを使いこなし、大量のデータを収集、加工、分析してビジネスに生かす職種とされる。2009年2月、米グーグル チーフエコノミストのハル・バリアン氏は「今後10年で最もセクシーな職業は統計家だ」と発言。さらに、米ハーバード・ビジネス・レビューの2012年10月号は、データサイエンティストを「21世紀で最もセクシーな職業」と表現した。

引用:IT PRO データサイエンティストって何なのさ

しかし、一部の方々の間ではデータサイエンティストはいらないとも言われています。

なぜこのように言われるようになったのでしょうか?ここではその理由をご説明します。

データサイエンティストのスキルを持つ人はいない?

「セクシー」として取り上げられたデータサイエンティストは,多くの人が就きたい職業として注目を浴びることになりました。
ビッグデータというキーワードもそれ以前から流行していましたので,企業がデータ分析できる人材を探す時期ともマッチしていました。
ふだんデータに関わることのあるエンジニアやマーケッターだけでなく,さまざまな人たちがデータサイエンティスト職を志望したのです。

しかし,実際の仕事は泥臭い作業が多く,プログラミング技術も必要です。
これらは,すでにデータ分析を仕事にしている方々からは明確な事実でしたが,志望者の多くは自分のスキルとのギャップに戸惑うことになります。
メディアはデータサイエンティストを注目の職業として取り上げ続けたためバズワード化する一方で,ギャップの激しさを嘲笑して本当のデータサインティストのスキルを持つ人はいない,とまで言われることにもなります。(中略)

技術的な内容に触れていない書籍をたよりにデータサイエンティストを志した方は,残念としか言いようがありません。

引用:データサイエンティスト(本物)は決して幻の職業などではない

21世紀において最もセクシーな職業と言われる裏には、高度なスキルと仕事における泥臭さが必要ということです。

メディアの誇張と志望者の現実とのギャップが「データサイエンティスのスキルを持つ人はいない」、ひいては「データサイエンティストはいらない」と言われるようになった原因です。

AIがデータサイエンティストの代わりになる?

2016年にバズワードとなったAI(Artificial Intelligence:人工知能)ですが、果たしてAIはデータサイエンティストの代わりになるのでしょうか?

結論を先に述べると将来的には考えられますが、すぐにそうなるとは思えません。

なぜなら、AIは過去のデータを蓄積することで、答えを求められた時にそれまで蓄積してきたデータの中から即座に最適解を導きます

一方でデータサイエンティストのように分析したデータに対して新たな意味を与えることは過去のデータから導くことはできないからです。

市場を分析し、消費者のニーズを理解し、データからニーズに対応できるように対策を練る。これはまだAIにはできないことです。

ただし、続きがあります。
あなたはシンギュラリティという言葉をご存じでしょうか?

シンギュラリティとは技術的特異点を意味し、具体的には機械が人間を超える瞬間のことと言われています。

シンギュラリティは2045年に起こると言われ、これは2045年問題とも言われています。

シンギュラリティの後では機械の方が人間よりも知能が高いので、それまでは人間が機械を開発していましたが、機械が機械を開発することになります。

現時点においてAIは人間のようにクリエイティブなことを考えられないので、データサイエンティストの代わりにはなれません。

しかし、シンギュラリティの後では人間以上の知能を持つことになるので、その頃にはAIがデータサイエンティストの代わりになっているかもしれません。

本来のデータサイエンティストは一人で全てを行う

本記事の冒頭で、データサイエンティストは膨大な量のデータを統計学とITスキルを駆使し、データに意味を与え、その上で事業戦略に役立たせるとお伝えしました。

これを3つに分けると、

①データを分析して課題を発見する

②分析したデータに意味を与える

③そのデータから事業戦略を導き出す

つまり、課題発見から課題解決までの一連の流れを一人でこなすことになります。

ただし、データがあるところから始めるか、あるいはデータを集めるところから始めるかは企業によります。

また、データから事業戦略を導い出しても、それを実行するのは上司かもしれません。
しかし一連の流れの重要な部分を担っていることに間違いはありません。

それに①〜③の前後もやることになれば、一人で全てを行っていることになります。

そう考えると起業家に近い部分があるかもしれません。

  • このエントリーをはてなブックマークに追加
  • Pocket
  • LINEで送る

SNSでもご購読できます。

  • カテゴリー