データサイエンス概論

今は未経験・・・でもデータサイエンティストに転職して活躍したい!

本記事を読むことで、未経験からデータサイエンティストへの転職のロードマップを知る事ができます。データサイエンティストとして身につけておくべきスキルとその学習方法を説明しますので、キャリアアップの指針としてくだされば幸いです。

1データサイエンスとは

「データサイエンス」とは、統計学、機械学習や人工知能(AI)、データ分析など色々な領域の手法を組み合わせて、大量のデータの中から企業や私達の生活にある
様々な課題解決につながる価値ある情報を発見し、アクションにつなげる研究分野です。

 

企業の経済活動や、私達の日常生活の中の購買行動、普段使用しているコンピュータやスマートフォンなど、現代社会はデータに溢れています。日々蓄積される膨大で複雑なデータは「ビッグデータ」と呼ばれ、このビッグデータを解析することで、今まで人間の目では見えなかった有益な情報や世の中にある課題に対するソリューションが見出される可能性を秘めています。

2データサイエンス転職の現状

データサイエンスに関わる職種として、「データサイエンティスト」「機械学習エンジニア」の2職種が挙げられます。両方ともITエンジニアの職種としては比較的新しく、最近トレンドとなっているビッグデータや人工知能を取り扱うエンジニアとして注目され、日本だけでなく世界的にも需要が高まっている状況です。

「人工知能に人間の仕事を奪われる」という恐ろしい話もよく耳にしますが、人工知能を構築、制御するエンジニア側に立つことができればそのような不安にとらわれることなく、最先端の技術を扱うエンジニアとして活躍の場は引く手あまたとなるでしょう。

3未経験のデータサイエンス転職求人

大手転職サイト(※1)にて、「データサイエンティスト 未経験」を条件で検索ヒットした求人例を下記にご紹介します。

「未経験」という求人ながら、詳細を確認すると「研修などでの教育、フォローが記載されていない」「実務は未経験でも数学的知識は必須」など、「全くの未経験、必要スキルなし」という事ではなかなか難しい職種であると言えます。

(※1)indeedインディード https://jp.indeed.com/

 2022/6/25時点の求人より

A社求人 データサイエンティスト/未経験

【仕事内容】

クライアントデータの分析結果をもとに課題解決に繋がるコンサル・開発を手掛ける仕事。

様々なビジネスシーンにおいて、データの力でデジタルトランスフォーメーションを推進するのが弊社のミッション。未経験からでもデータサイエンティストを目指せる環境を提供し、最短2ヶ月で実務につける独自メソッドでサポートします。

【具体的な業務内容例】

①各種データ分析

データを構造化・整理し、有効な情報となるように解析結果を導き出し結果を基に企業課題の解決方法の提案や意思決定を支援します。

 

②データ分析の基盤構築

データを収集・蓄積するために必要なデータ分析基盤の構築を行います。クライアント先で導入されているシステムと基盤を連携させるシステム開発に携わるケースもあります。

 

③クライアントへのアプローチ

分析した結果からデータをどう活用していくかなどをご提案。結果をわかりやすく伝えるコミュニケーションスキルが大切です。

 

【キャリアパス】

まずはジュニアメンバーとしてスキル・経験を積んでいただきます。

シニアメンバーへと成長後、マネージャーとしてのキャリアプランや、より特定分野のスキルを強くしていくなど、中長期に多彩な方面で力を伸ばしていくことが可能です。

雇用形態 正社員、契約社員
給与 275,000~500,000 (月給)
学歴 学士(必須)
職歴 データサイエンティスト: 1年 (望ましい)
エンジニア: 1年 (望ましい)

 

B社求人 データサイエンティスト(未経験・第二新卒OK)

【仕事内容】

ビジネス課題を解決する数学モデルの選定を中心に、データサイエンスプロジェクトの推進をお任せします。

【応募資格・条件】

データサイエンティストに求められるスキルセット「ビジネス力」「データサイエンス力」「データエンジニアリング力」のうち、特に「データサイエンス力(情報処理、人工知能、統計学などの情報科学系の知恵を理解し、使う力)」をお持ちの方を求めています。

[必須]

線形代数や微分積分・確率統計の基礎的知識、もしくは機械学習や数理最適化などの分析の基礎的知識

[歓迎]

SQLを用いたデータ抽出・集計の経験
・データ分析/データ活用/機械学習/数理最適化における業務適用・研究開発などの業務経験

データ分析のプロジェクトマネジメント経験

分析技術者、業務知識保有者などと協業しながら、お客様のデータ分析を実行し、結果報告とともに業務改善やシステム構築を提案、実現支援を行った経験を指します。

・SQL、pythonの実装経験またはDWH/BIツール(Tableauなど)を用いたデータ分析経験

4データサイエンス転職に必要なスキル

転職求人情報からも分かる通り、データサイエンスに関わるエンジニアは、幅広い専門知識とスキルが求められます。データサイエンス転職に向けて、自身でスキルを習得しておくことが望ましいスキルを説明していきます。

データサイエンスを学習する未経験者

・統計学や数学に関するスキル

 データを扱いやすい形に加工し、分析するには数学の知識、特に統計学と微分、線形代数の知識が不可欠です。

 

確率・統計学は、データの持つ性質を調べて活用目的に応じてデータを分析するときに使われる学問です。「大量のデータを扱いやすく分類整理すること」これはデータサイエンスにとっては最重要なプロセスとなり、確率・統計の数学知識は必須のものとなります。

微分を理解できていれば、「ある値が最小(最大)になる部分を計算することができる」様になります。

微分とは、現在の状況がどのくらいの速さで変化をしているのか、または変化をしていないのか、を数値化して表現することができます。このことを利用して、将来どのような変化をしてどのような数値になるのか、最小の値、最大の値はどの様になるのか、を詳細に予測することができます。

モデルを作成において最小と最大が求めることが強いモデルを作成できることに繋がります。

線形代数の中でも、特に「行列」が重要となってきます。行列とは「同一の性質を持つ情報の要素を縦×横に並べたもの」であり、データの取り扱いが意味のあるかたまりとして表現できるので取り扱いが容易になり、数値化することで機械(コンピュータ)が計算できるようになるのです。

・データベースの知識

データの収集、加工を行う際にはデータベースからデータを取得するSQLをはじめ、専門的なスキルが必要です。

・プログラミングスキル

データベースから取得したデータを加工分析する際に、モデルをプログラミングしながらデータの中から有益な情報を引き出していくことになります。

Python」は機械学習によく用いられるプログラム言語ですが、実は難易度はそこまで高くないため学びやすいです。

5スキル習得におすすめの学習教材

続いて、オススメの学習方法を学習参考書やオンライン講座と合わせてご紹介します。

【線形代数】

線形代数キャンパス・ゼミ 改訂9 マセマ出版社 

【微分積分】

微分積分キャンパス・ゼミ 改訂7 マセマ出版社

マセマ出版社の参考書は、出版社HPのフレーズ「数が苦 を 数楽 に変える」のとおり、数学を苦手としている方や初学者に非常におすすめできる参考書シリーズです。図解も豊富にあり、解答解説の途中式を省略することなく丁寧に解説してくれています。

【確率・統計学】

完全独習 統計学入門 ダイヤモンド社

こちらの書籍は、統計学という数学の本ながら、数学記号や数学公式を極限まで使用せずに書かれており(使っているのは中学数学のみ)具体例を交えながら、なぜそうなるのかを教えてくれます。

統計Web

こちらは書籍ではなくWebメディアになります。Step0からStep3までの章立てになっており、Step0と1まで学習を進めることで、大学で学ぶ統計学の基礎レベルとなる「統計検定2級」の範囲をカバーできる充実度となっています。

数式だけでなく具体例を交えて解説されており、演習問題にもすぐに取り組む事ができるので、前述の「統計学入門」と合わせて非常にオススメです。

【データサイエンス全般】

オンライン教育プラットフォーム「Udemyで開催されている講義です。

・データサイエンティストを目指すあなたへ〜データサイエンス25時間ブートキャンプ〜 

機械学習や人工知能に関するビジネス上の課題を、回帰分析などの分析手法を用いて解いていきます。「Python」ライブラリのスキルも習得できます。

6将来的なデータサイエンス転職のキャリアパス

前章でご説明したとおり、データサイエンスに関わる職種には、複数の専門知識、スキルが求められるため全くの未経験からの就職は難しいです。

データサイエンティストを将来のキャリア目標として、知識と実務経験を積み重ねるためにまずは「Web開発エンジニア」「データマイニングエンジニア」「データベースエンジニア」のITエンジニアに転職することをおすすめします。

「Web開発エンジニア」であれば、顧客のビジネス上の課題を解決するシステム開発が主な仕事となりますので、ニーズ分析や課題に対するソリューション提案、そして要件仕様通りのシステムを開発する、といった経験を積むことができます。

データサイエンティストでは「Python」というプログラミング言語を使う場面が多く、データを処理させる際のアルゴリズム、つまり解を導き出すまでの筋道や計算手順を組み立てる能力と、そのアルゴリズムにそってプログラミングする能力は必須となります。

機械学習用の機能を詰め合わせたライブラリを活用することも同時に必要とされるスキルです。

「データマイニングエンジニア」や「データベースエンジニア」であれば、日常的に大量のデータを取り扱う仕事となるため、データサイエンティストと距離の近い職種であると言えます。データベース構築のスキルやデータ抽出、データ加工の経験は、データサイエンティストに転職する際の強力な武器となります。

これらの職種で実務経験を積む事ができれば、データサイエンティストへの転職市場での価値を高めることができるでしょう。

おわりに

経済産業省の調査(※2)によると、従来のITシステム受託開発、保守・運用といったサービスは、2020年以降は減少していくと見られています。一方で、ビッグデータ、人工知能やクラウドなどの最先端技術領域は、日本だけでなく世界中で需要が高まり、2020年代後半にはITサービス市場の過半数を占めるようになると予測されています。

これら最先端領域に関しては今後も大きな成長エリアであり、まだまだ業務経験者、エンジニアが少ない今、将来を見据えて積極的に経験を積んでおくことはご自身のキャリアを考える上で強力な武器、アドバンテージとなることでしょう。

(2)経済産業省の調査https://www.meti.go.jp/shingikai/economy/daiyoji_sangyo_skill/pdf/001_s03_00.pdf