2022-07-11
データサイエンティストが一過性のブームを過ぎ、企業の業務に定着しつつある昨今、さらなるキャリアアップを模索されている方も多いのではないでしょうか。
ただ、ひと昔前の「分析技術があれば良い」という時代とは違い、今のデータサイエンティストに求められるスキルセットの範囲はとても広いため、何を優先的に身につけていくべきかが分からず、とりあえず自分の好きな領域から……という方も少なくないのではないかと思います。
そこで本稿では、最新のデータサイエンティストの求人動向から、企業が今データサイエンティストに求めているスキルセットを探ります。また、給与待遇の高いデータサイエンティストを「ハイクラス求人」と定義し、ハイクラスな人材を目指すために今後獲得すべきスキルセットについて考察します。
2022年3月時点でオンライン求人サイトに公開されているデータサイエンティストの求人情報全1,050件を対象に、「募集企業の業種」「募集条件」「給与待遇」の情報について分析を行いました。今回の分析ではデータサイエンティストに限った求人検索が可能かつ掲載求人数の多いDODAを使用しています。
各分析における分析軸は、以下のように定義しました。
求人情報はSIer業界が最多。次いでインターネット業界、情報サービス業界が続きます。
図表1 業界別求人件数
出典:DODAにおけるデータサイエンティストの転職・求人情報(2022年4月)をもとにPwCで作成
求人情報全体の平均値は727万円。後段の分析では、950万円以上(上位10%)の求人情報をハイクラス求人、590万~800万円(中位50%)をミドルクラス求人(中位50%)としました。
図表2 給与待遇別の求人件数
出典:DODAにおけるデータサイエンティストの転職・求人情報(2022年4月)をもとにPwCで作成
各求人情報において求められているスキル*を調べたところ、最も多く含まれるのはPythonで、約44%の求人情報に含まれていました。次いで、機械学習(36%)、SQL(29%)が多く含まれており、統計・機械学習やデータベース操作などのスキルセットは普遍的に求められていることが読み取れます。
その他、AWS(15%)、GCP(10%)などのスキルセットも上位に含まれており、いわゆるパブリッククラウドを活用した業務遂行が求められていることがうかがえます。
* 各スキルは求人情報の頻出単語から手動で名寄せ・分類を行い、さらに求人件数に対して出現率1%未満のものは除外。
図表3 スキル別の出現頻度
出典:DODAにおけるデータサイエンティストの転職・求人情報(2022年4月)をもとにPwCで作成
業界ごとに求められているスキルセットの特徴を調べたところ、自動車業界・半導体・精密機器業界では画像認識が、小売業界や監査・税理士法人業界ではBIツールが他業界と比べて頭が抜き出ており、業界ごとのニーズの違いも見えています。
図表4 業界別出現頻度:画像認識
図表5 業界別出現頻度:BIツール
出典:DODAにおけるデータサイエンティストの転職・求人情報(2022年4月)をもとにPwCで作成
各求人情報で求められているスキルセットをハイクラス求人(給与待遇上位10%)・ミドルクラス求人(中位50%)で分類したところ、特にハイクラス求人では以下のスキルセットが多く求められていることが分かりました。尚、給与待遇は業界や会社規模等によっても左右されますが、同観点は今回の分析対象からは除外しています。
①「マーケティング」「コンサルティング」「金融」など、ビジネスや事業ドメインに関する知識や知見
②「自然言語処理」「時系列分析」など、特定領域におけるより専門的な機械学習の経験やスキル
③「データマート」「ETLツール」など、データ基盤領域の経験やスキル
「データサイエンティスト」の求人情報のなかでも、特にハイクラスなデータサイエンティスト人材に求められているのは、従前までのデータサイエンススキル(Python、機械学習 など)から、よりビジネスやエンジニアリング領域にシフトしていることが見受けられます。
図表6 ハイクラス求人/ミドルクラス求人間のスキル別出現頻度
ハイクラス求人 | ミドルクラス求人 | 比率* | |
マーケティング | 13.3% | 4.5% | 3.0 |
金融 | 3.1% | 1.1% | 2.9 |
自然言語処理 | 13.3% | 5.7% | 2.3 |
時系列分析 | 3.1% | 1.4% | 2.2 |
データマート | 1.6% | 0.7% | 2.2 |
ETLツール | 8.6% | 4.3% | 2.0 |
プロジェクトマネジメント | 22.7% | 13.8% | 1.6 |
コンサルティング | 8.6% | 5.9% | 1.5 |
ソフトウェア開発 | 3.1% | 2.2% | 1.5 |
RDB | 2.3% | 1.6% | 1.5 |
機械学習 | 51.6% | 36.7% | 1.4 |
RedShift | 3.1% | 2.5% | 1.2 |
クラウド | 16.4% | 13.8% | 1.2 |
DWH | 7.8% | 6.8% | 1.1 |
SQL | 30.5% | 27.2% | 1.1 |
BIツール | 14.8% | 13.4% | 1.1 |
Go | 3.1% | 2.9% | 1.1 |
深層学習 | 8.6% | 8.4% | 1.0 |
Excel | 2.3% | 2.3% | 1.0 |
PyTorch | 2.3% | 2.5% | 0.9 |
プログラミング | 21.1% | 23.1% | 0.9 |
画像処理 | 7.0% | 7.9% | 0.9 |
Python | 42.2% | 48.0% | 0.9 |
GCP | 10.2% | 11.6% | 0.9 |
Tableau | 4.7% | 5.6% | 0.8 |
BigQuery | 3.9% | 4.7% | 0.8 |
Java | 7.0% | 8.6% | 0.8 |
AWS | 14.1% | 17.4% | 0.8 |
Docker | 1.6% | 2.0% | 0.8 |
Keras | 1.6% | 2.0% | 0.8 |
TensorFlow | 3.1% | 4.1% | 0.8 |
データベース | 10.2% | 14.2% | 0.7 |
Hadoop | 3.1% | 4.8% | 0.6 |
IoT | 1.6% | 2.5% | 0.6 |
アプリ | 1.6% | 2.5% | 0.6 |
JavaScript | 2.3% | 3.9% | 0.6 |
Azure | 3.1% | 5.4% | 0.6 |
Spark | 1.6% | 2.7% | 0.6 |
サーバー | 1.6% | 3.0% | 0.5 |
Linux | 1.6% | 5.6% | 0.3 |
「比率」は「ハイクラス求人での同スキル出現頻度÷ミドルクラス求人での同スキル出現頻度」で算出され、1.0を上回るほどハイクラス求人で多く求められているスキルセット、1.0を下回るほどミドルクラスで多く求められているスキルセットを意味する。
出典:DODAにおけるデータサイエンティストの転職・求人情報(2022年4月)をもとにPwCで作成
分析結果から、一口に「データサイエンティスト」と呼ばれる職種のなかには、実際には大きく2種類の役割が混在していることが見えてきました。すなわち、AI・機械学習のPoC(Proof of Concept: 実証実験)プロジェクト推進を期待される「従来型データサイエンティスト」(以降、従来型)と、AIや機械学習を用いた業務課題の解消、ビジネスへの活用など、より全面的な企画立案・推進を期待される「ビジネスプロデューサー」「ビジネストランスレーター」(以降、企画型)のような役割です。
後者の求人情報を発信するような企業では、既にデータ利活用のPoCはある程度完了しており、今後はAI・機械学習を既存のビジネスに組み込んでいくか、というフェーズにシフトしているのではないかと考えられます。実際に、私たちもクライアントとの会話のなかで、データ利活用に積極的に取り組む企業ほど、「これからは、データ利活用をビジネス課題と紐づけることができ、企画やプロジェクトリードができる人材を育てていかなければならない」ということをよく伺っており、まさに企画型のデータサイエンティストの人材像が当てはまっているように思います。
現状ではどちらも「データサイエンティスト」という職種で表現されていますが、今後は従来型・企画型はそれぞれ異なる用語で表現されていくようになるでしょう(一部企業では「ビジネストランスレーター」という呼称を用いて、既に企画型の求人を始めています)。
伝統的なデータサイエンティスト像にとらわれない開発や基盤整備に特化した求人の登場は、多くの企業でデータサイエンスの社会実装が進められた結果とも言えるでしょう。今後も社会実装の進展に合わせて、新たなデータサイエンティストの需要が現れると想像されます。
T.Kamiya
製造業やインフラ、製薬業界を中心に機械学習や統計解析を活用した戦略策定支援・業務改善のコンサルティングに従事。また価格最適化や画像診断モデルの開発、IoTデバイスの実証実験も経験。
PwC Japanグループでは、データアナリティクス領域でご活躍いただける方を募集しています。本記事に関連する求人情報は以下ページよりご覧ください。
PwCコンサルティング合同会社 中途採用職種一覧・セミナー |
|
(1):テック人材の採用と維持における企業の課題
(2):フィーチャーエンジニアリングとは?
(3):SNSを活用したコロナ禍における人々の心理的変化の洞察
(4):自然言語処理(NLP)の基礎
(5):今、データサイエンティストに求められるスキルは何か?データサイエンティスト求人動向分析
(6):コロナ禍における人流および不動産地価変化による実体経済への影響
(7):「匠」の減少―技能継承におけるAI活用の道しるべ
(8):開示された企業情報におけるESGリスクと財務インパクトの関係性の特定
(9):ビッグデータ分析で特に重要な「非構造化データ」における「コンピュータービジョン(画像解析)」とは
(10):自然言語処理・数理最適化による効率的なリスキリングの支援
(11):スポーツアナリティクスの黎明 サッカーにおけるデータ分析
(12):AIを活用した価格設定支援モデルの検討―外部環境変化に即座に対応可能な次世代型プライシング
(13):MLOps実現に向けて抑えるべきポイントー最前線
(14):合成データにより加速するデータ利活用
(1):ブロックチェーン技術の成熟度モデルとステーブルコインの最新動向について
(2):3次元空間情報の研究施設「Technology Laboratory」のデジタルツイン構築とデータの管理方法
(3):3次元空間情報の研究施設「Technology Laboratory」における共通ID「空間ID」と自律移動体の測位技術
(4):G7群馬高崎デジタル・技術大臣会合における空間IDによるドローン運航管理
(1):COVID‐19パンデミック下のオンプレミス環境におけるMLOpsプラクティス
(2):機械学習を用いたデータ分析
(3):AWSで構築したIoTプラットフォームのPoC環境をGCPに移行する方法
(4):テクノロジーの社会実装を高速に検証するPwCの独自手法「Social Implementation Sprint Service」-テクノロジー最前線
(5):自動車業界におけるデジタルコックピットの擬人化とインパクト
(6):成熟度の高いバーチャルリアリティ(VR)システム構築理論の紹介
(7):イノベーションの実現を加速する「BXT Works」とは
(8):Power Platformの承認機能、AI Builderを活用して業務アプリを開発する方
(9):社会課題の解決をもたらす先端テクノロジーとディサビリティ インクルージョンの可能性