今、データサイエンティストに求められるスキルは何か?データサイエンティスト求人動向分析―テクノロジー最前線 データアナリティクス&AI編(5)

2022-07-11

データサイエンティストが一過性のブームを過ぎ、企業の業務に定着しつつある昨今、さらなるキャリアアップを模索されている方も多いのではないでしょうか。

ただ、ひと昔前の「分析技術があれば良い」という時代とは違い、今のデータサイエンティストに求められるスキルセットの範囲はとても広いため、何を優先的に身につけていくべきかが分からず、とりあえず自分の好きな領域から……という方も少なくないのではないかと思います。

そこで本稿では、最新のデータサイエンティストの求人動向から、企業が今データサイエンティストに求めているスキルセットを探ります。また、給与待遇の高いデータサイエンティストを「ハイクラス求人」と定義し、ハイクラスな人材を目指すために今後獲得すべきスキルセットについて考察します。

分析軸の定義

各分析における分析軸は、以下のように定義しました。

  • 業界:求人情報の中から募集企業に関する情報を抽出し、業界単位で分類
  • 給与待遇:求人情報の中から給与待遇に関する情報を抽出
  • スキルセット:求人情報の中からスキルセットに関連する単語を抽出し、データサイエンティストに求められるスキルに絞って分類
  • ハイクラス求人・ミドルクラス求人:求人情報を、給与待遇の上位10%・中位50%に分類し、それぞれ「ハイクラス求人」「ミドルクラス求人」と定義

今後求められる「企画型」の人材

分析結果から、一口に「データサイエンティスト」と呼ばれる職種のなかには、実際には大きく2種類の役割が混在していることが見えてきました。すなわち、AI・機械学習のPoC(Proof of Concept: 実証実験)プロジェクト推進を期待される「従来型データサイエンティスト」(以降、従来型)と、AIや機械学習を用いた業務課題の解消、ビジネスへの活用など、より全面的な企画立案・推進を期待される「ビジネスプロデューサー」「ビジネストランスレーター」(以降、企画型)のような役割です。

後者の求人情報を発信するような企業では、既にデータ利活用のPoCはある程度完了しており、今後はAI・機械学習を既存のビジネスに組み込んでいくか、というフェーズにシフトしているのではないかと考えられます。実際に、私たちもクライアントとの会話のなかで、データ利活用に積極的に取り組む企業ほど、「これからは、データ利活用をビジネス課題と紐づけることができ、企画やプロジェクトリードができる人材を育てていかなければならない」ということをよく伺っており、まさに企画型のデータサイエンティストの人材像が当てはまっているように思います。

現状ではどちらも「データサイエンティスト」という職種で表現されていますが、今後は従来型・企画型はそれぞれ異なる用語で表現されていくようになるでしょう(一部企業では「ビジネストランスレーター」という呼称を用いて、既に企画型の求人を始めています)。

伝統的なデータサイエンティスト像にとらわれない開発や基盤整備に特化した求人の登場は、多くの企業でデータサイエンスの社会実装が進められた結果とも言えるでしょう。今後も社会実装の進展に合わせて、新たなデータサイエンティストの需要が現れると想像されます。

執筆者

T.Kamiya
製造業やインフラ、製薬業界を中心に機械学習や統計解析を活用した戦略策定支援・業務改善のコンサルティングに従事。また価格最適化や画像診断モデルの開発、IoTデバイスの実証実験も経験。

PwC Japanグループでは、データアナリティクス領域でご活躍いただける方を募集しています。本記事に関連する求人情報は以下ページよりご覧ください。

PwCコンサルティング合同会社 中途採用職種一覧・セミナー

 

テクノロジー最前線―先端技術とエンジニアリングによる社会とビジネスの課題解決に向けて

データアナリティクス&AI編

(1):テック人材の採用と維持における企業の課題
(2):フィーチャーエンジニアリングとは?
(3):SNSを活用したコロナ禍における人々の心理的変化の洞察
(4):自然言語処理(NLP)の基礎
(5):今、データサイエンティストに求められるスキルは何か?データサイエンティスト求人動向分析
(6):コロナ禍における人流および不動産地価変化による実体経済への影響
(7):「匠」の減少―技能継承におけるAI活用の道しるべ
(8):開示された企業情報におけるESGリスクと財務インパクトの関係性の特定
(9):ビッグデータ分析で特に重要な「非構造化データ」における「コンピュータービジョン(画像解析)」とは
(10):自然言語処理・数理最適化による効率的なリスキリングの支援
(11):スポーツアナリティクスの黎明 サッカーにおけるデータ分析
(12):AIを活用した価格設定支援モデルの検討―外部環境変化に即座に対応可能な次世代型プライシング
(13):MLOps実現に向けて抑えるべきポイントー最前線
(14):合成データにより加速するデータ利活用

エマージングテクノロジー編

(1):ブロックチェーン技術の成熟度モデルとステーブルコインの最新動向について
(2):3次元空間情報の研究施設「Technology Laboratory」のデジタルツイン構築とデータの管理方法
(3):3次元空間情報の研究施設「Technology Laboratory」における共通ID「空間ID」と自律移動体の測位技術
(4):G7群馬高崎デジタル・技術大臣会合における空間IDによるドローン運航管理

エンジニアリング編

(1):COVID‐19パンデミック下のオンプレミス環境におけるMLOpsプラクティス
(2):機械学習を用いたデータ分析
(3):AWSで構築したIoTプラットフォームのPoC環境をGCPに移行する方法
(4):テクノロジーの社会実装を高速に検証するPwCの独自手法「Social Implementation Sprint Service」-テクノロジー最前線
(5):自動車業界におけるデジタルコックピットの擬人化とインパクト
(6):成熟度の高いバーチャルリアリティ(VR)システム構築理論の紹介
(7):イノベーションの実現を加速する「BXT Works」とは
(8):Power Platformの承認機能、AI Builderを活用して業務アプリを開発する方
(9):社会課題の解決をもたらす先端テクノロジーとディサビリティ インクルージョンの可能性