開示された企業情報におけるESGリスクと財務インパクトの関係性の特定-テクノロジー最前線 データアナリティクス&AI編(8)

2022-11-18

English

今回は、PwCがNLP(自然言語処理)など前回までに紹介してきた高度なAIやデータマイニング技術を、社会課題やビジネス課題の解決に向けた革新的なソリューション開発に活用している事例を紹介します。PwCがAIやデータアナリティクスの理論をどのように実践に移しているのか、またチームワークやコラボレーションをいかに重要視しているかをご理解いただけると思います。

アジャイルアプローチによる開発

これらの問いを起点に、本プロジェクトではAI LabとサステナビリティCoEのリーダーのサポートのもと、NLP、システム開発、ESGの専門家からなるコアプロジェクトチームを立ち上げました。AIの高度な技術を使った革新的なアプローチを検討していたため、ソリューション開発にはアジャイルアプローチが採用され、プロジェクトをスプリントと呼ばれる小さなタスクにいくつも分け、開発プロセスの主要段階で継続するかどうかを判断するゲートウェイが設けられました。スプリント期間中、チームは毎日スクラムを組み、進捗や障害について話し合い、各スプリントの終わりにはレビューを行いました。バックエンドのインフラやフロントエンドの開発など、コアチーム以外のスキルが必要なスプリントでは、PwCの関連分野の専門家がサポートを提供しました。このようなアプローチにより、開発プロセスで発生した課題を克服し、PwCの専門家のリソースを効率的に活用することができました。

モデル学習のプロセス

この革新的なAI・データアナリティクスソリューションを提供するためには、さまざまな種類のファイルからデータを抽出するカスタムプロセスの構築から、ユーザーがデータベースに問い合わせるためのフロントエンドの設計・開発まで、エンドツーエンドのプロセス開発が求められました。

モデル学習の プロセス

チームが初期に決定しなければならなかったことの1つは、モデリング戦略でした。NLP技術の1つである固有表現抽出(NER)については、カスタムのESGニューラルネットワークモデルをトレーニングし、財務数値、財務指標、ESGリスクのお互いの関係の抽出を2クラス分類問題とするアプローチを取りました。モデルの学習とテストのためのデータセットを構築するために、このソリューションが分析に使用するデータの種類を代表するものとして、財務・決算報告データを大量に収集しました。

モデルの学習は、データの収集とクレンジング、特定のエンティティやエンティティ間の関係を認識するためのデータのアノテーション、ハイパーパラメータのチューニングを伴うモデルの学習といった標準的なプラクティスに沿って行われました。実際には、データのアノテーションはモデル学習におけるとりわけ重要なステップであり、アノテーションされたデータの質はモデルの性能に強い影響を及ぼします。このプロセスには、PwCの専門家の知識を利用することができました。

関係性抽出は、テキスト内の2つのエンティティの間にどのような関係が存在するかを決定するステップです。このソリューションでは、財務数値、財務指標、カスタムESGモデルから抽出されたESGエンティティの3つのエンティティ間の関係を関連性のあるものとして定義しています。データアノテーションの際、エンティティに「関係がある」「関係がない」というラベルを付けました。

成果

このコラボレーションの成果として完成したAIベースのESGデータアナリティクスツールとデータベースは、PwC Japanグループのチームがクライアントプロジェクトで使用しています。このソリューションにより、PwC Japanグループのチームは、上場企業において、COVID-19、気候変動関連の物理リスク、データセキュリティインシデントなどのESG課題が財務に与える影響について報告されたデータを入手することができるようになりました。

Example result

本ソリューションは、PwC Japanグループが持つ高度なAI・データアナリティクスソリューションのイノベーションとデリバリーの能力を示すものと言えます。今後も、社会とビジネスの課題解決に向けたAI・データアナリティクスの導入を進める活動の一環として、こうした取り組みをさらに発展させていく予定です。

また、このソリューションが示すように、チームワークとコラボレーションはPwCのカルチャーの重要な要素です。PwCは多様性がもたらす価値を認識しており、誰もが社会とビジネスの課題解決に貢献すべく自身のスキルを生かして価値を発揮しています。

P. Massey
ESGと金融のバックグラウンドを持ち、日本の金融セクターでの経験を生かし、ESGリスク管理プロセスの開発・導入支援、ESGリスクと機会の特定・定量化について、クライアントにアドバイスを提供している。最近では、気候変動シナリオの下で、気候変動に関連する移行リスクや物理的リスクがローンポートフォリオに与える影響を定量化するためのセクター固有のモデルの開発に注力している。

PwC Japanグループでは、データアナリティクス領域でご活躍いただける方を募集しています。本記事に関連する求人情報は以下ページよりご覧ください。

PwCあらた有限責任監査法人 中途採用職種一覧・セミナー

テクノロジー最前線―先端技術とエンジニアリングによる社会とビジネスの課題解決に向けて

データアナリティクス&AI編

(1):テック人材の採用と維持における企業の課題
(2):フィーチャーエンジニアリングとは?
(3):SNSを活用したコロナ禍における人々の心理的変化の洞察
(4):自然言語処理(NLP)の基礎
(5):今、データサイエンティストに求められるスキルは何か?データサイエンティスト求人動向分析
(6):コロナ禍における人流および不動産地価変化による実体経済への影響
(7):「匠」の減少―技能継承におけるAI活用の道しるべ
(8):開示された企業情報におけるESGリスクと財務インパクトの関係性の特定
(9):ビッグデータ分析で特に重要な「非構造化データ」における「コンピュータービジョン(画像解析)」とは
(10):自然言語処理・数理最適化による効率的なリスキリングの支援
(11):スポーツアナリティクスの黎明 サッカーにおけるデータ分析
(12):AIを活用した価格設定支援モデルの検討―外部環境変化に即座に対応可能な次世代型プライシング
(13):MLOps実現に向けて抑えるべきポイントー最前線
(14):合成データにより加速するデータ利活用

エマージングテクノロジー編

(1):ブロックチェーン技術の成熟度モデルとステーブルコインの最新動向について
(2):3次元空間情報の研究施設「Technology Laboratory」のデジタルツイン構築とデータの管理方法
(3):3次元空間情報の研究施設「Technology Laboratory」における共通ID「空間ID」と自律移動体の測位技術
(4):G7群馬高崎デジタル・技術大臣会合における空間IDによるドローン運航管理

エンジニアリング編

(1):COVID‐19パンデミック下のオンプレミス環境におけるMLOpsプラクティス
(2):機械学習を用いたデータ分析
(3):AWSで構築したIoTプラットフォームのPoC環境をGCPに移行する方法
(4):テクノロジーの社会実装を高速に検証するPwCの独自手法「Social Implementation Sprint Service」-テクノロジー最前線
(5):自動車業界におけるデジタルコックピットの擬人化とインパクト
(6):成熟度の高いバーチャルリアリティ(VR)システム構築理論の紹介
(7):イノベーションの実現を加速する「BXT Works」とは
(8):Power Platformの承認機能、AI Builderを活用して業務アプリを開発する方
(9):社会課題の解決をもたらす先端テクノロジーとディサビリティ インクルージョンの可能性