
財経部門の業務プロセスを変える生成AI活用実証実験の裏側――チャットボットの枠を超えて、真の生成AI変革を実現
業務プロセスの改革を目指す大手商社の三菱商事株式会社とPwC Japanグループは、共同で生成AIを用いた財務経理領域の業務自動化の実証実験を行いました。専門的な知見とテクノロジーを掛け合わせ、実験を成功に導いたプロジェクトメンバーの声を聞きました。
現在、多くの企業が生成AI(人工知能)を活用し、業務の効率化を図るべく検討をしています。しかし、そのユースケースはまだ少なく、多くは実業務への導入には至っていないのが現状です。生成AIをビジネスで活用するためには、データの品質・量、倫理的懸念、規制上の問題など、生成AIが抱える特有の課題を克服しなければなりません。
2000年に設立された株式会社エネットは、2023年7月から約2カ月間、PwCコンサルティングと共同で電気事業制度の分析に生成AIを活用する実証実験プロジェクトを実施しました。
電気事業制度は、燃料価格高騰などの影響による市場価格のボラティリティの顕在化や安定的な供給力の確保といった諸課題解決のため、頻繁に改正される制度です。その多岐にわたる論点や背景を体系的に分析・整理するのが今回のプロジェクトの主な狙いです。本稿ではプロジェクトを担当されたエネットの五郎丸章裕氏と荒木崇氏をお迎えし、プロジェクトの内容や、そこから得た知見についてお話を伺いました。(本文敬称略)
参加者
株式会社エネット
事業開発室長
五郎丸 章裕氏
株式会社エネット
経営企画部 企画担当 担当課長
荒木 崇氏
PwCコンサルティング合同会社
シニアマネージャー
木村 俊介
PwCコンサルティング合同会社
シニアアソシエイト
根本 萌生
左から根本 萌生、荒木 崇氏、五郎丸 章裕氏、木村 俊介
―― 最初にエネットの会社紹介をお願いします。
五郎丸:エネットは、NTTグループ・東京ガス・大阪ガスの3社が電力自由化元年の2000年に設立した小売電気事業者です。エネルギーとICTを組み合わせ、CO2排出量や環境負荷の低減といった利便性向上を支援する各種サービスを、法人のお客様向けに提供しています。
―― 今回のプロジェクトは2023年5月に開始したと伺っています。プロジェクトが発足するに至った背景を教えてください。
荒木:まず業界的な課題から説明しましょう。今回のプロジェクトは「電気事業制度が電力業界に与える影響を、生成AIを活用して分析・評価する」ものです。電気事業制度は経済産業省を中心としたさまざまな委員会で議論され、社会情勢などに応じて適宜改正されます。委員会(審議会)での議論では論点や情報が多岐にわたるため、我々がその内容を一元的に把握・理解し、迅速かつ適切に対処することが難しくなっていたのです。
五郎丸:「電気事業制度への対処」には、新電力会社として社会的に望まれる提言の発信も含まれます。したがって、審議会資料を理解して要約し、その制度改正案が我々に与える課題を抽出して提言をまとめなければなりません。
生成AIの中でも特に言語を対象とした技術領域(LLM:大規模言語モデル)はテキストの扱いに長けており、高度な事務作業の代替が可能だと認識しています。LLMを活用し、制度改正の論点や背景を体系的に分析・整理することで、制度変更内容の把握や影響評価の効率化、さらに事業活動や政策提言への迅速な反映など、お客様に対する迅速かつ正確な情報提供を実現できないかと考え、プロジェクトの発足に至りました。
荒木:テキストを扱う業務で生成AIのユースケースの対象になったものは、ほかにも複数ありました。今回は業務の重要性や情報漏洩のリスクなどを踏まえ、公開情報に基づく電気事業制度の分析をテーマとして選定しました。
株式会社エネット 事業開発室長 五郎丸 章裕氏
―― プロジェクトの内容を教えてください。
木村:作業の大枠は下図のとおりです。
最初に、生成AIに期待するタスクを、エネットの担当者の方々に洗い出していただきました。それを基にPwC側でタスクを完遂する生成AI推論ロジックの検討をはじめ、パブリッククラウド上への生成AIの実装、精度検証方法の設計など、アウトプットを創出するまでの仕組み作りを担当しました。
五郎丸:生成AIの活用で効率化が期待できるタスクとして挙げたのは、次の3項目です。
これらのタスクに対して生成AIを当てはめ、どのようにすれば業務プロセスの中に組込めるのかを検証しました。そして制度を担当する荒木やエネット社員が協力し、これまでの電力事業制度における議論を踏まえてアウトプットの精度を検証しました。
根本:今回は「RAG(Retrieval Augmented Generation)」というLLMの推論アプローチを採用しました。RAGとは、関連文書をデータベースから検索し、プロンプトに混ぜることで、LLMが持たない専門的な情報を追加で与えて回答を生成する手法のことです。したがって過去の審議会議事録など、必要な情報を別途収集した上で、タスクの検証に取り組みました。
―― お話を伺っていると、タスクの洗い出しやデータ収集など、前準備段階でかなりの作業が必要なのですね。
根本:そのとおりです。生成AIを活用するにあたっては、学習データの整備と前処理が大きなカギを握ります。今回のプロジェクトでは、各審議会がWebに公開している議事録や投影資料など、過去10年分のデータをスクレイピング(※)で半自動的に収集しました。
※ Webサイトのコンテンツの中から特定の情報だけを抽出・取集する技術
多くの議事録はPDFなどの電子文書ですが、LLMに読み込ませるためにはテキストデータを抽出する必要があります。その際、改行の乱れや文字の歯抜けなど、文書構造の一部が乱れてしまった箇所があったため、前処理を施してLLMにきれいなテキストデータを読み込ませるようにしました。
木村:厄介だったのは、電子文書の中にある画像や概念図(通称ポンチ絵)をLLMに解釈させることです。表であればカンマ区切りのテキストに変換できます。しかし、画像の場合はOCR技術で文字を読み込ませなければなりません。また、ポンチ絵をOCRしてテキストだけ抽出すると、矢印などでグラフィカルに表現された内容を汲み取ることができません。「LLMに読み込ませやすいような資料作成」は、技術の進展と並行して改善していく課題であると感じました。
五郎丸:そうですね。今回の分析対象は、議事録などのドキュメント形式のファイルでした。しかし、対象としなかったスライド形式のファイルにも重要な情報は記載されています。将来的には図版などもインプット対象として拡張する必要があると考えています。
株式会社 エネット 経営企画部 企画担当 担当課長 荒木 崇氏
―― 他に、LLM技術に関連する重要な作業はありますか。
根本:ユーザーによるプロンプト(質問文)の入力を改善することです。一般的には「プロンプトエンジニアリング」と呼ばれるものですが、LLMによる回答の精度を向上させるには質問文の書き方を工夫するスキルが求められます。分かりやすく言うと、同じ内容の質問であっても、質問文の書き方でアウトプットが違ってくるのです。
―― 要約したい部分のテキストを指定し、「以下の文章を要約してください」と入力するだけではダメなのですか。
根本:ダメではないのですが、ユーザーが頻繁に要約することを想定すると、より良いプロンプトを事前に用意しておいてあげることに意味があります。例えば同じ質問でも「要約して」と「短くして」ではアウトプットが異なります。プロンプト作成のスキルをユーザー任せにした結果、望んでいたアウトプットが得られずに「生成AIは使えない」といった印象を受け、活用意欲自体が減退してしまう懸念がありました。
したがって、そうした事態を回避すべく、工夫を施したUI(User Interface)を作成しました。具体的には、ユーザーは、UIに表示された必要な項目を選択肢から指定するのみでよく、以降は裏側で事前に用意したプロンプトのテンプレートに対してユーザーの選んだ項目を書き加えていき、完成したプロンプトを用いてLLMの推論を実行し、最後に結果をUI上に表示するといった仕組みです。
五郎丸:生成AIのメリットとして挙げられるのは「汎用性が高いこと」です。しかし、我々には特定の業務を効率化するという明確な意図がありました。要約業務では「特定の審議内容をこの論点で要約する」と決まっていたので、「どのようにすれば精度の高い回答が得られるか」を追究したのです。そうして修練した最終的な質問文を固定のプロンプトとし、「要約(実行)」ボタンをクリックすれば回答が得られるようにしました。
実際、審議会資料で「何を重要視するか」「どのような切り口で分析すべきか」という観点は、事業者ごとに異なります。したがって我々にとって重要な観点をプロンプトに反映することで、より有益な情報が抽出できるように努めました。
荒木:今回は対象となる審議会が20もあったので、インプットデータも膨大でした。その中から都度必要な資料をLLMが検索することはハードルが高かったことを確認したため、最初に対象となる資料が限定できるようなUIもPwCに作成してもらいました。
具体的には対象の審議会・期間・議事録や関連資料など資料ジャンルの選択をはじめ、資料中に含まれる用語・委員名などで検索できる機能の搭載です。これらを我々の用途に沿ったデータに限定したうえで、LLMに推論させました。
必要項目の選択とボタンを押すのみでLLM推論が完結するUI
―― 「LLMに推論させる」とは、具体的にどのようなことをするのでしょうか。
根本:「Chain of Thought(思考の連鎖)」と呼ばれるアプローチで段階的に推論を深め、求める回答にたどり着くようにしました。例えば、1つの審議会では複数の議事があります。そこから特定トピックの重要論点を抽出するには、以下のような3段階アプローチを執ります。
また、このような段階的な推論プロセスの途中には、ユーザーによる意思入れを介在させる工程を挟みました。
―― 「ユーザーによる意思入れ」とはどのような作業ですか。
根本:例えば「1」で抽出された論点に対して、「重要度が高いのはどれか」「どの観点で重要度が高いとするか」といった判断を行うには業務知見と経験が必要です。こうした作業は無理に生成AIに行わせず、エネットの担当者の方にお願いし、最終的に出力される結果がより良いものになるようにしました。
PwCコンサルティング合同会社 シニアアソシエイト 根本 萌生
―― 実際に生成AIが要約した文章をご覧になってどのような感想を持ちましたか。
五郎丸:今すぐ実業務に活用することは難しいものの、業務プロセスの見直しや機能の開発によって、活用可能な水準に到達できる可能性は高いと感じました。審議会資料は専門性が高い文章が多く、当初は要約にあたっては生成AIも苦労するのではないかと想定していましたが、精度の高い要約が出力されることが多くて驚きました。
―― 逆に「今後の課題」と感じた部分はありますか。
荒木:2つあります。1つは「抽象度の高い情報の粒度指定」です。分かりやすく言うと「どこまでを1つの論点として捉えるか」という課題です。議事録で討議されるさまざまな論点は、その多くが「論点」として明記されていません。ですから、「どこを論点とするか」が曖昧なのです。
例えば、Aという論点と、それに付随する論点A-1と論点A-2があるとしましょう。その場合、すべてをまとめて「論点A」とするのか、3つを個別の論点と捉えるかといった粒度の指定が困難でした。この課題を解決するには、「そもそも我々が論点をどのようなロジックで解釈しているか」を整理することから始めなければなりません。
もう1つは「チャンク分割によるコンテキストの分断」です。こちらも分かりやすく言うと「どこで文章を区切るか」という課題です。現状、LLMはプロンプトとして許容されるトークン数(LLMが解釈する単語数)に上限があり、テキストを途中で分割して与えなければなりません。
しかし、例えば、(議事録の)議論の半分で区切ってしまうと、LLMは与えられた内容が議事録のすべてと誤解して回答を作成します。これも検証中に気付いたことですが、質問が同じであっても3,000文字と5,000文字のテキストではアウトプットがまったく異なるのです。ですから「キリがよい箇所で分割する」ことが重要なのですが、そもそも「キリがよい箇所」を見つけるには議事の内容をある程度理解していないと難しいのですね。これも今後の課題だと感じました。
木村:ご指摘のとおりです。情報抽出粒度に関しては「One/Few Shot学習」と呼ばれるプロンプトエンジニアリングに倣い、事前に業務観点で望ましい粒度の論点サンプルを用意してLLMに読込ませる手法が有効だと考えます。あるいはLLMが得意な要約技術を用いて複数の論点を抽出し、その中から似通った論点を統合するといった手法もあるでしょう。
また普段の業務で担当者が「どのような思考のプロセスや業務観点で論点を定義するか」について今一度整理し、それをLLMの推論ロジックやプロンプトとして実装するといったアプローチも重要と考えます。
五郎丸:包括的な視点で課題を挙げると、「生成AIを活用することを前提とした業務プロセスの設定と検討」が必要だと強く感じました。具体的には生成AIを活用すべき業務の特定をはじめ、人間による生成AIのアウトプットの検証方法、フィードバックの仕組みづくり、アウトプットの精度を改善するための追加情報の提供などです。
―― 最後に今後の展望を教えてください。エネットでは今回の検証で得られた知見をどのように活用していく計画でしょうか。
五郎丸:今回の技術検証は約2カ月という短い期間でしたが、生成AIの技術精度は一定の水準に達していることを確認できました。同時に先述したような課題も詳らかになりました。今回の検証で得られた知見に基づき、業務プロセスの見直しを行い、電力事業制度に関連する業務の効率化・高度化に努めていきたいと考えています。
―― PwCは生成AIの活用を支援する立場ですよね。生成AIの導入を検討している企業に向けてメッセージをお願いします。
木村:今回の検証結果をベンチマークに、さまざまな業界業種の生成AI利活用促進を支援したいと考えています。ただし、そのアプローチは今回のような技術検証だけではなく、実業務への導入を見据えたビジネスモデル改革や、生成AI利活用を支える組織・人材の育成、生成AI活用基盤の整備も必要になります。さらに、ハルシネーション(AIが事実とは異なる情報を生成する現象)や情報漏洩といった、リスク管理やセキュリティ対策も不可欠です。
PwCは生成AIの台頭より以前から、最新技術の実装やそれらをユーザーに理解してもらうためのガイドライン整備など、幅広い分野で多岐にわたる支援をしています。
日本のデジタルトランスフォーメーション(DX)は各国の後塵を拝していると言われていますが、生成AIの利活用はその巻き返しを図れる大きなファクターになると考えます。本対談記事をご覧になった皆様には、生成AIの技術的可能性と、業務への活用のイメージを想起いただき、前向きに検討いただけると幸いです。
PwCコンサルティング合同会社 シニアマネージャー 木村 俊介
業務プロセスの改革を目指す大手商社の三菱商事株式会社とPwC Japanグループは、共同で生成AIを用いた財務経理領域の業務自動化の実証実験を行いました。専門的な知見とテクノロジーを掛け合わせ、実験を成功に導いたプロジェクトメンバーの声を聞きました。
「心の豊かさを、もっと。」というグループパーパスを羅針盤とし、生成AIなどのテクノロジーを活用した日本たばこ産業の価値提供について、同社執行役員 IT担当の下林央氏とPwCコンサルティングのプロフェッショナルが語り合いました。
セキュリティリスクなどの観点から現場で使われなくなるケースも多い生成AIを、国内でいち早く社内システムとして導入した日本たばこ産業。同社 IT部の加藤正人氏、山形典孝氏とPwCコンサルティングのプロジェクトメンバーが議論しました。
一般財団法人行政管理研究センター(IAM)は「AIガバナンス自治体コンソーシアム」の活動を開始しました。同コンソーシアム設立の狙いや期待される成果について、IAM 公務部門ワークスタイル改革研究会 研究主幹の箕浦龍一氏、大阪市CIO ICT戦略室長の鶴見一裕氏、コンソーシアム事務局のPwCコンサルティング合同会社 林 泰弘が意見を交換しました。
マーケットでの競争が激化するなか、成功しているビジネスリーダーは、価値の創出には体験から得られるリターンが不可欠であると認識しています。本レポートでは、顧客と従業員の体験に焦点を当てて企業がとるべき対応策を解説するとともに、日本企業に向けた示唆を紹介します。
2025年のプライベート・キャピタルにおけるM&Aは、業界を統合するような取引や業界の再編によって2024年来の世界的に活発な活動が継続し、加速すると予想されます。
生成AIの利用機会の増加に伴い実現可能なこと・不可能なことが明確になる中、実施困難なタスクや業務を解決するテクノロジーとしてAI Agentが注目を集めています。製薬企業において期待される活用事例と合わせ、AI Agentの特徴を解説します。
顧客とのロイヤルティを育むことは、組織に価値をもたらし、収益性を高めます。本稿では、PwCが実施した顧客ロイヤルティに関する調査からの洞察を紹介するとともに、日本企業が取るべき対応策を解説します。