データ抽出を目的としたAIや機械学習の活用に優先的に取り組んでいる企業幹部は28%でした。
{{item.title}}
{{item.text}}
{{item.title}}
{{item.text}}
事業を営む上で、請求書の処理は欠かせない基本業務のひとつです。とはいえ、なかなか面倒な作業でもあります。業者ごとに書式も違えば言い回しも異なり、「お支払期間は15日間です」と書いてあるものがあれば、「2週間以内にお支払いください」と書いてあるものもあります。同じサプライヤーから毎月届く請求書も、調達代理店が変更されていたり、書式がバラバラだったり、ときにはタイプミスがひそんでいることもあるかもしれません。しかもこれは、面倒な事務処理作業のほんの一部にすぎません。どこの企業でも経営レベルの上から下まで、あらゆる業務部門で従業員が契約書、リース関係書類、税務書類、調査報告書などさまざまな文書から、日々細かいデータを拾い出しています。
こうした状況に対して朗報となるのは、人工知能(AI)がこのような統合的かつ複雑な作業の大幅な効率化を可能にしてくれることです。AIソリューションは、シームレスで拡大可能であり、簡単に使えて管理も容易です。さまざまな革新的AI技術を使えば、文書処理がスピードアップし、業務手順も簡素化されます。手順が簡素化されるということは、ミスが減り、それに伴う修正や取り消し作業も減るということです。PwCが先日実施した自動分析に関する調査(英語)では、ごく初歩的なデータ抽出AIを導入しただけでも、文書処理に通常必要な作業時間を30~40%圧縮できることが判明しています。
AIは、さまざまな場面でパラダイムシフトをもたらしています。動画配信サービスの提案機能、オンライン上でカスタマーサービス担当者のようにふるまうチャットボット、ホテル宿泊料金のダイナミックプライシング、配送会社向けの経路設定などは、誰もがよく知るところです。こうした取り組みは多くの大企業で価値創造の原動力となり、企業に成功をもたらしています。一方、本稿で紹介するのはそうした華やかな事例とは全く異なり、一見すると平凡な活用方法です。目的はコスト削減と業務の最適化であり、産業の変革や新しい産業の創出を目指しているわけではありません。しかし、データ抽出にAIを活用することは、平凡に見えて本当は非常にエキサイティングな取り組みです。なぜなら、全ての企業が必ず直面する課題を解決に導き、生産性(ひいては利益率や企業価値)に具体的な効果をもたらしてくれるからです。
データ抽出AIには非常に大きな潜在能力があるにもかかわらず、PwC米国の『2021年AI 予測(英語)』によれば、データ抽出を目的としたAIや機械学習の活用に優先的に取り組んでいる企業幹部はわずか28%でした。職場の安全性確保のためのソリューションやチャットボットなどの他のAI活用事例に比べるときわめて低い割合です。その理由として、先進技術を開発し、拡大し、社内システムに統合するために要する時間とリソースが大きすぎると考えている人もいれば、AIを信用していいかどうか分からない(英語)、あるいは本当に役に立つかどうか分からない、と考えている人もいるようです。また、データ抽出がバックオフィス業務であるために、自動化の価値が見過ごされているのかもしれません。理由はどうあれ多くの企業が、プロセスを合理化し、投資利益率を向上する機会を取り逃がしています。
データ抽出を目的としたAIや機械学習の活用に優先的に取り組んでいる企業幹部は28%でした。
監査法人は毎年、クライアントの財務諸表に関連する残高や取引が正しいことを確認するために証憑を集め、取引の正当性をチェックするのに膨大な時間を費やしています。この30年ほどは、こうした確認作業の主なツールとしてスプレッドシートが使われてきました。
現在、監査のための証憑類(請求書、取引明細書、領収書)は通常PDF形式で保管され、その量は数千ページに及ぶこともあります。これらのPDFからスプレッドシートへのデータ入力は手作業です。例えば、毎年10万ページのPDF書類が発生する中規模企業があるとすると、1ページに3分かかるとして、全てを入力するのに5,000人時必要です。1時間あたりの人件費を50米ドルとすれば年間25万米ドルになります。
では、この作業に拡張知能(英語)(augmented intelligence)を導入すると、どうなるでしょうか?拡張知能は、機械学習を搭載した適応性の高いシステムを利用したアプリケーションで、アルゴリズムに人間の経験を学習させますが、最終的な決定は人間が下します。AIは請求書に記載された文字を“読み”、関連データ検索によって、あらかじめ重要書類としてタグ付けされた書類の中から証憑となる書類を素早く見つけ出します。これは膨大な数の例外的な請求書を取り扱う場合、大幅な省力化になります。請求書の書式が業者ごとに不統一でも、AIはそれぞれの請求書に記載された単価や数量といった重要なフィールドを見分け、元帳残高を自動計算します。先述の中規模企業の事例にAIを導入し、作業の40%をAIに任せれば、10万ページ当たり2,000時間の労働力削減が可能になります。
定型的な文書処理業務にごく初歩的なデータ抽出AIを導入すると、作業に必要な時間が40%削減されます。
もうひとつ、多くの企業が直面する問題があります。政府の歳入当局から従業員個人や法人宛てに送られてくる税務関係の通知や書類の内容を解釈し、必要な対応を取ることです。米国の場合、連邦政府が発行する税務関連通知は100種類以上あり、加えて各州が数千種類を発行しています。内容はアカウントの変更、納税請求書、税務申告の差異に関する通知などさまざまですが、どんな場合でも、誰かが書類や通知を読み、内容を理解し、正しいかどうか、該当するかどうかを判断し、分類し、最終的に必要な対応を行わなければなりません。これもなかなかやっかいなプロセスで、ミスが起こりがちです。一般的なデータ入力ミスに加え、税務関連書類が他の書類の山の中に文字どおり埋もれてしまい、見落とされたり対応が遅れたりすると、是正対応に膨大な時間が取られてしまいます。
PwCでは、従業員主導による社内の自動化の取り組みを全社を挙げて推進しており、その一環として税務通知の読み込みと対応に拡張知能を活用しています。AIがさまざまな書式の通知を読み、そこから期日、通知番号、未払い金額、無申告に対する罰則といった、具体的な対応を要求する言葉やフレーズを抽出し、理解します。その後、自然言語生成技術で自動的に返信を作成するため、手作業で返信する必要はありません。こうしたAIに他のデータ抽出ツールや、コンプライアンス、シナリオプランニング、国際税務に関するソリューションを組み合わせることによって、税務関連のさまざまなタスクの実行にかかる時間を500万時間以上、16%削減できました。
こうした税務関連通知の処理に対し人間が抜き取りチェックをするならば、このAIは拡張知能(augmented intelligence)です。しかし返信まで自動で行うなら、これは学習によって適応するだけでなく人間の介入なしで自ら決定を下すことができる自律知能(autonomous intelligence)です(拡張知能も自律知能もどちらも有用であり、リスク許容度に従ってさまざまな分野に応用されています)。加えて、先進的なパターンマッチング技術を導入すれば、特定の通知の原因となる傾向(例えば、税務書式の同じ場所に同じ誤情報を記入してしまうなど)を自動的に見つけ出すことができるので、今後同じ通知を受け取らずに済むような対応ができ、時間とリソースをさらに節約できます。
調査結果の詳細などのデジタルデータについても、手作業による分析が問題になってきます。例えば企業が従業員調査を実施した際には、誰かが結果を集計して分析しなければなりません。調査そのものは(データ記入ミスのリスクが高い手書きの回答ではなく)オンラインで実施したとしても、そのデータを誰かが集計し、分析し、概要をまとめることが必要なのです。これらの作業は多くの場合、統計に関して基礎的な知識と経験を持つ若手のアナリストに任されますが、きわめて誤りが生じやすいプロセスでもあります。変数と変数が本当は無関係であるにもかかわらず、結論に影響を与えるほど重大な関係があるものとして示され、間違った結論を導き出し、不適切で信頼性の低い戦略の後押しをしてしまうことも考えられます。アイスクリームの売上高と犯罪の発生率に正の相関関係があるとよくいわれるのも、その古典的な例のひとつです。当然ながら、アイスクリームがよく売れることは、犯罪の原因ではありません(その逆も然りです)。どちらも夏の暑い時期に増える、というだけです。
しかし、回答者をカテゴリー別に分類し、各グループを比較して有意な差があるかどうかをチェックする作業も、全て自動化できます。加えて、例えば「従業員の福利厚生の向上に役立つアイデアはありますか?」といった質問に対する「自由回答」についても、自然言語処理技術を用いて対応できます。回答の中にある重要なトピックや頻度の高いトピックを見つけ出し、要点をまとめ、報告書を自動作成するため、手作業で何百、何千という回答を全て読んで得点を算出する手間が省けます。ここで挙げた福利厚生に関する質問の場合、ヘルスケア、フレキシビリティ、生命保険などに言及した回答が選び出されるでしょう。ただし支援知能(assisted intelligence)の一種である静的なレコメンデーションをAIシステムで生成するには、人間による判断と意思決定が必要です。
AIを活用したデータ抽出によって、上述したような状況によくある非効率性や問題の多くに対処できます。しかしAIによるデータ抽出は、製造現場でロボットがスポット溶接や吹付塗装を行うようなルーティン化された定型作業とは異なります。変動する複数の要素を扱う複雑なデータサイエンス手法を数多く用い、常に変わり続ける状況に対応しなければなりません。光学式文字認識(OCR)、教師あり機械学習、自然言語処理を伴う自動分析技術などの先端技術をひとつのプロセスとしてシームレスに組み上げるには、時間と高い専門性が必要です。
OCRを例にとってみましょう。OCRはページ上に印刷された文字を読み取る技術で、どんなフォント、サイズ、向き、明るさの文字でも読むことができ、手書き文字の読み取りも可能です。米国でよく使われている用途としては、スマートフォンで小切手を口座に自動入金する際に、OCRで銀行支店番号や口座番号のほか、手書きで記入した額面金額や日付まで読み込みます。古くからある技術ですが、文書から必要なデータを収集するプロセスの最初の一歩として、現在でも不可欠な技術です。
多くの用途で、収集したデータに基づいて取るべき行動を決めるためには、パターンを認識・分類できる高度な機械学習アルゴリズムが必要になります。機械学習アルゴリズムは、既存のデータをもとに自らのパラメーターを調整した上で、新しいデータに適用します。調整によって、金銭上の不正を示すような高度かつ微妙なパターン(融資申請書のスペルミスや、過剰な送金・入金回数など)も認識できるようになります。また、異なる契約書の中から類似の意味を持つ文言を捕捉することも可能です。例えば「免責条項」「制限条項」「補償条項」などは全て、免責に関する条項です。
また、機械学習アルゴリズムはデータの集合体を扱うこともでき、対象をいくつかのグループに分類してまとめることが可能です。顧客セグメンテーションの自動化はよく知られていますが、他にも税務関連の書類や通知、契約書の条項の分類も可能なので、これらを読む膨大な時間が節約できます。
自然言語処理技術はここ数年の間に目覚ましく発展し、GPT-3などの先端的な言語生成アプリケーションが登場しています。AIによるデータ抽出にはそこまで最先端のアルゴリズムは必要ありませんが、それでも技術進化のおかげで、文脈を示す語や品詞などを特定することによって、文書の真の「意味」を明らかにできるようになりました。AI自体は言葉の意味は理解しませんが(しているように見えますが)、アルゴリズムによって要約文を生成し、主題を明らかにしたり、文章に込められた感情(ポジティブか、ネガティブか)を判断したり、文書の中から重要な用語、条件、条項を見つけ出したり、同じような対応を必要とする文書を集めてグループ分けしたりすることができます。
このようなAI技術を組み合わせれば、第三者や競合他社が発行した文書、社内の文書などを、たとえ長いものであっても素早く簡単に読み、概要をまとめ、迅速に適切な対応ができるようになります。あるアプリケーションを使い、融資やデリバティブなどに関するさまざまな種類の文書から35の概念語(「適用法」「終了日」など)を検索させるために、まず5件の文書で最初の訓練を行ったところ、F1スコアは0.28でした。F1スコアは正解率の指標で、偽陽性、偽陰性、真陽性を数学的に組み合わせてひとつの数値で表しています。完璧に正解していればF1スコアは1,逆に全く役に立たない場合は0となります。先ほどのアプリケーションに、さらに565件の文書を読ませて訓練を続けたところ、F1スコアは0.83まで上昇しました。満点ではありませんが、かなり良い成績です。
アルゴリズムが新しい文書を読むたびに経験する文脈が増え、サンプル数が増えるので、パラメーターの訓練が進み、正解率が上昇します。ただし、F1スコアだけで正確性を測定することはできません(例えば、F1スコアが0.60のモデルであっても、求める結果を的確に生成してくれる場合もあります)。すなわちF1スコアは目安としてとらえるべきで、どんなモデルなのか、どこまで正確なのかを判定するのは、人間の判断力と専門知識です。
一般にAIの正確性は非常に優れていますが、ときには、つじつまの合わない全くナンセンスなミスを犯すことがあります。そのためAI導入の際は、モデルの訓練についても、また下流のプロセスで生成されたアウトプットの最終的な修正についても、常に人間が監視して品質を確保することが不可欠です。したがって、AI導入を成功させたいなら、ツールを購入して終わりではありません。次のような対応が必要です。
新しいプラットフォームを構築し(または既存のプラットフォームの構成を変更して)、データ管理、自動化ツール、AIアプリケーションを組み入れるとともに、その過程で必ず人間が関与すること。例えば、全社共通レベルのポータル機能を持った中心的なプラットフォームを構築し、そのプラットフォーム上でデータの保管や受け渡し、アプリケーションのアップロードやダウンロードを行い、コミュニケーションインターフェースを通じてコラボレーションや共同開発を推進するといった方法が考えられます。プラットフォームには社内の誰もがアクセスできることが重要で、また、プロの開発者だけでなく従業員の主導によるイノベーションやアプリケーションも受け入れられるようにしておく必要があります。こうしたAIというパワフルな技術の民主化(英語)は、当然ながらしっかりと責任を明らかにして進めなければなりません。リーダーはリスクの可能性に常に注意を怠らず、適切な研修とコーポレートガバナンス確保の必要性を認識することが不可欠です。
全社的な研修プログラムを策定し、デジタルやアナリティクスに対する理解と認識を高めること。CEOから新入社員に至るまで、全レベル、全部門の従業員のアップスキリングが必要です。従業員の大半を対象に、時間節約につながるデータ抽出ツールの使い方だけでなく、その背景にあるAIテクノロジーの基礎も含めた研修の実施を検討しましょう。AIの能力、リスク、限界、前提などをよく理解すれば、AIをよりいっそう効率的に、責任を持って使う方法もよく理解できます。どの企業でも従業員が最新のテクノロジーに精通していることは重要ですが、全員を巻き込んで初めて、トランスフォーメーションが社内に根付くのです。
中間管理層への影響には特に注意すること。この層は基本的に、AIによって日常業務のかなりの部分が消滅します。これが自動化の現実で、現在人間がやっている仕事の一部を請け負うことによって効率性を高めるという側面があります。中間管理職に対しては、AIが仕事を肩代わりしてくれるおかげで、より解決が困難な課題に集中でき、人間の判断力や創造性を要する業務に取り組む余裕が生まれる――すなわち、退屈な反復作業が減って、より多くの経営管理業務に取り組めるようになるのだというメッセージを伝えることが重要です。
積極的にインセンティブを提供すること。新しいプラットフォームやAIの投資利益率が高いという事実を伝えるだけにとどめず、これらを実務レベルで使いこなす従業員にはインセンティブを提供します。どんなインセンティブにするかは企業の文化によって異なりますが、勤務評定にKPIを反映させる、ボーナスをリアルタイムで支給する、抽選を行って大きな賞を提供する、などが考えられます。インセンティブによって最初の使用を促せば、受け入れが加速します。AIが自分たちの生産性を向上させることを実感できるようになれば、誰もが積極的に使うようになるでしょう。
トップダウンで推進者の役割を担う人を任命し、社内風土の変化を推進すること。推進者は、AI導入のメリットを頻繁に繰り返し発信します。AIの活用は戦略に沿った望ましい施策であること、顧客のためだけでなく自社の健全性や成長にも有益であることをメッセージとして伝えれば、新技術への適応や文化の変容がより迅速に定着するはずです。
データ抽出は、AIの活用分野としては面白みに欠けると感じられるかもしれませんが、注意深く見てみると、決してそうではないことが分かります。自動知能や拡張知能といったソリューションを導入することで、これまで時間がかかりミスが発生しがちだったプロセスが改善され、業務のスピードアップと効率化の機会が明らかになり、長期的な成長に役立つ新しい知見を生み出すことが可能になるのです。地味な業務が、これまでになく楽しくなるはずです。
※本コンテンツは、PwCが2021年6月24日に発表した「It’s time to get excited about boring AI」を翻訳したものです。翻訳には正確を期しておりますが、英語版と解釈の相違がある場合は、英語版に依拠してください。