生成AI―新たな働き方革命の波に乗る―テクノロジー最前線 生成AI(Generative AI)編(11)

生成AIの技術動向から見る将来像:前編 生成AIの次の一歩

  • 2024-02-19

生成AIに関する実態調査2023 秋」によると、多くの企業が生成AI技術全般の理解や動向を重要視している様子が伺えます。これを受けて、生成AIの技術動向から見る将来像に関する仮説を前後編にわたって紹介します。後編の最後に、これらの内容を踏まえた生成AIの来るべき将来への備えを考えていきます。

後編はこちら

「過度な期待」のピーク期からの脱却

ガートナー社が発表した「日本における未来志向型インフラ・テクノロジのハイプ・サイクル:2023年」1 によると、生成AIは「過度な期待」のピーク期を迎えています。この「過度な期待」のピーク期の後に訪れる幻滅期をどのように乗り越えるかが、生成AIの真の価値を引き出すカギとなるでしょう。一足先に、安定的な成長を始めた従来のAI(パターン認識、予測など)の潮流を振り返りながら、生成AIの将来を考えていきます。

従来のAI技術は、第3次AIブームを発端に2018年頃には過当とも言える期待を受けていました。この時期には、画像認識や音声認識などに関する数多くのサービスやPoC(Proof of Concept)が登場しましたが、多くが期待を満たせない結果に終わりました。

しかし、この頃には後に生成AIの基礎となるTransformerモデルのような、AI技術の発展に欠かせない革新的な論文が発表されました。これらの重要な技術的進展は、新しいAIサービスやAI開発のための統合環境の登場を促し、ビジネスプロセスへのAI導入を加速させたと考えられます。この時期に生まれた技術とサービスは、AIの実用化と産業への浸透を促進する重要な役割を果たしたと言えるでしょう。

この頃に注目すべきサービスと重要な研究成果を出した企業を比較すると、それらは異なっており、利用者と開発者・研究者が分断されていた可能性が高いと推察されます。それが従来のAIへの過当とも言える期待を生み出す一因となったと考えられるでしょう。一方で、このような分断が少なかった業界では、AIによる価値創出がいち早く実現されました。例えばEC業界では、大手ECプラットフォームが自社で研究開発したAIモデルを商品推薦システムや在庫管理に組み込むことで、大きな効果を上げています。このことは、「過度な期待」のピーク期を迎えた生成AIの今後の展望に重要な教訓を与えるものだと考えられます。新たな技術やサービスに対する期待が現実と乖離しないよう、技術的な理解を深め、持続可能な発展と実用化への道筋を慎重に検討することが不可欠だと言えるでしょう。

「生成AIに関する実態調査2023 秋」によると、企業の管理職の9割程度が自社で生成AIの活用を推進している、または検討中であると回答しており、現在は生成AIの技術的な検証や可能性を検討する、いわば「実現性検証」のフェーズにあると考えられます。従来のAIの流れを踏まえると、このフェーズにおいては単一のサービスの検証だけでなく、多様な組織が発表する技術や研究成果に注目し、それらを横断的に検証することが次世代の生成AIサービス開発に向けて欠かせないプロセスだと考えられます。これらの洞察を基に、今後注目すべき技術動向について次節で詳しく掘り下げます。

また、技術動向を追う上では、研究者のキャリアの流動性に注意が必要です。生成AI分野における重要な論文の著者の中には、論文発表時に在籍していた企業を離れ、新たなスタートアップを立ち上げているケースが目立ちます。これらのスタートアップは高い注目を集め、大手IT企業による投資が加速しています。このことから、技術動向を追う際は企業の動向だけでなく、個々の研究者とそのキャリアパスにも焦点を当てることが重要であると考えられます。

図1 従来のAIと生成

注目技術1.マルチモーダル化

注目すべき技術として、マルチモーダル(テキスト、画像、音声、プログラムなど複数の種類の情報を統合して処理すること)が挙げられます。現在の生成AIの多くは、Text-to-TextやText-to-Imageなど、単一の情報源に基づいて単一種類の情報を出力するシングルモーダルが一般的で、インターフェースとして自然言語のテキストを用いることが多いです。一方で、マルチモーダル化した生成AIは、インターフェースが必ずしもテキストではなく、生成物に複数の種類の情報を含めることも可能です。例えば、ユーザーは生成AIに動画をインプットし、動画の雰囲気に合ったBGMや短い詩を生成することもできます。

生成AIの進歩においては、マルチヘッドアテンションや専門家統合モデル(MoE:Mixture-of-Experts)といった「処理をマルチ化させる技術」が重要な役割を果たしています。これらの技術は、複数の情報源を効率的に処理することを可能にし、生成AIのマルチモーダル化の基礎となっていると考えられます。また、生成AIのマルチモーダル化は、生成AIをハブとした従来のAIアセットやシステムとの統合を可能にし、その応用範囲は既存の生成AI活用検討範囲に留まりません。例えば、RAG(Retrieval Augmented Generation)などを用いて生成AIに社内文章を連携・参照させる際、社内文章に含まれる図面や画像をうまく読み込めないという課題があります。生成AIがマルチモーダル化すれば、テキストと図面・画像を統合して処理することが可能になるため、複数種類の情報が混在した資料などを生成AIに連携・参照させることが容易になると予想されます。

生成AIのマルチモーダル化は、既に実用段階に入っており、多様なアプリケーションが登場しています。例えば、画像や音声に対応する機能が搭載されたものや、画像生成AIに統合されたものもあります。さらに、ユーザーの入力目的に基づいて計画や行動を生成する機能を備えたシステムも登場しています。このような進展は、生成AIがビジネスプロセスに革命をもたらす可能性を示唆しており、今後もこの分野の発展が加速することを予期させます。

図2 生成AIのマルチモーダル化

注目技術2.軽量化

生成AIの軽量化技術(AIモデルの性能を大きく劣化させずに、推論に必要な計算リソースを抑制する技術)は、モバイル端末へ生成AIを実装する上で非常に重要になります。従来のAIモデル(特に画像認識や音声認識分野)で見られたように、高性能だが計算リソースを大量に消費するモデルが登場した後、それらをモバイル端末で使えるように軽量化する動きが見られました。この傾向は生成AIにも適用される可能性が高く、モバイル端末への生成AI実装の報道2が出始めており、今後の発展が期待されます。

従来のAIで用いられた主要な軽量化手法として、モデルの枝刈り(Pruning)、量子化(Quantization)、蒸留(Distillation)があります。これらはそれぞれ、影響の少ないノードや重みの小さい接続を削除すること、パラメータをより少ないビットで表現すること、そして大きなモデルの入出力を小さなモデルで学習させることにより、軽量化を実現します。

これらの手法を応用した生成AIモデルの研究も進んでおり、軽量化されたモデルがラップトップやモバイル端末で効率よく動作することが報告されています。また、生成AIを汎用化させるのではなく、特定領域に特化させることでモデルを軽量化させることも可能です。

軽量化技術は、エッジ/モバイル端末における新たな生成AIアプリケーションの開発など、生成AIの活用範囲を大幅に広げるとともに、必要な計算リソースの削減によって企業が独自に生成AIを学習させることを容易にすると考えられます。そのような状況では、生成AIに学習・連携させるデータの質が重要であり、企業が蓄積してきたノウハウなどを含む質の高いデータを有している企業が有利になるでしょう。

図3 生成AIの軽量化

マルチモーダル化や軽量化は、従来のAIにおいても注目されていた技術であるものの、生成AIは従来のAIに比べ、これらの技術発展が急速に進んでいます。これら技術を迅速に採用することは、市場において企業に大きな優位性をもたらし、生成AIを使いこなす企業とそうでない企業との間に差を生むことが予想されます。また、生成AIの効果的な活用には質の高いデータを生成AIに学習・連携させることが不可欠です。しかし、企業が自社データの価値を過小評価し、安易に他企業へデータを共有する場合、そのデータに含まれる自社に蓄積されたノウハウなどが流出するリスクがあります。そのため、社外に共有すべき情報と自社内で保有すべき情報の切り分けを戦略的に決定することが重要となります。

企業は、生成AIの可能性を最大限に引き出すために、技術動向を見極めるとともに、データの質とその管理にも注意を払う必要があるでしょう。

1 Gartner®, プレスリリース, 2023年8月17日, Gartner、「日本における未来志向型インフラ・テクノロジのハイプ・サイクル:2023年」を発表

Gartnerは、Gartner, Inc.および/または米国とその他の国におけるその関連会社の商標およびサービスマークであり、HYPE CYCLEは、Gartner, Inc.および/またはその関連会社の登録商標であり、本書では許可を得て使用しています。All rights reserved. Gartnerは、Gartnerリサーチの発行物に掲載された特定のベンダー、製品またはサービスを推奨するものではありません。また、最高のレーティング又はその他の評価を得たベンダーのみを選択するようにテクノロジーユーザーに助言するものではありません。Gartnerリサーチの発行物は、Gartnerリサーチの見解を表したものであり、事実を表現したものではありません。Gartnerは、明示または黙示を問わず、本リサーチの商品性や特定目的への適合性を含め、一切の責任を負うものではありません。

2 Apple Rumored to Follow ChatGPT With Generative AI Features on iPhone as Soon as iOS 18

執筆者

三善 心平

パートナー, PwCコンサルティング合同会社

Email

上野 大地

シニアマネージャー, PwCコンサルティング合同会社

Email

塩原 翔太

マネージャー, PwCコンサルティング合同会社

Email

本ページに関するお問い合わせ