2023-02-13
MLOpsは、Machine Learning Operations(機械学習オペレーション)の略語です。機械学習(Machine Learning 以降MLと略)、DevOps、およびデータエンジニアリングを組み合わせた一連のプラクティスであり、MLシステムを本番環境に確実かつ効率的にデプロイおよび維持することを目的としています[1]。
PwC Japanグループの2022年AI予測(日本)[2]によると、AI活用においては、内製化または自走化が重要な成功要因となるのです。特に「運用改善(MLOps)」のフェーズにおいて、内製化率に大きな差があることが分かります。運用フェーズがAIの価値を高める最も重要なフェーズです。運用フェーズを内製化できている企業ほど、AIの効果を享受できている可能性が高いと推察されます。
今回は、通信業界企業バックオフィス部門をクライアントとした機械学習プロジェクトにおける一部MLOpsの実践をご紹介します。当該クライアントのポリシーに従い、以降の前提条件と制限があると理解ください。
RPAでデータを取り込み、それらのデータをオンラインストレージとローカルドライブに保存し、定期的なバッチを使用してAIモデルの推論と再トレーニングを実行します。
ローカルドライブ割り当てによるオンラインストレージサービスは、データストレージオプションとして使用されます。そのため、データと構成ファイルのアップロード、データのダウンロード、データの検証と修正をリモートで行うことができます。
RPAを使用して、さまざまなシステムからデータを取り込み、ローカルドライブに保存します。その後、データはオンラインストレージサービスに同期されます。
最終的なAIアプリケーションはオンラインストレージに展開され、運用環境のローカルドライブに同期されます。そのため、必要に応じてどこからでもAIアプリケーションプログラムを更新できます。
入力データの準備ができたら、オペレーターはローカルドライブのトリガーファイル(目標フォルダ名入力ためのテキストファイル)を更新することでAIアプリケーションを手動で実行し、オンラインストレージにアップロードできます。
オンプレミスサーバーでは、推論されるデータ、トリガーファイル、およびその他の構成ファイルがローカルドライブに同期されます。
オンプレミスサーバーでは、定期的なバッチ(5分間隔など)によってAIアプリケーションが定期的に実行されます。
AIアプリケーションロジックは、トリガーファイルの内容をチェックします。有効な実行条件が設定されていれば、以下のロジックが実行されます。
重複実行を避けるために、AIプログラムは読み取り後にトリガーファイルをリセットします。
AIアプリケーションは新しいデータを推測し、結果を表計算ソフトに出力します。推論結果だけでなく、各データの確信度も結果ファイルに書き込まれます。
オペレーターは、ローカルドライブに同期された後、結果データを検査することができ、確信度の低い推論結果から優先的にチェックを行います。出力された表計算ソフトのファイルは、オペレーターが正しい判定結果が入力できるように設計されています。
AIモデルの再トレーニングの自動化は、MLOpsにとって不可欠な部分です。
再トレーニングプログラムは定期的に(例:1カ月に1回)実行され、オペレーターから修正データを読み取り、それらの修正を現在のトレーニングデータとマージします。次に、プログラムで新しいデータに応じてハイパーパラメーターの最適化も行われます。最後に、新しいAIモデルが構築され、AIアプリケーションフォルダーにデプロイされます。
オンプレミスサーバーの定期スケジューラとローカルドライブを使用したオンラインストレージサービスを使用することで、以下のアーキテクチャを実現することができます。
そのため、AIモデルは人間から新しい知識を取得することで継続的に進化することができます。1年間の稼働後、AIモデルは99.3%以上の精度を維持しました。
もちろん、このアーキテクチャはMLOpsの完全な実践ではありません。例えば、CI/CD利用のデプロイ自動化はまだ実装されていません。ただし、前述の背景と制限があるため、これはコロナ禍のオンプレミス環境でMLOpsを実践するための良い試みであると言えます。
[1] Breuel, C. ‘ML Ops: Machine Learning as an Engineering Discipline.’ Towards Data Science
2022年12月7日アクセス https://towardsdatascience.com/ml-ops-machine-learning-as-an-engineering-discipline-b86ca4874a3f
[2] ‘2022年AI予測(日本)’, PwC Japanグループ
2022年12月7日アクセス https://www.pwc.com/jp/ja/knowledge/thoughtleadership/2022-ai-predictions.html
G.Zhao
システム開発会社を経て現職。通信業界におけるデータ分析とAIツール開発、省庁におけるテレワーク環境整備調査、社内Digital Product(Intelligent Business Analytics Tool)開発チームのマネジメントなどに従事。
(1):テック人材の採用と維持における企業の課題
(2):フィーチャーエンジニアリングとは?
(3):SNSを活用したコロナ禍における人々の心理的変化の洞察
(4):自然言語処理(NLP)の基礎
(5):今、データサイエンティストに求められるスキルは何か?データサイエンティスト求人動向分析
(6):コロナ禍における人流および不動産地価変化による実体経済への影響
(7):「匠」の減少―技能継承におけるAI活用の道しるべ
(8):開示された企業情報におけるESGリスクと財務インパクトの関係性の特定
(9):ビッグデータ分析で特に重要な「非構造化データ」における「コンピュータービジョン(画像解析)」とは
(10):自然言語処理・数理最適化による効率的なリスキリングの支援
(11):スポーツアナリティクスの黎明 サッカーにおけるデータ分析
(12):AIを活用した価格設定支援モデルの検討―外部環境変化に即座に対応可能な次世代型プライシング
(13):MLOps実現に向けて抑えるべきポイントー最前線
(14):合成データにより加速するデータ利活用
(1):ブロックチェーン技術の成熟度モデルとステーブルコインの最新動向について
(2):3次元空間情報の研究施設「Technology Laboratory」のデジタルツイン構築とデータの管理方法
(3):3次元空間情報の研究施設「Technology Laboratory」における共通ID「空間ID」と自律移動体の測位技術
(4):G7群馬高崎デジタル・技術大臣会合における空間IDによるドローン運航管理
(1):COVID‐19パンデミック下のオンプレミス環境におけるMLOpsプラクティス
(2):機械学習を用いたデータ分析
(3):AWSで構築したIoTプラットフォームのPoC環境をGCPに移行する方法
(4):テクノロジーの社会実装を高速に検証するPwCの独自手法「Social Implementation Sprint Service」-テクノロジー最前線
(5):自動車業界におけるデジタルコックピットの擬人化とインパクト
(6):成熟度の高いバーチャルリアリティ(VR)システム構築理論の紹介
(7):イノベーションの実現を加速する「BXT Works」とは
(8):Power Platformの承認機能、AI Builderを活用して業務アプリを開発する方
(9):社会課題の解決をもたらす先端テクノロジーとディサビリティ インクルージョンの可能性