COVID‐19パンデミック下のオンプレミス環境におけるMLOpsプラクティスーテクノロジー最前線エンジニアリング編（1）

2023-02-13

MLOpsとは

MLOpsは、Machine Learning Operations（機械学習オペレーション）の略語です。機械学習（Machine Learning 以降MLと略）、DevOps、およびデータエンジニアリングを組み合わせた一連のプラクティスであり、MLシステムを本番環境に確実かつ効率的にデプロイおよび維持することを目的としています[1]。

なぜMLOpsが必要なのか

PwC Japanグループの2022年AI予測（日本）[2]によると、AI活用においては、内製化または自走化が重要な成功要因となるのです。特に「運用改善（MLOps）」のフェーズにおいて、内製化率に大きな差があることが分かります。運用フェーズがAIの価値を高める最も重要なフェーズです。運用フェーズを内製化できている企業ほど、AIの効果を享受できている可能性が高いと推察されます。

背景

今回は、通信業界企業バックオフィス部門をクライアントとした機械学習プロジェクトにおける一部MLOpsの実践をご紹介します。当該クライアントのポリシーに従い、以降の前提条件と制限があると理解ください。

AIが稼働する専用サーバーを必要とします。その理由は次のとおりです。
- オンデマンド実行が求められるため、サーバーが常に稼働されている必要があります。
- AIの推論とモデルを学習させる（再トレーニングの）ためには、多くのコンピューティングリソースが必要です。
AIアプリケーションは、データポリシーに基づいてオンプレミスサーバーでホストする必要があります。
最終的なビジネスユーザーは新型コロナウイルス感染症（COVID-19）の影響により基本的に自宅で仕事をしているため、AIツールとデータはリモートで操作可能です。
APIでのデータ連携は実装できません。

ソリューション

RPAでデータを取り込み、それらのデータをオンラインストレージとローカルドライブに保存し、定期的なバッチを使用してAIモデルの推論と再トレーニングを実行します。

データの保存と取り込み（MLOps：データ準備）

ローカルドライブ割り当てによるオンラインストレージサービスは、データストレージオプションとして使用されます。そのため、データと構成ファイルのアップロード、データのダウンロード、データの検証と修正をリモートで行うことができます。

RPAを使用して、さまざまなシステムからデータを取り込み、ローカルドライブに保存します。その後、データはオンラインストレージサービスに同期されます。

AIアプリケーションのデプロイ（MLOps：デプロイ）

最終的なAIアプリケーションはオンラインストレージに展開され、運用環境のローカルドライブに同期されます。そのため、必要に応じてどこからでもAIアプリケーションプログラムを更新できます。

AIモデル推論（MLOps：推論）

入力データの準備ができたら、オペレーターはローカルドライブのトリガーファイル（目標フォルダ名入力ためのテキストファイル）を更新することでAIアプリケーションを手動で実行し、オンラインストレージにアップロードできます。

オンプレミスサーバーでは、推論されるデータ、トリガーファイル、およびその他の構成ファイルがローカルドライブに同期されます。

オンプレミスサーバーでは、定期的なバッチ（5分間隔など）によってAIアプリケーションが定期的に実行されます。

AIアプリケーションロジックは、トリガーファイルの内容をチェックします。有効な実行条件が設定されていれば、以下のロジックが実行されます。

最新のAIモデルの読み込み
トリガーファイルで指定された入力データの検証と前処理
データのベクトル化および結果の推測

重複実行を避けるために、AIプログラムは読み取り後にトリガーファイルをリセットします。

モニタリングとフィードバック（MLOps：監視）

AIアプリケーションは新しいデータを推測し、結果を表計算ソフトに出力します。推論結果だけでなく、各データの確信度も結果ファイルに書き込まれます。

オペレーターは、ローカルドライブに同期された後、結果データを検査することができ、確信度の低い推論結果から優先的にチェックを行います。出力された表計算ソフトのファイルは、オペレーターが正しい判定結果が入力できるように設計されています。

AIモデルの自動再トレーニングとデプロイ（MLOps：再訓練）

AIモデルの再トレーニングの自動化は、MLOpsにとって不可欠な部分です。

再トレーニングプログラムは定期的に（例：1カ月に1回）実行され、オペレーターから修正データを読み取り、それらの修正を現在のトレーニングデータとマージします。次に、プログラムで新しいデータに応じてハイパーパラメーターの最適化も行われます。最後に、新しいAIモデルが構築され、AIアプリケーションフォルダーにデプロイされます。

結論

オンプレミスサーバーの定期スケジューラとローカルドライブを使用したオンラインストレージサービスを使用することで、以下のアーキテクチャを実現することができます。

新しい入力データの定期的な取り込み
オンデマンドでAIモデルの推論をリモートで実行
運用者はリモートからAIの推論結果を監視し、誤った推論結果を修正
運用者の訂正結果を踏まえて新しいAIモデルを定期的に再トレーニングし、新しいモデルをAIアプリケーションにデプロイ

そのため、AIモデルは人間から新しい知識を取得することで継続的に進化することができます。1年間の稼働後、AIモデルは99.3%以上の精度を維持しました。

もちろん、このアーキテクチャはMLOpsの完全な実践ではありません。例えば、CI/CD利用のデプロイ自動化はまだ実装されていません。ただし、前述の背景と制限があるため、これはコロナ禍のオンプレミス環境でMLOpsを実践するための良い試みであると言えます。

参考

[1] Breuel, C. ‘ML Ops: Machine Learning as an Engineering Discipline.’ Towards Data Science
2022年12月7日アクセス https://towardsdatascience.com/ml-ops-machine-learning-as-an-engineering-discipline-b86ca4874a3f

[2] ‘2022年AI予測（日本）’, PwC Japanグループ
2022年12月7日アクセス https://www.pwc.com/jp/ja/knowledge/thoughtleadership/2022-ai-predictions.html

G.Zhao
システム開発会社を経て現職。通信業界におけるデータ分析とAIツール開発、省庁におけるテレワーク環境整備調査、社内Digital Product（Intelligent Business Analytics Tool）開発チームのマネジメントなどに従事。

テクノロジー最前線―先端技術とエンジニアリングによる社会とビジネスの課題解決に向けて

本ページに関するお問い合わせ

© 2004 - 2026 PwC. All rights reserved. PwC refers to the PwC network and/or one or more of its member firms, each of which is a separate legal entity. Please see www.pwc.com/structure for further details.

MLOpsとは

なぜMLOpsが必要なのか

背景

ソリューション

データの保存と取り込み（MLOps：データ準備）

AIアプリケーションのデプロイ（MLOps：デプロイ）

AIモデル推論（MLOps：推論）

モニタリングとフィードバック（MLOps：監視）

AIモデルの自動再トレーニングとデプロイ（MLOps：再訓練）

結論

参考

テクノロジー最前線―先端技術とエンジニアリングによる社会とビジネスの課題解決に向けて

データアナリティクス&AI編

エマージングテクノロジー編

エンジニアリング編

本ページに関するお問い合わせ

関連情報

データアナリティクス

テクノロジー最前線―先端技術とエンジニアリングによる社会とビジネスの課題解決に向けて

サイバーセキュリティ＆プライバシー インサイト・対談

PwC Japanグループ 採用情報