2022-05-18
今回紹介するのは、自然言語処理を用いたメンタルヘルス分析の事例です。PwCコンサルティングではSNSを活用して、東日本大震災における人々の心理的変化を分析してきました。この取り組みを応用し、コロナ禍における人のメンタルヘルスの変化を定量的に評価しました。
新型コロナウイルス感染症の世界的な流行は、私たちの生活を一変させました。自身が感染症に罹る不安、無症状病原体保有により周囲に感染させてしまう不安といった「感染症そのものに対する不安」。新しい生活様式による職場・学校でのオンライン化(非対面化)による不安、マスクなどの一部商品が品薄になることへの不安といった「生活における不安」。ワクチン供給や医療体制の不足、ワクチン接種による副反応等に対する「医療における不安」。著名人が罹患したとのニュースや、不正確な情報(デマ)などから生じる「社会における不安」。それらはいずれも、感染症の蔓延前には想定し得なかった新たなストレスとして、私たちの心理に少なからず影響を与えてきました。
一部メディアによって「コロナうつ」という言葉が取り沙汰されているように、コロナ禍における心の不調は社会問題となっています。OECD(経済協力開発機構)の調査によれば、日本国内のうつ病の有病率は新型コロナウイルス蔓延前の2013年に7.9%であったものが、2020年初頭には17.3%とおよそ2.2倍にまで増加し*1、国内の2020年の自殺者数も著名人の死にも影響されてリーマンショック以降11年ぶりに増加に転じたと報じられています*2。
以上のことから、コロナ禍におけるメンタルヘルスの把握・不調の早期発見とそのケアは非常に重要なテーマであり、それを実現できる技術の開発が望まれます。
PwCコンサルティングでは、東日本大震災から10年目の節目の年となるタイミングにおいて、過去10年間のSNSへの投稿内容から、自然言語処理を用いて被災者と非・被災者のメンタルヘルスの状態を読み取り、メンタルヘルスの変化に関する分析を行いました。
メンタルヘルスの変化はSNSへの投稿という「行動」によって表出されると仮定した際、投稿に含まれる感情表現を捉えることで、投稿時の感情状態を推定することが可能となります。三浦・鳥海(2014)*3に倣い、この感情状態を推定するために感情語辞書を作成し、メンタルヘルスの状態を定量化しました。定量化において、健康(ポジティブな感情)、不健康(ネガティブな感情)をそれぞれ指し示す単語を定義し、投稿における単語の含有数によって投稿時における投稿者の感情状態を評価しました。評価の際に用いたインデックスをMFI(Mental Fluctuation Index)*4と名付け、健康投稿率と不健康投稿率の差分によって、投稿者の心理状態の時系列変化を測定しました。
その結果、発災直後は、被災者のメンタルヘルスが大きく不健康な状態に陥ったものの、復旧対策期には発災前の水準まで回復し、復旧対策期では、発災前の状態より良好な状態となっていることが分かりました(図1)。さらに、復興支援期においては被災者と非・被災者のMFI平均値の統計的有意差がなくなり、被災者と非・被災者は同水準のMFIである、つまり、被災者のメンタルヘルスが回復したことが示唆されました。
このような東日本大震災におけるメンタルヘルスケア分析のスキームを利用して、コロナ禍前後におけるメンタルヘルスの状態を評価しました。
東日本大震災における分析でも、2020年頃にMFIが低下していますが(図1)、投稿内容を具体的に見ていくと、「コロナ」という単語とネガティブな単語が併記されており、コロナによる影響が見て取れます。
ただし、あくまで母集団が東日本大震災の分析の際に抽出したアカウントであり、「発災当時にアカウントを持っていた者」という前提のため、2020年にかけて投稿数が減少してくること等に鑑み、改めて母集団を抽出しなおして評価していく必要があります。
今回は以下の分析条件のもと、前述のOECDの調査を参考に、コロナ前後の1年間の投稿データを用いてそれぞれのMFIの平均値を比較しました。
分析イメージ図
(上図はイメージ)
さらに、人流や経済指数等のさまざまなデータとの相関を分析しました。特に就業においては、美容室の倒産が4倍になり*6、また、ブライダル業界では1兆円規模の損失が見られたので*7、MFIと相関があるのかを確認しました。
データソースは、簡易的に、内閣官房デジタル田園都市国家構想実現会議事務局と内閣府地方創生推進室が提供しているV-RESA(https://v-resas.go.jp/)から抽出しました。
今回の調査では東日本大震災のケースを参考に、SNSを活用した人々のコロナ禍におけるメンタルヘルスの変化も定量的に評価することができました。今後も同様のスキームを利用することで、人々のメンタルヘルスの変化を早期に発見し、予防医学に応用することも可能であると考えています。また、産官学が一体となった社会課題解決に向けた取り組みも推進していきたいと思っています。
PwCのPurpose(存在意義)は「社会における信頼を構築し、重要な課題を解決する」ことです。私たちの活動がこの未曾有の事態を乗り切るための一助となることを願っています。
*1 OECD HP「Tackling the mental health impact of the COVID-19 crisis: An integrated, whole-of-society response」
https://www.oecd.org/coronavirus/policy-responses/tackling-the-mental-health-impact-of-the-covid-19-crisis-an-integrated-whole-of-society-response-0ccafa0b/
*2 厚生労働省自殺対策推進室、警察庁生活安全局生活安全企画課, 2021年「令和2年中における自殺の状況」
https://www.npa.go.jp/safetylife/seianki/jisatsu/R03/R02_jisatuno_joukyou.pdf
*3 三浦・鳥海 他(2014)「ソーシャルメディアにおける災害情報の伝播と感情:東日本大震災に際する事例」、2014年度近未来チャレンジ(人工知能学会)
*4 MFI =(健康投稿数-不健康投稿数)/総投稿数
=健康投稿数/総投稿数-不健康投稿数/総投稿数
=健康投稿率-不健康投稿率
*5 メンタルヘルスの状態が健康または不健康な場合に使用すると想定される単語をそれぞれ集めたリスト
*6 東京商工リサーチ,2021年10月8日「長引くコロナ禍で苦境の美容室、9月の倒産は4倍に【2020年度上半期】」
https://www.tsr-net.co.jp/news/analysis/20211008_05.html
*7 株式会社リクルート, 2021年6月16日「新型コロナ流行後のブライダル業界約1兆円損失も回復傾向 カップルの半数がオンライン参列導入への心理的ハードル低く」 https://www.recruit.co.jp/newsroom/pressrelease/2021/0616_8931.html
S.Kimura
外資系システム会社、外資系統計解析ベンダーを経て現職。データサイエンティストとして、さまざまな業界においてアナリティクスを活用した業務改善、顧客分析などに取り組む。
T.Kagemoto
基礎医学の研究に従事した後、大手教育業界のマーケティング担当を経て現職。RPAを活用した業務自動化支援、CSIRT立ち上げ支援、疾患予防プログラムの効果検証など、幅広いプロジェクトに従事。
T.Takahashi
大手メーカー、AIベンチャーを経て現職。金融業界における監査のDX支援、自動車OEMにおけるDX支援、省庁における施策の効果分析などを経験。
PwC Japanグループでは、データアナリティクス領域でご活躍いただける方を募集しています。本記事に関連する求人情報は以下ページよりご覧ください。
(1):テック人材の採用と維持における企業の課題
(2):フィーチャーエンジニアリングとは?
(3):SNSを活用したコロナ禍における人々の心理的変化の洞察
(4):自然言語処理(NLP)の基礎
(5):今、データサイエンティストに求められるスキルは何か?データサイエンティスト求人動向分析
(6):コロナ禍における人流および不動産地価変化による実体経済への影響
(7):「匠」の減少―技能継承におけるAI活用の道しるべ
(8):開示された企業情報におけるESGリスクと財務インパクトの関係性の特定
(9):ビッグデータ分析で特に重要な「非構造化データ」における「コンピュータービジョン(画像解析)」とは
(10):自然言語処理・数理最適化による効率的なリスキリングの支援
(11):スポーツアナリティクスの黎明 サッカーにおけるデータ分析
(12):AIを活用した価格設定支援モデルの検討―外部環境変化に即座に対応可能な次世代型プライシング
(13):MLOps実現に向けて抑えるべきポイントー最前線
(14):合成データにより加速するデータ利活用
(1):ブロックチェーン技術の成熟度モデルとステーブルコインの最新動向について
(2):3次元空間情報の研究施設「Technology Laboratory」のデジタルツイン構築とデータの管理方法
(3):3次元空間情報の研究施設「Technology Laboratory」における共通ID「空間ID」と自律移動体の測位技術
(4):G7群馬高崎デジタル・技術大臣会合における空間IDによるドローン運航管理
(1):COVID‐19パンデミック下のオンプレミス環境におけるMLOpsプラクティス
(2):機械学習を用いたデータ分析
(3):AWSで構築したIoTプラットフォームのPoC環境をGCPに移行する方法
(4):テクノロジーの社会実装を高速に検証するPwCの独自手法「Social Implementation Sprint Service」-テクノロジー最前線
(5):自動車業界におけるデジタルコックピットの擬人化とインパクト
(6):成熟度の高いバーチャルリアリティ(VR)システム構築理論の紹介
(7):イノベーションの実現を加速する「BXT Works」とは
(8):Power Platformの承認機能、AI Builderを活用して業務アプリを開発する方
(9):社会課題の解決をもたらす先端テクノロジーとディサビリティ インクルージョンの可能性