‘제3의 IT혁명 디바이스 시대’가 온다

내 손 안의 AI, 온디바이스 AI(On-Device AI) | 삼일PwC경영연구원

인류의 삶에 큰 영향을 준 IT 기술은 여러가지가 있습니다만 혁명적이라고 할 수 있는 변화는 크게 3가지로 나뉠 수 있습니다. 첫 번째는 인터넷 보급에 따른 PC의 등장이고, 두 번째는 스마트폰의 대중화입니다. 그리고 세 번째는 2022년말 이후 핫 이슈가 된 생성형 AI의 출현이며 그것을 기기 안에 탑재한 ‘온디바이스 AI’라고 생각됩니다. 이제 삼일PwC경영연구원에서는 이제 막 개화하기 시작된 온디바이스 AI의 현황과 전망, 필요 기술 등을 살펴봄으로써 국내 기업들이 경쟁력 우위를 점하기 위한 대응 방안을 제시하고자 합니다.

Prologue. ‘제3의 IT 혁명을 탑재한 디바이스 시대’의 도래

  • 제1의 IT혁명은 인터넷 발명에 따른 PC의 보급 → 제2의 IT 혁명은 스마트폰의 대중화 → 제3의 IT 혁명은 생성형 AI의 출현에 따른 ‘온디바이스 AI’ 시대
IT 혁명 디바이스: PC(인터넷) → 스마트폰(IoT) → 온디바이스 AI (AI 탑재 디바이스)

Source: 언론종합, 삼일PwC경영연구원

I. 온디바이스 AI의 개요 및 부상배경

  • 개요: ‘엣지 AI(Edge AI), ‘타이니 AI(Tiny AI)’라고 불리기도 하는 온디바이스 AI는 말 그대로 스마트폰, 노트북, 자동차, 드론, 로봇 등 기기 자체에서 AI 기능을 수행하는 기술임.
    • 온디바이스 AI는 멀리 떨어진 클라우드 서버를 거치지 않으며, 인터넷과 네트워크 연결 없이 기기 자체적으로 AI 모델을 수행하여 사용자 데이터를 수집하고 학습함.
클라우드 기반 AI vs. 온디바이스 AI 개념 이해

Source: 언론종합, 삼일PwC경영연구원

  • 특징: 온디바이스 AI의 주요 장점으로는 ① 빠른 서비스 제공, ② 데이터 보안 강화, ③ 자유로운 작동 환경, ④ 데이터 센터 운영비 및 에너지 소모량 절감, ⑤ 개인화된 AI 수요 대응 등이 있음. 이 외에도 대규모 하드웨어 인프라가 불필요해 유지보수 비용이 저렴한 등, 비용과 시간 측면에서 매우 효율적인 기술로 평가받고 있음. 다만, 클라우드 기반 AI 대비 처리하는 데이터 양이 적어 산출되는 결과물의 완성도가 부족할 수 있다는 점이 단점임.
부상 배경

* 엣지 컴퓨팅: 클라우드 컴퓨팅과 반대되는 개념으로, 인터넷이 아닌 로컬 장치(예: 스마트폰, 태블릿, IoT 장치 등)에서 데이터를 처리하는 기술

II. 온디바이스 AI 밸류체인

  • 온디바이스 AI 밸류체인과 주요 기업들

Source: 미래에셋증권, 삼일PwC경영연구원

주) NPU: 전력 소모가 적고 AI 추론을 효율적으로 수행하는 전용 프로세서

III. 온디바이스 AI 기술 현황

  • AI 기술이 확대되면서 함께 변화하고 있는 대표적인 산업이 ‘반도체’임. 특히 AI반도체 분야는 기존 반도체 강자들 뿐 아니라 글로벌 빅테크 기업들까지 엄청난 투자와 M&A를 통해 경쟁력 확보를 하려고 시도 중임
  • AI 반도체 현황 및 전망
    • (정의) 인공지능 서비스 구현에 필요한 대규모 연산을 초고속·저전력으로 실행하는 비메모리 반도체로 AI의 핵심 두뇌
    • (종류) 대표적 AI 반도체로는 NPU(Neural Processing Unit, FPGA와 ASIC), PIM(processing in memory), 뉴로모픽(neuromorphic) 등이 있음
    • (전망) AI반도체는 생산성 개선과 비용 효율성 측면에서 전 산업 지형을 크게 변화시킬 것으로 예상되며 중장기적으로 반도체 수요의 구조적 상승을 견인할 것으로 예상
      • 향후에는 용량대비 비싸더라도, 더 큰 용량과 더 큰 대역폭을 제공하는 메모리가 중요해짐에 따라 HBM(고대역 메모리)의 수요는 더욱 증가할 것으로 예상 → AI반도체 수요 급증하면서 ’24년 하반기 이후에는 반도체 공급 부족 전망도 나오고 있음
      • 엔비디아 vs. 反 엔비디아의  경쟁 확대로 반도체 수요 급증은 가속화될 것으로 예상
  • AI 반도체 하드웨어(HW) 기술 현황
    • 아직까지는 성능이 좋은 NPU를 디바이스에 탑재한다고 하여도 챗GPT와 같은 거대 AI 모델을 그 NPU 하나로 구동시킬 수는 없음.
    • NPU 개발 역사는 GPGPU 대비 짧기 때문에 고도의 완성도를 지닌 NPU가 현재까지는 많지 않으나, NPU를 개별 AI 서비스에 최적화하여 만든다면 학습과 추론면에서 GPGPU보다 우수할 것
    • 현재 국내외 주요 빅테크 및 반도체 기업들은 풍부한 자금을 기반으로 자체 NPU 개발 및 출시 중이며,해외에서 반도체 칩 전문 스타트업에서도 그에 상응하는 AI 반도체 개발에 나서는 중임. 국내 중소기업 및 스타트업의 경우 자율주행, IoT, 금융 등 응용 분야에 특화된 AI 반도체를 개발 및 상용화 추진 중임
CPU, GPU, NPU의 구조

주) ALU: arithmetic and logical unit, 산술 논리 장치 / Cahe: 자주 사용하는 데이터나 값을 미리 복사해 놓는 임시 장소

  • AI 반도체 소프트웨어(S/W) 기술 현황
    • 대표적인 AI 반도체 소프트웨어 기술은 ‘AI 경량화 기술’임. 이 기술은 ① 온디바이스 환경 전용 경량화된 AI 모델 및 추론 기술개발과, ② 기존 AI 모델을 경량화하는 기술로 나뉨
온디바이스 AI 소프트웨어 기술개발 동향

Source: 언론종합, ETRI, 삼일PwC경영연구원

IV. 향후 전망

시장 전반
  • 온디바이스 AI 시장은 AI 기술 향상 및 기기 적용의 본격화와 5G 네트워크 기술의 발전으로 향후 가파른 성장세를 보일 것으로 전망됨
  • 또한, 올해부터 온디바이스 AI가 급격히 확대되며 2028년에는 전체 PC 시장의 80%, 스마트 폰 시장의 60%가 AI를 탑재할(AI PC, AI 스마트폰) 것으로 전망됨
메모리반도체 D램
  • 온디바이스 AI 시장이 열리며 기존보다 더 작은 크기의 고성능과 저전력의 반도체가 주목받게 될 것
  • 2024부터 온디바이스 AI 제품들의 서비스 확대가 예상되면서 서버에서 차지하는 D램 비중은 2023년 17%에서 2027년 38%로 4배가량 증가할 것으로 전망되며 이에 따라 2023년 말부터 회복세를 보이고 있는 모바일 D램의 가격은 10% 내외의 추가 상승이 전망됨. 
  • 고부가 D램이 온디바이스 AI의 주요 솔루션으로 떠오르면서 ‘공급자 우위’ 추세가 당분간 지속될 전망이며, 업계에서는 AI 메모리 반도체는 다양한 영역의 맞춤형 주문이 가능해 향후 수주형 비즈니스로 변할 것으로 전망하고 있음
하드웨어 기기
  • 온디바이스 AI 기술이 발전함에 따라 PC, 스마트폰, 가전, 자동차 등 전 산업 분야에서 신규 수요를 창출할 것. 단기적으로는 ‘개인용 스마트폰’과 ‘개인용 PC’ 시장이 더욱 진화되어 활성화될 전망임.
  • 또한 스마트폰과 PC외에도 온디바이스 AI는 XR 헤드셋, 로봇, 자율주행차, 드론 등 다양한 하드웨어 기기에 빠르게 적용될 것으로 예상됨에 따라, 하드웨어 경쟁력 강화 시도가 이어질 것
결국 하드웨어 기기에 이어 소프트웨어, 칩, 서비스까지 수직 통합 기반의 시스템을 구축할 수 있는 player가 AI 시대의 진정한 강자가 될 수 있을 것

V. 시사점 및 제언

시사점
  • 2022년부터 LLM 중심으로 AI 대중화 시작
  • 2024년부터는 모든 기기에 AI가 탑재되는 온디바이스 AI 시대가 시작될 것임
  • 이에 따라 관련 산업의 폭발적 성장이 예상되는 바, 이에 대한 전방위적 준비가 필요해 보임
    • 성장예상 분야: 기기 전반(가전 등)의 폭발적 대체수요, 온디바이스 AI 전용 반도체, AI 경량화 기술 또는 경량 AI모델, DRAM 메모리 반도체 등 반도체 전반, 배터리(경박단소화) 등
제언
  • 온디바이스 AI 시장 본격 개화에 따라 관련 기술(생성형 AI, 엣지 기술, 고성능∙저전력 AI 반도체 등)보유업체에 대한 적극적인 투자 및 M&A 경쟁 불붙을 예정 → 기업들의 신속한 대응 방안 요구됨
  • 기업의 주어진 데이터를 기반으로 질 높은 데이터(의미 있는 인사이트)를 확보하는 역량이 중요해질 것 → 기업의 데이터 경쟁력이 곧 비즈니스 성과와 직결될 것
  • 온디바이스 AI의 한계점도 고려해 예상하지 못한 문제점들을 대응할 수 있는 역량 길러야 할 것 → 잠재적 리스크 사전에 파악하여 예방할 수 있는 역량 중요
  • 조만간 ‘앰비언트 컴퓨팅(Ambient Computing)’ 시대가 올 것 → 온디바이스 AI 기기들이 조화롭게 운용될 수 있는 연계 방안 요구됨
Follow us