키보드→마우스→터치→???…빅테크들이 앞다퉈 사는 이 업종

글로벌 빅테크 기업들이 키보드와 터치스크린을 잇는 차세대 인터페이스로 음성 AI를 낙점하고 MS의 뉘앙스 인수(약 29조 원), 오픈AI의 io 인수(약 9.75조 원) 등 천문학적 투자를 이어가고 있습니다. 음성 인식 서비스 시장은 올해 237억 달러에서 2034년 약 1,040억 5,000만 달러로 4배 이상 성장할 전망이며, 이는 자율주행차와 로봇 등 피지컬 AI 시대를 대비한 전략적 움직임으로 풀이됩니다.

AI 요약

PC 시대의 키보드·마우스, 스마트폰 시대의 터치스크린에 이어 음성이 차세대 인터페이스의 표준으로 급부상하고 있습니다. 구글, 애플, MS, 메타 등 글로벌 빅테크들은 생성형 AI 기술과의 시너지를 극대화하기 위해 음성 스타트업 인수에 막대한 자금을 투입하고 있습니다. 특히 자율주행차나 휴머노이드 로봇과 같은 '피지컬 AI'와 개인용 비서인 '에이전트' 시장이 열리면서, 직접 기기를 조작하기보다 음성으로 명령을 내리는 시스템이 필수적인 요소가 되었기 때문입니다. 이에 따라 과거 마우스와 터치스크린이 하드웨어 혁명을 이끌었듯, 이제는 고도화된 음성 기술이 새로운 기기 작동 패러다임을 형성하며 시장의 판도를 바꿀 것으로 예상됩니다.

핵심 인사이트

  • 천문학적 규모의 M&A: 마이크로소프트(MS)는 2022년 의료 특화 대화형 AI 기업 '뉘앙스'를 197억 달러(약 29조 원)에 인수했으며, 오픈AI는 2023년 5월 인터페이스 개발 스타트업 'io'를 65억 달러(약 9조 7,500억 원)에 인수했습니다.
  • 음성 AI 시장의 폭발적 성장: 전 세계 음성 인식 서비스 시장 규모는 2024년 237억 달러에서 2034년 1,040억 5,000만 달러(약 140조 원)로 성장이 예측되며, 연평균 성장률(CAGR)은 20.3%에 달할 전망입니다.
  • 애플의 선제적 투자: 애플은 올해 1월 이스라엘의 무성 대화 인식 스타트업 'Q.ai'를 20억 달러(약 3조 원)에 인수하며 차세대 먹거리 확보에 나섰습니다.
  • 정치적 변수 발생: 메타는 중국 스타트업 '마누스AI'를 20억 달러에 인수하려 했으나, 중국 정부가 해당 기술을 '국가전략자산'으로 규정하고 인수를 불허하며 차질을 빚고 있습니다.

주요 디테일

  • 구글의 신기술: iOS용 음성 받아쓰기 앱 'AI 에지 엘로퀀트'를 공개, 두서없는 음성도 AI가 문맥을 파악해 정제된 텍스트로 변환하는 기능을 제공합니다.
  • 애플의 시리 고도화: 내달 개최되는 'WWDC 2026'에서 자체 생성형 AI를 결합해 기능을 대폭 강화한 시리(Siri)의 새로운 버전을 공개할 예정입니다.
  • Q.ai의 독보적 기술: 사용자가 소리 내어 말하지 않아도 얼굴 근육의 움직임을 분석해 의사소통할 수 있는 '무성 대화 인식' 기술을 보유하고 있습니다.
  • 메타의 공격적 확장: 메타는 지난해 플레이AI, 웨이브폼스, 리미트리스 등 다수의 음성 관련 스타트업을 연달아 인수하며 음성 에이전트 기술 확보에 집중하고 있습니다.
  • 피지컬 AI 대응: 자율주행차나 로봇 등 물리적 하드웨어 조작 시 터치 방식의 한계를 극복하기 위한 수단으로 음성이 최적의 인터페이스로 꼽히고 있습니다.

향후 전망

  • 음성 기술은 단순히 말을 텍스트로 바꾸는 수준을 넘어, 사용자의 의도를 파악해 기기를 직접 작동시키는 '음성 기반 에이전트'로 진화할 것입니다.
  • 키보드, 마우스, 터치스크린에 이은 제4의 인터페이스 혁명이 자율주행과 로봇 산업의 대중화를 앞당기는 촉매제가 될 것으로 기대됩니다.
Share

이것도 읽어보세요

댓글

이 소식에 대한 의견을 자유롭게 남겨주세요.

댓글 (0)

불러오는 중...