[7월2일] 'VLA vs 월드 모델' 경쟁의 의미…피지컬 AI 전쟁의 핵심은

과학기술정보통신부가 '피지컬 AI 핵심 경쟁력 확보 전략'에서 VLA(비전-언어-행동) 모델과 월드 모델을 핵심 기술로 제시했다. VLA는 LLM 기반 로봇 제어 모델로 생산 현장 안정성 문제가 지적되고, 월드 모델은 가상 시뮬레이션을 통한 학습 지원이나 환각 현상이 약점이다. 엔비디아는 두 모델의 장점을 결합한 '코스모스 3'를 오픈소스로 공개했으며, 업계는 모델보다 데이터 확보가 경쟁력의 핵심이라고 본다.

AI 요약

과학기술정보통신부가 발표한 ‘피지컬 AI 핵심 경쟁력 확보 전략’에서 핵심 기술로 ‘피지컬 AI 파운데이션 모델(VLA)’과 ‘월드 모델’이 함께 꼽혔다. VLA는 LLM 기반으로 로봇의 행동을 직접 제어하는 데 초점을 맞춘 반면, 월드 모델은 가상 시뮬레이션을 통해 세상을 예측하고 학습을 지원한다. 실리콘밸리에서는 두 진영이 팽팽히 대립 중이며, 월드 모델 진영이 최근 더 주목받고 있으나 VLA는 안정성 문제, 월드 모델은 환각 현상이라는 한계를 각각 지닌다. 업계는 두 모델의 장점을 결합한 하이브리드 형태(예: 엔비디아의 코스모스 3)나 ‘코드 애즈 폴리시’ 같은 제3의 대안도 모색 중이다. 궁극적으로 피지컬 AI 경쟁의 핵심은 모델보다 ‘데이터’에 달려 있으며, 로봇이 이해할 수 있는 행동 데이터로 정제하는 역량이 중요해질 전망이다.

핵심 포인트

  • 과기정통부, ‘피지컬 AI 핵심 경쟁력 확보 전략’에서 VLA와 월드 모델을 핵심 기술로 선정
  • VLA 진영: 엔비디아 ‘그루트’, 피지컬 인텔리전스 ‘파이’ 등 / 월드 모델 진영: 구글 딥마인드 ‘지니’, 얀 르쿤 ‘제파’, 페이페이 리 ‘월드랩스’ 등
  • 엔비디아, VLA와 월드 모델 장점 결합한 오픈소스 ‘코스모스 3(옴니모델)’ 공개
  • 젠슨 황 엔비디아 CEO “로봇 공학의 챗GPT 모멘트 왔다”, 일론 머스크 “휴머노이드 로봇이 AI의 다음 거대 시장”

향후 전망

  • VLA와 월드 모델 중 승자는 아직 불확실하나, 데이터 구축 및 정제 역량이 모델 개발 못지않게 중요해질 것
Share

이것도 읽어보세요

댓글

이 소식에 대한 의견을 자유롭게 남겨주세요.

댓글 (0)

불러오는 중...