실시간 대비 50,000배 빠른 속도로 자율주행 AI를 학습시키는 기술

GM은 자율주행 AI 연구팀장 Ben Snyder의 주도하에 실시간 대비 50,000배 빠른 속도로 AI를 학습시키는 기술을 개발하여, 도로 위 낙하물이나 샌프란시스코 정전 같은 '롱테일' 시나리오 해결에 집중하고 있습니다. 이 기술은 시뮬레이션, 강화학습, 시각 언어 행동(VLA) 모델을 결합하여 인간 수준의 상식적 판단력을 갖춘 확장 가능한 자율주행 시스템 구축을 목표로 합니다.

AI 요약

General Motors(GM)는 자율주행 기술의 완전한 상용화를 위해 도로 위에서 발생하는 예측 불가능하고 희귀한 사건인 '롱테일(long tail)' 문제를 해결하는 데 주력하고 있습니다. Ben Snyder GM AI 연구팀장은 단순한 일상 주행 데이터를 넘어, 샌프란시스코 정전으로 인한 신호등 마비나 도로 위 매트리스 방치와 같은 극한 상황에서의 안전성을 강조합니다. 이를 위해 GM은 실시간 대비 5만 배 빠른 속도로 시뮬레이션을 수행하여 AI를 학습시키는 환경을 구축했습니다. 특히 시각 언어 행동(VLA) 모델을 도입하여 공사장 인부의 수신호나 복잡한 주차장에서의 양보와 같은 인간적 상식을 기계가 학습하도록 설계했습니다. 이러한 기술적 도약은 GM이 지향하는 '아이즈-오프(eyes-off)' 고속도로 주행 및 완전 자율주행 차량 배포의 핵심 동력이 될 것입니다.

핵심 인사이트

  • 학습 속도 혁신: GM은 실제 주행 시간보다 50,000배 빠른 속도로 자율주행 AI를 학습시킬 수 있는 대규모 시뮬레이션 및 강화학습 인프라를 구축했습니다.
  • 롱테일 시나리오 집중: 도로 위 매트리스, 갑작스러운 소화전 파열, 대규모 정전 상황 등 발생 확률은 낮지만 치명적인 '롱테일' 사건 해결을 안전의 핵심 과제로 정의했습니다.
  • VLA 모델 도입: 단순 비전 인식을 넘어 텍스트와 행동을 결합한 Vision Language Action(VLA) 모델을 활용하여 공사장 수신호와 같은 복잡한 맥락을 해석합니다.

주요 디테일

  • 기술 스택 구성: GM은 자체 툴킷인 'GM Gym & Boxworld', 'SHIFT32', '온폴리시 증류(On-policy distillation)' 등을 활용해 확장 가능한 AI를 구축 중입니다.
  • 상식적 판단 구현: 붐비는 주차장에서 교통을 방해하지 않고 대기하거나, 임시 표지판을 이해하는 등 인간 운전자의 '예의'와 '상식'을 기계에 이식하는 연구를 진행합니다.
  • 불확실성 관리: '에피스테믹 불확실성 헤드(Epistemic uncertainty head)' 기술을 통해 AI가 자신의 판단에 대한 확신도를 스스로 평가하도록 설계했습니다.
  • 복합 AI 접근법: 일상적인 주행의 99%를 처리하는 기존 시스템에 더해, 복잡한 추론을 담당하는 파운데이션 모델 기반 기술을 결합하는 'Compound AI' 전략을 사용합니다.

향후 전망

  • 고속도로 자율주행 고도화: 이 기술을 바탕으로 운전자의 주시가 필요 없는 '아이즈-오프(eyes-off)' 고속도로 주행 기술 상용화가 가속화될 전망입니다.
  • 소프트웨어 업데이트 주기 단축: 초고속 시뮬레이션 학습 덕분에 새로운 도로 환경이나 예외 상황에 대응하는 AI 업데이트 속도가 획기적으로 빨라질 것으로 보입니다.
Share

이것도 읽어보세요

댓글

이 소식에 대한 의견을 자유롭게 남겨주세요.

댓글 (0)

불러오는 중...