클로드의 8% 가격으로 코딩한다고? [정원훈의 AI 트렌드]

중국 AI 스타트업 미니맥스(MiniMax)가 클로드 3.5 소넷 대비 8%의 가격과 2배 빠른 속도를 갖춘 'M2.7' 코딩 모델을 공개했습니다. 또한 텐센트는 22개 벤치마크 중 16개에서 최상위 성능을 기록하며 로봇의 물리적 행동을 제어하는 'HY-Embodied-0.5' 모델을 오픈소스로 출시하며 AI의 물리 세계 확장을 본격화했습니다.

AI 요약

이번 주 허깅페이스 트렌드는 중국발 AI 모델들의 압도적인 가성비와 물리적 로봇 제어(Embodied AI)로의 진화가 핵심입니다. 중국 AI 기업 미니맥스(MiniMax)는 전문가 혼합(MoE) 구조를 활용해 2,300억 개의 파라미터 중 100억 개만 활성화함으로써 추론 비용과 속도를 획기적으로 개선한 'M2.7' 모델을 선보였습니다. 이 모델은 앤트로픽 클로드 3.5 소넷의 8% 가격으로 두 배 빠른 성능을 제공하며 개발자 커뮤니티의 큰 관심을 받고 있습니다. 한편 텐센트 로보틱스 X 랩은 가상 AI를 넘어 물리 세계에서 로봇의 두뇌 역할을 수행할 수 있는 'HY-Embodied-0.5'를 공개하며 구글 등 글로벌 빅테크가 독점하던 엠보디드 AI 분야에 도전장을 내밀었습니다. 또한 Z.ai의 GLM-5.1은 에이전트 엔지니어링 분야에서 장시간 복잡한 작업을 완수하는 지구력을 보여주며 AI가 단순한 챗봇을 넘어 자율적인 행동 주체로 거듭나고 있음을 시사했습니다.

핵심 인사이트

  • 미니맥스 M2.7의 가격 파괴: 앤트로픽 클로드 3.5 소넷 대비 약 8%의 API 가격을 책정하면서도 추론 속도는 2배 가까이 빠릅니다.
  • MoE 및 아키텍처 혁신: M2.7은 2,300억 개의 파라미터 중 100억 개만 사용하는 희소(sparse) MoE 구조를, 텐센트는 4B 중 2.2B만 활성화하는 '믹스처 오브 트랜스포머' 구조를 채택했습니다.
  • 벤치마크 성과: 텐센트의 HY-Embodied-0.5는 22개 벤치마크 중 16개에서 동급 최강을 기록했으며, 대형 32B 버전은 구글 제미나이 3.0 프로와 대등한 성능을 보입니다.
  • 인터리브드 추론: M2.7은 <think> 태그 내에 사고 과정을 기록하는 방식을 통해 복잡한 워크플로우에서도 높은 일관성을 유지합니다.

주요 디테일

  • M2.7의 성능 지표: GDPval-AA 벤치마크에서 오픈 가중치 모델 중 최고점인 ELO 1495를 기록하였고, MM Claw 평가에서는 62.7%로 클로드 소넷에 육박하는 성적을 냈습니다.
  • 로봇 특화 기능: 텐센트 모델은 일반 VLM과 달리 3차원 공간 인식 및 물리적 상호작용 능력을 확보하여 비전-언어-행동(VLA) 파이프라인의 핵심 뇌로 설계되었습니다.
  • 개발자 친화성: M2.7은 vLLM, SGLang, 트랜스포머 등 주요 추론 프레임워크를 출시 첫날(day-0)부터 지원하며 클라인(Cline), 커서(Cursor) 등과 즉시 호환됩니다.
  • 감성 및 일관성 강화: M2.7 버전은 단순히 코드 생성을 넘어 긴 대화 속에서도 인격적 일관성과 감성 지능을 유지하도록 훈련되었습니다.
  • 라이선스: 수정된 MIT(Modified-MIT) 라이선스를 적용하여 상업적 이용이 가능하도록 개방성을 높였습니다.

향후 전망

  • 에이전트 도입 가속화: 고성능 모델의 API 비용이 급감함에 따라 스타트업들의 자율형 코딩 에이전트 및 서비스 도입이 더욱 활발해질 것으로 보입니다.
  • 물리적 AI 시장 확대: 텐센트의 오픈소스 엠보디드 모델 공개로 인해 로봇 제조 및 물류 자동화 분야에서 오픈소스 AI의 영향력이 커질 전망입니다.
Share

이것도 읽어보세요

댓글

이 소식에 대한 의견을 자유롭게 남겨주세요.

댓글 (0)

불러오는 중...