MCP 연동으로 Opus 4.8 능가, 1조 매개변수 'Kimi K2.7 Code' 무료 공개

Moonshot AI는 2026년 6월 12일 총 1조 매개변수(액티브 320억) 규모의 오픈소스 코딩 에이전트 AI 모델 'Kimi K2.7 Code'를 무료 공개했습니다. 이 모델은 MCP 서버 연동 평가에서 81.1%를 기록하며 Claude Opus 4.8(76.4%)을 제쳤고, 토큰 소비량을 30% 감축해 코딩 효율을 극대화했습니다.

AI 요약

중국의 AI 스타트업 Moonshot AI는 2026년 6월 12일, 코딩 작업에 특화된 오픈소스 에이전트 AI 모델인 'Kimi K2.7 Code'의 무료 배포를 시작했습니다. 총 매개변수 1조 개, 활성(Active) 매개변수 320억 개를 갖춘 Mixture of Experts(MoE) 아키텍처를 기반으로 설계되었으며, Modified MIT 라이선스에 따라 모델 가중치가 전면 개방되었습니다. 이전 버전인 Kimi K2.6 대비 추론 시 토큰 소모량을 약 30% 감축하여 불필요한 연산을 줄였고, 4억 매개변수의 비전 인코더 'MoonViT'를 탑재해 이미지 입력까지 동시에 지원합니다. 특히 모델 컨텍스트 프로토콜(MCP) 연동 성능을 테스트하는 'MCP Mark Verified' 평가에서 81.1%를 획득하여 Claude Opus 4.8(76.4%)을 앞서는 성과를 거두었습니다. 현재 Hugging Face를 통한 로컬 도구 활용 및 Kimi API 등을 통해 폭넓게 활용할 수 있습니다.

핵심 인사이트

  • 1조 파라미터 오픈소스 모델: 총 1조 개의 매개변수(활성 매개변수 320억 개) 규모의 MoE 모델을 Modified MIT 라이선스를 통해 Hugging Face에 무상 공개함.
  • Claude Opus 4.8 능가: 다중 MCP 서버와의 연동을 검증하는 'MCP Mark Verified' 벤치마크에서 Kimi K2.7 Code가 81.1%를 획득하여 Claude Opus 4.8(76.4%)의 성능을 추월함 (GPT-5.5의 92.9%보다는 낮음).
  • 30% 토큰 절감: Kimi K2.6 대비 추론 토큰 사용량을 약 30% 절감하여 장기 코딩 작업에서 '과잉 사고'를 차단하고 작업 완수율을 높임.

주요 디테일

  • 비전 인코더 MoonViT 탑재: 이미지 입력을 완벽하게 분석하기 위해 4억 개의 매개변수로 구동되는 전용 비전 인코더 'MoonViT'를 결합함.
  • 코딩 성능 대폭 향상: 자체 벤치마크인 'Kimi Code Bench v2'에서는 성능이 기존 50.9%에서 62.0%로, 실제 환경을 반영한 'Program Bench'에서는 48.3%에서 53.6%로 크게 도약함.
  • 다중 MCP 서버 제어 및 장기 과업 수행: 며칠에 걸친 다수의 태스크를 자율적으로 처리하고, 여러 MCP 서버를 오가며 도구를 호출하는 장기 에이전트 능력을 제공함.
  • 합리적인 API 가격 책정: Kimi API 이용 요금은 입력 100만 토큰당 0.95달러, 출력 100만 토큰당 4달러, 캐시 히트 시에는 0.19달러로 설정됨.

향후 전망

  • 초고속 모드 출시 예고: 성능 최적화를 더욱 극대화하는 '6x High-Speed Mode'가 가까운 시일 내에 제공될 예정으로 추론 시간 단축이 예상됨.
  • 코딩 에이전트의 대중화: 오픈웨이트 고성능 모델의 무료 배포와 vLLM, SGLang 같은 로컬 도구 연동을 통해 전 세계 개발자들의 비용 부담이 크게 완화될 것으로 전망됨.
Share

이것도 읽어보세요

댓글

이 소식에 대한 의견을 자유롭게 남겨주세요.

댓글 (0)

불러오는 중...