AI 요약
중국의 AI 스타트업 Moonshot AI는 2026년 6월 12일, 코딩 작업에 특화된 오픈소스 에이전트 AI 모델인 'Kimi K2.7 Code'의 무료 배포를 시작했습니다. 총 매개변수 1조 개, 활성(Active) 매개변수 320억 개를 갖춘 Mixture of Experts(MoE) 아키텍처를 기반으로 설계되었으며, Modified MIT 라이선스에 따라 모델 가중치가 전면 개방되었습니다. 이전 버전인 Kimi K2.6 대비 추론 시 토큰 소모량을 약 30% 감축하여 불필요한 연산을 줄였고, 4억 매개변수의 비전 인코더 'MoonViT'를 탑재해 이미지 입력까지 동시에 지원합니다. 특히 모델 컨텍스트 프로토콜(MCP) 연동 성능을 테스트하는 'MCP Mark Verified' 평가에서 81.1%를 획득하여 Claude Opus 4.8(76.4%)을 앞서는 성과를 거두었습니다. 현재 Hugging Face를 통한 로컬 도구 활용 및 Kimi API 등을 통해 폭넓게 활용할 수 있습니다.
핵심 인사이트
- 1조 파라미터 오픈소스 모델: 총 1조 개의 매개변수(활성 매개변수 320억 개) 규모의 MoE 모델을 Modified MIT 라이선스를 통해 Hugging Face에 무상 공개함.
- Claude Opus 4.8 능가: 다중 MCP 서버와의 연동을 검증하는 'MCP Mark Verified' 벤치마크에서 Kimi K2.7 Code가 81.1%를 획득하여 Claude Opus 4.8(76.4%)의 성능을 추월함 (GPT-5.5의 92.9%보다는 낮음).
- 30% 토큰 절감: Kimi K2.6 대비 추론 토큰 사용량을 약 30% 절감하여 장기 코딩 작업에서 '과잉 사고'를 차단하고 작업 완수율을 높임.
주요 디테일
- 비전 인코더 MoonViT 탑재: 이미지 입력을 완벽하게 분석하기 위해 4억 개의 매개변수로 구동되는 전용 비전 인코더 'MoonViT'를 결합함.
- 코딩 성능 대폭 향상: 자체 벤치마크인 'Kimi Code Bench v2'에서는 성능이 기존 50.9%에서 62.0%로, 실제 환경을 반영한 'Program Bench'에서는 48.3%에서 53.6%로 크게 도약함.
- 다중 MCP 서버 제어 및 장기 과업 수행: 며칠에 걸친 다수의 태스크를 자율적으로 처리하고, 여러 MCP 서버를 오가며 도구를 호출하는 장기 에이전트 능력을 제공함.
- 합리적인 API 가격 책정: Kimi API 이용 요금은 입력 100만 토큰당 0.95달러, 출력 100만 토큰당 4달러, 캐시 히트 시에는 0.19달러로 설정됨.
향후 전망
- 초고속 모드 출시 예고: 성능 최적화를 더욱 극대화하는 '6x High-Speed Mode'가 가까운 시일 내에 제공될 예정으로 추론 시간 단축이 예상됨.
- 코딩 에이전트의 대중화: 오픈웨이트 고성능 모델의 무료 배포와 vLLM, SGLang 같은 로컬 도구 연동을 통해 전 세계 개발자들의 비용 부담이 크게 완화될 것으로 전망됨.
