MCP 연동으로 Opus 4.8 능가, 1조 매개변수 'Kimi K2.7 Code' 무료 공개

AI 요약

중국의 AI 스타트업 Moonshot AI는 2026년 6월 12일, 코딩 작업에 특화된 오픈소스 에이전트 AI 모델인 'Kimi K2.7 Code'의 무료 배포를 시작했습니다. 총 매개변수 1조 개, 활성(Active) 매개변수 320억 개를 갖춘 Mixture of Experts(MoE) 아키텍처를 기반으로 설계되었으며, Modified MIT 라이선스에 따라 모델 가중치가 전면 개방되었습니다. 이전 버전인 Kimi K2.6 대비 추론 시 토큰 소모량을 약 30% 감축하여 불필요한 연산을 줄였고, 4억 매개변수의 비전 인코더 'MoonViT'를 탑재해 이미지 입력까지 동시에 지원합니다. 특히 모델 컨텍스트 프로토콜(MCP) 연동 성능을 테스트하는 'MCP Mark Verified' 평가에서 81.1%를 획득하여 Claude Opus 4.8(76.4%)을 앞서는 성과를 거두었습니다. 현재 Hugging Face를 통한 로컬 도구 활용 및 Kimi API 등을 통해 폭넓게 활용할 수 있습니다.

핵심 인사이트

1조 파라미터 오픈소스 모델: 총 1조 개의 매개변수(활성 매개변수 320억 개) 규모의 MoE 모델을 Modified MIT 라이선스를 통해 Hugging Face에 무상 공개함.
Claude Opus 4.8 능가: 다중 MCP 서버와의 연동을 검증하는 'MCP Mark Verified' 벤치마크에서 Kimi K2.7 Code가 81.1%를 획득하여 Claude Opus 4.8(76.4%)의 성능을 추월함 (GPT-5.5의 92.9%보다는 낮음).
30% 토큰 절감: Kimi K2.6 대비 추론 토큰 사용량을 약 30% 절감하여 장기 코딩 작업에서 '과잉 사고'를 차단하고 작업 완수율을 높임.

주요 디테일

비전 인코더 MoonViT 탑재: 이미지 입력을 완벽하게 분석하기 위해 4억 개의 매개변수로 구동되는 전용 비전 인코더 'MoonViT'를 결합함.
코딩 성능 대폭 향상: 자체 벤치마크인 'Kimi Code Bench v2'에서는 성능이 기존 50.9%에서 62.0%로, 실제 환경을 반영한 'Program Bench'에서는 48.3%에서 53.6%로 크게 도약함.
다중 MCP 서버 제어 및 장기 과업 수행: 며칠에 걸친 다수의 태스크를 자율적으로 처리하고, 여러 MCP 서버를 오가며 도구를 호출하는 장기 에이전트 능력을 제공함.
합리적인 API 가격 책정: Kimi API 이용 요금은 입력 100만 토큰당 0.95달러, 출력 100만 토큰당 4달러, 캐시 히트 시에는 0.19달러로 설정됨.

향후 전망

초고속 모드 출시 예고: 성능 최적화를 더욱 극대화하는 '6x High-Speed Mode'가 가까운 시일 내에 제공될 예정으로 추론 시간 단축이 예상됨.
코딩 에이전트의 대중화: 오픈웨이트 고성능 모델의 무료 배포와 vLLM, SGLang 같은 로컬 도구 연동을 통해 전 세계 개발자들의 비용 부담이 크게 완화될 것으로 전망됨.

원문:https://pc.watch.impress.co.jp/docs/news/2116913.html

출처:hatena

MCP 연동으로 Opus 4.8 능가, 1조 매개변수 'Kimi K2.7 Code' 무료 공개

AI 요약

핵심 인사이트

주요 디테일

향후 전망

이것도 읽어보세요

전자레인지 활용한 새 튀김 방식, 감자튀김 '건강 버전'으로 탈바꿈

잠 못 이루는 폭염의 밤…숙면 돕는 8가지 꿀팁

과학자들이 발견한 충치 치료법… '드릴링' 없이 간단히 해결

장 건강이 기억력 결정에 영향을 미친다