미스트랄, 경량 모델 'Leanstral' 출시

Mistral AI가 2026년 3월 16일, Lean 4 증명 보조기를 위한 최초의 오픈소스 코드 에이전트 'Leanstral'을 출시했습니다. 120B 전체 파라미터 중 6B개만 활성화되는 희소 아키텍처를 기반으로 하며, FLTEval 벤치마크에서 26.3점을 기록하며 Qwen3.5-397B 등 거대 모델보다 높은 효율성을 입증했습니다.

AI 요약

Mistral AI는 2026년 3월 16일, 복잡한 수학적 객체와 소프트웨어 명세를 공식적으로 증명할 수 있는 Lean 4 전용 코드 에이전트 'Leanstral'을 공개했습니다. 기존 AI 모델들이 코드 생성에는 능숙하지만 인간의 수동 검토가 병목 현상을 일으킨다는 점에 착안하여, 기계가 생성한 로직을 사양에 따라 스스로 증명할 수 있는 기능을 갖췄습니다. Leanstral은 120B 파라미터 규모 중 6B개의 활성 파라미터만을 사용하는 고도로 희소한(Sparse) 아키텍처를 채택하여 연산 효율을 극대화했습니다. 특히 이번 출시는 Apache 2.0 라이선스로 가중치를 공개하고 무료 API를 제공함으로써 오픈소스 생태계의 접근성을 높였습니다. 성능 면에서도 FLTEval 벤치마크를 통해 Claude 4.6 및 초대형 오픈소스 모델들(Qwen, Kimi, GLM)과 비교하여 압도적인 비용 대비 성능 효율을 증명하며, AI 기반 증명 공학의 새로운 지평을 열었다는 평가를 받고 있습니다.

핵심 인사이트

  • 출시 및 라이선스: 2026년 3월 16일 발표되었으며, Apache 2.0 라이선스 하에 모델 가중치와 무료 API 엔드포인트가 공개되었습니다.
  • 모델 사양: Leanstral-120B-A6B 모델은 6B(60억 개)의 활성 파라미터를 보유한 희소 아키텍처를 사용하여 비용 효율성을 확보했습니다.
  • 벤치마크 성과: FLTEval 평가에서 26.3점을 획득하며, Qwen3.5-397B-A17B(25.4점), Kimi-K2.5-1T-A32B(20.1점) 등 훨씬 거대한 모델들을 능가했습니다.
  • 실무 지향적 도구: 단순 수학 경시대회용이 아닌 FLT(Fermat's Last Theorem) 프로젝트의 실제 PR(Pull Request)을 처리하는 실무 증명 공학 환경에 최적화되었습니다.

주요 디테일

  • Lean 4 통합: Rust 프래그먼트의 속성이나 퍼펙토이드 공간(Perfectoid spaces)과 같은 복잡한 명세를 표현할 수 있는 Lean 4 증명 보조기를 직접 지원합니다.
  • MCP 지원: 모델 컨텍스트 프로토콜(MCP)을 지원하며, 특히 lean-lsp-mcp를 활용할 때 성능을 극대화할 수 있도록 훈련되었습니다.
  • 검증 메커니즘: Lean을 완벽한 검증기(Verifier)로 활용하는 병렬 추론 방식을 통해 폐쇄형 소스 모델 대비 높은 신뢰성을 제공합니다.
  • 평가 스위트 FLTEval: 단순 문제를 넘어 현실적인 증명 시나리오에서의 유용성을 측정하기 위해 Mistral이 자체 개발한 새로운 평가 도구입니다.
  • 경쟁 모델 비교: GLM5-744B-A40B(16.6점)와 같은 초대형 모델들이 확장성에 한계를 보일 때, Leanstral은 적은 자원으로 더 높은 성능을 기록했습니다.

향후 전망

  • AI 에이전트의 역할이 단순 '디버깅'에서 사양을 기반으로 한 '공식 증명'으로 이동하며 고신뢰성 소프트웨어 엔지니어링 속도가 가속화될 것입니다.
  • Leanstral의 경량화된 고성능 아키텍처는 향후 프론티어 수학 연구 및 미션 크리티컬 시스템 설계에 광범위하게 도입될 것으로 보입니다.
출처:hackernews
Share

댓글

이 소식에 대한 의견을 자유롭게 남겨주세요.

댓글 (0)

불러오는 중...

미스트랄, 경량 모델 'Leanstral' 출시 | paper!