AI 요약
Ornith-1.0은 스스로 학습하며 코드를 작성하는 오픈소스 AI 에이전트 모델로, 9B부터 397B까지 다양한 크기로 출시되었습니다. 강화학습(RL)을 통해 솔루션 생성뿐만 아니라 이를 구동하는 스캐폴드(scaffold)까지 함께 최적화하는 독특한 훈련 프레임워크를 사용합니다. MIT 라이선스로 전 세계에서 자유롭게 사용 가능하며, Terminal-Bench, SWE-Bench 등 여러 코딩 벤치마크에서 동급 오픈소스 모델 대비 최고 성능을 기록했습니다.
핵심 포인트
- 9B-Dense, 31B-Dense, 35B-MoE, 397B-MoE 등 4가지 크기로 제공 (Gemma 4 및 Qwen 3.5 기반)
- 강화학습으로 솔루션 롤아웃과 스캐폴드를 동시 최적화하는 자기 개선 훈련 프레임워크 채택
- 397B 모델은 Terminal-Bench 2.1에서 77.5%, SWE-bench Verified에서 82.4% 기록
- MIT 라이선스로 지역 제한 없이 전 세계 사용 가능
향후 전망
- 오픈소스 코딩 에이전트 모델의 성능 한계를 크게 끌어올려, 상용 모델과의 격차를 더욱 좁힐 것으로 예상
출처:GitHub (deepreinforce-ai)
