AI 요약
최근 오픈소스 AI 시장은 '규모의 경제'와 '극한의 가성비'가 공존하는 새로운 국면에 접어들었습니다. 청화대 연구팀의 Z.ai가 공개한 GLM-5는 7,440억 개의 파라미터를 보유하며 오픈소스 최강자 자리를 노리고 있으며, 중국의 미니맥스는 시간당 단 1달러의 비용으로 구동 가능한 M2.5 모델을 통해 상용 모델과의 가격 전쟁을 선포했습니다. 동시에 알리바바의 Qwen3.5는 텍스트를 넘어 이미지와 동영상을 동시에 이해하는 멀티모달 능력을 갖추고 201개 언어를 지원하며 오픈소스의 범용성을 극대화하고 있습니다. 이러한 변화는 단순히 텍스트 추론에 머물던 AI가 실제 업무 환경에서 자율적인 에이전트로 동작하고, 기업들이 비용 부담 없이 사내 서버에 고성능 AI를 구축할 수 있는 환경이 조성되었음을 의미합니다.
핵심 인사이트
- 초대형 규모의 실현: Z.ai의 GLM-5는 전작 대비 2배 이상 확장된 7,440억 파라미터(활성 400억)와 28.5조 토큰의 사전학습 데이터를 통해 오픈소스 중 세계 최고 수준의 코딩 및 에이전트 성능을 달성했습니다.
- 파격적인 가성비 전략: MiniMax-M2.5는 초당 100토큰 속도로 1시간 구동 시 단 1달러라는 비용을 제시하며, 고가 정책을 유지하는 클로드 오퍼스(Opus) 등 상용 모델에 강력한 도전장을 내밀었습니다.
- 글로벌 멀티모달 확장: 2026년 2월 16일 공개된 알리바바의 Qwen3.5는 3,970억 파라미터 규모이면서도 201개 이상의 언어와 방언을 지원하며 글로벌 시장을 겨냥하고 있습니다.
주요 디테일
- GLM-5의 기술력: 딥시크 희소 어텐션(DeepSeek Sparse Attention, DSA) 기술을 통합하여 방대한 파라미터 규모에도 불구하고 배포 비용을 획기적으로 낮추면서 긴 맥락 처리 능력을 유지했습니다.
- MiniMax-M2.5의 효율성: 총 2,300억 파라미터 중 연산 시 100억 개만 활성화하는 MoE(전문가 혼합) 구조를 채택했으며, SWE-Bench Verified에서 80.2%의 높은 성적을 기록했습니다.
- Qwen3.5의 하이브리드 구조: 선형 어텐션(Gated DeltaNet)과 희소 MoE를 결합하여 높은 처리량과 낮은 지연 시간을 구현했으며, 아파치(Apache) 2.0 라이선스로 상업적 활용 제한을 없앴습니다.
- 이미지 편집의 대중화: 스페이스 1위를 차지한 'FireRed Image Edit 1.0'은 간단한 텍스트 입력만으로 사진의 배경을 바꾸는 등 직관적인 멀티모달 활용 사례를 보여줍니다.
향후 전망
- 기업용 AI 시장의 지각변동: 고성능 모델이 저렴한 비용이나 오픈소스로 제공됨에 따라, 보안이 중요한 기업들의 온프레미스(자체 서버) AI 도입이 가속화될 전망입니다.
- 멀티모달 에이전트의 일상화: 텍스트, 음성, 이미지를 통합 처리하는 초대형 오픈소스 모델들이 등장하면서, 단순 비서를 넘어 실제 업무를 자율적으로 수행하는 AI 에이전트 개발이 활발해질 것으로 보입니다.
