구글이 문을 열고, 넷플릭스가 사람을 지웠다 [정원훈의 AI 트렌드]

구글이 아파치 2.0 라이선스를 적용한 멀티모달 모델 '젬마(Gemma) 4'를 출시하며 오픈소스 시장의 주도권을 탈환했고, 중국 Z.ai의 'GLM-5.1'은 SWE 벤치 프로에서 58.4%의 성능으로 1위를 기록했습니다. 넷플릭스는 물리 법칙을 인식해 사물의 움직임을 재현하는 비디오 인페인팅 모델을 오픈소스로 공개하며 기술적 혁신을 선보였습니다.

AI 요약

이번 주 허깅페이스 트렌드는 구글의 화려한 복귀와 중국의 코딩 AI 강세, 그리고 넷플릭스의 창의적인 모델 공개로 요약됩니다. 구글 딥마인드는 상업적 이용이 완전히 자유로운 아파치 2.0 라이선스를 적용한 '젬마 4' 패밀리를 발표하며 멀티모달 모델의 새로운 기준점을 제시했습니다. 특히 젬마 4는 자기보다 20배 큰 모델들을 제치고 아레나 AI 리더보드 3위에 오르는 기염을 토했습니다. 한편, 중국의 Z.ai(구 지푸 AI)는 754B 파라미터 규모의 거대 모델 GLM-5.1을 통해 코딩 에이전트 분야에서 클로드 오퍼스 4.6을 추월했습니다. 또한 넷플릭스가 공개한 물리 인식형 비디오 인페인팅 모델은 단순한 이미지 수정을 넘어 물리적 상호작용까지 계산하는 고도의 기술력을 보여주며 AI 트렌드의 다변화를 입증했습니다.

핵심 인사이트

  • 구글 젬마 4 출시: E2B, E4B, 26B A4B(MoE), 31B(Dense) 4가지 크기로 출시되었으며, 최대 256K 토큰 컨텍스트 윈도우를 지원합니다.
  • 중국 Z.ai의 약진: 754B 파라미터의 MoE 모델인 GLM-5.1이 SWE 벤치 프로에서 58.4%를 기록하며 클로드 오퍼스 4.6(57.3%)을 제치고 1위를 차지했습니다.
  • 라이선스 변화: 젬마 4에 아파치 2.0 라이선스가 적용됨에 따라 스마트폰부터 워크스테이션까지 상업적 활용 제약이 사라졌습니다.
  • 넷플릭스의 혁신: 영상 속 인물을 지우면 들고 있던 기타가 바닥에 떨어지는 등 물리 법칙을 반영하는 인페인팅 모델을 오픈소스로 공개했습니다.

주요 디테일

  • Gemma 4의 기술적 특징: 하이브리드 어텐션 메커니즘을 통해 처리 속도와 장문 맥락 이해를 동시에 잡았으며, 26B MoE 모델은 추론 시 4B만 활성화되어 효율성을 극대화했습니다.
  • 경량화 마술: 'Gemma-4-31B-JANG' 버전은 혼합정밀도 양자화 기법을 통해 31B 모델을 단 18GB 메모리 환경에서 구동 가능하도록 압축했습니다.
  • 계층별 차등 양자화: 어텐션 레이어는 8비트, MLP 레이어는 4비트로 압축하여 MMLU 기준 품질 손실을 2% 수준으로 방어했습니다.
  • 에이블리터레이티드 모델: 안전 정렬(Safety alignment)을 제거한 'CRACK' 버전이 등장하여 보안 연구 및 침투 테스트 용도로 주목받고 있습니다.
  • 멀티링구얼 지원: 옴니보이스(OmniVoice)는 600개 이상의 언어를 복제하는 제로샷 음성 합성 기능을 선보였습니다.

향후 전망

  • 온디바이스 AI 가속화: 구글이 고성능 경량 모델을 오픈소스로 풀면서 모바일 환경에서의 멀티모달 AI 앱 개발이 폭발적으로 증가할 것으로 보입니다.
  • 코딩 에이전트 전쟁: Z.ai와 같은 중국 기업들의 강력한 성능 추격으로 인해 글로벌 코딩 보조 AI 시장의 경쟁 구도가 재편될 전망입니다.
Share

이것도 읽어보세요

댓글

이 소식에 대한 의견을 자유롭게 남겨주세요.

댓글 (0)

불러오는 중...