AI 요약
Lenny’s Podcast Network의 ‘How I AI’ 시리즈에서 Claire가 Z.ai의 새로운 오픈웨이트 모델 GLM-5.2를 실제 ChatPRD 코드베이스에서 테스트한 결과를 공유한다. GLM-5.2는 Claude Opus 4.8에 근접하고 GPT-5.5를 능가하는 벤치마크 성능을 보였으며, 100만 토큰 컨텍스트 윈도우와 추론 모드, 함수 호출 등을 지원한다. 45분 자율 버그 헌팅 테스트에서 20개의 Sentry 오류와 14개의 수정 계획을 생성했지만, React 관련 작업에서는 어려움을 겪다가 회복하는 모습을 보였다.
핵심 포인트
- GLM-5.2는 SWE Bench Pro에서 Claude Opus 4.8에 근접하고 GPT-5.5 이상의 성능 기록
- 100만 토큰 컨텍스트 윈도우, 추론 모드, 함수 호출, 구조화된 출력, 컨텍스트 캐싱 지원
- Cursor에서 30분, Claude Code에서 1시간 이내에 설정 가능
- 45분 자율 작업에서 20개 Sentry 오류, 5개 Vercel 로그 신호, 14개 수정 계획 생성
향후 전망
- 오픈웨이트 모델이 프로덕션 환경에서 폐쇄형 모델을 대체하는 사례가 증가할 것
출처:lennys_newsletter
