AI 요약
인공지능 스타트업 앤트로픽이 2026년 5월 28일 자사의 최첨단 AI 모델인 '클로드 오푸스(Claude Opus) 4.8'을 공식 발표했습니다. 이번 업데이트는 기존 Opus 4.7의 강점을 계승하면서도 벤치마크 전반에서 성능 향상을 이루어내어 한층 더 강력한 협업 도구로 진화했습니다. 신규 모델은 claude.ai 사용자들에게 작업에 투입할 노력(effort)의 양을 조절할 수 있는 제어 기능을 제공하며, 대규모 문제 해결을 위한 '클로드 코드(Claude Code)'의 동적 워크플로우 기능도 새롭게 추가되었습니다. 성능 측면에서는 Super-Agent 벤치마크에서 비용 대비 성능 기준으로 기존 오푸스 모델들과 GPT-5.5를 제치고 모든 케이스를 엔드투엔드(end-to-end)로 완수한 유일한 모델이 되었습니다. 또한, 브라우저 에이전트 성능을 평가하는 Online-Mind2Web 테스트에서 84%의 높은 점수를 기록하며 컴퓨터 제어 및 에이전트 기능의 신기원을 열었습니다. 이번 출시는 기존과 동일한 가격 정책을 유지하면서도 속도와 비용 효율성을 동시에 극대화했다는 점에서 AI 시장에 큰 파장을 일으킬 것으로 예상됩니다.
핵심 인사이트
- 출시일 및 가격 정책: 2026년 5월 28일 출시된 클로드 오푸스 4.8은 성능이 크게 개선되었음에도 기존 버전과 동일한 가격으로 제공됩니다.
- 압도적인 에이전트 성능: Super-Agent 벤치마크에서 이전 Opus 모델들과 GPT-5.5를 제치고 비용 대비 최적의 성능으로 모든 테스트 케이스를 엔드투엔드로 완료한 유일한 모델입니다.
- 웹 에이전트 신기록 달성: 온라인 브라우저 에이전트 성능을 측정하는 'Online-Mind2Web' 테스트에서 84%의 점수를 획득하여 Opus 4.7과 GPT-5.5를 크게 앞질렀습니다.
- 법률 벤치마크 최초 달성: 'Legal Agent Benchmark'에서 역대 최고 점수를 기록했으며, 올패스(all-pass) 기준에서 전반적으로 10% 선을 최초로 돌파한 모델이 되었습니다.
주요 디테일
- 효율적인 패스트 모드: 이전 모델의 패스트 모드 대비 작동 속도는 2.5배 빨라졌으며, 비용은 오히려 3배 더 저렴해져 경제성이 극대화되었습니다.
- 사용자 제어권 강화: claude.ai 플랫폼 사용자들은 이제 클로드 오푸스 4.8이 특정 작업에 투입할 '노력의 양(amount of effort)'을 직접 제어할 수 있습니다.
- 클로드 코드의 진화: '클로드 코드(Claude Code)'에 새롭게 도입된 '동적 워크플로우(dynamic workflows)' 기능을 통해 고도로 복잡하고 대규모인 문제를 자율적으로 해결할 수 있습니다.
- 도구 호출(Tool Calling) 최적화: 'CursorBench' 테스트 결과, 더 적은 단계를 거치면서도 동일한 지능 수준을 발휘하도록 도구 호출의 효율성이 크게 개선되었습니다.
- 향상된 협업 및 판단력: 초기 테스터들은 오푸스 4.8이 스스로의 실수를 감지하고 계획이 부적절할 때 반박하는 등 한층 더 날카로운 판단력과 신뢰성을 보여주었다고 평가했습니다.
향후 전망
- 자율 소프트웨어 공학의 가속화: 향상된 도구 사용 능력과 지속적인 컨텍스트 유지력 덕분에 인간의 개입 없이도 정밀하게 작동하는 무인 자율 엔지니어링 작업이 대중화될 전망입니다.
- 전문직 AI 대체 고도화: 법률 벤치마크 최초 10% 돌파 및 Super-Agent 테스트 완수를 통해 실제 전문 변호사 업무의 초안 작성, 심층 연구 및 분석 등의 업무 이관이 더욱 활발해질 것입니다.
