클로드 오푸스(Claude Opus) 4.8

AI 요약

인공지능 스타트업 앤트로픽이 2026년 5월 28일 자사의 최첨단 AI 모델인 '클로드 오푸스(Claude Opus) 4.8'을 공식 발표했습니다. 이번 업데이트는 기존 Opus 4.7의 강점을 계승하면서도 벤치마크 전반에서 성능 향상을 이루어내어 한층 더 강력한 협업 도구로 진화했습니다. 신규 모델은 claude.ai 사용자들에게 작업에 투입할 노력(effort)의 양을 조절할 수 있는 제어 기능을 제공하며, 대규모 문제 해결을 위한 '클로드 코드(Claude Code)'의 동적 워크플로우 기능도 새롭게 추가되었습니다. 성능 측면에서는 Super-Agent 벤치마크에서 비용 대비 성능 기준으로 기존 오푸스 모델들과 GPT-5.5를 제치고 모든 케이스를 엔드투엔드(end-to-end)로 완수한 유일한 모델이 되었습니다. 또한, 브라우저 에이전트 성능을 평가하는 Online-Mind2Web 테스트에서 84%의 높은 점수를 기록하며 컴퓨터 제어 및 에이전트 기능의 신기원을 열었습니다. 이번 출시는 기존과 동일한 가격 정책을 유지하면서도 속도와 비용 효율성을 동시에 극대화했다는 점에서 AI 시장에 큰 파장을 일으킬 것으로 예상됩니다.

핵심 인사이트

출시일 및 가격 정책: 2026년 5월 28일 출시된 클로드 오푸스 4.8은 성능이 크게 개선되었음에도 기존 버전과 동일한 가격으로 제공됩니다.
압도적인 에이전트 성능: Super-Agent 벤치마크에서 이전 Opus 모델들과 GPT-5.5를 제치고 비용 대비 최적의 성능으로 모든 테스트 케이스를 엔드투엔드로 완료한 유일한 모델입니다.
웹 에이전트 신기록 달성: 온라인 브라우저 에이전트 성능을 측정하는 'Online-Mind2Web' 테스트에서 84%의 점수를 획득하여 Opus 4.7과 GPT-5.5를 크게 앞질렀습니다.
법률 벤치마크 최초 달성: 'Legal Agent Benchmark'에서 역대 최고 점수를 기록했으며, 올패스(all-pass) 기준에서 전반적으로 10% 선을 최초로 돌파한 모델이 되었습니다.

주요 디테일

효율적인 패스트 모드: 이전 모델의 패스트 모드 대비 작동 속도는 2.5배 빨라졌으며, 비용은 오히려 3배 더 저렴해져 경제성이 극대화되었습니다.
사용자 제어권 강화: claude.ai 플랫폼 사용자들은 이제 클로드 오푸스 4.8이 특정 작업에 투입할 '노력의 양(amount of effort)'을 직접 제어할 수 있습니다.
클로드 코드의 진화: '클로드 코드(Claude Code)'에 새롭게 도입된 '동적 워크플로우(dynamic workflows)' 기능을 통해 고도로 복잡하고 대규모인 문제를 자율적으로 해결할 수 있습니다.
도구 호출(Tool Calling) 최적화: 'CursorBench' 테스트 결과, 더 적은 단계를 거치면서도 동일한 지능 수준을 발휘하도록 도구 호출의 효율성이 크게 개선되었습니다.
향상된 협업 및 판단력: 초기 테스터들은 오푸스 4.8이 스스로의 실수를 감지하고 계획이 부적절할 때 반박하는 등 한층 더 날카로운 판단력과 신뢰성을 보여주었다고 평가했습니다.

향후 전망

자율 소프트웨어 공학의 가속화: 향상된 도구 사용 능력과 지속적인 컨텍스트 유지력 덕분에 인간의 개입 없이도 정밀하게 작동하는 무인 자율 엔지니어링 작업이 대중화될 전망입니다.
전문직 AI 대체 고도화: 법률 벤치마크 최초 10% 돌파 및 Super-Agent 테스트 완수를 통해 실제 전문 변호사 업무의 초안 작성, 심층 연구 및 분석 등의 업무 이관이 더욱 활발해질 것입니다.

원문:https://www.anthropic.com/news/claude-opus-4-8

출처:hackernews

클로드 오푸스(Claude Opus) 4.8

AI 요약

핵심 인사이트

주요 디테일

향후 전망

이것도 읽어보세요

전자레인지 활용한 새 튀김 방식, 감자튀김 '건강 버전'으로 탈바꿈

잠 못 이루는 폭염의 밤…숙면 돕는 8가지 꿀팁

과학자들이 발견한 충치 치료법… '드릴링' 없이 간단히 해결

장 건강이 기억력 결정에 영향을 미친다