Claude Sonnet 4.6

앤스로픽이 2026년 2월 17일 출시한 Claude Sonnet 4.6은 베타 버전 기준 1M(100만) 토큰의 컨텍스트 창을 제공하며, 코딩과 컴퓨터 사용 능력에서 비약적인 발전을 이루었습니다. 백만 토큰당 $3/$15의 가격을 유지하면서도 2025년 11월 출시된 Claude Opus 4.5의 성능을 능가하여 개발자들에게 더 높은 선호도를 얻고 있습니다.

AI 요약

앤스로픽(Anthropic)은 2026년 2월 17일, 자사의 중급 모델 라인업인 Sonnet의 최신 버전 'Claude Sonnet 4.6'을 발표했습니다. 이 모델은 코딩, 추론, 에이전트 계획, 지식 작업 등 모든 분야에서 성능이 업그레이드되었으며, 특히 베타 서비스로 100만(1M) 토큰의 컨텍스트 창을 지원하는 것이 특징입니다. 현재 claude.ai의 무료 및 유료(Pro) 플랜에 기본 모델로 적용되었으며, 가격은 이전 버전인 Sonnet 4.5와 동일하게 유지되었습니다. 초기 사용자들은 이 모델의 코딩 능력이 2025년 11월에 출시된 최상위 모델인 Claude Opus 4.5보다 뛰어나다고 평가하고 있습니다. 또한 '컴퓨터 사용(Computer use)' 기능이 대폭 강화되어 사람이 실제 마우스와 키보드를 사용하는 것처럼 복잡한 소프트웨어를 제어할 수 있는 수준에 도달했습니다.

핵심 인사이트

  • 대규모 컨텍스트 지원: 베타 버전을 통해 업계 최고 수준인 100만(1M) 토큰의 컨텍스트 창을 제공하여 방대한 양의 정보를 한 번에 처리할 수 있습니다.
  • 가격 경쟁력 유지: 백만 토큰당 입력 $3, 출력 $15로 책정되어, Sonnet 4.5와 동일한 가격으로 Opus급 성능을 누릴 수 있습니다.
  • 최상위 모델 능가: 2025년 11월에 출시된 앤스로픽의 최고 성능 모델인 Claude Opus 4.5보다 Sonnet 4.6의 코딩 및 지시 이행 능력이 더 우수하다는 평가를 받고 있습니다.

주요 디테일

  • 컴퓨터 사용 기능 고도화: OSWorld 벤치마크에서 Chrome, VS Code, LibreOffice 등 실제 소프트웨어를 가상 마우스 클릭과 타이핑으로 제어하는 능력이 입증되었습니다.
  • 업무 자동화 역량: 복잡한 스프레드시트 탐색, 다단계 웹 양식 작성, 여러 브라우저 탭을 오가는 작업 등에서 인간 수준의 역량을 보여줍니다.
  • 검증된 안전성: 연구진의 안전성 평가 결과, 모델은 "따뜻하고 정직하며 친사회적인" 성격을 띠며 고위험 정렬 불량(misalignment)에 대한 우려가 없는 것으로 확인되었습니다.
  • 사용자 접근성: 현재 claude.ai 웹사이트와 Claude Cowork 서비스에서 즉시 기본 모델로 사용 가능합니다.
  • 벤치마크 성과: 16개월간 지속된 OSWorld 데이터 분석 결과, Sonnet 시리즈는 인간의 숙련도에 근접하는 지속적인 성능 향상을 기록하고 있습니다.

향후 전망

  • 레거시 시스템 자동화: API가 존재하지 않는 오래된 특수 소프트웨어도 AI가 사람처럼 조작할 수 있게 됨으로써 기업들의 자동화 범위가 획기적으로 넓어질 것입니다.
  • 워크플로우 혁신: 1M 토큰의 컨텍스트와 향상된 에이전트 계획 능력을 결합하여, 인간의 개입이 거의 없는 장기적이고 복잡한 사무 프로젝트 수행이 가능해질 전망입니다.
Share

이것도 읽어보세요

댓글

이 소식에 대한 의견을 자유롭게 남겨주세요.

댓글 (0)

불러오는 중...