AI 요약
앤트로픽(Anthropic)이 차세대 고성능 인공지능 모델군인 '미토스(Mythos) 클래스' 모델의 안전성 강화를 위해 새로운 데이터 보존 및 검토 정책을 발표했습니다. 이에 따라 2026년 6월 9일부터 '클로드 미토스 5(Claude Mythos 5)' 및 '클로드 페이블 5(Claude Fable 5)' 모델에 입력되는 프롬프트와 출력 데이터는 신뢰 및 안전성 분석을 위해 모든 제공 플랫폼에서 30일 동안 일시적으로 보존됩니다. 이번 정책은 기존에 데이터 유출을 방지하기 위해 '제로 데이터 보존(ZDR)' 옵션을 적용하여 서비스를 이용하던 기업 고객군에도 동일하게 적용됩니다. 앤트로픽은 'Best-of-N 탈옥(Jailbreaking)'이나 국가 배후의 스파이 행위 등 고도로 정교화된 다중 요청 기반의 위협을 감지하기 위해서는 데이터를 임시 보존하여 거시적인 분석을 수행하는 것이 필수적이라고 설명했습니다. 보존 기간 동안 수집된 데이터는 복사 및 다운로드가 불가능한 제한된 툴 내에서 위변조 방지 로그가 기록되는 상태로 관리되며, 30일 이후에는 안전성 조사나 법적 의무가 없는 한 완전히 자동 삭제됩니다.
핵심 인사이트
- 정책 시행일: 새로운 데이터 보존 의무화 정책은 2026년 6월 9일부터 정식 적용됩니다.
- 대상 모델: 급격한 성능 향상이 이루어진 차세대 모델인 **'클로드 미토스 5(Claude Mythos 5)'**와 사이버 및 바이오 보안 장치가 강화된 **'클로드 페이블 5(Claude Fable 5)'**가 대상입니다.
- 보존 기간 설정: 신뢰성 및 안전성 확보를 목적으로 프롬프트 입력값과 생성 결과물이 30일간 보존됩니다.
- ZDR 기업 고객 적용: 기존에 제로 데이터 보존(ZDR) 환경을 구축했던 클로드 콘솔, 클로드 엔터프라이즈(Claude Code 사용 포함), 그리고 AWS Bedrock, Google Cloud Agent Platform, Microsoft Foundry의 ZDR 기업 고객들이 직접적인 적용 대상입니다.
주요 디테일
- 도입 취지: 'Best-of-N' 탈옥 공격이나 지능형 지속 위협(APT), 데이터 갈취 캠페인과 같이 여러 차례의 프롬프트 변형을 거치는 정교한 공격 패턴은 단일 요청 분석만으로는 감지가 불가능하여 다중 요청 분석용 임시 보존이 필수적입니다.
- 일반 소비자 영향 없음: 이미 안전성 목적으로 데이터 보존을 시행하고 있는 일반 소비자용 플랜(Claude Free, Pro, Max 및 Claude.ai, Claude Code 앱)은 이번 업데이트의 영향을 받지 않습니다.
- 철저한 접근 제어: 심각한 유해성 플래그가 감지되거나 고객이 서면으로 요청한 경우를 제외하고는 앤트로픽 내부 직원의 대화 데이터 접근이 금지됩니다.
- 보안 감사 및 유출 방지: 데이터 검토는 승인된 소수의 인원만 전용 툴을 통해 수행하며, 툴 자체에서 데이터의 복사, 내보내기, 다운로드가 원천 차단되고 모든 기록은 위변조가 불가능한(Tamper-proof) 로그에 실시간 기록됩니다.
- 추가 보안 옵션: 해당 정책 대상인 기업 고객들은 자체 보안 강화를 위해 고객 관리형 암호화 키(Customer-Managed Encryption Keys)를 추가로 적용할 수 있습니다.
향후 전망
- 엔터프라이즈 AI 보안 기준 변화: 그동안 무조건적인 '제로 데이터 보존(ZDR)'을 선호하던 대기업 및 규제 산업군에서 초고성능 AI 도입과 데이터 보안 통제력 간의 타협점 설정이 고심거리가 될 것입니다.
- 안전 준수 모델의 업계 표준화: 앤트로픽의 선제적인 위협 감지 정책이 오픈AI(OpenAI), 구글(Google) 등 경쟁사들이 향후 초고성능 프론티어 모델을 출시할 때 보안 데이터 수집 정책을 설계하는 기준점으로 작용할 가능성이 높습니다.
