앤스로픽(Anthropic), 3월 6일부로 캐시 TTL(Time-To-Live) 하향 조정

앤스로픽(Anthropic)이 2026년 3월 6일을 기점으로 Claude Code의 캐시 TTL을 1시간에서 5분으로 소리 없이 하향 조정하면서 캐시 생성 비용이 20~32% 증가하는 문제가 발생했습니다. 약 12만 건의 API 호출 데이터 분석 결과, 서버 측 설정 변경으로 인해 구독자들의 쿼터 소모와 비용 부담이 급격히 늘어난 것으로 확인되었습니다.

AI 요약

앤스로픽의 개발자 도구인 'Claude Code'에서 프롬프트 캐싱 유지 시간(TTL)이 기존 1시간에서 5분으로 대폭 단축되었다는 사용자 분석 결과가 공개되었습니다. 한 개발자가 2026년 1월 11일부터 4월 11일까지 수집된 119,866건의 API 호출 데이터를 정밀 분석한 결과, 3월 6일부터 8일 사이를 기점으로 TTL 정책에 명확한 변화가 감지되었습니다. 이 변경으로 인해 캐시 생성 비용이 기존 대비 20%에서 최대 32%까지 상승했으며, 평소 할당량을 초과하지 않던 유료 구독 사용자들 사이에서 쿼터 부족 현상이 속출하고 있습니다. 특히 이번 조치는 클라이언트 업데이트 없이 서버 측에서 일방적으로 진행된 것으로 보여, 비용 효율성을 중시하는 개발자 커뮤니티의 우려가 커지고 있습니다.

핵심 인사이트

  • TTL 하향 조정: 2026년 3월 6일부터 8일 사이, 프롬프트 캐시의 TTL이 기존 1시간에서 5분으로 회귀하는 '침묵의 퇴보(Silent Regression)' 발생.
  • 비용 상승 수치: 짧아진 캐시 유지 시간으로 인해 캐시 생성(Cache Creation) 비용이 20%~32% 가량 증가함.
  • 방대한 분석 데이터: 리눅스와 윈도우 환경에서 서로 다른 계정으로 수행된 총 119,866건의 JSONL 세션 데이터를 기반으로 도출된 결과임.

주요 디테일

  • API 필드 분석: API 응답 내 ephemeral_5m_input_tokensephemeral_1h_input_tokens 필드의 비중 변화를 통해 TTL 티어 변경을 실시간 확인.
  • 단계별 변화: 2월 1일부터 3월 5일까지는 1시간 TTL이 표준이었으나, 3월 8일 이후부터는 5분 TTL이 다시 지배적인 비중을 차지함.
  • 서버 측 변경: 사용자의 클라이언트 버전이나 사용 패턴 변화가 전혀 없는 상태에서 앤스로픽 서버 측 설정만으로 발생한 현상임.
  • 사용자 영향: 구독형 서비스 사용자들이 이전에는 겪지 못했던 쿼터 한도 초과 및 비용 인플레이션 문제를 겪고 있음.

향후 전망

  • 앤스로픽의 공식 대응: 이번 현상이 의도된 정책 변경인지 혹은 기술적 오류(Bug)인지에 대한 앤스로픽 측의 공식적인 답변이 요구됨.
  • 개발자 전략 수정: 프롬프트 캐싱에 의존하여 비용을 절감하던 개발자들은 짧아진 TTL에 맞춰 워크플로우를 수정하거나 대체 모델을 검토해야 할 가능성이 높음.
Share

이것도 읽어보세요

댓글

이 소식에 대한 의견을 자유롭게 남겨주세요.

댓글 (0)

불러오는 중...