AI 요약
2026년 4월 14일, Anthropic은 보안 작업에 압도적인 성능을 보이는 새로운 LLM 'Mythos'를 발표했습니다. Anthropic은 이 모델의 위험성을 고려해 일반 공개를 거부하고, 주요 소프트웨어 제조사들에게만 시스템 방어 강화 목적으로 우선 접근권을 부여했습니다. AI 보안 연구소(AISI)의 분석에 따르면 Mythos는 인간 전문가가 20시간 동안 수행해야 하는 32단계 기업 네트워크 공격 시뮬레이션 'The Last Ones'를 완수한 유일한 모델로 확인되었습니다. 특히 시도시 투입되는 토큰 예산이 늘어날수록 성능이 선형적으로 향상된다는 점이 발견되었는데, 이는 보안이 이제 지능 싸움을 넘어 자본력에 기반한 '연산량 경쟁'으로 변모하고 있음을 의미합니다. 결과적으로 현대 보안은 암호화폐의 '작업 증명(PoW)' 시스템처럼 공격자보다 더 많은 비용을 들여 취약점을 먼저 찾아내야 하는 구조적 변화를 맞이하고 있습니다.
핵심 인사이트
- 신규 모델 Mythos의 성능: Anthropic의 Mythos는 32단계 복잡한 네트워크 공격 시뮬레이션에서 10번 중 3번의 성공을 기록하며, Opus 4.6이나 GPT-5.4가 실패한 과업을 유일하게 완수함.
- 토큰 경제와 보안: 1회 시도당 1억 개의 토큰(비용 약 12,500달러, 10회 총 125,000달러)을 투입한 결과, 토큰 예산 증액에 따른 성능 저하(한계 효용 체감) 현상이 아직 나타나지 않음.
- 보안의 '작업 증명(PoW)'화: 보안 강화가 지능적인 설계보다 '공격자가 사용할 토큰보다 더 많은 토큰을 들여 취약점을 먼저 찾는' 연산 검색 문제로 변모함.
- 검증된 사실: AISI의 3자 분석 보고서는 Mythos가 기존 프론티어 모델들보다 사이버 보안 성능 면에서 명확한 한 단계 진보(Step up)를 이뤘음을 공식 인정함.
주요 디테일
- 공격 시뮬레이션 'The Last Ones': 초기 정찰부터 전체 네트워크 장악까지 포함하는 32단계의 고난도 과정으로, AISI는 인간이 이를 수행하는 데 약 20시간이 소요될 것으로 추정함.
- 비용 구조: Mythos를 이용한 보안 점검은 1회당 약 1,700만 원(12,500달러) 수준의 비용이 발생하며, 이는 보안이 고도의 자본 집약적 산업이 되었음을 보여줌.
- 전략적 비공개: Anthropic은 Mythos가 공격적으로 오용될 것을 우려하여, 방어자들이 시스템을 보완(Hardening)할 시간을 가질 수 있도록 폐쇄적인 배포 전략을 선택함.
- 저온 로또(Low Temperature Lottery): 보안을 '토큰을 사서 취약점이 나오길 기다리는' 확률적 과정으로 묘사하며, 성공 여부는 결국 얼마나 오래, 많이 시도하느냐에 달려 있음.
- 오픈 소스의 가치: AI 기술이 고도화될수록 누구나 취약점을 점검하고 방어할 수 있는 오픈 소스 소프트웨어 생태계의 중요성이 역설적으로 더욱 커짐.
향후 전망
- 보안 예산의 재편: 기업들의 보안 예산이 인적 자원 중심에서 '취약점 탐색을 위한 AI 토큰 구매 비용' 위주로 이동할 가능성이 큼.
- 자본력에 따른 보안 격차: 고성능 보안 LLM 운용 비용을 감당할 수 있는 거대 기업과 그렇지 못한 중소 조직 간의 보안 수준 양극화가 심화될 것으로 예상됨.
