앤스로픽, 중국 AI 연구소들의 클로드 데이터 무단 수집 비판… 미 AI 칩 수출 규제 논의 중 발생

앤스로픽(Anthropic)은 딥시크, 문샷 AI, 미니맥스 등 3개 중국 AI 연구소가 24,000여 개의 가짜 계정을 통해 클로드(Claude)로부터 1,600만 건 이상의 데이터를 무단 수집했다고 주장했습니다. 이들은 '지식 증류(Distillation)' 기법으로 클로드의 추론 및 코딩 능력을 복제하려 했으며, 특히 미니맥스는 신규 모델 출시 당시 트래픽의 절반을 데이터 수집에 투입한 것으로 밝혀졌습니다.

AI 요약

앤스로픽이 딥시크(DeepSeek), 문샷 AI(Moonshot AI), 미니맥스(MiniMax) 등 중국의 선도적인 AI 기업들이 자사의 인공지능 모델인 '클로드(Claude)'를 무단으로 활용해 모델 성능을 고도화했다고 폭로했습니다. 앤스로픽의 분석에 따르면, 이들 기업은 24,000개 이상의 가짜 계정을 생성하여 약 1,600만 건 이상의 대화를 생성했으며, 이를 통해 클로드의 핵심 강점인 에이전트 추론, 도구 활용 및 코딩 로직을 학습 데이터로 흡수했습니다. 이러한 행위는 고성능 AI 칩의 대중국 수출 규제 강화 여부를 두고 미국 내 논의가 치열한 시점에 발생하여 더욱 주목받고 있습니다. 이미 오픈AI(OpenAI)도 이달 초 딥시크의 유사한 행위를 의회에 고발한 바 있어, 중국 AI 기업들의 데이터 확보 방식에 대한 비판이 거세지고 있습니다. 앤스로픽은 이러한 '지식 증류(Distillation)' 공격에 대응하기 위한 기술적 방어책을 강화하고 업계 전반의 공동 대응을 촉구하고 있습니다.

핵심 인사이트

  • 대규모 무단 수집: 중국 3개 연구소는 24,000개 이상의 가짜 계정을 동원해 총 1,600만 건 이상의 클로드 대화 데이터를 추출함.
  • 타겟 역량: 클로드의 차별화 요소인 에이전트 추론(Agentic reasoning), 도구 활용(Tool use), 코딩 능력을 집중적으로 모방함.
  • 미니맥스의 공세: 미니맥스는 1,300만 건의 대화를 생성했으며, 클로드 최신 모델 출시 당시 자사 트래픽의 거의 절반을 데이터 수집에 할당함.
  • 딥시크의 전략: 15만 건의 대화를 통해 기초 로직과 검열 민감 쿼리에 대한 안전한 대안(Censorship-safe alternatives) 확보를 시도함.

주요 디테일

  • 지식 증류(Distillation) 기법: 경쟁사 모델의 출력을 자사 모델 학습에 사용하여 성능을 높이는 방식으로, 타사의 '숙제를 베끼는 것'과 유사한 행위로 지목됨.
  • 문샷 AI의 활동: 340만 건의 대화를 수집했으며, 지난달 오픈소스 모델인 Kimi K2.5와 코딩 에이전트를 출시한 배경에 클로드 데이터가 활용되었을 가능성이 제기됨.
  • 딥시크의 부상: 1년 전 출시한 R1 모델로 저비용 고효율 성능을 입증한 딥시크는 곧 클로드와 ChatGPT를 능가하는 성능의 'DeepSeek V4' 출시를 예고함.
  • 정치적 배경: 이번 사건은 미국 내에서 대중국 AI 칩 수출 통제를 얼마나 엄격하게 적용할지 논의되는 가운데 발생하여 정책적 결정에 영향을 미칠 가능성이 큼.
  • 기술적 대응: 앤스로픽은 지식 증류 공격을 식별하고 차단하기 위한 방어 기술에 투자를 지속하겠다고 선언함.

향후 전망

  • 규제 강화: 미국 정부가 AI 모델의 지적 재산권 보호와 데이터 보안을 명분으로 중국에 대한 기술 및 데이터 접근 차단을 가속화할 것으로 보임.
  • 업계 표준 변화: AI 기업 간의 무단 데이터 수집을 방지하기 위한 공동 대응 및 기술적 보안 표준이 강화될 전망임.
  • 중국 모델의 신뢰도: 높은 성능을 기록하는 중국 모델들이 서구권 모델의 데이터를 얼마나 활용했는지에 대한 검증 요구가 거세질 것으로 예상됨.
Share

댓글

이 소식에 대한 의견을 자유롭게 남겨주세요.

댓글 (0)

불러오는 중...

앤스로픽, 중국 AI 연구소들의 클로드 데이터 무단 수집 비판… 미 AI 칩 수출 규제 논의 중 발생 | paper!