Dav2d

VideoLAN의 소스 코드 저장소는 AI 기업들의 무분별한 스크래핑에 대응하기 위해 'Hashcash' 방식의 작업 증명(PoW) 시스템인 'Anubis'를 도입했습니다. 이 시스템은 일반 사용자의 접속은 유지하면서 대규모 스크래핑에는 높은 연산 비용을 부과하여 서버 가용성을 보호하는 것을 목표로 합니다.

AI 요약

VideoLAN 프로젝트의 코드 저장소(code.videolan.org)는 AI 기업들이 공격적으로 웹사이트 데이터를 긁어가는(scraping) 행위로 인해 서버 다운타임이 발생하는 문제를 해결하고자 'Anubis' 보호 시스템을 구축했습니다. Anubis는 이메일 스팸 방지를 위해 제안되었던 'Hashcash'와 유사한 방식의 작업 증명(Proof-of-Work) 메커니즘을 사용합니다. 이는 개별 사용자에게는 무시할 수 있는 수준의 연산 부하를 주지만, 대량으로 스크래핑을 시도하는 측에는 막대한 비용적 부담을 주도록 설계되었습니다. 현재 이 시스템은 임시 해결책으로 도입되었으며, 향후 폰트 렌더링 분석과 같은 핑거프린팅 기술을 통해 헤드리스 브라우저를 식별하여 정상 사용자의 불편을 최소화할 계획입니다.

핵심 인사이트

  • Anubis 도입: AI 기업의 공격적인 스크래핑으로 인한 서버 자원 고갈을 막기 위한 전용 보안 계층이 적용되었습니다.
  • Hashcash 알고리즘 활용: 과거 스팸 메일 차단용으로 고안된 Hashcash의 작업 증명(PoW) 방식을 채택하여 대규모 수집 행위의 경제적 비용을 높였습니다.
  • 사회적 계약의 변화: 웹 호스팅에 대한 기존의 사회적 계약이 AI 기업들의 데이터 수집 행태로 인해 변화했음을 지적하며 이에 대응하는 기술적 조치를 정당화했습니다.

주요 디테일

  • 기술적 요구사항: Anubis는 현대적인 자바스크립트(JavaScript) 기능을 필요로 하며, 보안 플러그인인 'JShelter'가 활성화된 경우 정상적인 이용이 불가능할 수 있습니다.
  • 브라우저 식별 기술: 폰트 렌더링 방식을 분석하여 자동화된 헤드리스 브라우저를 구별해내는 핑거프린팅 기술이 고도화될 예정입니다.
  • 사용자 편의성 고려: 현재는 모든 사용자에게 PoW 챌린지를 제시하지만, 향후 정당한 사용자를 더 정교하게 식별하여 이 과정을 생략하는 것이 목표입니다.
  • 개발 현황: 자바스크립트를 사용하지 않는(No-JS) 환경을 위한 솔루션도 현재 개발 중(Work-in-progress)에 있습니다.

향후 전망

  • 오픈소스 프로젝트 호스팅 사이트들이 AI 학습용 데이터 크롤링에 대응하기 위해 PoW 기반의 방어막을 도입하는 사례가 늘어날 것으로 예상됩니다.
  • 데이터 수집 비용이 상승함에 따라 AI 기업들과 콘텐츠 보유 플랫폼 간의 기술적·법적 대립이 더욱 심화될 전망입니다.
Share

이것도 읽어보세요

댓글

이 소식에 대한 의견을 자유롭게 남겨주세요.

댓글 (0)

불러오는 중...