Git의 –author 플래그를 활용해 깃허브 저장소 내 AI 봇 스팸을 차단한 방법

Archestra는 900달러 현상금을 건 이슈에 253개의 AI 스팸 댓글이 달리고 x.ai 연동 이슈에 27개의 무분별한 PR이 제출되는 등 심각한 AI 오염을 겪었습니다. 이에 대응하여 기여자의 평판을 계산하는 'London-Cat' 봇을 거쳐, 최종적으로 5단계 온보딩을 완료한 사용자만 활동할 수 있는 화이트리스트 기반의 '강력한 차단 정책'을 도입했습니다.

AI 요약

Archestra의 CTO Ildar Iskhakov는 최근 깃허브 저장소에 범람하는 AI 생성 스팸으로 인해 오픈소스 기여의 질이 급격히 저하되고 있다고 경고했습니다. 실제 사례로 900달러의 현상금을 내건 'MCP Apps' 지원 이슈에 무려 253개의 무의미한 AI 댓글이 달렸으며, x.ai 프로바이더 지원 이슈에는 테스트도 거치지 않은 27개의 Pull Request(PR)가 쏟아졌습니다. 이로 인해 관리자들은 매주 반나절을 스팸 청소에 소비해야 했고, @ethanwater와 같은 실제 기여자의 의견이 묻히는 문제가 발생했습니다. Archestra 팀은 평판 기반 시스템인 'London-Cat'과 자동 차단기 'AI Sheriff'를 시도했으나 한계를 느끼고, 결국 승인된 사용자만 활동할 수 있는 5단계 온보딩 시스템을 도입했습니다. 이는 VC 투자를 받는 스타트업으로서 지표 하락을 감수한 '핵심적인 결단'으로, 양보다 질을 우선시하는 새로운 오픈소스 관리 모델을 제시합니다.

핵심 인사이트

  • 스팸 규모: $900의 현상금이 걸린 특정 이슈에 총 253개의 댓글이 달렸으며, 대부분은 무의미한 AI 생성 구현 계획이나 공격적인 내용이었습니다.
  • PR 과부하: x.ai 서비스 연동 이슈 단 하나에 대해 테스트되지 않은 AI 생성 PR이 27개나 접수되어 코드 리뷰 효율성을 저해했습니다.
  • 운영 비용: 팀원 중 한 명은 매주 최소 반나절(약 4시간 이상)을 AI가 생성한 허위 이슈와 PR을 삭제하는 데 할애해야 했습니다.
  • 실제 피해: @ethanwater, @developerfred, @Geetk172 등 현상금을 위해 실제로 작업하던 정당한 기여자들이 소음으로 인해 소통의 어려움을 겪었습니다.

주요 디테일

  • 초기 시도(London-Cat): 기여자의 머지된 PR 이력 등을 기반으로 평판 점수를 계산하여 기여자의 신뢰도를 식별하려 했습니다.
  • 기술적 부작용(AI Sheriff): AI를 탐지하여 자동으로 이슈를 닫는 봇을 운영했으나, 정당한 기여자의 PR까지 오판하여 닫아버리는 사례가 발생했습니다.
  • 최종 해결책(Nuclear Option): 화이트리스트 승인을 받지 않은 사용자는 이슈 생성, PR 요청, 댓글 작성이 전면 차단됩니다.
  • 온보딩 프로세스: 기여를 원하는 사용자는 반드시 5단계의 온보딩 과정을 거쳐 화이트리스트에 등록되어야 활동 권한을 얻습니다.
  • 철학적 변화: VC 투자 스타트업은 활동량 지표(Metrics)가 중요함에도 불구하고, AI가 만든 저품질 데이터(AI Slop)보다는 코드의 질과 실제 커뮤니티의 안전을 선택했습니다.

향후 전망

  • 오픈소스의 폐쇄화: 무분별한 AI 도구 사용으로 인해 기존의 '누구나 참여 가능한' 오픈소스 모델이 '인증된 사용자 중심'의 폐쇄형 모델로 변모할 가능성이 큽니다.
  • 기여 인증 도구의 확산: 깃허브 차원의 강력한 스팸 필터링이 부재할 경우, 프로젝트별로 별도의 기여자 검증 시스템(온보딩) 도입이 표준이 될 것으로 보입니다.
Share

이것도 읽어보세요

댓글

이 소식에 대한 의견을 자유롭게 남겨주세요.

댓글 (0)

불러오는 중...