깃허브 코파일럿, 사용자 데이터를 AI 학습에 활용... '옵트아웃' 설정으로 거부 가능

마이크로소프트 산하 깃허브(GitHub)가 2026년 3월 25일, 코파일럿(Copilot) 사용자의 코드 스니펫과 활동 데이터를 AI 모델 학습에 활용한다고 발표했습니다. 프리(Free) 및 프로(Pro) 사용자 계정이 대상이며, 비즈니스 및 엔터프라이즈 계정은 제외되나 개인 사용자는 설정을 통해 데이터 제공을 거부(Opt-out)할 수 있습니다.

AI 요약

마이크로소프트가 소유한 세계적인 코딩 플랫폼 깃허브는 2026년 3월 25일, 깃허브 코파일럿의 성능을 개선하기 위해 사용자들의 상호작용 데이터를 AI 모델 학습에 활용하기로 결정했습니다. 이번 조치는 입력 및 출력 데이터, 코드 스니펫, 주석, 문서화, 파일 이름 및 리포지토리 구조 등 광범위한 정보를 수집 대상으로 삼습니다. 깃허브 측은 이미 마이크로소프트 임직원들의 데이터를 활용해 모델의 긍정적인 성능 향상을 확인했으며, 이를 일반 사용자에게 확대하여 더 정확하고 안전한 코드 제안과 버그 탐지 기능을 제공하겠다는 계획입니다. 해당 데이터 수집은 코파일럿 프리(Free)와 프로(Pro), 프로 플러스(Pro+) 계정 사용자에게 적용되지만, 기업용 계정인 비즈니스 및 엔터프라이즈 사용자는 대상에서 제외됩니다. 사용자는 깃허브 설정 메뉴를 통해 언제든지 이 데이터 수집 기능을 비활성화할 수 있습니다.

핵심 인사이트

  • 발표 날짜 및 내용: 2026년 3월 25일, 깃허브는 코파일럿 성능 향상을 위해 사용자 데이터를 AI 학습용으로 수집한다고 공식화함.
  • 수집 대상 계정: Copilot Free, Copilot Pro, Copilot Pro+ 사용자가 포함되며, Copilot Business 및 Enterprise 계정은 자동으로 제외됨.
  • 수집 데이터 범위: 입력/출력값, 코드 조각(snippets), 주석, 파일 이름, 리포지토리 구조 등을 포함한 모든 코딩 워크플로우 데이터.

주요 디테일

  • 학습 기반의 변화: 초기에 공개 데이터와 수동 제작 샘플로 학습되었던 모델을 실제 개발 환경의 풍부한 데이터로 대체하여 고도화하려는 목적임.
  • 통합 서비스 범위: Visual Studio Code(VS Code), 깃허브 웹사이트, 코파일럿 CLI(Claude Code의 경쟁 툴) 등 코파일럿이 통합된 모든 서비스에서의 활동이 수집 대상임.
  • 성능 개선 효과: 모델이 개발 워크플로우를 더 잘 이해하게 되어 배포 전 잠재적 버그를 잡거나 보안상 안전한 코드 패턴을 제안하는 능력이 향상될 것으로 기대됨.
  • 옵트아웃(Opt-out) 방법: 깃허브 계정 설정의 'Privacy' 섹션에서 'Allow GitHub to use my data for AI model training' 드롭다운 메뉴를 'Disabled'로 설정하여 거부 가능.

향후 전망

  • AI 모델의 비약적 발전: 수백만 명의 개인 개발자 데이터를 통해 AI의 코드 완성도가 현재보다 더 정교해질 것으로 전망됨.
  • 보안 및 프라이버시 이슈: 데이터 수집이 기본 설정(Default)으로 적용됨에 따라 개인 개발자들 사이에서 보안 및 데이터 소유권에 대한 논의가 가속화될 가능성이 있음.
Share

이것도 읽어보세요

댓글

이 소식에 대한 의견을 자유롭게 남겨주세요.

댓글 (0)

불러오는 중...