영국 바이오뱅크 건강 데이터, 지속적으로 GitHub에 유출되는 문제 발생

영국 바이오뱅크(UK Biobank)의 건강 데이터가 GitHub에 지속적으로 노출되어 2025년 7월부터 2026년 4월 17일까지 총 110건의 삭제 요청이 접수되었습니다. 유출된 데이터에는 주피터 노트북과 PLINK 등 유전체 데이터가 포함되었으며, 미국(24명)과 중국(21명)을 비롯한 전 세계 14개국 연구자들이 연루된 것으로 확인되었습니다.

AI 요약

영국 바이오뱅크(UK Biobank)가 연구자들의 관리 소홀로 유출된 민감 건강 데이터를 삭제하기 위해 GitHub의 저작권 침해 신고 시스템을 이례적으로 활용하고 있습니다. 영국 내에 개인정보 침해 시 즉각적인 조치를 강제할 DMCA 수준의 법적 장치가 부족하여, 바이오뱅크 측은 특정 파일이나 저장소를 대상으로 저작권법을 근거로 한 삭제 요청을 진행 중입니다. 2025년 7월 첫 신고 이후 2026년 4월 17일까지 총 110건의 요청이 발생했으며, 특히 가디언(The Guardian)의 보안 취약점 보도 직후 신고 활동이 급증했습니다. 유출 데이터는 분석용 노트북부터 고도의 유전체 정보까지 다양하며, 이는 전 세계 연구 네트워크 전반에 걸친 보안 관리의 허점을 드러내고 있습니다.

핵심 인사이트

  • 대규모 삭제 요청: 2025년 7월부터 2026년 4월 17일까지 GitHub에 총 110건의 DMCA 기반 데이터 삭제 요청이 접수되었습니다.
  • 글로벌 유출 현황: 확인된 170명의 개발자 중 14개국에 걸친 위치 데이터가 확인되었으며, 미국(24명), 중국(21명), 영국(7명) 순으로 많았고 한국(1명)도 포함되었습니다.
  • 데이터 구성비: 유출 파일의 약 50%는 주피터 또는 R 노트북 파일이며, 25%는 PLINK, BOLT-LMM, BGEN과 같은 핵심 유전체/게놈 데이터 파일입니다.

주요 디테일

  • 법적 우회 수단: 개인정보 유출 대응 법안의 공백을 메우기 위해, 바이오뱅크는 파일 단위의 저작권 침해를 주장하며 GitHub의 삭제 메커니즘을 활용하고 있습니다.
  • 유출 데이터의 민감도: CSV, TSV, Excel 등 표 형식의 데이터셋은 물론, 참가자의 유전자형(Genotypes)과 연관성 분석 결과가 포함된 전문 유전체 파일이 다수 노출되었습니다.
  • 신고 타임라인의 특이점: 2026년 1월부터 3월 중순까지 중단되었던 신고 활동은 가디언의 조사 결과가 발표된 직후인 3월 말부터 다시 재개되는 양상을 보였습니다.
  • 분석 방법론: GitHub의 'github/dmca' 공용 저장소에서 "uk-biobank" 슬러그 및 관련 키워드 분석을 통해 도출된 데이터입니다.

향후 전망

  • 보안 규정 강화: 데이터 접근 권한(Data Access Agreements) 위반에 대한 연구자 및 기관 단위의 징계와 보안 가이드라인이 대폭 강화될 것으로 보입니다.
  • 법적 제도 정비: 민감한 의료 및 생체 데이터 보호를 위해 영국 내에서도 개인정보 보호를 위한 즉각적 삭제 강제 법안 도입 논의가 촉발될 가능성이 있습니다.
출처:hackernews
Share

이것도 읽어보세요

댓글

이 소식에 대한 의견을 자유롭게 남겨주세요.

댓글 (0)

불러오는 중...