HERRO 교정 심플렉스 나노포어 리드를 활용한 T2T(Telomere-to-Telomere) 유전체 조립

딥러닝 기반의 HERRO 프레임워크는 ONT 심플렉스 리드의 정확도를 최대 100배 향상시켜, 고비용의 다중 플랫폼 없이도 인간의 32개 염색체를 T2T(Telomere-to-Telomere) 수준으로 조립하는 데 성공했습니다. Verkko 어셈블러와 결합하여 NGA50 수치 100Mb 이상을 달성함으로써 유전체 분석 비용 절감과 품질 향상을 동시에 이끌어냈습니다.

AI 요약

기존의 텔로미어 투 텔로미어(T2T) 유전체 조립은 PacBio HiFi와 같은 고정밀 리드와 ONT의 초장기 리드를 결합해야 했기에 비용과 기술적 장벽이 높았습니다. 이를 해결하기 위해 개발된 HERRO(Haplotype-aware ERRor cOrrection)는 딥러닝을 활용해 ONT 심플렉스 리드의 오류를 교정하면서도 반수체(Haplotype) 간의 미세한 차이를 보존하는 프레임워크입니다. 연구진은 HERRO를 통해 인간 이배체 유전체에서 리드 정확도를 최대 100배까지 끌어올렸으며, 이를 Verkko 어셈블러와 연동하여 분석을 진행했습니다. 그 결과, X와 Y 염색체를 포함하여 최대 32개의 염색체를 T2T 수준으로 재구성하는 성과를 거두었습니다. 특히 여러 인간 유전체 데이터에서 NGA50 지표 100Mb 이상을 일관되게 기록하며 성능을 입증했습니다. 이 기술은 ONT R9.4.1 및 R10.4.1 리드를 모두 지원하며 인간 외의 다른 종에도 적용 가능하여 유전체 연구의 경제성을 획기적으로 개선할 것으로 기대됩니다.

핵심 인사이트

  • 정확도 100배 향상: HERRO 딥러닝 프레임워크는 인간 이배체 유전체의 ONT 심플렉스 리드 정확도를 최대 100배까지 높이는 데 성공했습니다.
  • 32개 염색체 T2T 조립: X와 Y 염색체를 포함하여 최대 32개의 염색체를 완벽한 T2T 수준으로 재구성했습니다.
  • 고성능 지표 NGA50 100Mb+: 여러 인간 유전체 분석에서 NGA50 수치 100Mb 이상을 지속적으로 달성하여 조립의 연속성을 증명했습니다.
  • 광범위한 호환성: Oxford Nanopore Technologies(ONT)의 R9.4.1 및 최신 R10.4.1 규격을 모두 지원합니다.

주요 디테일

  • 기술적 혁신: 기존의 복잡한 다중 플랫폼(PacBio + ONT) 방식에서 벗어나 단일 ONT 심플렉스 리드만으로 고품질 T2T 조립이 가능해졌습니다.
  • Haplotype 보존: HERRO는 게놈 반복 복사본이나 반수체를 구분하는 정보 위치를 정확히 인식하여 유전적 차이를 소실 없이 보존합니다.
  • 어셈블러 최적화: 최첨단 de novo 어셈블러인 Verkko와의 결합을 통해 조립 효율을 극대화했습니다.
  • 연구 주체: 싱가포르 A*STAR 산하 GIS(Genome Institute of Singapore), 크로아티아 자그레브 대학교, Oxford Nanopore Technologies의 공동 연구로 수행되었습니다.
  • 경제성 제고: 시퀀싱에 필요한 게놈 DNA 양을 줄이고 분석 비용을 낮추어 대규모 유전체 프로젝트의 접근성을 높였습니다.

향후 전망

  • 유전체 분석의 대중화: 분석 비용 감소와 기술적 단순화로 인해 개인 맞춤형 정밀 의료 및 대규모 인구 집단 유전체 연구가 가속화될 전망입니다.
  • 다양한 생물종 확장: 인간뿐만 아니라 가축, 작물 및 멸종 위기종 등 다양한 생물체의 고품질 참조 유전체 구축에 활용될 것으로 보입니다.
Share

이것도 읽어보세요

댓글

이 소식에 대한 의견을 자유롭게 남겨주세요.

댓글 (0)

불러오는 중...