AI 요약
2026년 5월 5일 작성된 이 기사는 M4 칩이 탑재된 맥북 에어와 NVIDIA의 최신 플래그십 그래픽카드인 RTX 5090을 eGPU(외장 그래픽) 형태로 결합하는 실험적인 프로젝트를 다룹니다. 저자는 썬더볼트 4의 PCIe 터널링 기술을 활용해 40Gbps 대역폭으로 장치를 연결하지만, Apple Silicon 기반 macOS에서 NVIDIA 드라이버가 지원되지 않는 근본적인 문제에 직면합니다. 이를 해결하기 위해 tinygrad와 같은 오픈소스 드라이버 스택을 검토했으나, AI 추론 속도가 M4 Pro 칩의 네이티브 Metal 연산보다 10배나 느린 것으로 나타나 실용성 면에서 한계를 보였습니다. 기술적으로는 PCI BAR 매핑, DMA(Direct Memory Access), NVIDIA 고유의 메모리 정렬 문제 등 하드웨어와 OS 계층의 복잡한 최적화 과정이 필요함을 강조하고 있습니다.
핵심 인사이트
- 극단적인 하드웨어 조합: 소비 전력 22W의 M4 CPU와 600W의 RTX 5090 GPU를 썬더볼트 인터페이스로 연결하는 '불균형적' 실험을 시도함.
- 드라이버 부재의 장벽: Apple Silicon macOS는 NVIDIA 및 AMD GPU용 공식 드라이버를 제공하지 않아, tinygrad 등 별도의 드라이버 파이프라인 구축이 필수적임.
- 성능 저하 수치: tinygrad eGPU 드라이버를 통한 추론 성능은 M4 Pro 칩에서 직접 실행하는 네이티브 Metal 추론보다 약 10배 느린 것으로 확인됨.
- 연결 규격: 썬더볼트 4는 4개의 PCIe 레인을 사용하며 최대 40Gbps 대역폭을 제공하지만, 터널링 과정에서 발생하는 성능 페널티가 존재함.
주요 디테일
- PCIe 터널링: 썬더볼트는 USB-C 케이블을 통해 PCIe 신호를 전송하며, 컴퓨터는 이를 내부 PCIe 장치와 동일하게 인식함.
- 기술적 난제: Apple Silicon 상에서 DMA(직접 메모리 액세스)를 구현하기 위해 apple-dma-pci 매핑 및 NVIDIA 장치 특유의 정렬(alignment) 문제를 해결해야 함.
- 소프트웨어 제한: 현재 tinygrad 드라이버는 범용 디스플레이 드라이버가 아닌 AI 스택용으로만 작동하며, 지원하는 AI 모델도 극히 제한적임.
- 벤치마크 항목: Cyberpunk 2077(720p Low, 1080p, 4K), Shadow of the Tomb Raider, Horizon Zero Dawn Remastered 등 고사양 게임이 성능 테스트 대상으로 언급됨.
- AI 모델 테스트: Qwen 3.6 및 Gemma 4와 같은 모델을 통해 eGPU 환경에서의 AI 추론 성능을 측정함.
향후 전망
- 오픈소스 커뮤니티의 역할: macOS에서 외부 GPU를 활용하기 위한 tinygrad 등 오픈소스 드라이버 프로젝트가 기술적 돌파구를 마련할지 주목됨.
- 실용성 확보 여부: 드라이버 최적화와 대역폭 문제가 해결되지 않는 한, 일반 사용자보다는 기술적 호기심을 충족하기 위한 실험적 영역에 머물 것으로 보임.
출처:hackernews
