AI 요약
엔비디아가 GTC 행사에서 에이전틱 AI(Agentic AI)와 강화 학습(RL) 시대를 위해 특수 설계된 차세대 프로세서인 'Vera' CPU를 공개했습니다. 이 제품은 작업을 계획하고 도구를 실행하며 결과를 검증하는 에이전틱 AI의 특성에 맞춰, 기존 랙 스케일 CPU보다 2배 더 효율적이고 50% 빠른 성능을 자랑합니다. 기존 Grace CPU의 성공을 기반으로 개발된 Vera는 업계 최고 수준의 싱글 스레드 성능과 코어당 대역폭을 제공하여 코딩 어시스턴트나 기업용 에이전트와 같은 대규모 AI 서비스의 처리량을 극대화합니다. 엔비디아는 이 CPU를 256개 통합한 새로운 액체 냉각 랙을 통해 22,500개 이상의 독립적인 동시 환경을 지원하며, 이는 AI 팩토리의 규모 확장을 가속화할 전망입니다. 특히 Vera는 차세대 Rubin NVL72 플랫폼의 핵심 요소로서 NVLink-C2C 기술을 통해 GPU와 1.8 TB/s의 초고속 대역폭으로 연결됩니다. 젠슨 황 CEO는 이제 CPU가 단순히 모델을 보조하는 수준을 넘어 AI 시스템의 추론과 행동을 직접 주도하는 핵심 동력이 되었다고 강조했습니다.
핵심 인사이트
- 성능 혁신: 전통적인 랙 스케일 CPU 대비 2배의 에너지 효율성과 50% 더 빠른 처리 속도를 구현.
- 초고속 데이터 전송: NVLink-C2C 기술을 적용해 PCIe Gen 6보다 7배 빠른 1.8 TB/s의 코히런트(Coherent) 대역폭 제공.
- 대규모 확장성: 새로운 Vera CPU 랙은 256개의 액체 냉각 CPU를 통합하여 단일 랙에서 22,500개 이상의 동시 환경 구동 가능.
- 글로벌 파트너십: Alibaba, Meta, Oracle Cloud 등 주요 하이퍼스케일러 및 Dell, HPE, Lenovo, Supermicro 등 글로벌 제조사와 협업.
주요 디테일
- 에이전틱 AI 최적화: AI가 스스로 추론하고 행동하는 '에이전틱' 기능에 필수적인 작업 계획, 도구 실행, 데이터 상호작용 등에 특화된 설계.
- Rubin 플랫폼 통합: 차세대 GPU 플랫폼인 NVIDIA Vera Rubin NVL72 및 HGX Rubin NVL8 시스템의 호스트 CPU로 채택되어 GPU 가속 워크로드 제어.
- 모듈형 아키텍처: NVIDIA MGX 모듈형 참조 아키텍처를 기반으로 설계되어 전 세계 80여 개의 에코시스템 파트너가 즉시 도입 가능.
- 다양한 워크로드 지원: 강화 학습, 에이전틱 추론, 데이터 처리, 오케스트레이션, 클라우드 애플리케이션 및 고성능 컴퓨팅(HPC)에 최적화.
- 유연한 구성: 파트너사를 통해 단일 및 듀얼 소켓 CPU 서버 구성을 모두 제공하여 인프라 구축의 유연성 확보.
향후 전망
- 에이전틱 AI의 대중화를 가속화하여 개발자, 스타트업 및 기업들이 대규모 AI 인프라를 더 효율적이고 낮은 비용으로 구축할 수 있게 함.
- CPU가 AI 모델 구동의 전면에 나서면서 더 복잡하고 지능적인 실시간 AI 에이전트 서비스가 산업 전반에 확산될 것으로 예상.
