엔비디아, 에이전틱 AI 전용으로 설계된 'Vera' CPU 발표

엔비디아가 에이전틱 AI와 강화 학습에 최적화된 세계 최초의 'Vera' CPU를 발표하며 기존 대비 2배의 효율성과 50% 빠른 성능을 달성했습니다. 이 프로세서는 NVLink-C2C 기술을 통해 1.8 TB/s의 대역폭을 제공하며, 단일 랙에서 22,500개 이상의 동시 CPU 환경을 지원하여 대규모 AI 서비스 확장을 주도합니다.

AI 요약

엔비디아가 GTC 행사에서 에이전틱 AI(Agentic AI)와 강화 학습(RL) 시대를 위해 특수 설계된 차세대 프로세서인 'Vera' CPU를 공개했습니다. 이 제품은 작업을 계획하고 도구를 실행하며 결과를 검증하는 에이전틱 AI의 특성에 맞춰, 기존 랙 스케일 CPU보다 2배 더 효율적이고 50% 빠른 성능을 자랑합니다. 기존 Grace CPU의 성공을 기반으로 개발된 Vera는 업계 최고 수준의 싱글 스레드 성능과 코어당 대역폭을 제공하여 코딩 어시스턴트나 기업용 에이전트와 같은 대규모 AI 서비스의 처리량을 극대화합니다. 엔비디아는 이 CPU를 256개 통합한 새로운 액체 냉각 랙을 통해 22,500개 이상의 독립적인 동시 환경을 지원하며, 이는 AI 팩토리의 규모 확장을 가속화할 전망입니다. 특히 Vera는 차세대 Rubin NVL72 플랫폼의 핵심 요소로서 NVLink-C2C 기술을 통해 GPU와 1.8 TB/s의 초고속 대역폭으로 연결됩니다. 젠슨 황 CEO는 이제 CPU가 단순히 모델을 보조하는 수준을 넘어 AI 시스템의 추론과 행동을 직접 주도하는 핵심 동력이 되었다고 강조했습니다.

핵심 인사이트

  • 성능 혁신: 전통적인 랙 스케일 CPU 대비 2배의 에너지 효율성50% 더 빠른 처리 속도를 구현.
  • 초고속 데이터 전송: NVLink-C2C 기술을 적용해 PCIe Gen 6보다 7배 빠른 1.8 TB/s의 코히런트(Coherent) 대역폭 제공.
  • 대규모 확장성: 새로운 Vera CPU 랙은 256개의 액체 냉각 CPU를 통합하여 단일 랙에서 22,500개 이상의 동시 환경 구동 가능.
  • 글로벌 파트너십: Alibaba, Meta, Oracle Cloud 등 주요 하이퍼스케일러 및 Dell, HPE, Lenovo, Supermicro 등 글로벌 제조사와 협업.

주요 디테일

  • 에이전틱 AI 최적화: AI가 스스로 추론하고 행동하는 '에이전틱' 기능에 필수적인 작업 계획, 도구 실행, 데이터 상호작용 등에 특화된 설계.
  • Rubin 플랫폼 통합: 차세대 GPU 플랫폼인 NVIDIA Vera Rubin NVL72HGX Rubin NVL8 시스템의 호스트 CPU로 채택되어 GPU 가속 워크로드 제어.
  • 모듈형 아키텍처: NVIDIA MGX 모듈형 참조 아키텍처를 기반으로 설계되어 전 세계 80여 개의 에코시스템 파트너가 즉시 도입 가능.
  • 다양한 워크로드 지원: 강화 학습, 에이전틱 추론, 데이터 처리, 오케스트레이션, 클라우드 애플리케이션 및 고성능 컴퓨팅(HPC)에 최적화.
  • 유연한 구성: 파트너사를 통해 단일 및 듀얼 소켓 CPU 서버 구성을 모두 제공하여 인프라 구축의 유연성 확보.

향후 전망

  • 에이전틱 AI의 대중화를 가속화하여 개발자, 스타트업 및 기업들이 대규모 AI 인프라를 더 효율적이고 낮은 비용으로 구축할 수 있게 함.
  • CPU가 AI 모델 구동의 전면에 나서면서 더 복잡하고 지능적인 실시간 AI 에이전트 서비스가 산업 전반에 확산될 것으로 예상.
Share

댓글

이 소식에 대한 의견을 자유롭게 남겨주세요.

댓글 (0)

불러오는 중...