엔비디아(CEO 젠슨 황)는 VM웨어 프라이빗 AI 파운데이션(VMware Private AI Foundation)을 지원하는 '엔비디아 AI 레디 서버'(NVIDIA AI-ready)를 제공, 기업은 독자적인 비즈니스 데이터를 사용해 생성형 AI 애플리케이션을 맞춤화하고 배포할 수 있도록 지원한다고 밝혔다.

엔비디아 AI 레디 서버에는 엔비디아 L40S GPU, 엔비디아 블루필드-3(BlueField®-3) DPU, 엔비디아 AI 엔터프라이즈 소프트웨어가 탑재된다. 이를 통해 기업들은 생성형 AI 기반 모델을 미세 조정하고 지능형 챗봇, 검색, 요약 도구 등과 같은 생성형 AI 애플리케이션을 구현할 수 있다.

비디아 L40S 기반 서버는 델 테크놀로지스(Dell Technologies), 휴렛팩커드 엔터프라이즈(Hewlett Packard Enterprise), 레노버(Lenovo) 등 글로벌 시스템 제조업체를 통해 연말 출시를 앞두고 있다. 해당 서버는 엔터프라이즈용 생성형 AI 가속화에 활용될 예정이다.

엔비디아의 창립자 겸 CEO인 젠슨 황(Jensen Huang)은 "새로운 컴퓨팅 시대가 시작됐다. 모든 산업 분야의 기업들이 생성형 AI를 도입하기 위해 경쟁하고 있다. 엔비디아는 세계 최고의 소프트웨어와 시스템 파트너 에코시스템을 통해 전 세계 기업들에게 생성형 AI를 제공하고 있다"고 말했다.

엔비디아 AI 레디 서버는 엔비디아와 함께 VM웨어 프라이빗 AI 파운데이션을 구축하려는 기업들에게 이상적인 플랫폼이다.

VM웨어의 CEO인 라구 라구람(Raghu Raghuram)은 "생성형 AI는 디지털 전환을 가속화하고 있으며, 기업은 비즈니스를 발전시킬 수 있는 애플리케이션을 보다 안전하게 구축하기 위해 완전히 통합된 솔루션이 필요하다. VM웨어, 엔비디아 그리고 서버 제조업체 파트너의 전문성을 결합해 기업은 데이터 프라이버시, 보안, 제어 등을 유지하면서 AI를 개발하고 배포할 수 있다"고 말했다.

 

엔비디아 AI 레디 서버는 생성형 AI를 도입하려는 업계에 풀 스택 가속 인프라와 소프트웨어를 제공하도록 설계됐다. 여기에는 신약 개발, 유통 제품 설명, 지능형 가상 어시스턴트, 제조 시뮬레이션 등 광범위한 애플리케이션이 해당된다.

이 서버에는 엔비디아 AI 플랫폼 운영 체제인 엔비디아 AI 엔터프라이즈가 탑재된다. 이 소프트웨어는 LLM을 위한 엔비디아 네모(NeMo), 시뮬레이션을 위한 엔비디아 모듈러스(Modulus), 데이터 사이언스를 위한 엔비디아 래피즈(RAPIDS), 프로덕션 AI를 위한 엔비디아 트리톤 추론 서버(Triton Inference Server) 등 100개 이상의 프레임워크, 사전 훈련된 모델, 툴킷, 소프트웨어에 대한 프로덕션 지원과 보안을 제공한다.

L40S GPU는 수십억 개의 매개변수가 있는 복잡한 AI 워크로드를 처리하도록 설계됐으며, 4세대 텐서 코어와 FP8 트랜스포머 엔진이 포함된다. 이를 통해 1.45페타플롭스 이상의 텐서 처리 성능과 엔비디아 A100 텐서 코어 GPU에 비해 최대 1.7배의 훈련 성능을 제공한다.

지능형 챗봇, 어시스턴트, 검색, 요약 등과 같은 생성형 AI 애플리케이션의 경우 엔비디아 L40S는 엔비디아 A100 GPU에 비해 최대 1.2배 더 뛰어난 생성형 AI 추론 성능을 제공한다.

엔비디아 블루필드 DPU를 통합하면 가상화, 네트워킹, 스토리지, 보안과 기타 클라우드 기반 AI 서비스의 엄청난 컴퓨팅 부하를 가속화, 오프로드 또는 격리해 속도를 더욱 높일 수 있다.

엔비디아 커넥트X-7 스마트NIC(ConnectX®-7 SmartNIC)는 고급 하드웨어 오프로드와 초저지연을 제공해 데이터 집약적인 생성형 AI 워크로드를 위한 동급 최고 수준의 확장성을 제공한다.

델 파워엣지(PowerEdge) R760xa, 엔비디아와 함께하는 VM웨어 프라이빗 AI 파운데이션을 위한 HPE 프로라이언트(ProLiant) Gen11, 레노버 씽크시스템(ThinkSystem) SR675 V3를 비롯한 세계 주요 컴퓨터 제조업체들이 엔비디아 AI 서버를 구축하고 있다.

L40S GPU와 블루필드 DPU가 탑재된 엔비디아 AI 레디 서버는 연말 출시 예정이며, 향후 몇 달 내 클라우드 서비스 제공업체를 통해 인스턴스를 이용할 수 있다.

관련기사

저작권자 © 맨즈랩 무단전재 및 재배포 금지