144TB, 256 superchips e mais: NVIDIA anuncia supercomputador para IA

Na última semana, a NVIDIA anunciou uma nova classe de supercomputadores de InteligênciaArtificial (IA) de atributos assustadores quando comparado ao que se tem no mercado.

Trata-se do supercomputador NVIDIA DGX, que possui com tecnologia NVIDIA GH200 Grace Hopper Superchips, munido do NVIDIA NVLink Switch System, uma máquina criada para permitir o desenvolvimento de modelos gigantes de última geração para aplicações de linguagem generativas de IA, sistemas de recomendação e cargas de trabalho de análise de dados.

Memória e superchip

O enorme espaço de memória compartilhada da NVIDIA DGX GH200 utiliza a tecnologia de interconexão NVLink com o NVLink Switch System para combinar 256 superchips GH200, permitindo que funcionem como uma única GPU. Isso fornece 1 exaflop de desempenho e 144 terabytes de memória compartilhada — quase 500x mais memória do que a geração anterior NVIDIA DGX A100, lançada em 2020.

“IA generativa, grandes modelos de linguagem (LLMs) e sistemas de recomendação são os motores digitais da economia moderna”, diz Jensen Huang, fundador e CEO da NVIDIA. “Os supercomputadores de IA DGX GH200 integram as tecnologias de computação e rede aceleradas mais avançadas da NVIDIA para expandir a fronteira da IA.”

A tecnologia NVIDIA NVLink expande a IA em escala

De acordo com a NVIDIA, os superchips GH200 eliminam a necessidade de uma conexão tradicional de CPU para GPU PCIe combinando uma CPU NVIDIA Grace baseada em Arm com uma GPU NVIDIA H100 Tensor Core no mesmo pacote, usando interconexões de chip NVIDIA NVLink-C2C.

Isso aumenta a largura de banda entre GPU e CPU em 7x em comparação com a mais recente tecnologia PCIe, reduz o consumo de energia de interconexão em mais de 5x e fornece um bloco de construção de GPU de arquitetura Hopper de 600 GB para supercomputadores DGX GH200.

A arquitetura DGX GH200 é o primeiro supercomputador a emparelhar Grace Hopper Superchips com o NVIDIA NVLink Switch System, uma nova interconexão que permite que todas as GPUs em um sistema DGX GH200 funcionem juntas como uma só. O sistema da geração anterior fornecia apenas oito GPUs para serem combinadas com o NVLink como uma GPU sem comprometer o desempenho.

“Cada vez mais a NVIDIA vem investindo em soluções mais potentes para supercomputadores. Isso segue a tendência de mercado devido à demanda crescente por poder computacional avançado e aceleração de inteligência artificial”, reforça Marcio Aguiar, diretor da divisão Enterprise da NVIDIA para América Latina.

A arquitetura DGX GH200 fornece 48x mais largura de banda NVLink do que a geração anterior, oferecendo o poder de um enorme supercomputador de IA com a simplicidade de programar uma única GPU.

Para quem chega primeiro

Google Cloud, Meta e Microsoft estão entre os primeiros a obter acesso a DGX GH200 para explorar seus recursos para cargas de trabalho de IA generativas. A NVIDIA também pretende fornecer o design DGX GH200 como um modelo para provedores de serviços em nuvem e outros hiperescaladores, para que possam personalizá-lo ainda mais para sua infraestrutura.

“A construção de modelos generativos avançados requer abordagens inovadoras para a infraestrutura de IA”, afirma Mark Lohmeyer, vice-presidente de computação do Google Cloud. “A nova escala NVLink e a memória compartilhada dos Superchips Grace Hopper abordam os principais gargalos da IA em larga escala e estamos ansiosos para explorar seus recursos para o Google Cloud e nossas iniciativas de IA generativa.”

“À medida que os modelos de IA crescem, eles precisam de uma infraestrutura poderosa que possa ser dimensionada para atender às demandas crescentes”, ressalta Alexis Björlin, vice-presidente de infraestrutura, sistemas de IA e plataformas aceleradas da Meta. “O design Grace Hopper da NVIDIA procura fornecer aos pesquisadores a capacidade de explorar novas abordagens para resolver seus maiores desafios.”

Novo supercomputador NVIDIA Helios para pesquisa e desenvolvimento avançados

A NVIDIA está construindo seu próprio supercomputador IA baseado em DGX GH200 para potencializar o trabalho de seus pesquisadores e equipes de desenvolvimento. Batizado de NVIDIA Helios, o supercomputador contará com quatro sistemas DGX GH200.

Cada sistema no supercomputador Helios será interconectado com a rede NVIDIA Quantum-2 InfiniBand com largura de banda de até 400 Gb/s para aumentar a taxa de transferência de dados para treinar grandes modelos de IA. O Helios incluirá 1.024 Grace Hopper Superchips e deverá estar online até o final do ano.

Totalmente integrado e construído especificamente para modelos gigantes

Os supercomputadores DGX GH200 incluem softwares NVIDIA para fornecer uma solução completa e pronta para uso para as maiores cargas de trabalho de IA e análise de dados. O software NVIDIA Base Command™ oferece gerenciamento de fluxo de trabalho de IA, gerenciamento de cluster de nível empresarial, bibliotecas que aceleram computação, armazenamento e infraestrutura de rede e software de sistema otimizado para executar cargas de trabalho de IA.

Também está incluso o NVIDIA AI Enterprise, a camada de software da plataforma NVIDIA AI. Ele fornece mais de 100 estruturas, modelos pré-treinados e ferramentas de desenvolvimento para simplificar o desenvolvimento e a implantação da IA de produção, incluindo IA generativa, visão computacional, IA de fala e muito mais.