O Argonne National Laboratory e a Intel disseram na quinta-feira que instalaram todas as 10.624 cifras do supercomputador Aurora, uma máquina anunciada em 2015 com uma história particularmente acidentada. O sistema promete oferecer o mais alto desempenho de computação teórica em 2 FP64 ExaFLOPS usando uma combinação de dezenas de milhares de CPUs Xeon Max ‘Sapphire Rapids’ com memória HBM2E integrada e uma GPU Max ‘Ponte Vecchio’ para o data center. O sistema ficará online ainda este ano.
“Aurora é a primeira implantação de GPU da série Max da Intel, o maior sistema baseado em CPU Xeon Max e o maior cluster de GPU do mundo”, disse Jeff McPhee, vice-presidente corporativo da Intel e gerente geral do Super Compute Group.
O supercomputador Aurora parece impressionante, mesmo pelos números. O dispositivo é alimentado por 21.248 processadores de uso geral com mais de 1,1 milhão de núcleos para cargas de trabalho que exigem potência de CPU tradicional e 63.744 GPUs de computação que atendem a cargas de trabalho de IA e HPC. Em termos de memória, o Aurora tem 1,36 petabytes de memória HBM2E integrada e 19,9 petabytes de memória DDR5 usada pelas CPUs, além dos 8,16 petabytes de HBM2E mantidos pelas GPUs Ponte Vecchi.
O Aurora usa 166 racks com 66 lâminas cada. Ele se estende por oito fileiras e ocupa uma área equivalente a duas quadras de basquete. Enquanto isso, o subsistema de armazenamento Aurora, que usa 1.024 nós de armazenamento totalmente flash que fornecem 220 TB de armazenamento e uma largura de banda total de 31 TB/s, não conta. Atualmente, o Argonne National Laboratory não divulga números oficiais de consumo de energia para o Aurora ou seu subsistema de armazenamento.
O supercomputador, que será usado para uma variedade de cargas de trabalho, de simulações de fusão nuclear a previsões e de aerodinâmica a pesquisa médica, usa a arquitetura de supercomputador Shasta da HPE com conexões Slingshot. Enquanto isso, antes que o sistema passe nos testes de aceitação da ANL, ele será usado para modelos de IA generativos científicos em larga escala.
“Enquanto trabalhamos nos testes de aceitação, usaremos o Aurora para treinar alguns modelos de IA geradora de código aberto em grande escala para a ciência”, disse Rick Stevens, diretor associado de laboratório do Argonne National Laboratory. “Com mais de 60.000 GPUs Intel Max, um sistema de I/O muito rápido e um enorme sistema de armazenamento em estado sólido completo, o Aurora é o ambiente perfeito para treinar esses modelos.“
Mesmo com os blades Aurora instalados, o supercomputador ainda precisa passar por uma série de testes de aceitação, que é um procedimento comum para supercomputadores. Depois de digitalizado com sucesso e colocado on-line no final do ano, espera-se que atinja um desempenho teórico superior a 2 ExaFLOPS (dois bilhões de operações de ponto flutuante por segundo). Com desempenho fenomenal, espera-se garantir a primeira posição na lista Top500.
A instalação do supercomputador Aurora marca vários marcos: é o primeiro supercomputador da indústria com desempenho acima de 2 ExaFLOPS e o primeiro dispositivo da classe ExaFLOPS baseado em Intel. Por fim, marca a conclusão da saga Aurora, que começou há oito anos, quando a jornada do supercomputador passou por alguns percalços.
Originalmente revelado em 2015, o Aurora foi inicialmente planejado para ser alimentado por coprocessadores Intel Xeon Phi e deveria entregar aproximadamente 180 PetaFLOPS em 2018. No entanto, a Intel decidiu abandonar o Xeon Phi em favor de módulos de computação. precisa renegociar o acordo com o Argonne National Laboratory para fornecer o sistema ExaFLOPS até 2021.
A entrega do sistema foi atrasada por complicações com os ladrilhos de computação Ponte Vecchio devido ao atraso do nó de produção de 7nm da Intel (agora conhecido como Intel 4) e a necessidade de redesenhar os ladrilhos para a tecnologia de processo N5 (classe de 5nm) da TSMC. A Intel finalmente apresentou seus produtos de centro de dados GPU Max no final do ano passado e já despachou mais de 60.000 dessas GPUs para a ANL.
“Viciado em TV certificado. Ninja zumbi irritantemente humilde. Defensor do café. Especialista em web. Solucionador de problemas.”
More Stories
Como os especialistas em IA do novo programa Gemini Gems do Google podem impulsionar seu SEO
Vazamentos revelam o nome e design do suposto dispositivo PS5 Pro
Os jogadores reclamam do longo tempo de matchmaking no PS5 conforme os números do Concord caem