Supercomputador Aurora é classificado como o mais rápido para IA

No ISC 2024, a Intel anuncia que Aurora é o supercomputador de IA mais rápido, rompeu a barreira exascale e detalha a importância de um ecossistema aberto em HPC e IA.

Notícias

  • 13 de maio de 2024

  • Entre em contato com o PR da Intel

  • Siga a Intel Newsroom nas redes sociais:

    Logotipo do Twitter
    Ícone do YouTube

author-image

Por

O que há de novo: No ISC High Performance 2024, a Intel anunciou em colaboração com o Argonne National Laboratory e a Hewlett Packard Enterprise (HPE) que o supercomputador Aurora rompeu a barreira de exascale em 1,012 exaflops e é o sistema de IA mais rápido do mundo dedicado à IA para ciência aberta, alcançando 10,6 AI exaflops. A Intel também detalhará o papel crucial dos ecossistemas abertos na condução de computação de alto desempenho (HPC) acelerada por IA.

"O supercomputador Aurora superando exascale permitirá que ele abra o caminho para as descobertas do futuro. Desde a compreensão dos padrões climáticos até a desvendamento dos difusores do universo, os supercomputadores servem como bússola para resolver desafios científicos verdadeiramente difíceis que podem melhorar a humanidade".

–Ogi Brkic, vice-presidente geral e gerente geral de soluções de IA para data centers da Intel

Por que importa: Projetado como um sistema centrado em IA desde sua criação, o Aurora permitirá que os pesquisadores aproveitem modelos de IA generativos para acelerar a descoberta científica. Progressos significativos foram feitos nas primeiras pesquisas orientadas por IA de Argonne. As histórias de sucesso incluem o mapeamento dos 80 bilhões de neurônios do cérebro humano, a física de partículas de alta energia aprimorada pela aprendizagem profunda e o design e descoberta de medicamentos acelerados pelo aprendizado de máquina, entre outros.

Detalhes do Supercomputador Aurora: O supercomputador Aurora é um sistema extenso com 166 racks, 10.624 blades de computação, 21.248 processadores Intel® Xeon® CPU Série Max e 63.744 unidades Intel® Data Center GPU Max Series, tornando-o um dos maiores clusters de GPUs do mundo. Aurora também inclui a maior interconexão de supercomputação aberta baseada em Ethernet em um único sistema de terminais de malha HPE de 84.992 HPE. O supercomputador Aurora ficou em segundo lugar no parâmetro de comparação do LINPACK (HPL) de alto desempenho, mas quebrou a barreira de exascale em 1,012 exaflops usando 9.234 nós, apenas 87% do sistema. O supercomputador Aurora também garantiu o terceiro lugar no benchmark de gradiente conjugado de alto desempenho (HPCG) a 5.612 teraflops por segundo (TF/s) com 39% da máquina. Este parâmetro de comparação tem como objetivo avaliar cenários mais realistas que fornecem percepções sobre padrões de acesso à comunicação e memória, que são fatores importantes em aplicações de HPC do mundo real. Ele complementa parâmetros de comparação, como o LINPACK, oferecendo uma visão abrangente dos recursos de um sistema.

Como a IA é otimizada: No coração do supercomputador Aurora está o Intel Data Center GPU Max Series. A arquitetura Intel Xe GPU é fundamental para a série Max, com hardware especializado como blocos de computação de matriz e vetor otimizados para tarefas de IA e HPC. O design da arquitetura Intel Xe que oferece desempenho de computação inigualável é a razão pela qual o supercomputador Aurora garantiu o primeiro lugar no benchmark de precisão mista LINPACK (HPL-MxP) de alto desempenho, o que destaca melhor a importância das cargas de trabalho de IA em HPC.

Os recursos de processamento paralelo da arquitetura Xe se destacam no gerenciamento das complexas operações vetoriais de matriz inerentes à computação de IA de rede neural. Esses núcleos de computação são cruciais na aceleração de operações de matrizes cruciais para modelos de aprendizagem profunda. Complementada pelo conjunto de ferramentas de software da Intel, incluindo o compilador Intel® oneAPI DPC++/C++, um rico conjunto de bibliotecas de desempenho e estruturas e ferramentas de IA otimizadas, a arquitetura Xe promove um ecossistema aberto para desenvolvedores que é caracterizado pela flexibilidade e escalabilidade em vários dispositivos e fatores de forma.

Promovendo a computação acelerada com software aberto e capacidade de computação: Em sua sessão especial no ISC 2024, na terça-feira, 14 de maio, às 18h45, (GMT+2) Hall 4, Congress Center Hamburg, Alemanha, o CEO Andrew Richards da Codeplay, uma empresa da Intel, abordará a crescente demanda por computação acelerada e software em HPC e IA. Ele destacará a importância da oneAPI, oferecendo um modelo de programação unificado em diversas arquiteturas. Baseada em padrões abertos, a oneAPI capacita os desenvolvedores a criar códigos que são executados perfeitamente em diferentes plataformas de hardware sem modificações extensas ou dependência do fornecedor. Esse também é o objetivo da Base Unificada de Aceleração (UXL) da Linux Foundation, na qual Arm, Google, Intel, Qualcomm e outros estão desenvolvendo um ecossistema aberto para todos os aceleradores e computação heterogênea unificada em padrões abertos para romper o bloqueio proprietário. A Fundação UXL está adicionando mais membros à sua crescente coalizão.

Enquanto isso, a Intel® Tiber™ Developer Cloud está expandindo sua capacidade de computação com novas plataformas de hardware de última geração e novas capacidades de serviço que permitem que empresas e desenvolvedores avaliem os mais recentes arquitetura Intel, inovem e otimizem rapidamente modelos e cargas de trabalho de IA e, em seguida, implantem modelos de IA em escala. O novo hardware inclui visualizações dos Intel® Xeon® sistemas E-core e P-core para clientes selecionados e clusters baseados no intel® Gaudi® 2 e Intel® Data Center GPU Max Series em grande escala. Os novos recursos incluem o serviço Intel® Kubernetes para cargas de trabalho de treinamento e inferência de IA nativas na nuvem e contas com múltiplos usuários.

O que vem a seguir: Novos supercomputadores que estão sendo implantados com as tecnologias Intel Xeon CPU Série Max e Intel Data Center GPU Max Series ressaltam o objetivo da Intel de promover a HPC e a IA. Os sistemas incluem o Centro Euro-Mediterrâneo em Cassandra de Mudanças Climáticas (CMCC) para acelerar a modelagem das mudanças climáticas; Agência Nacional Italiana de Novas Tecnologias, Energia e Desenvolvimento Econômico Sustentável (ENEA) CRESCO 8 para permitir avanços na fusão de energia; Texas Advanced Computing Center (TACC), que está em produção total para permitir a análise de dados na biologia para fluxos de turbulência supersônica e simulações atomísticas em uma ampla variedade de materiais; bem como a Autoridade de Energia Atômica do Reino Unido (UKAEA) para resolver problemas vinculados à memória que sustentam o projeto de futuras usinas de fusão.

O resultado do parâmetro de referência de IA de precisão mista será fundamental para a GPU de próxima geração da Intel para IA e HPC, codinome Falcon Shores. Falcon Shores aproveitará a arquitetura Intel Xe da próxima geração com a melhor da Intel® Gaudi®. Essa integração permite uma interface de programação unificada.

Os resultados iniciais de desempenho no Intel® Xeon® 6 com memória de P-cores e Multiplexer Combined Ranks (MCR) a 8800 megatransfers por segundo (MT/s) oferecem até 2,3x melhoria de desempenho para aplicações de HPC do mundo real, como a Nucleus para modelagem europeia do oceano (NEMO), quando comparada à geração anterior,1 estabelecendo uma base forte como a escolha preferida de CPU do host para soluções HPC.

Mais contexto: Intel Tiber Developer Cloud | Base UXL | A Intel dá o próximo passo para construir processadores quânticos escaláveis baseados em silício | Intel Gaudi, Xeon e PC de IA aceleram cargas de trabalho Meta Llama 3 GenAI

As letras miúdas:

1Consulte a seção ISC 2024 sobre intel.com/performanceindex para cargas de trabalho e configurações. Os resultados podem variar.
As tecnologias Intel podem exigir ativação de hardware, software ou de serviços.
Os resultados de desempenho são baseados em testes realizados nas datas mostradas nas configurações e podem não refletir todas as atualizações disponíveis publicamente. Nenhum produto ou componente pode ser absolutamente seguro.
A Intel não controla ou audita dados de terceiros. Você deve consultar outras fontes para avaliar a precisão.