Download de imagens (16 MB)
O que há de novo: Na SC23, a Intel apresentou a computação de alto desempenho (HPC) acelerada por IA com desempenho líder para cargas de trabalho de HPC e IA em Intel® Data Center GPU Max Series, aceleradores de IA Intel® Gaudi®2 e processadores de Intel® Xeon®. Em parceria com o Argonne National Laboratory, a Intel compartilhou progressos no projeto Aurora de IA gerativa (genAI), incluindo uma atualização sobre os 1 trilhão de parâmetros GPT-3 LLM no Aurora supercomputador que é possibilitado pela arquitetura exclusiva da GPU série Max e pelos recursos do sistema do supercomputador Aurora. A Intel e a Argonne demonstraram a aceleração da ciência com aplicações do Aurora Early Science Program (ESP) e do Exascale Computing Project. A empresa também mostrou o caminho para os aceleradores de IA Intel® Gaudi®3 e Falcon Shores.
"A Intel sempre foi comprometida em fornecer soluções de tecnologia inovadoras para atender às necessidades da comunidade de HPC e IA. O excelente desempenho das nossas CPUs Xeon, juntamente com nossas GPUs e CPUs Max, ajudam a impulsionar a pesquisa e a ciência. Isso, juntamente com nossos aceleradores Gaudi, demonstram nossa amplitude de tecnologia para fornecer aos nossos clientes escolhas atraentes para atender às suas diversas cargas de trabalho.
Por que importa: A IA gerativa para ciência, juntamente com os resultados mais recentes de desempenho e parâmetros de referência, ressaltam a capacidade da Intel de fornecer soluções personalizadas para atender às necessidades específicas de clientes de HPC e IA. A abordagem definida por software da Intel com oneAPI e HPC e kits de ferramentas aprimorados por IA, ajuda os desenvolvedores a portar perfeitamente seu código entre estruturas arquitetônicas para acelerar pesquisas científicas. Além disso, as GPUs e CPUs da série Max serão implantadas em vários supercomputadores que estão sendo on-line.
Sobre a IA gerativa para ciência: O Argonne National Laboratory compartilhou os progressos em seu genAI para iniciativas científicas com o Aurora supercomputador. O projeto Aurora genAI é uma colaboração com a Argonne, a Intel e parceiros para criar modelos de IA fundamentais de última geração para a ciência. Os modelos serão treinados em textos científicos, conjuntos de dados de código e ciência em escalas de mais de 1 trilhão de parâmetros de diversos domínios científicos. Utilizando as tecnologias fundamentais do Megatron com DeepSpeed, o projeto genAI atenderá a várias disciplinas científicas, incluindo biologia, pesquisa de câncer, ciência do clima, cosmologia e ciência dos materiais.
A distinta arquitetura de GPU Intel Série Max e os recursos Aurora sistema de supercomputadores podem lidar eficientemente com 1 trilhão de modelos de parâmetros com apenas 64 nós, muito menos do que seria normalmente necessário. A Argonne National Laboratory executou quatro instâncias em 256 nós, demonstrando a capacidade de executar várias instâncias em paralelo no Aurora, abrindo o caminho para escalar o caminho para escalar o treinamento de trilhões de modelos de parâmetros mais rapidamente com trilhões de tokens em mais de 10.000 nós.
Sobre a Intel e a Argonne National Laboratory: A Intel e a Argonne National Laboratory demonstraram a aceleração da ciência em escala habilitada pelos recursos do sistema e pela pilha de software no Aurora. 1 Exemplos de carga de trabalho incluem:
- A reconstrução do connectome cerebral é habilitada em escala com a Connectomics ML, mostrando a taxa de transferência de inferência competitiva em mais de 500 nós Aurora.
- O General Atomic and Molecular Electronic Structure System (GAMESS) mostrou mais de 2x de desempenho competitivo com a GPU Intel Max em comparação com a Nvidia A100. Isso permite a modelagem de processos químicos complicados em projetos de drogas e catalisadores para revelar os segredos da ciência molecular com o supercomputador Aurora.
- O Código de Cosmologia Acelerada por Hardware/Híbrido (HACC) demonstrou execuções em mais de 1.500 nós Aurora, permitindo a visualização e a compreensão da física e evolução do universo.
- O aplicativo de inferência de IA de triagem medicamentos, parte do projeto de ciência precoce do Aurora Drug Discovery (ESP), permite a triagem eficiente de vastos conjuntos de dados químicos, permitindo a triagem de mais de 20 bilhões dos compostos mais sintetizados em apenas 256 nós.
A Intel também mostrou novo desempenho de HPC e IA, bem como otimizações de software em hardware e aplicações:
- A Intel e a Dell publicaram resultados para o STAC-A2, um conjunto de parâmetros de comparação independente baseado em cargas de trabalho reais de análise de risco do mercado, mostrando um excelente desempenho para o setor financeiro. Em comparação com oito GPUs PCIe Nvidia H100, quatro Intel® Data Center GPU Max 1550s tinham gregos quentes 26% mais altos com desempenho de 10-100k-1260 e eficiência de espaço 4,3 vezes maior.
- O Intel® Data Center GPU Max Series 1550 supera a placa PCIe Nvidia H100 em uma média de 36% (1,36x) em diversas cargas de trabalho de HPC.
- Intel Data Center GPU Max Series oferece suporte aprimorado para modelos de IA, incluindo vários modelos de linguagem grande (LLMs), como GPT-J e LLAMA2.
- Intel® Xeon® CPU Série Max, o único processador x86 com memória de alta largura de banda (HBM), apresentou um desempenho em média 19% maior em comparação com o processador AMD Epyc Genoa.
- Na semana passada, o MLCommons2publicou resultados do parâmetro de referência de treinamento MLPerf v3.1 padrão do setor para modelos de IA de treinamento. O Intel Gaudi2 demonstrou um significativo salto de desempenho em 2x com a implementação do tipo de dados FP8 no benchmark GPT-3 do treinamento v3.1.
- A Intel introduzirá os aceleradores de IA Gaudi3 Intel em 2024. O acelerador de IA Gaudi3 será baseado na mesma arquitetura de alto desempenho que o Gaudi2 e deve fornecer 4x o compute (BF16), o dobro da largura de banda de rede para um maior desempenho de escalonamento, e 1,5x mais memória HBM integrada para lidar prontamente com a crescente demanda por computação de alto desempenho e alta eficiência de LLMs sem degradação do desempenho.
- Os processadores Intel® Xeon® da 5ª Geração fornecerão desempenho até 1,4x maior de geração a geração em aplicações HPC, como demonstrado pelo LAMMPS-Copper.
- Granite Rapids, um futuro processador Intel Xeon, fornecerá maior número de núcleos e aceleração integrada com Intel® Advanced Matrix Extensions e suporte para DIMMs multiplexadores combinados (MCR). Granite Rapids terá inferência de IA 2,9x melhor em DeepMD+LAMMPS. A MCR atinge velocidades de 8.800 megatransfers por segundo com base em DDR5 e mais de 1,5 terabytes por segundo de capacidade de largura de banda de memória em um sistema de dois soquetes, que é fundamental para alimentar a crescente contagem de núcleos de CPUs modernas e permitir eficiência e flexibilidade.
Sobre o novo progresso na oneAPI: A Intel anunciou recursos para suas ferramentas de desenvolvimento de software de 2024 que promovem o desenvolvimento de software aberto com programação multiarquitetura oneAPI. As novas ferramentas ajudam desenvolvedores a ampliar novos recursos de IA e HPC em CPUs e GPUs Intel com cobertura mais ampla, incluindo desempenho e implantações mais rápidas usando Python padrão para cargas de trabalho numéricas e aprimoramentos de compilador que oferecem uma implementação quase completa do SYCL 2020 para melhorar a produtividade e o descarregamento de códigos.
Além disso, o Texas Advanced Computing Center (TACC) anunciou que seu oneAPI Center of Excellence se concentrará em projetos que desenvolvem e otimizam códigos de referência de imagens sísmicas. A Intel promove um ambiente no qual a inovação em software e hardware e as pesquisas impulsionam o setor, com 32 centros de excelência oneAPI em todo o mundo.
O que vem a seguir: A Intel enfatizou seu compromisso com a IA e a HPC e destacou o impulso do mercado. Novas implantações de supercomputador com as tecnologias de GPU e CPU Intel Série Max incluem sistemas como Aurora, Dawn Phase 1, SuperMUC-NG Phase 2, Clementina XX1 e muito mais. Novos sistemas com aceleradores Intel Gaudi2 incluem um grande supercomputador de IA com IA de estabilidade como cliente âncora.
Esse impulso será fundamental para a Falcon Shores GPU da Intel de próxima geração para IA e HPC. Falcon Shores aproveitará a propriedade intelectual (IP) da Intel Gaudi e Intel Xe com uma única interface de programação de GPU construída na oneAPI. Aplicativos construídos em aceleradores Intel Gaudi AI, bem como GPUs Intel Série Max hoje poderão migrar com facilidade para Falcon Shores no futuro.
Mais contexto: acelerador De IA Intel Gaudi ganha 2x salto de desempenho em GPT-3 com software FP8 | O mais rápido supercomputador de IA do Reino Unido, com tecnologias Intel e Dell, para impulsionar pesquisas
As letras miúdas:
1Testes realizados pelo Argonne National Laboratory. A Intel não controla ou audita dados de terceiros. Você deve consultar outras fontes para avaliar a precisão.
2Visite https://mlcommons.org/benchmarks/training/ para cargas de trabalho e configurações. Os resultados podem variar. O desempenho varia conforme o uso, a configuração e outros fatores. Saiba mais no site MLPerf. Os resultados de desempenho são baseados em testes realizados nas datas mostradas nas configurações e podem não refletir todas as atualizações disponíveis publicamente.
As tecnologias Intel podem exigir ativação de hardware, software ou de serviços.
Os resultados de desempenho são baseados em testes realizados nas datas mostradas nas configurações e podem não refletir todas as atualizações disponíveis publicamente. Nenhum produto ou componente pode ser absolutamente seguro.
O desempenho varia conforme o uso, a configuração e outros fatores. Saiba mais no site do Índice de Desempenho.
Os custos e resultados podem variar.
A Intel não controla ou audita dados de terceiros. Você deve consultar outras fontes para avaliar a precisão.