Em janeiro, lançamos nossas ofertas mais fortes para computação de alto desempenho (HPC) e IA sempre com os processadores escaláveis Intel® Xeon® da 4ª Geração, Intel® Xeon® CPU Max Série® Max e GPU Intel Data Center Max Series. Também introduzimos a GPU Flex do Intel® Data Center no ano passado , um produto principal para transmissão de mídia, jogos em nuvem e inferência de IA – e o processador de aprendizagem profunda Habana® Gaudi®2 para treinamento.
Desenvolvidos em conjunto com os principais provedores de serviços de nuvem, clientes corporativos e supercomputador, esses produtos mostram as principais inovações técnicas, incluindo a integração de memória de alta largura de banda com CPUs x86 e arquiteturas de chiplet avançadas. O portfólio completo de hardware de data center e IA da Intel, incluindo nossos produtos Xeon e Habana, foi desenvolvido para ajudar nossos clientes a resolver os problemas mais difíceis do mundo e treinar os maiores modelos de IA.
A computação acelerada e as GPUs estão entre os segmentos que mais crescem no mercado de computação e são centrais para o sucesso de longo prazo da Intel. Estamos vendo um excelente suporte ao cliente e continuamos demonstrando melhorias de desempenho enormes em cargas de trabalho de HPC e IA no mundo real nesses produtos implantados recentemente.
Com base nesse impulso, com o envolvimento próximo do cliente em seus requisitos, estamos simplificando e agilizando nosso roteiro de GPU de data center. Isso permite que nossos clientes e o ecossistema maximizem seus investimentos em GPUs Max Series e Flex Series atualmente disponíveis, ao mesmo tempo em que garantem que os produtos da próxima geração ofereçam saltos significativos no desempenho e na produtividade do desenvolvedor.
Deixe-me compartilhar detalhes relacionados à adoção de clientes, melhorias de desempenho de aplicações no mundo real e atualizações de roteiro.
Adoção antecipada de clientes
Nossos primeiros esforços para colocar as GPUs Intel® Xeon, Max Series e Flex Series no mercado de data center têm visto uma recepção positiva dos clientes.
Você provavelmente já ouviu falar sobre o Laboratório Nacional argonne, que implantará mais de 60.000 GPUs max series e 20.000 CPUs max series para energizar o supercomputador Aurora este ano. Aurora espera-se que se torne o primeiro supercomputador do mundo com 2 exaflops de desempenho de pico. A implantação está indo bem, com a Intel colaborando de perto em testes e desenvolvimento. Argonne espera que o sistema seja acessível aos primeiros pesquisadores até o terceiro trimestre de 2023.
Os Laboratórios Nacionais Lawrence Livermore (LLNL) e Sandia National Laboratories estão instalando milhares de nós da 4ª Geração de Intel Xeons em seus sistemas CTS-2 – o cavalo de trabalho supercomputador do Departamento de Energia (DOE). O antecessor da LLNL com Intel Xeon, JADE, contribuiu recentemente para o avanço na energia de fusão, ajudando a projetar o pacote ideal para indução a laser.
Los Alamos National Laboratory (LANL), outro centro de pesquisa do DOE, está instalando mais de 10.000 CPUs Max series para seu supercomputador Crossroads, que impulsionará a segurança nacional e a pesquisa contra incêndios.
O impacto dessas tecnologias na ciência, engenharia e indústria não pode ser subestimado.
Desempenho
As GPUs viram um crescimento explosivo no espaço de HPC e IA, com o número de flops das GPUs na lista dos 500 supercomputadores mais rápidos do mundo crescendo a três vezes o ritmo daqueles das CPUs. Com a GPU Série Max, a Intel apresentou seu processador mais sofisticado de todos os tempos, utilizando os mais avançados processos de embalagem e fabricação, com recursos ricos, como rastreamento de raios acelerados por hardware, cache RAMBO, matrizes sistólicas profundas para IA... a lista continua e continua.
Mas como ele funciona? Na reunião do Intel Extreme Performance User Group (IXPUG) desta semana, Tim Williams, diretor-adjunto da Divisão de Ciência Computacional da Argonne, apresentou dados de desempenho para aplicações reais em GPUs da série Max de produção. Para ciência de materiais, engenharia nuclear, cosmologia e códigos de física de plasma, os pesquisadores mediram de 30% a 260% as acelerações em comparação às principais GPUs alternativas.
A GPU Flex Series também está mostrando liderança em densidade de fluxo de mídia e qualidade visual e agora está enviando implantações iniciais para provedores de serviços de nuvem e empresas multinacionais, permitindo implantações de jogos em nuvem e entrega de mídia em larga escala.
Esses primeiros resultados nos dão uma enorme confiança de que nossos investimentos já estão pagando dividendos para nossos clientes e o ecossistema de desenvolvedores – e que nossos produtos de GPU têm as capacidades e escalabilidade necessárias para ajudar a resolver os problemas mais desafiadores do mundo hoje e no futuro.
Roteiro
Com o objetivo de maximizar o retorno dos investimentos para clientes, passaremos para uma cadência de dois anos para as GPUs do data center. Isso corresponde às expectativas dos clientes sobre novas apresentações de produtos e permite tempo para desenvolver seus ecossistemas.
Com base no impulso da GPU série Max, nosso próximo produto na família Max series será a arquitetura de GPU com codinome Falcon Shores. Orientada para introdução em 2025, a arquitetura flexível baseada em chiplets da Falcon Shores abordará o crescimento exponencial das necessidades de computação para HPC e IA. Estamos trabalhando em variantes para esta arquitetura que suportam IA, HPC e a convergência desses mercados. Esta arquitetura fundamental terá a flexibilidade para integrar o novo IP (incluindo núcleos de CPU e outros chiplets) da Intel e dos clientes ao longo do tempo, fabricados usando nosso modelo IDM 2.0. Rialto Bridge, que foi destinado a fornecer melhorias incrementais em relação à nossa arquitetura atual, será descontinuado.
A família de produtos Flex Series também se moverá para uma cadência de dois anos. Descontinuaremos o desenvolvimento de Lancaster Sound, que foi destinado a ser uma melhoria incremental em relação à nossa geração atual. Isso nos permite acelerar o desenvolvimento no Melville Sound, o que será um salto arquitetônico significativo da geração atual em termos de desempenho, recursos e cargas de trabalho que ele permitirá.
Além de melhorar nosso roteiro, estamos aumentando nosso foco no ecossistema de software. Forneceremos atualizações contínuas para nossos produtos Max Series e Flex Series, com melhorias de desempenho, novos recursos, suporte a sistemas operacionais expandidos e novos casos de uso para ampliar os benefícios desses produtos.
Acelerando o trabalho de nossos clientes
Nossos produtos de computação acelerada estão no mercado e aumentando. O ecossistema de software aberto OneAPI está amadurecendo a cada dia. Simplificamos nosso roteiro com o objetivo de fazer menos coisas melhor e estamos lançando rapidamente produtos para nossos clientes. Fique atento para atualizações frequentes sobre implantações, cargas de trabalho e desempenho. Estou ansioso para compartilhar mais sobre os próximos eventos e espero vê-lo na Conferência Internacional de Supercomputação (ISC) em maio.
Jeff McVeigh é vice-presidente corporativo e gerente geral interino do Grupo de Sistemas de Computação Acelerada e Gráficos na Intel Corporation.