A Intel constrói o maior sistema neuromórfico do mundo para permitir IA mais sustentável

Hala Point, o primeiro sistema neuromórfico de 1,15 bilhão de neurônios do setor, constrói um caminho para uma IA mais eficiente e escalável.

Notícias

  • 17 de abril de 2024

  • Entre em contato com o PR da Intel

  • Siga a Intel Newsroom nas redes sociais:

    Logotipo do Twitter
    Ícone do YouTube

author-image

Por

O que há de novo: Hoje, a Intel anunciou que construiu o maior sistema neuromórfico do mundo. Batizado como Hala Point, esse sistema neuromórfico de larga escala, inicialmente implantado nos Laboratórios Nacionais Sandia, utiliza o processador Loihi 2 da Intel, visa apoiar a pesquisa para a futura inteligência artificial (IA) inspirada no cérebro e enfrenta desafios relacionados à eficiência e à sustentabilidade da IA atual. Hala Point avança o sistema de pesquisa em larga escala da Intel, Pohoiki Springs, com melhorias arquitetônicas para alcançar mais de 10 vezes mais capacidade de neurônio e desempenho até 12 vezes maior.

"O custo da computação dos modelos de IA atuais está subindo a taxas insustentávels. O setor precisa de abordagens fundamentalmente novas capazes de escalar. Por essa razão, desenvolvemos Hala Point, que combinam a eficiência da aprendizagem profunda com novas capacidades de aprendizagem e otimização inspiradas no cérebro. Esperamos que a pesquisa com Hala Point avance a eficiência e a adaptabilidade da tecnologia de IA em larga escala".

Mike Davies, diretor do Laboratório de Computação Neuromórfica da Intel Labs

O que ele faz: Hala Point é o primeiro sistema neuromórfico em larga escala a demonstrar eficiências computacionais de última geração em cargas de trabalho de IA convencionais. A caracterização mostra que ele pode suportar até 20 quatrilhões de operações por segundo, ou 20 petaops, com uma eficiência superior a 15 trilhões de operações de 8 bits por segundo por watt (TOPS/W) ao executar redes neurais profundas convencionais. Isso rivaliza e excede os níveis alcançados por arquiteturas baseadas em unidades de processamento gráfico (GPU) e unidades de processamento central (CPU). Os recursos exclusivos da Hala Point poderiam permitir aprendizagem contínua em tempo real para aplicações de IA, como solução de problemas científicos e de engenharia, logística, gerenciamento de infraestrutura inteligente de cidades, grandes modelos de idioma (LLMs) e agentes de IA.

Como ele será usado: Pesquisadores dos Laboratórios Nacionais da Sandia planejam usar Hala Point para pesquisas avançadas de computação em escala cerebral. A organização se concentrará na solução de problemas de computação científica em física de dispositivos, arquitetura de computadores, ciência da computação e informática.

"Trabalhar com Hala Point melhora a capacidade de nossa equipe da Sandia para solucionar problemas de modelagem computacional e científica. Realizar pesquisas com um sistema deste tamanho nos permitirá manter o ritmo da evolução da IA em campos que variam do comercial à defesa até a ciência básica", disse Craig Vineyard, Hala Point chefe da equipe nos Laboratórios Nacionais de Sandia.

Atualmente, Hala Point é um protótipo de pesquisa que promoverá as capacidades de sistemas comerciais futuros. A Intel prevê que essas lições levem a avanços práticos, como a capacidade de os LLMs aprenderem continuamente com novos dados. Esses avanços prometem reduzir significativamente a carga de treinamento insustentável de implantações generalizadas de IA.

Por que importa: As tendênciasrecentes de escalonamento de modelos de aprendizagem profunda para trilhões de parâmetros expuseram desafios de sustentabilidade assustadores em IA e destacaram a necessidade de inovação nos menores níveis de arquitetura de hardware. A computação neuromórfica é uma abordagem fundamentalmente nova que baseia-se nas percepções de insights que integram memória e computação com paralelismo altamente granular para minimizar o movimento de dados. Em resultados publicados da Conferência Internacional de Acústica, Fala e Processamento de Sinal (ICASSP, em inglês) deste mês, o Loihi 2 demonstrou ordens de ganhos de magnitude na eficiência, velocidade e adaptabilidade das cargas de trabalho de borda de pequena escala emergentes1.

Avançando em seu antecessor, Pohoiki Springs com inúmeras melhorias, Hala Point agora traz ganhos de desempenho neuromórfico e eficiência para modelos convencionais de aprendizagem profunda convencionais, notadamente aqueles que processam cargas de trabalho em tempo real, como vídeo, fala e comunicações sem fio. Por exemplo, a Ericsson Research está aplicando Loihi 2 para otimizar a eficiência da infraestrutura de telecomunicações, conforme destacado no Mobile World Congress deste ano.

Sobre Hala Point: Loihi 2 processadores neuromórficos, que formam a base para Hala Point, aplicam princípios de computação inspirados no cérebro, como redes neurais (SNNs) baseadas em eventos, memória e computação integradas, e conexões escassas e continuamente mudando para obter ganhos de ordens de magnitude no consumo e desempenho de energia. Os neurônios se comunicam diretamente entre si em vez de se comunicarem através da memória, reduzindo o consumo geral de energia.

Hala Point pacotes 1.152 processadores Loihi 2 produzidos em nó de processo Intel 4 em um gabinete de data center de seis unidades de rack do tamanho de um forno de microondas. O sistema suporta até 1,15 bilhão de neurônios e 128 bilhões de sinapses distribuídas por mais de 140.544 núcleos de processamento neuromórfico, consumindo um máximo de 2.600 watts de energia. Também inclui mais de 2.300 processadores x86 incorporados para computação osciladora.

Os Hala Point integram canais de processamento, memória e comunicação em uma malha extremamente paralelizada, oferecendo um total de 16 petabytes por segundo (PB/s) de largura de banda de memória, 3,5 PB/s de largura de banda de comunicação entre núcleos e 5 terabytes por segundo (TB/s) de largura de banda de comunicação inter-chip. O sistema pode processar mais de 380 trilhões de sinapses de 8 bits e mais de 240 trilhões de operações de neurônios por segundo.

Aplicado a modelos de rede neural de spiking inspirados em bios, o sistema pode executar sua capacidade total de 1,15 bilhão de neurônios 20 vezes mais rápido que um cérebro humano e taxas até 200 vezes mais rápidas com uma capacidade mais baixa. Embora o Hala Point não se destine à modelagem neurocientífica, sua capacidade neuronal é aproximadamente equivalente à do cérebro de uma coruja ou do córtex de um macaco-prego.

Loihi sistemas baseados em Loihi podem executar problemas de inferência de IA e resolver problemas de otimização usando 100 vezes menos energia em velocidades até 50 vezes mais rápidas do que as arquiteturas convencionais de CPU e GPU1. Ao explorar até 10:1 de conectividade e atividade impulsionada por eventos, os resultados iniciais no Hala Point mostram que o sistema pode alcançar eficiências profundas de rede neural de até 15 TOPS/W2 sem exigir que dados de entrada sejam coletados em lotes, uma otimização comum para GPUs que atrasou significativamente o processamento de dados que chegam em tempo real, como o vídeo de câmeras. Enquanto ainda estão em pesquisa, futuras LLMs neuromórficas capazes de aprendizagem contínua podem resultar em gigawatt-hours de economia de energia, eliminando a necessidade de reprogramação periódica com conjuntos de dados em constante crescimento.

O que vem a seguir: A entrega de Hala Point à Sandia National Labs marca a primeira implantação de uma nova família de sistemas de pesquisa neuromórfica de larga escala que a Intel planeja compartilhar com seus colaboradores da pesquisa. Um desenvolvimento adicional permitirá que aplicações de computação neuromórfica superem as restrições de potência e latência que limitam a implantação em tempo real dos recursos de IA.

Juntamente com um ecossistema de mais de 200 membros da Intel Neuromórfica Research Community (INRC), incluindo importantes grupos acadêmicos, laboratórios governamentais, instituições de pesquisa e empresas em todo o mundo, a Intel está trabalhando para expandir os limites da IA inspirada no cérebro e progredindo essa tecnologia de protótipos de pesquisa para produtos comerciais líderes do setor nos próximos anos.

Mais contexto: Laboratórios Intel

As letras miúdas:

1 Consulte "Processamento eficiente de vídeo e áudio com Loihi 2", Conferência Internacional de Acústica, Fala e Processamento de Sinal, abril de 2024 e "Avanço da computação neuromórfica com Loihi: pesquisa de resultados e perspectivas", Processos do IEEE, 2021.

2 Caracterização realizada com uma rede de perceptron multicamadas (MLP) com 14.784 camadas, 2048 neurônios por camada, pesos de 8 bits estimulados com ruído aleatório. O Hala Point implementação da rede MLP é poda para 10:1 desmedida com os modelos sigma-delta neuron, oferecendo taxas de ativação de 10%. Resultados a partir de testes em abril de 2024. Os resultados podem variar.