Gerenciamento térmico para Intel® Xeon® escaláveis

Documentação

Manutenção e desempenho

000006710

10/05/2023

Clique no tópico para obter detalhes:

Visão geral do gerenciamento térmico

Para caixa versus bandeja, acesse: Qual é a diferença entre processadores Intel® in a box e bandeja?

Qual é a solução de gerenciamento térmico?

A solução de gerenciamento térmico para Intel® Xeon® escaláveis, destinada para multiprocessamento de 4 ou 8 vias, é específica para o fabricante da placa-mãe e do gabinete. Todos os produtos Intel® Xeon® de processadores escaláveis in a box são vendidos como um kit que consiste em uma configuração:

  • Solução térmica
  • Mãe
  • Chassis
  • Alimentação

Para obter especificações de gerenciamento térmico, consulte o fabricante do sistema ou a Intel Xeon do processador. O túnel de vento do processador (PWT) destina-se apenas para uso com servidor de uso geral (2U e acima)processador escalável Intel® Xeon®, não o MP do processador Intel Xeon ou o processador Intel Xeon para servidores de montagem em rack de 1U.

Você pode me dar alguns conceitos básicos de gerenciamento térmico?

Os sistemas que Intel® Xeon® processadores escaláveis exigem gerenciamento térmico. Este documento assume um conhecimento geral e experiência com operação do sistema, integração e gerenciamento térmico. Os integradores que seguem as recomendações apresentadas podem fornecer a seus clientes sistemas mais confiáveis e verão menos clientes retornando com problemas de gerenciamento térmico. (O termo in a box Intel® Xeon® de processadores escaláveis refere-se a processadores embalados para uso por integradores de sistema.)

O gerenciamento térmico em Intel® Xeon® sistemas escaláveis baseados em processadores pode afetar tanto o desempenho quanto o nível de ruído do sistema. Os Intel® Xeon® escaláveis usam o recurso Monitor Térmico para proteger o processador durante os tempos em que o silício operaria acima da especificação. Em um sistema projetado corretamente, o recurso monitor térmico nunca deve ficar ativo. O recurso destina-se a fornecer proteção para circunstâncias inusitadas, como temperaturas de ar ambiente normais ou falha de um componente de gerenciamento térmico do sistema (como uma ventoinha do sistema). Enquanto o recurso monitor térmico estiver ativo, o desempenho do sistema pode cair abaixo do seu nível normal de desempenho de pico. É fundamental que os sistemas foram projetados para manter temperaturas ambiente internas baixas o suficiente para evitar que os processadores escaláveis Intel® Xeon® entrem em um estado ativo do Monitor Térmico. As informações sobre o recurso Monitor Térmico podem ser encontradas na ficha técnica Intel® Xeon® processadores escaláveis.

Além disso, o dissipador de calor Intel® Xeon® processadores escaláveis usa uma solução de duto ativa chamada Processor Wind Tunnel (PWT), que inclui uma ventoinha de alta qualidade. Esta ventoinha do processador opera em uma velocidade constante. Este duto fornece fluxo de ar adequado no dissipador de calor do processador, desde que a temperatura ambiente seja mantida abaixo da especificação máxima.

Permitir que os processadores operem em temperaturas além de sua temperatura operacional máxima especificada pode encurtar a vida útil do processador e pode causar uma operação não confiável. Atender às especificações de temperatura do processador é, em última análise, responsabilidade do integrador do sistema. Ao construir sistemas de qualidade usando o processador Intel Xeon, é imprescindível considerar cuidadosamente o gerenciamento térmico do sistema e verificar o design do sistema com testes térmicos. Este documento detalha os requisitos térmicos específicos do Intel Xeon processador. Os integradores de sistema que usam o Intel Xeon processador devem se familiarizar com este documento.

O que é o gerenciamento térmico adequado?

O gerenciamento térmico adequado depende de dois elementos principais: um dissipador de calor montado corretamente no processador e o fluxo de ar efetivo através do gabinete do sistema. O objetivo final do gerenciamento térmico é manter o processador abaixo ou abaixo de sua temperatura máxima de operação.

O gerenciamento térmico adequado é alcançado quando o calor é transferido do processador para o ar do sistema, que é então ventilado para fora do sistema. Os processadores Intel® Xeon® escaláveis in a box são enviados com um dissipador de calor e o PWT, que pode transferir efetivamente o calor do processador para o ar do sistema. É responsabilidade do integrador do sistema garantir o fluxo de ar adequado do sistema. Os processadores escaláveis Intel® Xeon® bandeja não são enviados com um dissipador de calor e o PWT, é de responsabilidade do integrador do sistema para garantir o fluxo de ar adequado do sistema.

Operações de gerenciamento térmico

Como eu instalo o dissipador de calor? Você deve conectar com segurança o dissipador de calor (incluído com os processadores escaláveis Intel® Xeon® in a box) ao processador. O material de interface térmica (aplicado durante a integração do sistema) fornece transferência de calor eficaz do processador para o dissipador de calor da ventoinha.

Crítico: O uso do processador in a box sem aplicar corretamente o material de interface térmica incluído anulará a garantia do processador in a box e poderá causar danos ao processador. Siga os procedimentos de instalação documentados no manual do processador in a box e na visão geral de integração.

A ventoinha no túnel de vento do processador é uma ventoinha de rolamento de esfera de alta qualidade que fornece um bom fluxo de ar local. Esta corrente de ar transfere o calor do dissipador de calor para o ar dentro do sistema. No entanto, mover o calor para o ar do sistema é apenas metade da tarefa. O fluxo de ar suficiente do sistema também é necessário para esgotar o ar. Sem uma corrente de ar constante pelo sistema, o dissipador de calor da ventoinha re circulará ar quente e, portanto, pode não resfriar o processador adequadamente.

Como eu gerendo o fluxo de ar do sistema?

A seguir, os fatores que determinam o fluxo de ar do sistema:

  • Design do gabinete
  • Tamanho do gabinete
  • Localização das entradas de ar e saídas de escape do gabinete
  • Capacidade e ventilação da ventoinha de fonte de alimentação
  • Localização dos slots do processador
  • Colocação de placas e cabos adicionais

Os integradores do sistema devem garantir o fluxo de ar adequado através do sistema para permitir que o dissipador de calor funcione de forma eficaz. A atenção adequada ao fluxo de ar ao selecionar subamáblias e sistemas de construção é importante para um bom gerenciamento térmico e para uma operação confiável do sistema.

Os integradores usam dois fatores básicos de forma de fonte de alimentação para gabinetes e motherboards para servidores e workstations: variações ATX e o fator de forma servidor AT mais antigo. Devido às considerações de resfriamento e tensão, a Intel recomenda o uso de motherboards e gabinetes de fator de forma ATX para os processadores escaláveis Intel® Xeon® in a box.

As motherboards de fator de forma SERVER AT não são recomendadas porque esses designs não são padronizados para um gerenciamento térmico eficaz. No entanto, alguns gabinetes projetados exclusivamente para motherboards de formato Server AT podem produzir resfriamento eficiente.

A seguir, uma lista de diretrizes a serem usadas ao integrar um sistema:

  • As saídas de ventilação do gabinete devem estar funcionais e não excessivas em quantidade: Os integradores devem ter cuidado para não selecionar gabinetes que contêm apenas aberturas cosméticas. As aberturas cosméticas são projetadas para parecer que permitem o fluxo de ar, mas pouco ou nenhum fluxo de ar realmente existe. O gabinete com saídas de ar excessivas também deve ser evitado. Neste caso, muito pouco ar flui sobre o processador e outros componentes. No gabinete ATX, os escudos de E/S devem estar presentes. Caso contrário, a abertura de E/S pode fornecer ventilação excessiva.
  • As condutas de ventilação devem estar corretamente localizadas: Os sistemas devem ter corretamente localizados entradas e saídas de escape. Os melhores locais para entradas de ar permitem que o ar entre no gabinete e flua diretamente sobre o processador. As saídas de escape devem estar situadas para que o ar flua em um caminho através do sistema, sobre vários componentes, antes de sair. A localização específica das aberturas depende do gabinete. Para sistemas ATX, as saídas de escape devem estar localizadas na parte inferior frontal e traseira do gabinete. Além disso, para sistemas ATX, os escudos de E/S devem estar presentes para permitir que o gabinete venta ar conforme projetado. A falta de um escudo de E/S pode interromper o fluxo de ar adequado ou a circulação dentro do gabinete.
  • Direção de fluxo de ar da fonte de alimentação: É importante escolher uma fonte de alimentação que tenha uma ventoinha que exauri o ar na direção certa. Algumas fontes de alimentação têm marcações que notam a direção do fluxo de ar.
  • Força do ventilador de fonte de alimentação: As fontes de alimentação do PC contêm uma ventoinha. Para alguns gabinetes onde o processador está funcionando muito quente, mudar para uma fonte de alimentação com uma ventoinha mais forte pode melhorar muito o fluxo de ar.
  • Ventilação da fonte de alimentação: Muito ar flui pela unidade de fonte de alimentação, o que pode ser uma restrição significativa se não estiver bem ventilada. Escolha uma unidade de fonte de alimentação com grandes aberturas. Os guardas com os dedos do fio para a ventoinha de fonte de alimentação oferecem muito menos resistência ao fluxo de ar do que as aberturas estampadas na caixa metálica da chapa da unidade de fonte de alimentação.
  • Ventilador do sistema - Deve ser usado? Alguns gabinetes podem conter uma ventoinha do sistema (além da ventoinha de fonte de alimentação) para facilitar o fluxo de ar. Uma ventoinha do sistema é normalmente usada com dissipadores de calor passivos. Em algumas situações, uma ventoinha do sistema melhora o resfriamento do sistema. Os testes térmicos com uma ventoinha do sistema e sem a ventoinha revelarão qual configuração é a melhor para um gabinete específico.
  • Direção do fluxo de ar da ventoinha do sistema: Ao usar uma ventoinha do sistema, certifique-se de que ela atraia ar na mesma direção que o fluxo de ar geral do sistema. Por exemplo, uma ventoinha do sistema em um sistema ATX deve agir como uma ventoinha de exaustão, retirando ar de dentro do sistema através das saídas traseiras ou dianteiras do gabinete.
  • Proteja-se contra pontos de contato: Um sistema pode ter um fluxo de ar forte, mas ainda contém pontos de calor. Os pontos quentes são áreas dentro do gabinete que são significativamente mais quentes do que o resto do ar do gabinete. O posicionamento inadequado da ventoinha de exaustão, placas de adaptador, cabos ou suportes de gabinete e subassemblies bloqueando o fluxo de ar dentro do sistema, pode criar tais áreas. Para evitar pontos de calor, coloque os ventiladores de exaustão conforme necessário, reposicione placas adaptadoras de comprimento completo ou use placas de meia duração, reenviar e amarrar cabos e garantir que o espaço seja fornecido ao redor e sobre o processador.
Como eu faço testes térmicos?

As diferenças em motherboards, fontes de alimentação, periféricos e gabinetes adicionais afetam a temperatura operacional dos sistemas e dos processadores que os rodam. Os testes térmicos são altamente recomendados ao escolher um novo fornecedor para motherboards ou gabinetes, ou quando começam a usar novos produtos. Os testes térmicos podem determinar se uma configuração específica de placa-mãe de fonte de alimentação de gabinete fornece fluxo de ar adequado para Intel® Xeon® processadores escaláveis in a box. Para começar a determinar a melhor solução térmica para seus sistemas Intel® Xeon® de processadores escaláveis, entre em contato com o fornecedor da placa-mãe para obter recomendações de configuração de chassis e ventiladores.

Sensor térmico e byte de referência térmica
Os Intel® Xeon® escaláveis tem capacidades de gerenciamento de sistema exclusivas. Uma delas é a capacidade de monitorar a temperatura do núcleo do processador em relação a uma configuração máxima conhecida. O sensor térmico do processador fornece a temperatura atual do processador e pode ser abordado através do Barramento de gerenciamento de sistema (SMBus). Um byte térmico (8 bits) de informações pode ser lido a qualquer momento a partir do sensor térmico. A granularidade do byte térmico é de 1°C. A leitura do sensor térmico é então comparada com o Byte de referência térmica.

O Byte de referência térmica também está disponível através da ROM de informações do processador no SMBus. Este número de 8 bits é gravado quando o processador é fabricado. O Byte de referência térmica contém um valor pré-programado que corresponde à leitura do sensor térmico quando o processador é estressado à sua especificação térmica máxima. Portanto, se a leitura de byte térmico do sensor térmico nunca exceder o Byte de referência térmica, o processador está funcionando mais quente do que a especificação permite.

Enfatizar cada um dos processadores em um sistema totalmente configurado, ler o sensor térmico de cada processador e compará-lo com o byte de referência térmica de cada processador para determinar se ele está funcionando dentro das especificações térmicas pode fazer testes térmicos. O software que pode ler as informações do SMBus é necessário para ler o Byte de referência térmica e sensor térmico.

Procedimento de teste térmico
O procedimento para testes térmicos é o seguinte:

Nota Se você estiver testando um sistema com uma ventoinha de sistema de velocidade variável, você deve executar o teste na temperatura máxima da sala de operação especificada para o sistema.
  1. Para garantir o consumo máximo de energia durante o teste, você deve desabilitar os modos automáticos de desativação de energia ou recursos verdes do sistema. Esses recursos são controlados dentro do BIOS do sistema ou por drivers do sistema operacional.
  2. Configure um método para registrar a temperatura ambiente, seja com um termômetro preciso ou combinação de termopar e medidor térmico.
  3. Ligue a estação de trabalho ou o servidor. Se o sistema tiver sido montado corretamente e o processador estiver instalado e instalado corretamente, o sistema será inicializado no sistema operacional (SO) pretendido.
  4. Invoque a aplicação de estresse térmico.
  5. Permita que o programa seja executado por 40 minutos. Isso permite que todo o sistema aqueça e se estabilize. Grave a leitura do sensor térmico para cada processador uma vez a cada 5 minutos durante os próximos 20 minutos. Grave a temperatura ambiente no final do período de 1 hora.
Após gravar a temperatura ambiente, desligue o sistema. Remova a tampa do gabinete. Deixe o sistema esfriar pelo menos 15 minutos.

Usando a mais alta das quatro medições tiradas do sensor térmico, siga o procedimento na seção a seguir para verificar o gerenciamento térmico do sistema.

Cálculo para verificar a solução de gerenciamento térmico de um sistema
Esta seção explica como determinar se um sistema pode operar na temperatura operacional máxima, mantendo o processador dentro do seu alcance operacional máximo. O resultado deste processo mostra se o fluxo de ar do sistema precisa ser melhorado ou se a temperatura operacional máxima do sistema precisa ser revisada para produzir um sistema mais confiável.

A primeira etapa é selecionar a temperatura máxima da sala de operação para o sistema. Um valor comum para sistemas onde o ar condicionado não está disponível é de 40°C. Esta temperatura excede a temperatura externa recomendada máxima para plataformas baseadas em processadores escaláveis Intel® Xeon®, mas pode ser usada se o gabinete usado não exceder a especificação de temperatura de entrada da ventoinha de 45°C. Um valor comum para sistemas onde o ar condicionado está disponível é de 35°C. Escolha um valor adequado para o seu cliente. Escreva este valor na linha A abaixo.

Escreva a temperatura ambiente gravada após o teste na linha B abaixo. Subtraia a linha B da linha A e escreva o resultado na linha C. Essa diferença compensa o fato de que o teste foi provavelmente conduzido em uma sala mais fria do que a temperatura operacional máxima do sistema.

A. __________ (Temperatura operacional máxima, tipicamente 35° C ou 40° C)

B. - ________ Temperatura da sala ° C no final do teste

C._________

Escreva a temperatura mais alta registrada a partir do medidor térmico na linha D abaixo. Copie o número da linha C para a linha E abaixo. Adicione a linha D e a linha E e escreva a soma na linha F. Este número representa a leitura mais alta do sensor térmico para o núcleo do processador quando o sistema é usado em sua temperatura máxima de sala de operação especificada executando uma aplicação desgastante térmica semelhante. Este valor deve permanecer abaixo do valor do Byte de referência térmica. Escreva a leitura do byte de referência térmica na linha G.

D. __________ Leitura máxima do sensor térmico

E. + ________ Max. ajuste de temperatura operacional da linha C acima

F. ___________ Max. leitura do sensor térmico em um pior ambiente da sala de gabinete

G. __________ Leitura do byte de referência térmica

Os processadores não devem ser executados em temperaturas mais altas do que a temperatura operacional especificada máxima ou podem ocorrer falhas. Os processadores in a box permanecerão dentro da especificação térmica se a leitura do sensor térmico for menor do que o Byte de referência térmica o tempo todo.

Se a linha F revelar que o núcleo do processador excedeu sua temperatura máxima, a ação será necessária. Ou o fluxo de ar do sistema deve ser significativamente melhorado, ou a temperatura máxima da sala de operação do sistema deve ser baixada.

Se o número na linha F for menor ou igual ao Byte de referência térmica, o sistema manterá o processador in a box dentro das especificações sob condições de estresse térmico semelhantes, mesmo que o sistema seja operado em seu ambiente mais quente.

Resumindo:
Se o valor na linha F for maior do que o Byte de referência térmica, há duas opções:

  1. Melhore o fluxo de ar do sistema para baixar a temperatura de entrada da ventoinha do processador (siga as recomendações feitas anteriormente). Em seguida, teste novamente o sistema.
  2. Escolha uma temperatura máxima de sala de operação mais baixa para o sistema. Tenha em mente o cliente e o ambiente típico do sistema.
Após implementar qualquer uma das opções, você deve recalcular o cálculo térmico para verificar a solução.

Dicas de teste
Use as seguintes dicas para reduzir a necessidade de testes térmicos desnecessários:

  1. Ao testar um sistema que suporta mais de uma velocidade do processador, teste usando o(s) processador(s) que gera a maior potência. Os processadores que dissiparem mais energia gerarão mais calor. Ao testar o processador mais quente suportado pela placa-mãe, você pode evitar testes adicionais com processadores que geram menos calor com a mesma configuração da placa-mãe e do gabinete.

    A dissipação de energia varia com a velocidade do processador e a revisão do silício. Para garantir a seleção do processador adequado para testes térmicos do seu sistema, consulte a Tabela 1 para obter números de dissipação de energia para processadores escaláveis Intel® Xeon® in a box. Os processadores Intel® Xeon® escaláveis in a box são marcados com um número de especificação de teste de 5 dígitos, geralmente começando com a letra S.
  2. O check-out térmico com uma nova motherboard não é necessário se todas as seguintes condições são atendidas:
    • A nova placa-mãe é usada com um gabinete testado anteriormente que trabalhou com uma placa-mãe semelhante
    • O teste anterior mostrou a configuração para fornecer fluxo de ar adequado
    • O processador está localizado em aproximadamente o mesmo lugar em ambas as motherboards
    • Um processador com a mesma ou menor dissipação de energia será usado na nova motherboard
  3. A maioria dos sistemas é atualizada (RAM adicional, placas adaptadoras, unidades, etc.) em algum momento da vida útil. Os integradores devem testar sistemas com algumas placas de expansão instaladas para simular um sistema que foi atualizado. Uma solução de gerenciamento térmico que funcione bem em um sistema fortemente carregado não precisa ser re-testada para configurações levemente carregadas.

Especificações de gerenciamento térmico

Quais são as especificações térmicas Intel® Xeon® processadores escaláveis?

A Intel® Xeon® de processadores escaláveis (também listada na Tabela 1) lista a dissipação de energia dos Intel® Xeon® escaláveis em várias frequências operacionais. Para Intel® Xeon® escaláveis, o processador de frequência mais alta disponível dissipará mais energia do que frequências mais baixas. Ao construir sistemas que apresentarão muitas frequências operacionais, os testes devem ser realizados usando o processador de frequência mais alta suportado, porque ele dissipa a maior potência. Os integradores do sistema podem realizar testes térmicos utilizando termopares para determinar a temperatura do difusor de calor integrado do processador (consulte a ficha técnica Intel® Xeon® processadores escaláveis, para obter detalhes).

Nota Como o PWT pode ser configurado em um modo de vácuo ou em um modo de pressão, a temperatura de entrada do duto deve ser retirada da entrada para a PWT, que pode não estar no mesmo lado da ventoinha.

Uma avaliação simples da temperatura do ar que entra no dissipador de calor da ventoinha pode fornecer confiança no gerenciamento térmico do sistema. Para Intel® Xeon® escaláveis, o ponto de teste está no centro do hub do ventilador, aproximadamente 0,3 polegadas na frente da ventoinha. A avaliação dos dados de teste permite determinar se um sistema tem gerenciamento térmico suficiente para o processador in a box. Os sistemas devem ter uma temperatura máxima esperada de 45°C nas condições ambientes externas máximas previstas (que normalmente é de 35°C).

Tabela 1: especificações térmicas Intel® Xeon® processadores escaláveis 1,3

Frequência do núcleo do processador (GHz) Temperatura máxima de caixa (°C) Temperatura máxima de entrada da ventoinha recomendada (°C) Potência de design térmico do processador (W)
1.40 69 45 56.0
1.50 70 45 59.2
1.70 73 45 65.8
1,802 69 45 55.8
2 78 45 77.2
22 70 45 58
2,202 (etapa B0) 72 45 61
2.202 (etapa C1) 75 45 61
2,402 (etapa B0) 71 45 65
2,402 (etapa C1) 74 45 65
2,402,4 (etapa M0) 72 45 77
2,602 74 45 71
2,662 (etapa C1) 74 45 71
2,662 (etapa M0) 72 45 77
2,802 (etapa C1) 75 45 74
2,802,4 (etapa M0) 72 45 77
32 73 45 85
3.062 (etapa C1) 73 45 85
3.062 (etapa MO) 70 45 87
3.22,4 (etapa M0) 71 45 92
Notas
  1. Essas especificações são da ficha técnica Intel® Xeon® processadores escaláveis.
  2. Este processador é uma tecnologia de processo de 0,13 mícron.
  3. Barramento frontal de 400 MHz e processadores barramento frontal de 533 MHz têm características térmicas idênticas.
  4. Esses processadores incluem cache iL3 de 1 MB e 2 MB (apenas processador de 3,2 GHz).
Quais são as recomendações do gabinete?

Os integradores de sistema devem usar um gabinete ATX que foi especificamente projetado para suportar Intel® Xeon® processadores escaláveis. O gabinete projetado especificamente para suportar Intel® Xeon® processadores escaláveis será enviado com suporte mecânico e elétrico adequado para o processador, além de ter desempenho térmico aprimorado. A Intel testou chassis para uso com Intel® Xeon® processadores escaláveis usando placas habilitadas de terceiros. O gabinete que passa neste teste térmico fornece aos integradores do sistema um local de partida para determinar qual gabinete avaliar.

Nota Para demonstrações no soquete LGA3647, consulte: