Como se recuperar de um erro interno (IERR) para placas para servidor Intel®

Documentação

Solução de problemas

000006043

17/07/2023

O que estou vendo?

Uma IERR é um erro catastrófico relatado pelo processador, mas geralmente causado por dispositivos fora do núcleo do processador (por exemplo, memória, PCIe).

  • A execução do processador parou devido a um evento fora do processador.
  • Este problema é frequentemente acompanhado por um evento caterr que pode ser cruzado para obter informações adicionais.

Como corrigi-lo:

Siga estas etapas em ordem:

  1. Revise o Registro de eventos do sistema (SEL) para eventos de código de correção de erro (ECC ). A memória defeituosa pode desencadear uma IERR.
  2. Revise o SEL para quaisquer eventos PCIe. Dispositivos PCIe com defeito podem desencadear uma IERR.
  3. Certifique-se de que os drivers do sistema operacional (SO) estejam atualizados para o servidor, bem como para quaisquer dispositivos de hardware recentemente adicionados. Os drivers de so desatualização podem acionar uma IERR.
  4. Verifique os logs do soo em qualquer entrada de arquitetura de verificação de máquina (MCA) que possa indicar uma falha de hardware que poderia ter acionado o IERR.
  5. Confirme se você tem o BIOS mais recente para o sistema servidor.
  6. para o Console web do controlador de gerenciamento de placa base > configuração > de memória > tipo PPR e defina configurações de PPR como difíceis.
  7. Se os logs confirmarem que há um(s) módulo(s) de memória específico que possa estar causando o problema, prossiga para recolocar o( s) memory stick(s) e monitore o servidor por 24 horas.

Tópicos relacionados
Meu servidor falha e mostra este erro: Máquina de CPU do processador Chk
Para atualizações de firmware e dicas de solução de problemas
Guias de solução de problemas de log de eventos do sistema para placas para servidor Intel®