Como se recuperar de um erro interno (IERR) para placas para servidor Intel®
O que estou vendo?
Uma IERR é um erro catastrófico relatado pelo processador, mas geralmente causado por dispositivos fora do núcleo do processador (por exemplo, memória, PCIe).
- A execução do processador parou devido a um evento fora do processador.
- Este problema é frequentemente acompanhado por um evento caterr que pode ser cruzado para obter informações adicionais.
Como corrigi-lo:
Siga estas etapas em ordem:
- Revise o Registro de eventos do sistema (SEL) para eventos de código de correção de erro (ECC ). A memória defeituosa pode desencadear uma IERR.
- Revise o SEL para quaisquer eventos PCIe. Dispositivos PCIe com defeito podem desencadear uma IERR.
- Certifique-se de que os drivers do sistema operacional (SO) estejam atualizados para o servidor, bem como para quaisquer dispositivos de hardware recentemente adicionados. Os drivers de so desatualização podem acionar uma IERR.
- Verifique os logs do soo em qualquer entrada de arquitetura de verificação de máquina (MCA) que possa indicar uma falha de hardware que poderia ter acionado o IERR.
- Confirme se você tem o BIOS mais recente para o sistema servidor.
- Vá para o Console web do controlador de gerenciamento de placa base > configuração > de memória > tipo PPR e defina configurações de PPR como difíceis.
- Se os logs confirmarem que há um(s) módulo(s) de memória específico que possa estar causando o problema, prossiga para recolocar o( s) memory stick(s) e monitore o servidor por 24 horas.