O que eu estou vendo?
Um IERR é um erro catastrófico relatado pelo processador, mas geralmente causado por dispositivos fora do núcleo do processador (por exemplo, memória, PCIe).
- A execução do processador estagnou devido, tipicamente, a um evento fora do processador.
- Esse problema é frequentemente acompanhado por um evento CATERR que pode ser cruzado para obter informações adicionais.
Como corrigi-lo:
Siga estas etapas em ordem:
- Consulte o Registro de eventos do sistema (SEL) para obter eventos de código de correção de erros (ECC ). Memória defeituosa pode acionar uma IERR.
- Revise o SEL para quaisquer eventos de PCIe. Dispositivos PCIe com defeito podem acionar uma IERR.
- Certifique-se de que os drivers do sistema operacional (SO) estejam atualizados para o servidor, bem como para quaisquer dispositivos de hardware adicionados recentemente. Os drivers de SO desatualizados podem acionar uma IERR.
- Verifique os logs do SO para obter quaisquer entradas de Machine Check Architecture (MCA) que possam indicar uma falha de hardware que poderia ter acionado o IERR.
- Confirme se a sua versão do BIOS é a mais recente para o sistema servidor.
- Vá para o Console web do controlador de gerenciamento de placa base > Configuração > Configuração de memória > tipo de PPR e defina as configurações do PPR como Hard.
- Se os logs confirmarem que há um(s) módulo(s) de memória específico que pode estar causando o problema, siga para recolocar o(s) memory stick(s) e monitorar o servidor por 24 horas.