Intel® Data Center Diagnostic Tool de processadores Intel® Xeon®

Documentação

Manutenção e desempenho

000058107

26/03/2024

Visão geral do produto

O Intel® Data Center Diagnostic Tool é uma ferramenta para verificar a integridade dos núcleos da CPU.

A versão atual é 603 e foi lançada em 22 de março de 2024.

Ambiente

Um dos principais provedores de nuvem e data centers corporativos de hiperescala sempre foi fornecer o melhor tempo de atividade e confiabilidade possíveis. Historicamente, o setor tem feito muito bem, alcançando rotineiramente >99,999% de tempo de atividade. No entanto, a infraestrutura de computação moderna traz expectativas de usuário cada vez maiores para a qualidade do serviço (QoS) e a alta disponibilidade. Essas expectativas enfatizam a necessidade de ferramentas de software poderosas que podem ajudar a identificar e minimizar falhas inesperadas do sistema que podem comprometer o QoS ou o tempo de atividade.

Na Intel, construímos e empregamos ferramentas avançadas de teste e validação de nível de componentes que reduzem significativamente defeitos em nossos produtos que podem resultar em erros do sistema. Nossos clientes de hiperescala e seus fornecedores usam essas mesmas ferramentas de software desenvolvidas pela Intel para manter a saúde da frota ao longo da vida de seus sistemas. Eles reconhecem que, ao longo do tempo, o monitoramento próximo dos ativos do sistema pode melhorar a resiliência geral da frota e o QoS do cliente.

A Intel reconhece que muitos clientes diferentes podem se beneficiar dos mesmos recursos, e o Intel® Data Center Diagnostic Tool é uma versão simplificada deste software para gerenciar ambientes locais.

Ferramenta de diagnóstico para data center da Intel®

A Intel® Data Center Diagnostic Tool (Intel® DCDiag) foi desenvolvida para que gerentes de TI conduzam manutenção periódica de suas frotas de data centers. O Intel® DCDiag pode ser usado em qualquer tamanho do data center para ajudar a garantir o mais alto nível de qualidade e disponibilidade contínuos. Além disso, o DCDiag pode ser usado para triagem periódica da frota em primeiro plano (~45 minutos de tempo de execução) ou em modo de segundo plano e pode identificar microprocessadores defeituosos. A execução da manutenção periódica do sistema ajuda a identificar problemas potenciais de forma proativa e dá aos administradores do sistema a capacidade de substituir esses microprocessadores.

O Intel® DCDiag é um conjunto de testes que verifica metodicamente a maioria das funcionalidades do SoC, incluindo o de cada núcleo de microprocessador individual. Ao verificar se cada computação do DCDIAG está correta, e não apenas confirmando que o teste foi concluído corretamente, o DCDIAG é capaz de detectar muitos tipos de falhas, incluindo aquelas que se manifestam como Erros de Dados Silenciosos.

O Intel® DCDiag encontra falhas verificando os resultados corretos das operações do processador com vários testes.

  • Executa vários loops de código, ou executa o mesmo código em todos os núcleos e verifica se os resultados são os mesmos.
  • Verifica caches, comunicações core-a-core e a maioria das instruções do processador.

Conjuntos de dados aleatórios são usados para testar instruções e núcleos. O relatório foi aprovado ou reprovado fácil de entender em um processador. Os processadores que falharem no teste devem ser devolvidos ao fornecedor do sistema ou ao distribuidor para substituição.

How Does DCDIAG Work?

Resultados dos testes

Os resultados dos testes do DCDiag foram projetados para ser fáceis de entender. Quando o diagnóstico for concluído, o sistema retorna uma das seguintes mensagens:

  • Teste concluído com sucesso. Nenhum problema detectado.
  • Teste concluído com sucesso. Ocorreu um ou mais erros de verificação da máquina. Verifique os logs do sistema.
  • Este processador não é compatível com esta versão da ferramenta.
    • Verifique o modelo e a versão do processador do sistema. Esta mensagem aparece se o Intel Data Center Diagnostic Tool não detectar uma versão de produção dos processadores suportados. Amostras de engenharia não são suportadas por esta ferramenta.

    • Encontre ajuda para identificar o processador.

  • Teste concluído. Os resultados são inconclusivos devido a uma versão desatualizada do microcódigo.
    • A versão mais recente do microcódigo soluciona problemas conhecidos. A Intel recomenda a atualização para a versão mais recente.

  • O teste falhou. Para obter suporte, entre em contato com o fabricante do seu sistema ou com o fornecedor do processador.
    • Se os resultados dos testes apresentarem falha, verifique se os processadores do seu nó de servidor ainda estão na garantia.

    • Se você tiver um processador Intel® Xeon® in a box ainda sob uma garantia de 3 anos, entre em contato com Intel Customer Support para obter assistência.

    • Se você tiver um processador de bandeja, entre em contato com o fornecedor do seu sistema ou processador ou com o local de compra para obter assistência.

Requisitos do sistema

O Intel® Data Center Diagnostic Tool é um aplicativo disponível para sistemas operacionais Linux* e Windows*. A ferramenta pode ser instalada e executada em muitas distribuições atuais do Linux* e do Windows*, consulte Instalação no Linux* e Windows*.

A partir da versão 558, a ferramenta pode ser instalada no Windows* usando o instalador MSI fornecido e executada em qualquer versão do Windows 10*, Windows Server 2016* ou mais recente atualmente compatível com a Microsoft. Consulte as informações de versão do Windows* Server para determinar quais versões de sistemas Windows* Server estão disponíveis e são suportadas no momento.

Para melhor cobertura, execute o aplicativo no sistema raiz de um servidor. É possível executá-la dentro de um contêiner ou máquina virtual, mas esteja ciente de que algumas funcionalidades podem estar desativadas.

Processadores suportados:

  • Processadores escaláveis Intel® Xeon® da 5ª Geração (anteriormente Emerald Rapids)
  • Processadores escaláveis Intel® Xeon® da 4ª Geração (anteriormente Sapphire Rapids)
  • Processadores escaláveis Intel® Xeon® da 3ª Geração (anteriormente Ice Lake e Cooper Lake)
  • Processadores escaláveis Intel® Xeon® da 2ª Geração (anteriormente Cascade Lake)
  • Processadores escaláveis Intel® Xeon® da 1ª Geração (anteriormente Skylake)
  • Família de processadores Intel® Xeon® E5 v4 (anteriormente Broadwell)
  • Família do processador Intel® Xeon® E7 v4 (anteriormente Broadwell)

Intel® Data Center Diagnostic Tool dos processadores Windows em Intel® Xeon®

Intel® Data Center Diagnostic Tool para Linux em processadores Intel® Xeon®

Como testar o processador Intel® Xeon® usando Intel® Data Center Diagnostic Tool

Nota:

Para desenvolvedores: a Intel iniciou o projeto de diagnóstico de data center aberto, que abre a estrutura de diagnóstico de data center da Intel e fornece testes selecionados. Isso oferece aos desenvolvedores uma estrutura de desenvolvimento de testes consistente que convida a criatividade da comunidade de código aberto a aprimorar o gerenciamento de frotas de nuvem através do desenvolvimento de telas de teste exclusivas e de outras soluções inovadoras. Para obter mais informações e acesso a esse framework e testes.

Histórico de versões

Data Versão Descrição
07 de julho de 2021 540 Versão inicial
16 de agosto de 2022 549 Correção de bugs
20 de setembro de 2022 549 Comando alterado para habilitar a ferramenta e verificar a habilitação
10 de janeiro de 2023 550 Inclua processadores Intel® Xeon® da 4ª Geração
20 de janeiro de 2023 576 Versão 576 da versão
14 de dezembro de 2023 594 Versão 594
22 de março de 2024 603 Versão 603 da versão

*Outros nomes e marcas podem ser propriedade de outras empresas.

Tópicos relacionados
Intel® Xeon® site central de suporte
Guia de garantia dos processadores Intel®
Intel® Data Center Diagnostic Tool de processadores Intel® Xeon® para Windows*