ID do artigo: 000056596 Tipo de conteúdo: Documentação e informações do produto Última revisão: 26/07/2021

Atributos SMART comuns para produtos de tecnologia intel® SSDs e Intel® Optane™ cliente

Resumo

Explica como os atributos SMART podem monitorar a saúde de um dispositivo de armazenamento. Este artigo descreve atributos comuns suportados em SSDs Intel® cliente

Descrição

O que são atributos SMART e como eles podem ser úteis?

Resolução

A tecnologia smart (Self-Monitoring, Analysis and Reporting Technology) é um padrão aberto utilizado pelos drives e hosts para monitorar a saúde das unidades e relatar possíveis problemas.

Cada unidade opera sob um conjunto predefinido de atributos SMART e valores de limiar correspondentes, dos quais a unidade não deve passar durante a operação normal.

Descrições de alguns atributos SMART Health Info são mostradas na tabela a seguir. Esses atributos variam dependendo da SSD Intel ou de outra unidade selecionada. A sua SSD ou unidade pode não suportar alguns desses atributos.

Atributos SMART para SATA

Id

Atributo e descrição (SATA)

05

Contagem de setores alocados

O valor bruto mostra o número de blocos aposentados desde que deixou a fábrica (contagem de defeitos cultivados).

09

Contagem de horas de alimentação

O valor bruto relata o número cumulativo de horas de alimentação durante a vida útil do dispositivo.

Nota:  O status de "On/Off" do recurso Gerenciamento de Energia Iniciado por Dispositivo (DIPM - Device Initiated Power Management) afeta o número de horas relatadas.

  • Se o DIPM estiver ligado, o valor registrado não incluirá o tempo em que o dispositivo está em estado de repouso.
  • Se o DIPM estiver desligado, o valor registrado deve corresponder ao tempo do clock, uma vez que todos os três estados do dispositivo são consideradosinativos, inativos e inativos.

0C

Contagem de ciclos de energia

O valor bruto relata o número cumulativo de eventos de ciclo de energia (ciclos de alimentação/desligado) durante a vida útil do dispositivo.

Aa

Umespaço reservado disponível

Informa o número de blocos de reserva restantes. O valor normalizado começa às 100 (64h), o que corresponde a 100% de disponibilidade do espaço reservado. O valor de limiar para este atributo é de 10% de disponibilidade.

Ab

Contagem de falhas do programa

O valor bruto mostra a contagem total de falha do programa. O valor normalizado, a partir de 100, mostra que o percentual restante do programa pode falhar.

Ac

Apagar a contagem de falhas

O valor bruto mostra a contagem total de falha de apagar. O valor normalizado, a partir de 100, mostra que o porcentual restante da apagar permitida falha.

Ae

Perda de energia inesperada

Informa o número de desligamentos temporários, cumulativos durante a vida útil da SSD. Um "desligamento temporário" é a remoção da energia sem ESPERA IMEDIATA como o último comando (independentemente da atividade do PLI usando alimentação do capacitor). Ele é também conhecido como "Contagem de retração de energia" por terminologia de unidade magnética.

B8

Contagem de detecção de erros de ponta a ponta

Relata o número de erros encontrados durante as verificações da marcação do Endereço de bloco lógico (LBA) no caminho de dados da SSD. O valor normalizado começa em 100 e é decrementado em 1 para cada incompatibilidade de etiquetas LBA detectada. O valor limite é 90.

Bb

Contagem de erros incorrigíveis

O valor bruto mostra a contagem de erros que não puderam ser recuperados usando o Código de correção de erro (ECC).

Ser

Temperatura - fluxo de ar (case)

Informa a temperatura do caso da SSD em graus Celsius. O valor bruto é o seguinte:

  • Byte 0 = Temperatura do caso atual (° C)
  • Byte 2 = Temperatura mínima de caso recente (° C)
  • Byte 3 = Temperatura máxima de caso recente (° C)

O valor normalizado é de 100. A temperatura do caso é calculada com base em um deslocamento do sensor de temperatura interno.

C0

Contagem de desligamento não seguro (contagem de retração de energia)

O valor bruto relata o número cumulativo de eventos de desligamento não seguros (não seguros) durante a vida útil do dispositivo. Um desligamento não seguro ocorre sempre que o dispositivo é desligado sem que o comando STANDBY IMMEDIATE seja o último comando.

C2

Temperatura - Dispositivo interno

Informa a temperatura interna da SSD. A leitura da temperatura é o valor direto do sensor interno. O valor bruto é a temperatura atual. O valor normalizado é o resultado mínimo (temperatura de 150 corrente, 100).

C7

Contagem de erros do CRC

O número total de erros de verificação de redundância de redundância (CRC) encontrados na interface SATA.

E1

Gravações em host

O valor bruto relata o número total de setores escritos pelo sistema host. O valor bruto aumenta 1 para cada 65.536 setores escritos pelo host.

E2

Carga de trabalho temporada, desgaste de mídia

Mede o desgaste visto pela SSD (desde a redefinição do Temporizador de carga de trabalho temporada, atributo E4), como uma porcentagem dos ciclos avaliados máximos.

E3

Carga de trabalho temporada, proporção de leitura/gravação de host

A porcentagem de operações de E/S que são operações de leitura (desde a redefinição do Temporizador de carga de trabalho temporada, atributo E4).

E4

Temporizador de carga de trabalho crono temporada

Mede o tempo decorrido (número de minutos) desde o início deste temporizador de carga de trabalho.

E8

Espaço reservado disponível

Informa o número de blocos de reserva restantes. O valor normalizado começa às 100 (64h), o que corresponde a 100% de disponibilidade do espaço reservado. O valor de limiar para este atributo é de 10% de disponibilidade.

E9

Indicador de desgaste de mídia

Informa o número de ciclos que a mídia NAND sofreu. O valor normalizado diminui linearmente de 100 para 1 à medida que a contagem média de ciclos de apagaamento aumenta de 0 para os ciclos classificados máximos. Quando o valor normalizado chegar a 1, o número não diminuirá, embora seja provável que um desgaste adicional significativo possa ser colocado no dispositivo.

F1

Total de LBAs gravados

Conta setores escritos pelo host.

F2

Total de LBAs lidos

Conta os setores lidos pelo host.

Atributos SMART para NVMe*

Id

Atributo e descrição (NVMe)

0

Aviso crítico

Esses bits se definidos, sinalizam várias fontes de aviso.

  • Bit 0: A reposição disponível está abaixo do limite
  • Bit 1: A temperatura excedeu o limite
  • Bit 2: A confiabilidade está degradada devido a mídia excessiva ou erros internos
  • Bit 3: A mídia é colocada no modo somente leitura
  • Bit 4: Falha no sistema de backup de memória volátil (por exemplo, falha no teste do capacitor de perda de energia aprimorada)
  • Bits 5-7: Reservado

Qualquer aviso crítico pode ser vinculado à notificação de eventos assíncrona.

1

Temperatura

Informa a temperatura geral da corrente do dispositivo em Kelvin.

3

Disponível de reposição

Contém uma porcentagem normalizada (0 a 100%) da capacidade de reposição restante disponível. Começa a partir de 100 e decrementos.

4

Limiar de reposição disponível

O limite é definido como 10%.

5

Estimativa de porcentagem utilizada

(Valor permitido exceder 100%). Um valor de 100 indica que a resistência estimada do dispositivo foi consumida, mas pode não indicar uma falha do dispositivo. O valor é permitido ultrapassar 100. Porcentagens acima de 254 serão representadas como 255. Este valor deve ser atualizado uma vez por hora de alimentação (quando o controlador não estiver em estado de união).

32

Leitura das unidades de dados (em LBAs)

Contém o número de 512 unidades de dados de byte que o host leu do controlador; esse valor não inclui metadados. Esse valor é relatado em milhares (ou seja, um valor de 1 corresponde a 1.000 unidades de 512 bytes de leitura) e é arredondado. Quando o tamanho LBA for um valor diferente de 512 bytes, o controlador converterá a quantidade de dados lidos para 512 unidades de bytes.

48

Gravação de unidades de dados (em LBAs)

Contém o número de 512 unidades de dados de byte que o host escreveu para o controlador; esse valor não inclui metadados. Esse valor é relatado em milhares (ou seja, um valor de 1 corresponde a 1.000 unidades de 512 bytes gravados) e é arredondado. Quando o tamanho LBA for um valor diferente de 512 bytes, o controlador converterá a quantidade de dados gravados em 512 unidades de bytes. Para o conjunto de comando NVM, os blocos lógicos gravados como parte das operações de gravação devem ser incluídos neste valor. A gravação de comandos incorrigíveis não afetará este valor.

64

Comandos de leitura de host

Contém o número de comandos de leitura emitidos para o controlador.

80

Comandos de gravação de host

Contém o número de comandos de gravação emitidos para o controlador.

96

Tempo de trabalho do controlador (em minutos)

Contém o tempo que o controlador está ocupando com comandos de E/S. O controlador está movimentado quando há um comando pendente de uma fila de E/S. (Especificamente, um comando foi emitido por meio de uma gravação de e/S Submission Queue Door referente à fila de espera e a entrada correspondente da fila de conclusão ainda não foi publicada na Fila de Conclusão de E/S associada.) Esse valor é relatado em minutos.

112

Ciclos de energia

Contém o número de ciclos de alimentação

128

Horas de alimentação

Contém o número de horas de alimentação. Isso não inclui tempo em que o controlador foi alimentado e em estado de baixo consumo de energia.

144

Desligamentos não seguros

Contém o número de desligamentos não seguros. Essa contagem é incrementada quando uma notificação de desligamento (CC.S PEQUENOS) não é recebida antes da falta de energia.

160

Erros de mídia

Contém o número de ocorrências em que o controlador detectou um erro de integridade de dados não detectado. Erros como ECC incorrigível, falha de verificação do CRC ou incompatibilidade de etiquetas LBA são incluídos neste campo.

176

Número de entradas de registro de informações de erro

Contém o número de entradas de registro de Informações de Erro durante a vida útil do controlador.

192

Aviso tempo de temperatura composta

Contém a quantidade de tempo em minutos em que o controlador está operacional e a Temperatura composta é maior ou igual ao campo Limite de Temperatura Composta de Aviso (WCTEMP) e menos do que o campo Limiar de Temperatura Composta Crítica (CCTEMP) na estrutura de dados Identificar controlador.

196

Tempo crítico de temperatura composta

Contém a quantidade de tempo em minutos em que o controlador está operacional e a Temperatura composta é maior o campo CcTEMP (Critical Composite Temperature Threshold) na estrutura de dados Identificar controlador.

Disclaimer

1

Todas as publicações e o uso do conteúdo deste site estão sujeitos aos termos de uso da Intel.com.

O conteúdo desta página é uma combinação de tradução humana e por computador do conteúdo original em inglês. Este conteúdo é fornecido para sua conveniência e apenas para informação geral, e não deve ser considerado completo ou exato. Se houver alguma contradição entre a versão em inglês desta página e a tradução, a versão em inglês prevalecerá e será a determinante. Exibir a versão em inglês desta página.