Engenharia de Confiabilidade Reduz o Tempo de Inatividade
Saiba como a TI Intel usa engenharia de confiabilidade para reduzir o tempo de inatividade não programado de sistemas de fabricação.
Impulsionada pela crescente importância de manter os locais de fabricação operando em capacidade total, 24 horas por dia, 7 dias por semana, a Intel Manufacturing IT (MIT) estabeleceu a meta de alcançar “quatro noves” (99,99%) de disponibilidade (ou 0,01% de tempo de inatividade) até 2025.
Para ajudar a alcançar essa meta ambiciosa, adicionamos a função de engenheiro de confiabilidade para aprimorar a resiliência das instalações de fabricação da Intel. A engenharia de confiabilidade (RE) é uma prática emergente, desenvolvida primeiramente por prestadores de serviços digitais baseados em nuvem. Ela foca no projeto de sistemas que sejam tolerantes a falhas, de modo que o serviço seja mantido, mesmo quando componentes individuais falham.
Em sua essência, a RE envolve a identificação de padrões de design que promovam a continuidade do serviço, tanto em aplicativos individuais quanto em suas interações. Essa abordagem envolve a colaboração entre a equipe de RE e a equipe de desenvolvimento, para ajudar a garantir que o feedback sobre as oportunidades de aprimoramento da resiliência seja recebido e incorporado ao design dos sistemas. Ao fechar o ciclo com os desenvolvedores, os engenheiros de confiabilidade ajudam a alinhar suas metas gerais de resiliência com os objetivos de entrega de recursos da equipe de desenvolvimento, permitindo-nos criar soluções robustas e confiáveis que atendam às necessidades de nossas partes interessadas.
Nossos engenheiros de confiabilidade abordam de forma proativa potenciais vulnerabilidades e desenvolvem estratégias para mitigar o impacto das falhas nas operações de fabricação. Eles desempenham um papel crucial na identificação de modos de falha comuns, no desenvolvimento de padrões e no design de soluções para reduzir o risco de falha.
- O uso da metodologia FMEA (Failure Mode and Effects Analys) pelos engenheiros de confiabilidade nos permitiu desenvolver um Modelo de Maturidade de Resiliência (RMM), aplicável em todos os nossos sistemas.
- Essa abordagem nos ajudou a identificar mais de 200 projetos de aprimoramento de resiliência e adicioná-los ao nosso roteiro de desenvolvimento para os próximos dois anos.
- Por meio dessas iniciativas de RE e da implementação de inúmeras atividades de melhoria operacional, o tempo de inatividade não programado da fábrica caiu 50% em relação aos níveis de 2019.
Nossos resultados mostram como uma abordagem de RE pode estender os benefícios da resiliência para o ambiente de fabricação, preparando-nos para a adoção futura de ambientes microsserviço baseados em nuvem. Demonstramos que a melhor confiabilidade e disponibilidade da categoria dos sistemas de TI podem ser alcançadas com a adoção de um conjunto padrão de ferramentas de RE e aplicando-as e forma proativa para melhorar a resiliência.