Miniatura do Napatech

Os IPUs Reduzem a Sobrecarga de Computação em Cargas de Trabalho de Armazenamento

A Napatech integra a IPU F2070X com base na Intel® IPU em seu software Link-Storage* para descarregar cargas de trabalho NVMe ao TCP, reduzindo as sobrecargas computacionais.

Resumo

  • Os data centers empresariais e de nuvem estão adotando cada vez mais a tecnologia de armazenamento NVMe/TCP por causa de suas vantagens de desempenho, latência, escalabilidade, gerenciamento e utilização de recursos. No entanto, a implementação das cargas de trabalho necessárias do inicializador de armazenamento na CPU do host do servidor impõe sobrecargas de computação significativas e limita o número de núcleos de CPU disponíveis para a execução de serviços e aplicativos.

  • A solução integrada de hardware e software da Napatech, que compreende a pilha de software Link-Storage que executa no IPU F2070X, resolve esse problema ao descarregar as cargas de trabalho de armazenamento da CPU do host para a IPU enquanto mantém a compatibilidade total do software no nível do aplicativo.

  • A solução de descarga de armazenamento da Napatech libera núcleos da CPU do host cujas funções de armazenamento seriam consumidas de outra forma. Seu desempenho é significativamente melhor do que o de uma implementação baseada em software, reduzindo o CAPEX, o OPEX e o consumo de energia do data center. Também introduz o isolamento de segurança no sistema, aumentando a proteção contra ataques cibernéticos.

author-image

Por

Logotipo nvm expressEste resumo da solução explica como a solução integrada de hardware e software da Napatech descarrega as cargas de trabalho de armazenamento NVMe/TCP da CPU do host para uma IPU, reduzindo significativamente o CAPEX, o OPEX e o consumo de energia. Também aborda o isolamento de segurança no sistema, aumentando a proteção contra ataques cibernéticos.

O que é NVMe sobre o TCP?

O NVMe/TCP é uma tecnologia de armazenamento que permite que os dispositivos de Non-Volatile Memory Express (Memória Não Volátil Expressa) sejam acessados em uma rede usando malhas de data center padrão. Consulte a Figura 1.

Os data centers empresariais e de nuvem modernos estão adotando cada vez mais A NVME/TCP devido às vantagens convincentes que oferecem em relação aos protocolos de armazenamento mais antigos, como o Fibre Channel ou Internet Small Computer System Interface (iSCSI):

Figura 1. Arquitetura de armazenamento desagregada

 

  • Desempenho mais alto: o NVMe foi projetado para aproveitar ao máximo as modernas unidades de estado sólido (SSDs) com base em NAND de alta velocidade e oferece taxas de transferência de dados significativamente mais rápidas do que os protocolos de armazenamento tradicionais. O NVMe/TCP amplia esses benefícios para um ambiente de armazenamento em rede, permitindo que os data centers alcancem acesso de armazenamento de alto desempenho por meio da tela.

  • Latência reduzida: a natureza de baixa latência do NVMe/TCP é crítica para aplicativos com uso intensivo de dados e cargas de trabalho em tempo real. A NVMe/TCP pode ajudar a reduzir as latências de acesso ao armazenamento e melhorar o desempenho geral do aplicativo minimizando a sobrecarga de comunicação e eliminando a necessidade de conversões de protocolo.

  • Escalabilidade: os data centers geralmente lidam com implantações de armazenamento em larga escala, e a NVMe/TCP permite a escalabilidade perfeita ao fornecer uma solução de acesso ao armazenamento flexível e eficiente em uma rede. À medida que o número de dispositivos NVMe cresce, os data centers podem manter níveis de alto desempenho sem congestionamentos significativos.

  • Conjunto de armazenamento compartilhado: a NVMe/TCP habilita a criação de conjuntos de armazenamento compartilhados acessíveis para vários servidores e aplicativos simultaneamente. Essa arquitetura de armazenamento compartilhada melhora a utilização de recursos e simplifica o gerenciamento de armazenamento, economizando significativamente os custos.

  • Compatibilidade de infraestrutura obsoleta: os data centers geralmente têm infraestrutura existente construída em redes Ethernet, InfiniBand ou Fibre Channel. A NVMe/TCP permite que eles aproveitem seus investimentos de malha atuais enquanto integram a tecnologia de armazenamento mais recente com base em NVMe sem reformar toda a infraestrutura de rede.

  • Utilização eficiente de recursos:  NVMe/TCP habilita a melhor utilização de recursos ao reduzir a necessidade de recursos de armazenamento dedicados em cada servidor. Vários servidores podem acessar dispositivos de armazenamento NVMe compartilhados pela rede, otimizando o uso de recursos de armazenamento NVMe dispendiosos.

  • Futuro Garantido: à medida que os data centers evoluem e adotam tecnologias de armazenamento mais rápidas, a NVMe/TCP oferece uma abordagem inovadora para o acesso ao armazenamento, garantindo que as redes de armazenamento possam acompanhar as crescentes demandas de aplicativos e cargas de trabalho modernos.

No geral, a NVMe/TCP oferece uma solução de armazenamento poderosa e flexível para data centers, permitindo alto desempenho, baixa latência e utilização eficiente de recursos em um ambiente de armazenamento compartilhado e escalável.

Limitações de Arquiteturas de Armazenamento Apenas de Software

Apesar dos benefícios convincentes da NVMe/TCP para armazenamento, os operadores de data center devem estar cientes de limitações significativas associadas a uma implementação na qual todos os serviços de iniciador de armazenamento necessários são executados em software na CPU do servidor host. Consulte a Figura 2.

armazenamento de rede
Figura 2. Armazenamento em rede com base em software

 

Primeiro, um risco de segurança no nível do sistema é apresentado se o software de virtualização de armazenamento, o hipervisor ou o comutador virtual (vSwitch) estiverem comprometidos em um ataque cibernético.

Em segundo lugar, não há como garantir o isolamento total entre cargas de trabalho do locatário. Uma única arquitetura hospeda vários aplicativos e dados de clientes em um ambiente de vários locatários. O efeito de “vizinho barulhento” ocorre quando um aplicativo ou máquina virtual (VM) usa os recursos mais disponíveis e degrada o desempenho do sistema para outros locatários na infraestrutura compartilhada.

Por fim, uma parte significativa dos núcleos da CPU do host é necessária para a executação de serviços de infraestrutura, como o software de virtualização de armazenamento, o hipervisor e o vSwitch. Isso reduz o número de núcleos de CPU que podem ser monetizados para VMs, contêineres e aplicativos. Os relatórios indicam que entre 30% e 50% dos recursos da CPU de data center são normalmente consumidos por serviços de infraestrutura.

Em um subsistema de armazenamento de alto desempenho, a CPU do host pode ser necessária para executar vários protocolos, como Transmission Control Protocol (TCP), Acesso Remoto à Memória por Ethernet Convergente (RoCEv2), InfiniBand e Fibre Channel. Quando a CPU do host é altamente utilizada para executar esses protocolos de armazenamento e outros serviços de infraestrutura, o número de núcleos de CPU disponíveis para aplicativos do locatário é significativamente reduzido. Por exemplo, uma CPU de 16 núcleos pode oferecer apenas o desempenho de uma CPU de 10 núcleos.

Por esses motivos e muito mais, uma arquitetura apenas de software apresenta desafios empresariais e técnicos significativos para o armazenamento de data center.

Solução de Descarga de Armazenamento com Base em IPU

A descarga da carga de trabalho NVMe/TCP para uma IPU, além de outros serviços de infraestrutura, como o hipervisor e o vSwitch (consulte a Figura 3), direciona as limitações de uma implementação apenas de software e oferece benefícios significativos para os operadores de data center:

 

  • Utilização da CPU: a comunicação NVMe/TCP envolve o encapsulamento de comandos e dados NVMe no protocolo de transporte TCP. A CPU do host processa essas tarefas de encapsulação e desencapsulação sem descarregar. A descarga dessas operações para um hardware dedicado permite que a CPU se concentre em outras tarefas críticas, melhorando o desempenho geral do sistema e a utilização da CPU.

  • Menor latência: a descarga das tarefas de comunicação NVMe/TCP para um hardware especializado pode reduzir significativamente a latência dos comandos de armazenamento do processamento. Como resultado, os aplicativos podem experimentar tempos de resposta mais rápidos e melhor desempenho ao acessar dispositivos de armazenamento NVMe remotos.

  • Movimento de dados eficiente: a descarga de tarefas de aplicativos que não utilizam a CPU para aceleradores de hardware discretos permite que as operações de movimento de dados sejam realizadas de forma mais eficiente do que o uso de uma CPU de propósito geral. Pode lidar com grandes transferências de dados e gerenciamento de memória temporária de forma eficaz, reduzindo as latências e melhorando a taxa de transferência geral.

  • Escalabilidade aprimorada: a descarga de tarefas NVMe/TCP melhora a escalabilidade em implantações de armazenamento em larga escala. Ao aliviar a CPU de lidar com a comunicação de rede, o sistema pode suportar mais conexões e dispositivos de armazenamento simultâneos sem se tornar limitado à CPU.

  • Eficiência energética: ao descarregar certas tarefas para o hardware dedicado, o consumo de energia na CPU do host pode ser reduzido. Essa eficiência energética pode ser especialmente importante em ambientes de data center de grandes dimensões onde o consumo de energia é uma consideração significativa.

armazenamento desagregado da ipu
Figura 3. Armazenamento desagregado habilitado por IPU

 

Além dos benefícios acima que se aplicam à carga de trabalho de armazenamento NVMe/TCP, a arquitetura do sistema com base em IPU oferece opções de isolamento de segurança incrementais, nas quais os serviços de infraestrutura são isolados dos aplicativos do locatário. Isso garante que os serviços de armazenamento, hipervisor e vSwitch não sejam comprometidos por um ataque cibernético iniciado por um aplicativo do locatário. Os próprios serviços de infraestrutura estão protegidos, pois o processo de inicialização da própria IPU é seguro, enquanto a IPU atua como a raiz da confiança para o servidor do host.

Solução Integrada de Hardware e Software da Napatech

A Napatech oferece uma solução integrada de nível do sistema para a descarga de armazenamento de data center, que compreende a pilha de software Link-Storage de alto desempenho que é executada na IPU F2070X. Veja a Figura 4.

Figura 4. A descarga de armazenamento da Napatech é executada na IPU F2070X

 

O software Link-Storage incorpora um conjunto rico de funções, incluindo:

 

  • Descarga completa de cargas de trabalho NVMe/TCP do host para a IPU;

  • Descarga completa das cargas de trabalho TCP do host para a IPU;

  • Iniciador NVMe para TCP;

  • Configuração do armazenamento por meio da interface Storage Performance Development Kit Remote Procedure Call (SPDK RPC);

  • Suporte ao Multipath NVMe;

  • Apresentação de 16 dispositivos de bloqueio para o host por meio da interface virtio-blk;

  • Compatibilidade com drivers padrão virtio-blk em distribuições Linux* comuns;

  • Isolamento de segurança entre a CPU do host e a IPU, sem interfaces de rede expostas ao host.

Além do Link-Storage, a F2070X também é compatível com o software Link-Virtualization, que oferece um plano de dados virtualizados descarregado e acelerado, incluindo funções como Open vSwitch (OVS), migração ao vivo, espelhamento de VM para VM, encapsulação/descapsulação de VLAN/VxLAN, Q-in-Q, balanceamento de carga de escalabilidade lateral (RSS), agregação de links e Qualidade de Serviço (QoS).

Como o F2070X é baseado em um FPGA e uma CPU, em vez de ASICs, a funcionalidade completa da plataforma pode ser atualizada após a implantação. Seja para modificar um serviço existente, adicionar novas funções ou ajustar parâmetros de desempenho específicos, essa reprogramação pode ser realizada apenas como uma atualização de software no ambiente do servidor existente sem desconectar, remover ou substituir qualquer hardware.

IPU Napatech F2070X

A IPU Napatech F2070X, com base na plataforma Intel® IPU F2000X-PL, é uma placa PCIe 2x100G com um FPGA Intel Agilex® 7 Série F e um processador Intel® Xeon® D de altura máxima, meio-comprimento (FHHL), fator de forma de slot duplo.

A configuração padrão da IPU F2070X compreende um FPGA Intel Agilex® 7 AGF023 com quatro bancos de memória DDR4 de 4 GB e um processador Intel® Xeon® D-1736 de 2,3 GHz com dois bancos de memória DDR4 de 8 GB. Outras opções de configuração podem ser fornecidas para suportar cargas de trabalho específicas.

A IPU F2070X se conecta ao host por meio de uma interface PCIe 4.0 x16 (16 GTps), com uma interface PCIe 4.0 x16 (16 GTps) entre o FPGA e o processador.

Duas interfaces de rede QSFP28/56 do painel frontal suportam configurações de rede de:

 

  • 2x 100 G;
  • 8x 10G ou 8x 25G (usando cabos breakout).

Uma porta RJ45 dedicada oferece sincronização de tempo opcional com um SMA-F externo e um conector MCX-F interno. Suporte de carimbo de data e hora do IEEE 1588v2.

Gerenciamento de placas de um conector Ethernet RJ45 dedicado. As atualizações de imagem de FPGA seguras permitem que novas funções sejam adicionadas ou os recursos existentes sejam atualizados após a implantação da IPU.

O processador executa o Fedora Linux, com um BIOS de UEFI, suporte de inicialização PXE, acesso completo ao shell por meio de SSH, e um UART.

Adaptador Intel IPU F2000X
Adaptador Intel® IPU Platform F2000X-PL