Selecione as máquinas virtuais do Google Cloud N2 para executar suas cargas de trabalho do Genomics com mais eficiência e economia

Genomics Analytics Toolkit

  • Os clusters da MV do Google Cloud N2 concluíram tarefas do Genomics em menos de 75% do tempo em comparação com os clusters de MV padrão N1 e C2.

  • Os clusters de MV do Google Cloud N2 concluíram tarefas do Genomics em apenas 78% do custo em comparação com clusters de MV padrão N1 e C2.

author-image

Por

Em comparação com outras máquinas virtuais (MVs) do Google Cloud, as MVs N2 com processadores escaláveis Intel® Xeon® da 2ª Geração reduziram em até 25% o tempo e o custo para executar tarefas do Genomics Analytics Toolkit

As cargas de trabalho do Genomics exigem grande quantidade de recursos de computação. Se estiver comprando MVs de nuvem pública, é importante pesquisar o desempenho de diferentes opções. A escolha certa pode reduzir drasticamente o valor gasto na execução dessas cargas de trabalho. Para ilustrar como as MVs podem variar em termos de desempenho e custo, a Intel realizou testes de parâmetro de referência em clusters de três séries de MVs do Google Cloud: N2 Standard e C2 Standard, ambos com processadores escaláveis Intel® Xeon® da 2ª Geração e N1 Standard com processadores escaláveis Intel® Xeon® da 1ª Geração.

O parâmetro de referência Cromwell no Google Cloud mediu a rapidez com que essas MVs executaram 24 tarefas no aplicativo Genomics Analytics Toolkit (GATK). Os resultados dos testes mostraram que o cluster N2 Standard executou as tarefas em menos tempo do que os outros clusters, o que resultou em um custo menor. Para eficiência e economia, execute suas cargas de trabalho do Genomics em MVs N2 Standard com processadores escaláveis Intel® Xeon® da 2ª Geração.

Os clusters de MV padrão N2 superaram os clusters da MV padrão N1 e custam menos

Como mostra a Figura 1, em nossos testes, o cluster da MV N2 com processadores escaláveis Intel® Xeon® da 2ª Geração concluiu tarefas do Genomics no aplicativo GATK em 75% do tempo que o cluster da MV N1 Standard precisava. Quando seu cluster da MV conclui um conjunto de tarefas em menos tempo, você paga por menos tempo de atividade da MV, o que ajuda em seus resultados. Essa eficiência se traduz em economia: o custo de execução das tarefas no cluster da MV N2 seria 21% menor do que no cluster da MV N1.

Figura 1. Tempo e custo relativo para concluir tarefas do Genomics. Números mais baixos são melhores.

Os clusters de MV padrão N2 superaram os clusters de MV padrão C2 e custam menos

Como mostra a Figura 2, em nossos testes, o cluster da MV N2 com processadores escaláveis Intel® Xeon® da 2ª Geração concluiu tarefas do Genomics no aplicativo GATK em 78% do tempo que o cluster da MV C2 Standard precisava. Essa eficiência se traduz em economia: o custo de execução das tarefas no cluster da MV N2 seria 22% menor do que no cluster da MV N1.

Figura 2. Tempo e custo relativo para concluir tarefas do Genomics. Números mais baixos são melhores.

Conclusão

Como os aplicativos de análise do Genomics são muito intensivos em computação, é fundamental selecionar uma MV na nuvem com desempenho robusto. Em nossos testes, mostramos que as MVs do Google Cloud N2 Standard com processadores escaláveis Intel® Xeon® da 2ª Geração reduziram o tempo e o custo para concluir as tarefas do Genomics, em comparação com as MVs N1 Standard e C2 Standard.

Saiba mais

Para começar a executar suas cargas de trabalho do Genomics nas máquinas virtuais do Google Cloud N2 com processadores escaláveis Intel® Xeon® da 2ª Geração, visite https://cloud.google.com/compute/docs/general-purpose-machines#n2_machines.

Todos os testes da Intel no GCP/us-central1 em 10/09/2020-09/10/2020. Todos os testes: CentOS 7, Input Data Set 30X Coverage Human Whole Genome Sequence (WGS); NA12878, Workload GATK Best Practices Pipeline para Germline Variant Calling com pré-processamento, GATK 4.0.10.1, Genomics Kernel Library (GKL) 0.8.6, Cromwell 52, Picard 2.20, BWA 0.7.15-r1140, Samtools 1.3.1. Ferramentas em https://hub.docker.com/r/broadinstitute/genomes-in-the-cloud/: us.gcr.io/broad-gotc-prod/genomes-in-the-cloud:2.4.3-1564508330, us.gcr.io/broad-gatk/gatk:4.0.10.1. Fluxo de trabalho definido: https://github.com/gatk-workflows/gatk4-genome-processing-pipeline/blob/master/WholeGenomeGermlineSingleSample.wdl. Execute Iterations:3. Detalhes da MV: Série de máquinas N1: Processador escalável Intel® Xeon® da 1ª Geração (Skylake): N1-standard-2: 2 vCPUs, 7,5 GB de RAM; N1-padrão-16: 16 vCPUs, 60 GB de RAM. Série de máquinas N2: Processador escalável Intel® Xeon® da 2ª Geração (Cascade Lake): N2-standard-2: 2 vCPUs, 8 GB de RAM; N2-padrão-16: 16 vCPUs, 64 GB de RAM. Série de máquinas C2: Processador escalável Intel® Xeon® da 2ª Geração (Cascade Lake): C2-standard-4: 4 vCPUs, 16 GB de RAM. C2-standard-16: 16 vCPUs, 64 GB RAM.