Domine o fluxo de trabalho de ciência de dados
Essas estações de trabalho especialmente projetadas para combinar um grande espaço de memória, vários slots de expansão para conectar múltiplos dispositivos e CPUs escolhidas cuidadosamente para atender às demandas específicas de projetos baseados em Python de cientistas e analistas de dados como você.
Estação de trabalho para ciência de dados: incluem superpoderes
Como um cientista de dados, você gasta a maior parte do seu tempo espremendo conjuntos de dados de médio e grande porte em bibliotecas e algoritmos Python que exigem bastante processamento da CPU — isso faz com que a maioria das estações de trabalho não consigam acompanhar o ritmo.
Isso acontece porque sua estação de trabalho é provavelmente superdimensionada para o treinamento de modelos, mas subdimensionada para a transformação de dados com uso intensivo de memória.
Evite erros de memória ao tentar carregar e explorar dados — uma experiência comum quando as funções Pandas precisam de mais memória do que sua máquina ou instância de nuvem tem disponível.
Processamento de NumPy/SciPy mais rápido que a geração anterior
A álgebra linear é a base da ciência de dados e numérica. As ferramentas de computação numérica fornecidas pelo NumPy e o SciPy permitem que o cientista de dados trabalhe com análises e funções numéricas, bem como uma variedade de modelos de aprendizado de máquina e fórmulas matemáticas. O iBench é um parâmetro de referência que testa comandos de estresse em álgebra linear de algoritmos comuns usados em NumPy e SciPy como dot, det, inv, lu, qr e svd. O desempenho é medido em segundos (quanto menor, melhor). Em comparação com o Xeon-W3275 da 3ª geração, o Xeon-W3495X da 4ª geração foi de 25% a 75% mais rápido nos testes mais recentes do iBench.1
Dê novos poderes à ciência de dados
Nós projetamos estações de trabalho para ciência de dados baseadas em tecnologia Intel para tornar os fluxos de trabalho de IA e aprendizado de máquina rápidos, fluidos e responsivos. Com até 8 TB de memória em sistemas de soquete duplo e CPUs compatíveis com a carga de trabalho, essas estações podem executar conjuntos de dados de médio a grande porte na memória e economizar horas nas tarefas mais demoradas no desenvolvimento de IA.
Estações de trabalho para ciência de dados baseadas em tecnologia Intel
As estações de trabalho para ciência de dados baseadas em tecnologia Intel vêm em três plataformas — móvel, convencional e especialista — com uma variedade de CPUs, capacidades de memória e slots de expansão PCIe.
Plataformas móveis para ciência de dados para conjuntos de dados de 32 GB a 64 GB
Desempenho notável para o desenvolvimento de IA e visualização de dados móveis.
- Série Intel Core HX com até 24 núcleos (8P + 16E).
- 128 GB DRAM DDR5 para todas as plataformas.
- SKUs recomendados:
- i9-13950HX (24 núcleos)
- i7-13850HX (20 núcleos)
Plataformas convencionais para ciência de dados para conjuntos de dados de 64 GB a 512 GB
Desempenho excelente por dólar para o pré-processamento e análise em conjuntos de dados de médio porte.
- Processadores Intel Xeon W-2400 com até 24 núcleos desbloqueados.
- Até 2 TB de RIDMM DDR5.
- SKUs recomendados:
- W7-2495X (24 núcleos)
- W5-2465X (16 núcleos)
Plataformas para especialistas para até 8 TB DDR5 em plataformas de soquete duplo
Desempenho máximo para manipular conjuntos de dados grandes, aprendizado de máquina e análise de dados.
- Processadores Intel Xeon W-3400 com até 56 núcleos.
- Até 4 TB RIDMM DDR5 para a série W-3400 e até 8 TB DDR5 para plataformas de dois soquetes Xeon SP da 4ª Geração.
- SKUs recomendados para plataformas de soquete único:
- W9-3475X (36 núcleos)
- W7-3455 (24 núcleos)
- W5-3425X (16 núcleos)
- SKUs recomendados para plataformas de soquete duplo:
- 6448Y (32 núcleos)
- 6442Y (24 núcleos)
- 6444Y (16 núcleos)
Escolha sua estação de trabalho para ciência de dados baseada em tecnologia Intel
As estações de trabalho para ciência de dados baseadas em tecnologia Intel são enviadas em várias configurações e numa variedade de preços por parceiros e fabricantes da Intel.
Seja mais rápido com o kit de ferramentas para análises de IA Intel® oneAPI
Otimizamos as ferramentas mais populares no ecossistema Python para arquiteturas Intel e as agrupamos no kit de ferramentas para análises de IA Intel oneAPI para facilitar sua experiência na construção do seu ambiente de ciência de dados e aumentar o desempenho dessas ferramentas. Essas otimizações de fácil implantação estão prontas para serem executadas para que você trabalhe mais rápido com poucas ou nenhuma alteração em sua forma de programar.
Baixe o kit de ferramentas para análises de IA Intel® oneAPI
Perguntas frequentes
Existem dois fatores principais a serem considerados ao escolher uma estação de trabalho para tarefas de ciência de dados: quais ferramentas e técnicas você mais usa e qual o tamanho dos seus conjuntos de dados.
Para as estruturas relacionadas a ciência de dados, um maior número de núcleos nem sempre se traduz num desempenho melhor. O NumPy, SciPy, e scikit-learn não escalam bem com mais de 18 núcleos. Por outro lado, o HEAVY.AI (anteriormente OmniSci) consegue usar todos os núcleos que forem dados a ele.
Todas as estações de trabalho para ciência de dados baseadas em tecnologia Intel usam os processadores escaláveis Intel® Core™, Intel® Xeon® W e Intel® Xeon®, que se destacam em cargas de trabalho para ciência de dados em testes do mundo real. Você receberá o melhor desempenho de cada família de processador, ou seja, a capacidade de memória é a sua escolha mais importante.
As estruturas de ciência de dados utilizam duas a três vezes a quantidade de memória do conjunto a ser analisado. Para saber sua linha de base em termos de memória, examine seus conjuntos de dados típicos e multiplique por três. Se você pode trabalhar com 512 GB ou menos, terá um desempenho excelente em uma máquina desktop. Se seus conjuntos de dados tendem a ser maiores do que 500 GB, você precisará de uma torre com 1,5 TB de memória ou mais.
Os aceleradores de GPU se destacam no treinamento de modelos de aprendizado profundo e inferência de aprendizado profundo em larga escala. No entanto, para a maior parte do trabalho relacionado a ciência de dados — preparação de dados, análises e aprendizado de máquina clássico — essas GPUs ficam ociosas, porque a maioria das bibliotecas Python para ciência de dados são executadas nativamente na CPU. Você precisa de um adaptador gráfico para dar imagem aos seus displays, mas não de um equipamento de GPU.
A nuvem não proporcionará o melhor desempenho, a menos que você esteja utilizando uma máquina virtual dedicada ou um servidor bare metal. As instâncias de nuvem se apresentam como um único nó, mas no back-end, as coisas são altamente distribuídas. Sua carga de trabalho e seus dados são divididos em vários servidores em vários locais. Isso cria latências de processamento e de memória que degradam o tempo de execução. Além disso, trabalhar com conjuntos de dados grandes e gráficos através de uma área de trabalho remota não é uma experiência ideal.
Ao manter a carga de trabalho e os dados locais, em uma única máquina, você pode usufruir de um desempenho muito aprimorado e uma experiência de trabalho mais fluida e responsiva.
Você pode, mas vai desperdiçar imensas quantidades de tempo assistindo aos dados enquanto são transportados entre o armazenamento, memória e CPU. Se você está trabalhando em um ambiente profissional, atualizar seu sistema para um notebook ou desktop para ciência de dados Intel® intermediário pode economizar muito do seu tempo. Testamos e projetamos intencionalmente os notebooks para ciência de dados baseados em tecnologia Intel® Core™ para que os alunos, iniciantes e fabricantes de IA possam ter uma opção acessível para desenvolver e experimentar ferramentas de IA de código aberto.
Você pode executar ferramentas para ciência de dados baseadas em Python mais rápido em um PC padrão usando bibliotecas e distribuições otimizadas para a tecnologia Intel. Eles todos fazem parte do kit Intel AI gratuito.
Avisos legais e isenções de responsabilidade
Conforme estimado por medições feitas usando a plataforma de validação da Intel comparando o Intel Xeon w9-3495X com o Intel® Xeon® W-3275 no NumPy/SciPy — Inv, N=25000
Consulte intel.com/performanceindex para obter os detalhes de configuração. Os resultados podem variar.
Os resultados de desempenho são baseados em testes realizados nas datas especificadas nas configurações e podem não incluir todas as atualizações disponíveis publicamente. Consulte o fabricante para obter os detalhes de configuração. Saiba mais em intel.com/PerformanceIndex.
A aceleração de tarefas Pandas, scikit-learn e TensorFlow foi obtida usando a Intel® Distribution do Modin. Para obter mais detalhes, consulte intel.com/content/www/br/pt/developer/articles/technical/code-changes-boost-pandas-scikit-learn-tensorflow.html#gs.mdyh9o.
© Intel Corporation. Intel, o logotipo Intel e outras marcas Intel são marcas comerciais da Intel Corporation ou de suas subsidiárias. Outros nomes e marcas podem ser propriedade de outras empresas.