NVIDIA fala sobre queda de 17% nas ações após DeepSeek

A DeepSeek, uma startup chinesa de inteligência artificial, causou um grande impacto no setor de tecnologia com seu modelo R1.

Esse modelo, que compete com os melhores da OpenAI, foi desenvolvido com custos muito menores, levantando questões sobre como a empresa alcançou esse feito.

A NVIDIA, gigante das GPUs, entrou na discussão para esclarecer as coisas.

O que é o modelo R1 da DeepSeek?

O modelo R1 da DeepSeek é um avanço significativo no campo da inteligência artificial.

Ele é capaz de competir com modelos como o o1 da OpenAI, mas com um custo de treinamento muito menor.

Enquanto empresas como a OpenAI gastam bilhões de dólares para desenvolver seus modelos, a DeepSeek conseguiu criar o R1 com menos de US$ 6 milhões.

Esse feito impressionante levantou muitas perguntas.

Como a DeepSeek conseguiu isso? Eles usaram hardware proibido? A NVIDIA entrou na discussão para esclarecer essas dúvidas.

A polêmica das GPUs da NVIDIA

Uma das maiores questões em torno do sucesso da DeepSeek é o uso de GPUs da NVIDIA.

As GPUs são essenciais para treinar modelos de IA, e as mais avançadas, como a H100, não podem ser vendidas para a China devido às restrições de exportação dos EUA.

Alexandr Wang, CEO da Scale AI, afirmou que a DeepSeek teria cerca de 50 mil GPUs H100.

Essa declaração gerou muita especulação, já que seria impossível para a DeepSeek adquirir tantas GPUs avançadas legalmente.

Elon Musk até endossou a afirmação de Wang, aumentando ainda mais a polêmica.

A resposta da NVIDIA

A NVIDIA respondeu às especulações, afirmando que o trabalho da DeepSeek é um “avanço excelente” e que foi feito de forma totalmente compatível com as restrições de exportação dos EUA.

A empresa explicou que a DeepSeek usou uma técnica chamada “Test Time Scaling”, que permite criar novos modelos usando hardware amplamente disponível e dentro das regras.

A NVIDIA também destacou que a inferência (o processo de executar modelos de IA) ainda requer um grande número de GPUs e redes de alta performance.

Isso significa que, mesmo com o avanço da DeepSeek, a demanda por produtos da NVIDIA continuará alta.

Impacto no mercado e nas ações da NVIDIA

O sucesso da DeepSeek teve um impacto imediato no mercado.

As ações da NVIDIA caíram 17% em um único dia, refletindo o medo de que o avanço da DeepSeek reduzisse a necessidade de hardware caro, como as GPUs da NVIDIA.

A empresa perdeu sua posição como a segunda empresa mais valiosa do mundo, caindo para o terceiro lugar.

No entanto, a NVIDIA acredita que o trabalho da DeepSeek não ameaça seu negócio.

Pelo contrário, a empresa vê o avanço como uma oportunidade para expandir o uso de suas GPUs em novas aplicações de IA.

NVIDIA revela benchmarks da série RTX 40 vs RTX 50 - Capa

O que é Test Time Scaling?

A técnica usada pela DeepSeek, chamada Test Time Scaling, é um conceito novo no campo da IA.

Ela permite que modelos de IA já treinados usem mais poder de computação durante a execução para melhorar suas respostas.

Isso significa que, mesmo com um modelo treinado com menos recursos, é possível obter resultados melhores durante o uso.

Essa técnica já é usada em alguns modelos da OpenAI e agora foi aplicada com sucesso pela DeepSeek.

A NVIDIA vê isso como uma evolução natural das leis de escalabilidade na IA, que antes se concentravam apenas no pré e pós-treinamento.

Jensen Huang fala sobre Test Time Scaling na CES 2025
Jensen Huang, CEO da NVIDIA, fala sobre Test Time Scaling na CES 2025

O futuro da IA e da NVIDIA

O avanço da DeepSeek com o modelo R1 mostra que a inteligência artificial está evoluindo rapidamente, com novas técnicas que reduzem custos e aumentam a eficiência.

A NVIDIA, apesar da queda nas ações, continua otimista.

A empresa acredita que a demanda por suas GPUs continuará crescendo, especialmente com o aumento do uso de técnicas como o Test Time Scaling.

Enquanto isso, a DeepSeek provou que é possível competir com gigantes da tecnologia usando criatividade e inovação.

O futuro da IA promete ser emocionante, com muitas novidades por vir.

Matérias que você pode gostar

Menor latência: Lexar lança memória ARES CL26

Joaquim Júnior

Intel lança update para correção dos Core Ultra 200S

Joaquim Júnior

Intel Arc B570 fica 12% abaixo da B580 em benchmark vazado

Joaquim Júnior

Este site usa cookies para melhorar sua experiência. Assumiremos que você está de acordo com isso, mas você pode optar por não aceitar, se desejar. Aceitar Saber mais