A DeepSeek, uma startup chinesa de inteligência artificial, causou um grande impacto no setor de tecnologia com seu modelo R1.
Esse modelo, que compete com os melhores da OpenAI, foi desenvolvido com custos muito menores, levantando questões sobre como a empresa alcançou esse feito.
A NVIDIA, gigante das GPUs, entrou na discussão para esclarecer as coisas.
O que é o modelo R1 da DeepSeek?
O modelo R1 da DeepSeek é um avanço significativo no campo da inteligência artificial.
Ele é capaz de competir com modelos como o o1 da OpenAI, mas com um custo de treinamento muito menor.
Enquanto empresas como a OpenAI gastam bilhões de dólares para desenvolver seus modelos, a DeepSeek conseguiu criar o R1 com menos de US$ 6 milhões.
Esse feito impressionante levantou muitas perguntas.
Como a DeepSeek conseguiu isso? Eles usaram hardware proibido? A NVIDIA entrou na discussão para esclarecer essas dúvidas.
A polêmica das GPUs da NVIDIA
Uma das maiores questões em torno do sucesso da DeepSeek é o uso de GPUs da NVIDIA.
As GPUs são essenciais para treinar modelos de IA, e as mais avançadas, como a H100, não podem ser vendidas para a China devido às restrições de exportação dos EUA.
Alexandr Wang, CEO da Scale AI, afirmou que a DeepSeek teria cerca de 50 mil GPUs H100.
Essa declaração gerou muita especulação, já que seria impossível para a DeepSeek adquirir tantas GPUs avançadas legalmente.
Elon Musk até endossou a afirmação de Wang, aumentando ainda mais a polêmica.
Obviously
— Elon Musk (@elonmusk) January 27, 2025
A resposta da NVIDIA
A NVIDIA respondeu às especulações, afirmando que o trabalho da DeepSeek é um “avanço excelente” e que foi feito de forma totalmente compatível com as restrições de exportação dos EUA.
A empresa explicou que a DeepSeek usou uma técnica chamada “Test Time Scaling”, que permite criar novos modelos usando hardware amplamente disponível e dentro das regras.
A NVIDIA também destacou que a inferência (o processo de executar modelos de IA) ainda requer um grande número de GPUs e redes de alta performance.
Isso significa que, mesmo com o avanço da DeepSeek, a demanda por produtos da NVIDIA continuará alta.
Impacto no mercado e nas ações da NVIDIA
O sucesso da DeepSeek teve um impacto imediato no mercado.
As ações da NVIDIA caíram 17% em um único dia, refletindo o medo de que o avanço da DeepSeek reduzisse a necessidade de hardware caro, como as GPUs da NVIDIA.
A empresa perdeu sua posição como a segunda empresa mais valiosa do mundo, caindo para o terceiro lugar.
No entanto, a NVIDIA acredita que o trabalho da DeepSeek não ameaça seu negócio.
Pelo contrário, a empresa vê o avanço como uma oportunidade para expandir o uso de suas GPUs em novas aplicações de IA.

O que é Test Time Scaling?
A técnica usada pela DeepSeek, chamada Test Time Scaling, é um conceito novo no campo da IA.
Ela permite que modelos de IA já treinados usem mais poder de computação durante a execução para melhorar suas respostas.
Isso significa que, mesmo com um modelo treinado com menos recursos, é possível obter resultados melhores durante o uso.
Essa técnica já é usada em alguns modelos da OpenAI e agora foi aplicada com sucesso pela DeepSeek.
A NVIDIA vê isso como uma evolução natural das leis de escalabilidade na IA, que antes se concentravam apenas no pré e pós-treinamento.

O futuro da IA e da NVIDIA
O avanço da DeepSeek com o modelo R1 mostra que a inteligência artificial está evoluindo rapidamente, com novas técnicas que reduzem custos e aumentam a eficiência.
A NVIDIA, apesar da queda nas ações, continua otimista.
A empresa acredita que a demanda por suas GPUs continuará crescendo, especialmente com o aumento do uso de técnicas como o Test Time Scaling.
Enquanto isso, a DeepSeek provou que é possível competir com gigantes da tecnologia usando criatividade e inovação.
O futuro da IA promete ser emocionante, com muitas novidades por vir.