Negócios Negócios

DeepSeek lança modelo de IA “topo de linha” um ano depois de chocar o mundo

24/04/2026 às 18h31

Por: Redação Fonte: Bloomberg

Compartilhe:

DeepSeek lança modelo de IA “topo de linha” um ano depois de chocar o mundo.

Startup chinesa apresenta a família V4, diz superar grandes modelos em testes, corta preço por token e acirra a disputa com OpenAI, Google e Anthropic.

Um ano depois de sacudir o Vale do Silício com sua tecnologia, a chinesa DeepSeek colocou no ar versões de prévia de um novo modelo de inteligência artificial considerado seu carro-chefe — e já o vende como “a plataforma open source mais poderosa do mercado”, em um recado direto para rivais como OpenAI e Anthropic.

Continua após a publicidade

A startup apresentou as séries V4 Flash e V4 Pro, dizendo que os modelos têm desempenho de ponta em testes de programação e trazem avanços importantes em raciocínio e em tarefas feitas por agentes autônomos.

Segundo a empresa, eles chegam com mudanças na arquitetura e melhorias de otimização, detalhadas em uma publicação no Hugging Face. A DeepSeek destacou uma técnica batizada de Hybrid Attention Architecture, que, de acordo com a companhia, melhora a capacidade do modelo de lembrar perguntas e respostas ao longo de conversas longas.

Continua após a publicidade

A janela de contexto também foi ampliada para 1 milhão de tokens — o que permite enviar bases de código inteiras ou documentos muito extensos em um único prompt.

O V4 surge mais de um ano depois de a DeepSeek, sediada em Hangzhou, ter disparado uma venda de ações que apagou mais de US$ 1 trilhão em valor de mercado com o lançamento do R1, um modelo aberto que imita o processo de raciocínio humano. O R1 chegou a rivalizar com sistemas de IA de ponta de empresas como a OpenAI, mas teria sido desenvolvido a uma fração do custo dos concorrentes americanos.

Na bolsa chinesa, as ações de fabricantes locais de chips dispararam nesta sexta-feira, com investidores apostando que o novo modelo deve sustentar a demanda por semicondutores produzidos na China.

Em uma postagem no WeChat, a DeepSeek reconheceu que a capacidade de serviço da linha V4 Pro ainda é “extremamente limitada”, por causa da falta de infraestrutura computacional.

A expectativa da empresa é que o custo de uso dos modelos caia de forma relevante depois da entrada em operação, no segundo semestre, de clusters equipados com chips Ascend 950, da Huawei Technologies Co. A startup também negocia com Tencent e Alibaba sua primeira rodada de captação com investidores externos.

A nova família de modelos é mais um salto em escala e eficiência — duas marcas da trajetória da DeepSeek — e aumenta a pressão competitiva sobre os rivais. Depois do R1, gigantes de tecnologia e investidores chegaram a repensar a lógica de despejar bilhões de dólares em projetos de IA.

Esse movimento, porém, perdeu força: empresas americanas de tecnologia devem investir algo em torno de US$ 650 bilhões em 2026 só em infraestrutura de IA e data centers.

O sistema de 1 trilhão de parâmetros da DeepSeek usa a técnica Mixture-of-Experts (mistura de especialistas), que aciona apenas uma parte dos “experts” do modelo em cada tarefa, ativando no máximo 37 bilhões de parâmetros por requisição. Com isso, o custo de inferência fica bem abaixo do de outros modelos de fronteira com escala semelhante.

Segundo a empresa, o DeepSeek-V4 Pro custa só uma fração do que cobram os principais laboratórios dos EUA. Os tokens de entrada — o texto enviado pelo usuário — saem a US$ 1,74 por milhão, enquanto os tokens de saída — a resposta do modelo — custam US$ 3,48 por milhão. No Claude Sonnet 4, modelo topo de linha da Anthropic, o milhão de tokens de entrada custa US$ 3, e o de saída, US$ 15.

A combinação de arquitetura e técnicas coloca a DeepSeek em confronto direto com os modelos mais recentes de OpenAI, Google e Anthropic. Nesta sexta, a startup afirmou que supera o desempenho de sistemas como o GPT-5.2, da OpenAI, em benchmarks padronizados, mas admitiu que o V4 ainda está de 3 a 6 meses atrás dos modelos mais avançados do mercado.

Mesmo assim, a empresa faz questão de dizer que não está jogando apenas o jogo da “força bruta”, e sim o da redução de custos. O V4 foi desenhado para rodar em infraestrutura mais barata, o que pode apertar ainda mais o cerco a outras empresas chinesas de IA, como a MiniMax.

“Minimax e Zhipu, por serem provedoras independentes de modelos, sempre vão ficar expostas à concorrência, principalmente de grandes plataformas de internet ou de nuvem, que têm muito mais alcance e distribuição”, disse Vey-Sern Ling, diretor-gerente do Union Bancaire Privée. “No fim das contas, a diferença de desempenho entre modelos tende a ficar imperceptível para a maioria dos usuários.”

O avanço da DeepSeek no ano passado desencadeou uma corrida em torno da IA na China, com gigantes como Alibaba e Baidu despejando no mercado serviços baratos de inteligência artificial. Rivais como ByteDance, Zhipu e Minimax correram para revisar e relançar seus modelos nas semanas que antecederam abril, numa tentativa de não ficar para trás.

Com o estrelato, veio também o escrutínio. Líderes de empresas de tecnologia e autoridades dos EUA acusam a DeepSeek de usar técnicas e hardwares proibidos para treinar seus sistemas.

OpenAI e Anthropic já afirmaram que a DeepSeek recorreu à “destilação” — processo em que a saída de outros modelos de IA é usada para treinar um sistema com capacidades semelhantes. As duas empresas americanas dizem ter detectado esse tipo de uso vindo da startup chinesa, e a OpenAI começou a levantar o assunto nos bastidores logo após o lançamento do R1.

Há ainda a suspeita de que a DeepSeek tenha acesso a chips de IA da Nvidia que estão na lista de componentes vetados para a China. Segundo pessoas a par do tema, o governo americano acredita que a startup usou processadores Blackwell, da Nvidia — efetivamente proibidos para o mercado chinês — em um data center na região da Mongólia Interior.

* O conteúdo de cada comentário é de responsabilidade de quem realizá-lo. Nos reservamos ao direito de reprovar ou eliminar comentários em desacordo com o propósito do site ou que contenham palavras ofensivas.