7 pontos para entender como a DeepSeek pode mudar o jogo na corrida da IA

Nesta semana a DeepSeek foi alçada às manchetes e provocou tombos monumentais em ações de companhias de tecnologia que, até então surfavam no hype da Inteligência Artificial (IA). Mas qual o diferencial deste bot de conversação?

+ Saiba quem é Liang Wengfeng, nerd que fundou startup chinesa DeepSeek

+ Nvidia diz que DeepSeek é um ‘excelente avanço em IA’

Somente na segunda, 27, com a DeepSeek ganhando espaço na mídia, a Nvidia perdeu mais de US$ 380 bilhões em valor de mercado – cifra praticamente igual a cinco vezes o valor de mercado inteiro da Petrobras, que vale R$ 500 bilhões.

A tecnologia, apelidada de ‘ChatGPT da China‘, surgiu de forma disruptiva, com promessa de treinar modelos e se desenvolver de forma muito mais barata, simples e eficiente.

Basicamente, o chatbot usa chips de baixo custo e menos dados. Com isso a barreira de entrada do segmento, que parecia ser altíssima, pode agora ser encurtada, já que a tecnologia tem código-fonte aberto, permitindo que players menores tenham um custo muito menor para entrar no ramo e competir com a OpenAI, dona do ChatGPT.

Além disso, a tecnologia consegue rodar localmente, diferente do ChatGPT, que opera no formato de Software as a Service (SaaS), em que o modelo roda nos servidores da empresa e não na máquina do usuário.

Abaixo, 7 pontos para entender a nova Inteligência Artificial.

O que é a DeepSeek?

A DeepSeek é uma startup chinesa especializada em IA, sediada em Hangzhou.

Ela ganhou destaque ao desenvolver modelos de linguagem de grande escala, como o DeepSeek-V3, que demonstram desempenho comparável ao de soluções de empresas líderes como OpenAI e Google.

Ela tem uma abordagem econômica e eficiente no desenvolvimento de tecnologia de ponta, tornando a IA mais acessível a um público amplo.

Quem está por trás?

A DeepSeek foi fundada por Liang Wenfeng, cofundador de um hedge fund chamado High-Flyer. A empresa atraiu jovens talentos de universidades de elite chinesas, oferecendo altos salários e liberdade para explorar projetos de pesquisa de ponta, segundo informações do The Wall Street Journal.

Com isso, a startup conseguiu reunir uma equipe diversificada e altamente qualificada, impulsionando seu rápido avanço no campo da IA.

O que a empresa tem de diferente?

O grande diferencial é o custo, que é expressivamente menor.

Os pesquisadores da startup publicaram um artigo, na semana do dia 19 de janeiro, alegando que o treinamento do modelo DeepSeek-V3 custou cerca de US$ 6 milhões – ao passo que outras IAs, como as da OpenAI, demandaram cerca de US$ 100 milhões.

Basicamente a tecnologia utiliza chips menos avançados – os H800, mais baratos da Nvidia – e métodos de treinamento otimizados, alcançando eficiência sem sacrificar a qualidade.

Além disso, o modelo pode reavaliar suas decisões em tempo real, um fenômeno que os pesquisadores chamam de “momento aha”, que é uma novidade no nicho.

Quanto custa?

O foco em eficiência permite que a empresa ofereça custos substancialmente menores para as empresas que a adotam, por conta dos métodos de treinamento otimizados e hardware mais acessível.

Além dos chips mais baratos, a empresa também empregou técnicas inovadoras, como compressão de modelo, quantização e podas (pruning), que permitem reduzir o tamanho do modelo sem comprometer significativamente sua precisão. Assim, menos hardware é necessário, diminuindo os custos de treinamento e execução.

Além disso, a eficiência da DeepSeek na utilização de dados foi destacada. Enquanto modelos ocidentais dependem de vastas quantidades de dados, a startup chinesa prioriza o uso de dados pré-catalogados e mais seletivos, acelerando o treinamento e reduzindo os custos.

Essa eficiência econômica da DeepSeek não passou despercebida. Especialistas e líderes do setor já comentaram sobre como a startup conseguiu uma revolução nos custos.

Jon Withaar: Gerente sênior de portfólio da Pictet Asset Management, Withaar afirmou à Reuters que, se os números sobre os custos divulgados pela DeepSeek forem precisos, eles representam “uma mudança de paradigma”.

Marc Andreessen, empresário do Vale do Silício e cofundador da Mosaic e Netscape, classificou a DeepSeek como “um presente profundo para o mundo” em suas redes sociais.

Além disso, consultores tecnológicos na China e em outros países da Ásia têm elogiado a abordagem econômica da DeepSeek como um marco que democratiza o acesso à inteligência artificial.

Por que (e quem) a DeepSeek assusta?

A entrada da DeepSeek no mercado de IA gerou preocupações entre as gigantes tecnológicas estabelecidas.

Empresas como Nvidia, que fornecem hardware de ponta para IA, viram suas ações caírem, já que agora a percepção é de que a barreira de entrada no setor não é tão grande assim e não haverá uma demanda tão grande por hardware de alta performance.

O impacto da DeepSeek vai além das empresas diretamente envolvidas no desenvolvimento de inteligência artificial. Sua abordagem disruptiva exerce uma pressão no setor de tecnologia inteiro, ao remodelar a dinâmica do mercado.

Além da Nvidia – que sofreu o maior impacto -, gigantes como OpenAI e Meta também devem sofrer, já que são grandes empresas de inteligência artificial que lideraram o mercado até agora e investiram bilhões em pesquisa, treinamento de modelos e infraestrutura para manter suas soluções competitivas.

Em suma, o modelo econômico da DeepSeek questiona a sustentabilidade desse investimento.

Sobre a OpenAI, em específico, a DeepSeek é uma ameaça direta ao modelo de negócios da empresa de Sam Altman, já que ela se baseia no fornecimento de serviços centralizados via nuvem, dependendo de uma infraestrutura pesada para operar.

Desafios e riscos

Apesar de seu sucesso inicial, a DeepSeek enfrenta desafios significativos, por conta de restrições impostas pelos EUA à exportação de chips avançados para a China – justamente o fator que obrigou a empresa a ser flexível e estocar chips antes das restrições mais severas.

A crescente rivalidade entre China e Estados Unidos já colocou empresas chinesas como Huawei e TikTok no centro de polêmicas globais, e a DeepSeek não está imune a esse tipo de escrutínio.

Simultaneamente a rápida ascensão da DeepSeek pode atrair escrutínio regulatório e concorrência acirrada. A empresa, aliás, já sofreu seu primeiro ataque cibernético, que a obrigou a limitar os novos usuários.

Dentro do mercado, o modelo disruptivo da DeepSeek certamente abalou gigantes como OpenAI, Google e Nvidia, mas também despertou sua atenção, e são players com recursos quase ilimitados e equipes de ponta para reagir rapidamente às inovações da startup, ajustando suas abordagens e otimizando seus modelos para competir em custos e eficiência.

O fato de a DeepSeek ter adotado uma abordagem de código aberto também significa que outras startups poderão facilmente replicar ou adaptar suas soluções, criando uma competição ainda mais acirrada.

Impacto da DeepSeek no mercado de IA

O impacto direto é uma quebra de paradigma, já que a empresa põe em xeque a tese de que apenas empresas bilionárias poderiam dominar o setor de IA, mostrando que é possível treinar modelos avançados com custos muito mais baixos.

Marc Andreessen, empresário do Vale do Silício, disse, em suas redes sociais, que o modelo da DeepSeek é o ‘momento Sputnik’ do universo de IA, em alusão ao lançamento do satélite da União Soviética durante a corrida espacial.

“O Deepseek R1 é uma das descobertas mais incríveis e impressionantes que já vi – e, como código aberto, é um profundo presente para o mundo”, disse, em postagem no X, antigo Twitter.

O post 7 pontos para entender como a DeepSeek pode mudar o jogo na corrida da IA apareceu primeiro em ISTOÉ DINHEIRO.