Nos últimos dias, o cenário da Inteligência Artificial foi balançado com o lançamento da DeepSeek-R1, modelo de inteligência artificial chinês concorrente do ChatGPT que está tirando o sono de muita gente no Vale do Silício. Mas, afinal, o que tem de tão especial em mais um modelo que se junta a tantos outros como o Gemini, da Google, o Claude, da Anthropic, e o próprio ChatGPT? Vem cá que a gente lhe conta.
Até o lançamento desse modelo, existia a crença de que, para treinar e rodar modelos do tipo Large Language Model (LLM), era necessário um investimento bilionário. Estima-se que, para treinar o ChatGPT 4, a OpenAI tenha usado cerca de 25.000 placas NVIDIA A100. Cada placa dessas custa entre U$ 18.000 ~ U$ 20.000, rodando por cerca de 90 a 100 dias, sem contar demais custos, como energia, funcionários, coleta de dados e o custo de inferência (isto é, toda vez que você manda uma mensagem para ele e ele responde).
Por isso, também existia a crença de que apenas grandes empresas do setor, também conhecidas como BigTechs, pudessem ser players no jogo dos LLMs. Então, o cenário que havia se desenhado era este: A NVIDIA venderia os chips para essas grandes empresas criarem seus modelos, essas empresas “arrendariam” seus LLMs a outras empresas que quisessem customizá-los para suas operações, que por sua vez venderiam ou incorporariam esses modelos em seus produtos/serviços. Um negócio e tanto, não acha?
É aí que entra esse grupo de chineses com uma história, no mínimo, inusitada. O fundo de hedge quantitativo, High-Flyer, conhecido por elaborar modelos de Machine Learning para tomar decisões de investimento, decidiu começar um projeto paralelo em 2023 para desenvolver modelos com foco na busca pela inteligência artificial geral (do inglês, Artificial General Intelligence, AGI), e menos de dois anos depois o resultado é a DeepSeek.
O modelo causou esse burburinho todo por três principais razões: (I) os pesquisadores anunciaram que gastaram “apenas” U$ 5 milhões para treinar seus modelos, valor que é uma fração do gasto com modelos das BigTechs; (II) foram superados todos os modelos existentes nos benchmarks – testes usados para comparar performance de modelos; (III) foi publicado em mais de 13 artigos todo o passo a passo de desenvolvimento do modelo, bem como divulgado todo o código dele para qualquer pessoa baixar e rodar de graça em seu computador.
Assim, quem o fizer não precisará compartilhar informações confidenciais com servidores de terceiros na esperança de que essa informação não seja usada no futuro pelas BigTechs. Sim, você pode rodar um modelo supostamente melhor que o ChatGPT no seu computador ou assinar o serviço “premium” da DeepSeek por uma fração dos preços cobrados pela OpenAI.
Mas calma, que precisamos esclarecer uma coisa antes. A realidade não é tão simples quanto “você pode rodar um modelo melhor que o ChatGPT no seu computador”. A DeepSeek liberou vários modelos de pequeno porte, que conseguem ser rodados em telefones celulares, até modelos gigantes, que precisam de chips tão grandes quanto as placas NVIDIA A100, e são estes modelos que “venceram” o ChatGPT, entretanto até os modelos pequenos tiveram ganho de performance considerável, vencendo modelos bem maiores. Isso “abriu as portas” para um novo mundo, o mundo de aplicativos de LLMs, que poderão funcionar de maneira offline sem precisarmos confiar nossas conversas a grandes corporações ou servidores do Partido Comunista Chinês.
Essa “descentralização” da inteligência artificial não passou despercebida no mundo do dinheiro. Na segunda-feira, a NVIDIA perdeu quase U$ 600 bilhões em valor de mercado, mais que sete vezes o valor da Petrobrás, pela expectativa de que seus chips não sejam mais tão necessários num mundo que precisa de menos poder de processamento para treinar bons modelos. Pois foi isto o que o time da DeepSeek nos ensinou, que era possível fazer mais com menos.
Num dia em que os mercados de ações perderam mais de U$ 1 trilhão, alguns analistas chamaram esse de o momento “Sputnik” da Inteligência Artificial, uma referência ao lançamento do primeiro satélite artificial da Terra, em 4 de outubro de 1957, pela União Soviética, causando espanto aos americanos, que se viram atrás tecnologicamente, marcando o início da corrida espacial. Nessa briga de “Davi X Golias”, quem ganhou foi o usuário, com maior competição em função da entrada de um novo player. Agora fica a pergunta: qual será o “Projeto Apollo” de IA dos americanos?
A FIEC, por meio do Observatório da Indústria Ceará, oferece às empresas um panorama completo e atualizado sobre as tecnologias de Inteligência Artificial e seus potenciais impactos em diversos setores produtivos. A partir de técnicas de machine learning e deep learning, a solução aplica inteligência artificial para resolver problemas de negócios, proporcionando análises mais robustas e assertivas. Com nossos diagnósticos e análises personalizadas para cada ambiente industrial, as empresas podem se preparar para as mudanças, otimizar seus processos e tomar decisões estratégicas para se manterem competitivas nesse novo cenário da Inteligência Artificial.
Francisco José Matos Nogueira Filho
Cientista de Dados do Observatório da Indústria Ceará