A revolução da inteligência artificial devora os seus filhos

A empresa chinesa de IA DeepSeek está a abalar o modelo de negócio da indústria emergente

 

Tomasz Konicz

 

As ondas de choque que o modelo chinês de IA DeepSeek provocou na indústria americana de alta tecnologia também produziram momentos irónicos e absolutamente cómicos. A criadora do ChatGPT, OpenAI, que é apoiada pela Microsoft, acusou a start-up chinesa de roubo de dados e espionagem. O modelo de negócio da pioneira americana da IA foi construído com base no “roubo de dados de toda a Internet”, para agora “se queixar de que o DeepSeek está a ser treinado com base nos resultados da OpenAI”, disse a PC Gamer citando o crítico tecnológico Ed Zitron.1 A equipa liderada pelo guru da IA Sam Altman iria agora tomar o seu “próprio remédio”, indignou-se Zitron. A OpenAI tinha concebido uma “máquina de plágio” e queixava-se agora de que os seus plágios estavam a ser utilizados para gerar novas máquinas de plágio.

A destilação do conhecimento é o que a indústria chama a este processo, no qual é possível poupar muito dinheiro e recursos utilizando os resultados de um modelo linguístico de grandes dimensões especificamente para treinar um modelo mais pequeno e mais barato. Não é por acaso que a OpenAI, em particular, se queixa da concorrência chinesa de baixo custo, que alegadamente completou o seu modelo por pouco menos de seis milhões de dólares – ironicamente, a pioneira da indústria da IA, que gosta de propagar agressivamente o seu potencial de racionalização económica global, parece estar simplesmente a perder o seu modelo de negócio. Os sistemas de IA proprietários e fechados pretendiam, na verdade – devido aos seus custos de formação gigantescos – ser monopolizados e vendidos pelos gigantes tecnológicos de Silicon Valley, uma vez que a aprendizagem automática conseguiu até agora devorar milhares de milhões de dólares. A OpenAI tornar-se-ia no entanto obsoleta na sua forma actual, assim que se generalizassem as inovações do modelo de língua chinesa, que é em grande parte de código aberto.

O DeepSeek desencadeou um choque disruptivo em que o software proprietário é derrotado pelo princípio do código aberto, que permite uma colaboração e uma inovação muito mais rápidas e globais (apenas o retardatário Meta também adoptou uma abordagem de código aberto com o seu grande modelo linguístico Llama – precisamente porque o Facebook & Cia. não dependem da receita do negócio de IA).2 Os sonhados lucros com software dos gigantes da indústria da IA seriam assim em grande parte destruídos, porque em breve todas as empresas de média dimensão estarão a encantar os seus clientes com ferramentas de IA igualmente irritantes, como a Microsoft fez com o seu já muito odiado Copilot – o Clippy da era da IA,3 por assim dizer – a um custo de milhares de milhões.4

Uma analogia com o mercado dos sistemas operativos pode ilustrar a ruptura que está agora a ocorrer: A indústria da IA queria seguir um modelo como o que a Microsoft vinha praticando com o seu sistema operativo Windows desde os anos 90, em que o próprio software é o produto monopolizado. Com o DeepSeek, o software torna-se gratuito e/ou mais barato, enquanto agora são os serviços e as personalizações, o “serviço” por assim dizer, que devem ser rentabilizados – à semelhança do que a Red Hat faz com a sua Enterprise Linux. Trata-se de um princípio comercial realista, mas este volume potencial do mercado da IA é muito mais pequeno, mesmo antes da sua ampla realização.

No entanto, os fabricantes de hardware cujas capacidades de computação tornaram possível o boom da IA também sofreram grandes perdas nas bolsas de valores após o choque da DeepSeek. A Nvidia, fabricante de placas gráficas, não só descobriu uma mina de ouro com as suas placas de computação adaptadas aos processos de IA, como também a monopolizou largamente, aumentando o preço das suas acções quase dez vezes em dois anos – depois do DeepSeek, caiu 20%. Todo o boom da IA, que na realidade apenas ele mantém o mercado financeiro dos EUA num boom especulativo (a UE já está em grande parte dissociada), corre o risco de se esgotar. E se as esperanças de um novo regime de acumulação, de novos mercados e de sectores económicos geradores de emprego rebentarem tão abruptamente como durante a deflação da bolha das “dot-com” na viragem do milénio? Um dos pilares mais importantes da economia americana, que na verdade só consegue manter a sua posição excepcional graças ao dólar americano, foi claramente quebrado por um massacre de preços de cerca de um bilião de dólares em fevereiro.5

O DeepSeek não está apenas a minar o boom do mercado financeiro dos EUA, a ferramenta de IA também coloca um desafio geopolítico e militar ao domínio de Washington, que agora só pode ser mantido graças ao poder da máquina militar dos EUA. É por isso que a Casa Branca – abstraindo dos chavões de Trump sobre o efeito promotor de inovação da concorrência – se moveu imediatamente para minimizar o alcance da aplicação e simplesmente proibir a sua utilização em agências governamentais.

O timing da publicação do DeepSeek tinha provavelmente também como objetivo humilhar a gigantomania de terawatts de Trump e dos seus tecno-oligarcas, que tinham anunciado um programa de investimento em IA de 500 mil milhões de dólares alguns dias antes com o Stargate, que agora parece simplesmente ridículo.6 O sinal que o capitalismo de Estado chinês está a enviar é claro: a eficiência chinesa vence a abordagem americana da força bruta. A China também demonstrou a ineficácia das sanções americanas sobre produtos de alta tecnologia, que se destinavam a impedir o desenvolvimento de uma IA chinesa competitiva no contexto da luta hegemónica entre Washington e Pequim – precisamente devido ao potencial assustador das aplicações militares dos sistemas de IA.

Pelo contrário, a DeepSeek afirma ter feito da necessidade uma virtude, com uma série de inovações nas fases de treino da IA que levaram a que a utilização de chips Nvidia se limitasse a 2048 modelos H800 mais antigos (a DeepSeek não confirmou a alegada destilação de conhecimentos que escandaliza a OpenAI).7 No entanto, um estudo do think tank informático SemiAnalysis veio agora lançar enormes dúvidas precisamente sobre estas vantagens de custos da concorrência chinesa.8 Segundo o estudo, o fundo de investimento chinês High-Flyer, que financiou o DeepSeek, dispõe de parques informáticos com cerca de 60.000 placas Nvidia, e as despesas com o pessoal altamente qualificado e o desenvolvimento de novos métodos de formação não estão incluídas no cálculo dos custos dos criadores do DeepSeek, pelo que as verdadeiras despesas do fundo de investimento High-Flyer na “República Popular” devem ascender a mil milhões de dólares.

Mesmo que grande parte deste contra-cálculo ocidental do custo corresponda à realidade, a sua lógica implícita está errada. O DeepSeek é de fonte aberta, os seus custos de desenvolvimento não desempenham qualquer papel na sua utilização posterior, as inovações processuais que estiveram na base do seu desenvolvimento não são mantidas em segredo, tornaram-se propriedade comum – e baixam inevitavelmente o preço dos serviços baseados em IA que a indústria informática americana queria monopolizar. O bolo da IA está a derreter-se. E estas inovações são reais, não são apenas uma cópia barata, como reconheceu a MIT Technology Review9 – os concorrentes dos EUA estão agora a trabalhar afincadamente para copiar estas inovações, que estão a ser promovidas pelas sanções de Washington. Os novos métodos de compressão, como a Multi-head Latent Attention, reduziram o consumo de memória e minimizaram os estrangulamentos resultantes de uma largura de banda de memória inadequada,10 por exemplo.

Outro passo inovador decisivo alcançado pelo DeepSeek é a automatização extensiva da fase de formação em várias etapas das máquinas de automatização. De acordo com o Financial Times (FT),11 a “grande inovação” do DeepSeek consiste em minimizar a utilização de mão de obra humana na “etiquetagem” correcta dos dados. De acordo com o FT, esta técnica, que é utilizada na fase final de formação e é designada internamente na indústria como “aprendizagem por reforço a partir de feedback humano” (RLHF), é dispendiosa e morosa, uma vez que requer um “pequeno exército de rotuladores de dados”.12 Os trabalhadores ao dia da era da IA, a maioria dos quais recebe menos de dois dólares americanos por hora e é normalmente recrutada em regiões periféricas como a América Latina ou África, passam o seu dia de trabalho a etiquetar repetidamente dados digitais para a IA – não muito diferente dos captchas de semáforos, bicicletas ou cães que costumam ser solicitados quando se introduzem palavras-passe.

E estas centenas de milhares de empregos miseráveis, que a indústria de alta tecnologia do século XXI está a fazer renascer do século XVIII, explorando-os como parte da RLHF, tornar-se-ão em breve obsoletos. Segundo o FT, a DeepSeek conseguiu automatizar a aprendizagem por reforço através de mecanismos digitais de recompensa que são activados quando o sistema de IA dá as respostas certas. Assim que este processo é repetido com frequência suficiente, o modelo de linguagem de grande dimensão começa a “resolver espontaneamente problemas sem supervisão humana”, uma vez ultrapassado um ponto de viragem. De acordo com a revista financeira, o DeepSeek começou a avaliar novamente as perguntas e a adaptar o seu tempo de computação às diferentes perguntas, fazendo eco de relatórios de investigadores chineses de IA. Para replicar este processo, já não são necessários trabalhadores ao dia de IA, mas “o seu modelo muito forte e pré-treinado” e uma infraestrutura muito boa para levar a cabo “o processo de aprendizagem reforçada em grande escala”.

A IA também devora os seus filhos pobres. No entanto, os assalariados da periferia do sistema mundial capitalista tardio, que correm agora o risco de perder até os seus empregos precários nos bairros de lata, serão em breve seguidos na obsolescência por milhões de empregados nos centros. Embora a IA venha a transformar radicalmente as sociedades dos centros, à semelhança do que aconteceu com a Internet e a primeira fase da digitalização, não irá provocar um boom económico a longo prazo, no sentido de um novo regime de acumulação que utilize massas de força de trabalho no processo de produção do capital.

O que acontece é o contrário. A dessubstanciação do capital e a expulsão do trabalho assalariado da produção de mercadorias e do sector dos serviços vão continuar. É por isso que os receios de uma quebra na procura de chips de IA são infundados; pelo menos a Nvidia continuará a beneficiar de uma procura saudável. Onde quer que “pessoas experientes continuem a premir os mesmos botões numa corrida” (FAZ), a pressão da racionalização mediada pelo mercado prevalecerá em primeiro lugar.13 As reduções de preço das unidades de treino para grandes modelos linguísticos só levarão a uma adaptação acelerada desta tecnologia no processo de valorização do capital, que só conseguiu manter a sua existência de zombie durante décadas graças à produção de procura gerada pelo crédito e de capital fictício nos mercados financeiros globais. O último eco desta economia global de bolhas da era neoliberal que se afunda é actualmente a bolha da IA nos EUA.

 

1 https://www.pcgamer.com/gaming-industry/the-brass-balls-on-these-guys-openai-complains-that-deepseek-has-been-using-its-data-you-know-the-copyrighted-data-its-been-scraping-from-everywhere/#comment-jump

2 https://www.nytimes.com/2025/01/29/technology/meta-deepseek-ai-open-source.html?searchResultPosition=6

3 https://9to5mac.com/2017/04/26/clippy-microsoft-office-mac/

4 https://www.zdnet.com/home-and-office/work-life/the-microsoft-365-copilot-launch-was-a-total-disaster/

5 https://www.dqindia.com/news/deepseek-sparks-1-trillion-tech-stock-meltdown-8662575

6 https://apnews.com/article/trump-ai-openai-oracle-softbank-son-altman-ellison-be261f8a8ee07a0623d4170397348c41

7 https://www.dw.com/de/deepseek-ki-aktie-b%C3%B6rse-nvidia-v3/a-71434687

8 https://winfuture.de/news,148575.html

9 https://www.technologyreview.com/2025/01/24/1110526/china-deepseek-top-ai-despite-sanctions/

10 https://towardsai.net/p/artificial-intelligence/a-visual-walkthrough-of-deepseeks-multi-head-latent-attention-mla-%EF%B8%8F

11 https://archive.ph/IeaPD#selection-2425.166-2453.178

12 https://www.cbsnews.com/news/labelers-training-ai-say-theyre-overworked-underpaid-and-exploited-60-minutes-transcript/

13 https://archive.ph/8itUg#selection-2523.37-2523.240

 

Original “Die KI-Revolution frisst ihre Kinder” in exit-onine.org. Antes publicado em konicz.info, 16.02.2025. Tradução de Boaventura Antunes

 

 

http://www.obeco-online.org/

http://www.exit-online.org/