A trajetória da DeepMind reflete a tese fundacional de que a inteligência artificial geral (AGI) não emergirá de regras programadas, mas da exposição de agentes a ambientes simulados. Em vídeo publicado no canal Brazil Valley | AI em 25 de novembro de 2025, o cofundador Demis Hassabis argumenta que a resolução da inteligência é o passo fundamental para endereçar problemas científicos complexos. A estratégia da empresa, financiada inicialmente por investidores como Peter Thiel e posteriormente adquirida pelo Google, evitou o desenvolvimento imediato de produtos comerciais para focar em pesquisa pura. O modelo mental de Hassabis, moldado por sua experiência como prodígio do xadrez e desenvolvedor de comportamentos autônomos no jogo Theme Park, estabeleceu os jogos digitais como o campo de testes ideal para o desenvolvimento de redes neurais.
A arquitetura do aprendizado contínuo
O primeiro marco técnico documentado pela empresa foi a combinação de algoritmos de deep learning com aprendizado por reforço na execução de jogos de Atari. O sistema operava sem conhecimento prévio das regras, recebendo apenas os pixels da tela e o objetivo de maximizar a pontuação. Em jogos como Breakout, o agente descobriu autonomamente a estratégia ótima de cavar um túnel nas laterais para atingir a parte superior da estrutura.
A evolução desse método culminou no AlphaGo, sistema que derrotou o campeão mundial Lee Sedol. O pesquisador David Silver destaca que o algoritmo calculou uma probabilidade de apenas um em dez mil de que um humano executasse o chamado "movimento 37", revelando uma inovação tática fora do repertório histórico humano. O ex-CEO do Google, Eric Schmidt, afirma no vídeo que a vitória subsequente do sistema contra Ke Jie funcionou como um "momento Sputnik" para a China, desencadeando uma corrida global pela tecnologia.
A transição para o AlphaZero eliminou o uso de dados de partidas humanas, permitindo que o algoritmo aprendesse exclusivamente jogando contra si mesmo. O grau de complexidade aumentou com o AlphaStar, treinado para StarCraft II, um ambiente de fluxo contínuo e informação incompleta. Hassabis e sua equipe reconhecem que as capacidades demonstradas por esses agentes levantam questões sobre o uso militar da tecnologia, com o fundador se posicionando expressamente contra o armamento autônomo e criticando a filosofia de desenvolvimento baseada em "mover rápido e quebrar as coisas".
Da simulação à biologia estrutural
A infraestrutura teórica desenvolvida nos jogos foi redirecionada para o problema do enovelamento de proteínas, um desafio que Hassabis acompanhava desde seu período na Universidade de Cambridge. A premissa é que a determinação da estrutura tridimensional de uma proteína a partir de sua sequência de aminoácidos pode acelerar drasticamente a descoberta de medicamentos e o tratamento de doenças. Para contexto, a BrazilValley aponta que este redirecionamento de arquiteturas reflete uma transição mais ampla da indústria, onde métodos de força computacional bruta passam a ser aplicados nas ciências da vida.
A DeepMind desenvolveu o AlphaFold e o submeteu ao CASP, uma avaliação global bianual de predição de estruturas proteicas. Diferente dos jogos, onde os dados gerados em simulação são virtualmente infinitos, o treinamento para proteínas dependia de um conjunto de dados restrito, construído ao longo de décadas de experimentação laboratorial.
Na avaliação documentada, o AlphaFold alcançou o estado da arte, prevendo a estrutura mais precisa em 25 de 43 proteínas na categoria de maior dificuldade. Hassabis afirma que, apesar de superar a equipe segunda colocada por uma margem de quase 50%, o modelo ainda não havia resolvido o problema de forma definitiva para o uso prático de biólogos naquele estágio de desenvolvimento.
A progressão da DeepMind ilustra a viabilidade de construir sistemas generalistas que escalam de ambientes lúdicos fechados para problemas científicos de alta dimensionalidade. O desafio técnico migra da capacidade de processar regras perfeitas para a habilidade de inferir padrões em dados biológicos escassos. Se a AGI será alcançada por meio dessa arquitetura permanece em aberto, mas a metodologia de tratar a inteligência como um problema de otimização provou ser um dos vetores mais eficientes da pesquisa contemporânea.
Fonte · Brazil Valley | AI




