Em artigo recente intitulado "When AI builds itself", a Anthropic delineou os primeiros estágios práticos da melhoria recursiva de inteligência artificial. A tese central é sustentada por uma mudança operacional interna dramática: em maio de 2026, mais de 80% de todo o código integrado à base da empresa foi escrito pelo Claude. O número representa um salto em relação às taxas de um dígito registradas antes do lançamento do Claude Code em fevereiro de 2025. A transição indica que os modelos deixaram de ser apenas ferramentas de uso para se tornarem componentes ativos na arquitetura que desenvolve a próxima geração de sistemas.
A automação da engenharia e pesquisa
A eficiência operacional dentro da Anthropic foi reconfigurada pela delegação da execução. Os engenheiros da companhia estão integrando oito vezes mais código por dia do que em 2024, um aumento impulsionado pelo redirecionamento do trabalho humano para a supervisão. Em tarefas de codificação abertas e sem especificações claras, a taxa de sucesso do Claude atingiu 76% em maio de 2026, um avanço de 50 pontos percentuais em seis meses. Em um caso prático documentado, o modelo isolou e corrigiu uma falha que derrubava dezenas de milhares de rotinas de treinamento em cerca de duas horas — um processo que exigiria até três dias de esforço humano. Além da geração, simulações retrospectivas indicaram que a revisão automatizada teria evitado um terço dos bugs que causaram incidentes de produção no domínio claude.ai.
O impacto se estende à pesquisa de alinhamento. Em testes de otimização de código, enquanto um pesquisador humano levaria horas para atingir um ganho de velocidade de quatro vezes, o modelo Claude Mythos preview, em abril de 2026, registrou uma aceleração de 52 vezes. A disparidade ficou evidente no problema de supervisão de modelos: enquanto dois pesquisadores humanos levaram sete dias para recuperar 23% da lacuna de performance entre um modelo fraco e um forte, nove agentes paralelos baseados no Claude Opus 4.6 operaram por 800 horas cumulativas e recuperaram 97% da capacidade, a um custo de US$ 18 mil em processamento.
O esgotamento dos benchmarks e a governança
A aceleração interna da Anthropic é corroborada por dados da organização de pesquisa METR, que mede o horizonte de tempo de tarefas autônomas. A capacidade dos modelos saltou de resoluções de quatro minutos com o Claude Opus 3 (março de 2024) para 16 horas com o Mythos preview. A velocidade de duplicação dessa métrica encolheu de sete para quatro meses, saturando benchmarks públicos como SWEBench e Corebench. Segundo Krishna Rao, CFO da Anthropic, a automação transbordou da engenharia para o corporativo: o fechamento financeiro mensal agora chega a 95% de prontidão via IA antes da intervenção humana, reduzindo relatórios de horas para trinta minutos.
O cenário força um reconhecimento público sobre a dinâmica competitiva. O documento de governança da OpenAI ecoa a visão da Anthropic sobre os sinais de melhoria recursiva e a pressão entre desenvolvedores e nações. A Anthropic projeta três futuros possíveis: uma estagnação por gargalos físicos — onde sistemas atuais ainda causam impactos massivos, como o Project Glasswing que identificou mais de 10 mil vulnerabilidades críticas de software —, uma aceleração onde 100 pessoas produzem o equivalente a 10 mil, ou o autodesenvolvimento recursivo total.
A conclusão da Anthropic de que apenas uma pausa coordenada e verificável entre múltiplos laboratórios seria eficaz expõe a armadilha do setor: recuos unilaterais apenas transferem a liderança. Para contexto, a BrazilValley aponta que a transição de engenheiros de software para gestores de frotas de agentes autônomos altera fundamentalmente a economia do desenvolvimento de tecnologia, substituindo o gargalo da execução humana pela disponibilidade de poder computacional. O desafio que resta às instituições não é mais acelerar a capacidade técnica, mas garantir mecanismos de verificação antes que a arquitetura dos próximos modelos seja inteiramente opaca aos seus próprios criadores.
Fonte · Brazil Valley | Technology




