Em keynote na Computex 2026, Lip-Bu Tan, há 14 meses no cargo de CEO da Intel, utilizou o evento em Taiwan para reposicionar a fabricante como uma companhia estritamente focada em engenharia e execução. A tese central da apresentação estabelece que a transição da inteligência artificial generativa tradicional para a "IA agêntica" altera fundamentalmente a demanda por infraestrutura física. Enquanto a inferência convencional concentra o processamento pesado em GPUs, fluxos de trabalho agênticos — que iteram, planejam e utilizam ferramentas — exigem uma orquestração contínua que devolve o protagonismo às CPUs. O argumento da companhia é que o volume de tokens consumidos por agentes é ordens de grandeza maior, forçando o mercado a adotar arquiteturas heterogêneas.
A economia da IA agêntica e inferência híbrida
A estratégia da Intel para capturar essa demanda no ecossistema de PCs passa pela inferência híbrida. Aravind Srinivas, CEO da Perplexity, detalhou no palco a criação de um sistema operacional de IA que orquestra até 20 modelos diferentes. Utilizando as GPUs da linha Intel Core Ultra Series 3, o sistema permite que modelos menores rodem localmente para processar arquivos confidenciais — como dados financeiros em rodadas de fusões e aquisições —, enviando para a nuvem apenas o que não é sensível. Essa arquitetura visa maximizar o valor do token por watt, equilibrando privacidade e custo computacional.
Para sustentar essa adoção, a Intel afirma que seu processo de fabricação 18A já opera em escala total. A linha Core Series 3, introduzida em abril, alcançou quase 400 designs no mercado em poucos meses. A companhia também tenta expandir essa arquitetura para mercados adjacentes, como o de consoles portáteis. O chip gráfico Arc G3 foi apresentado como uma solução 40% mais rápida que a concorrência, consumindo metade da energia para rodar jogos de alto desempenho em resolução 1080p.
Arquitetura de rack e silício customizado
No data center, a resposta da Intel é o processador Xeon 6 Plus, construído sob a tecnologia 18A, equipado com 288 núcleos de eficiência (E-cores) e 576 MB de cache L3. Executivos demonstraram que, em pipelines agênticos, a proporção de uso entre CPU e GPU se aproxima da paridade, diferentemente da proporção histórica de treinamento onde as GPUs dominavam. Com a nova densidade, a Intel projeta que um único rack de 32U pode rodar até 150 mil agentes simultaneamente.
Para escalar essa infraestrutura, a companhia está abandonando a venda isolada de chips em favor do que chama de "Rack Scale Blueprints", desenvolvidos com parceiros como Foxconn. Rodrigo Liang, CEO da SambaNova, demonstrou uma arquitetura de inferência desagregada heterogênea que combina processadores Xeon 6, unidades RTU da SambaNova e GPUs da Nvidia. Segundo os testes apresentados, essa combinação reduz a latência de ponta a ponta e opera de duas a três vezes mais rápido do que o uso exclusivo de GPUs. Simultaneamente, a Intel oficializou sua entrada no mercado de silício customizado, fornecendo unidades de processamento de infraestrutura (IPUs) para o Google e chips de rede em escala global para a Ericsson.
Para contexto, a BrazilValley aponta que a tentativa de descentralizar o processamento de IA e otimizar arquiteturas de rack reflete um esforço do mercado corporativo para conter os custos de infraestrutura e reduzir a dependência histórica de clusters baseados puramente em aceleradores gráficos de um único fornecedor. O sucesso da Intel dependerá de sua capacidade de manter o volume de produção do processo 18A e de provar que a orquestração via CPU é, de fato, o eixo econômico da próxima década da inteligência artificial física, um mercado que a companhia projeta atingir US$ 25 trilhões até 2050.
Fonte · Brazil Valley | Technology




