Em debate recente sobre a abertura de capital da Cerebras, Steven Griner, fundador da fabricante de semicondutores Sphere Semi, destrinchou a tese técnica que diferencia a novata da hegemonia da Nvidia. A premissa central não é construir uma Unidade de Processamento Gráfico (GPU) superior, mas reverter a lógica de arquitetura da indústria. Enquanto a Nvidia escala interligando centenas de GPUs separadas — dependentes de memória de alta largura de banda (HBM) externa e conectores como o NVLink —, a Cerebras aposta no conceito de wafer-scale. A empresa mantém o disco de silício (wafer) inteiro como um único processador gigante, integrando memória SRAM diretamente no chip. A abordagem elimina gargalos de comunicação externa, resultando em latência ultrabaixa.
O gargalo da inferência e o milagre do yield
O desafio histórico da fabricação em grande escala é a proporção de chips funcionais, conhecida como yield. Griner aponta que, tradicionalmente, quanto maior a área do silício impressa pelas máquinas de litografia ultravioleta extrema (EUV), maior a probabilidade de falhas e pior o aproveitamento final. A Nvidia contorna isso fatiando o wafer em centenas de GPUs menores; as defeituosas são descartadas. A Cerebras, ao manter o disco intacto, desenvolveu um método de engenharia para contornar fisicamente os pontos mortos no silício, alcançando taxas de aproveitamento estimadas acima de 30% — um número que Griner classifica como um feito essencial para viabilizar as margens do negócio.
Essa arquitetura monolítica posiciona a Cerebras para uma demanda específica do mercado de inteligência artificial: a fase de inferência. Embora os clusters da Nvidia continuem sendo indispensáveis para o treinamento de grandes modelos fundacionais, a geração de tokens sequenciais em aplicações de IA e agentes autônomos exige movimentação constante de dados. Ao concentrar a computação e a memória no mesmo ambiente físico, cortando a necessidade de transferir terabytes de dados para fora do chip, a Cerebras ataca diretamente o gargalo da latência.
Para contexto, a BrazilValley aponta que a transição do foco de mercado do treinamento para a inferência reflete a maturidade do ciclo de adoção de inteligência artificial, um movimento estrutural focado em custo e eficiência operacional que diversas outras startups de silício também tentam capitalizar em seus respectivos nichos.
Soberania computacional e a dependência da TSMC
Além da vantagem técnica, Griner destaca um apelo geopolítico para a arquitetura da Cerebras. Nações de médio porte demonstram preocupação crescente com a soberania de sua infraestrutura tecnológica. Governos buscam evitar a dependência exclusiva de provedores de nuvem americanos (hyperscalers) ou de infraestrutura chinesa capitaneada pela Huawei. A capacidade de adquirir um cluster de inferência denso e autônomo, sem precisar construir um data center na escala exigida pelo ecossistema da Nvidia, oferece a esses países uma rota alternativa para internalizar o processamento de dados críticos de finanças, saúde e defesa.
Apesar dessa promessa de independência arquitetônica, a cadeia de suprimentos global permanece estrangulada em Taiwan. A Cerebras continua dependente das fundições da TSMC para imprimir seus processadores. Griner nota que, embora a abordagem de wafer único simplifique a cadeia por reduzir a dependência de componentes periféricos como a memória HBM, ela não resolve o limite físico da capacidade global de litografia.
A longo prazo, a mitigação desse risco geopolítico passa pela construção de capacidade de fabricação em solo americano. O fundador da Sphere Semi relata que a Intel historicamente enfrentou resistência do mercado de design de chips devido a um histórico de mau atendimento ao cliente em seus serviços de fundição, contrastando com a eficiência comercial da TSMC. Contudo, a expectativa da indústria é que as novas fábricas da TSMC no Arizona e os esforços de reestruturação da Intel gradualmente reduzam a dependência absoluta da ilha asiática.
No limite, a tese em torno da Cerebras transcende a simples competição por volume de processamento bruto. A empresa oferece uma resposta estrutural à latência da inferência e uma alternativa tática para governos que buscam fugir do bloqueio imposto pelo ecossistema fechado das gigantes. Enquanto a própria Sphere Semi explora chips de sinais mistos para inteligência física em robótica militar junto ao Pentágono, o data center civil passa por uma fragmentação previsível. A hegemonia do treinamento pode continuar com a Nvidia, mas a infraestrutura de inferência começa a se adaptar às exigências de soberania e engenharia de precisão.
Fonte · Brazil Valley | Technology




