A arquitetura econômica da inteligência artificial opera hoje sob a forma de um triângulo invertido. Diferente das revoluções da internet, do mobile e da nuvem — onde o software de baixo custo marginal capturou a maior parte do valor —, a geração atual de IA concentra sua receita na base da infraestrutura. Em vídeo publicado no canal Brazil Valley | AI em 9 de abril de 2026, Apoorv Agrawal, investidor da Altimeter Capital, argumenta que o custo incremental para operar aplicações de IA não é zero. Cada novo usuário exige queima contínua de processamento gráfico, destruindo as margens brutas de 80% a 90% típicas da era do software tradicional. O resultado é um ecossistema onde o hardware dita as regras financeiras, forçando uma reavaliação sobre como e quando os investimentos massivos em data centers se traduzirão em retornos reais.
A hegemonia do silício e o custo da inferência
Agrawal aponta que, nos últimos dois anos, cerca de US$ 350 bilhões em receita foram adicionados ao ecossistema de IA. Desse total, aproximadamente 75% fluíram diretamente para a camada de semicondutores. A disparidade de lucratividade é brutal: enquanto as receitas de data center da Nvidia operam com margens brutas próximas a 75%, as margens da camada de aplicações variam entre zero e 30%.
Essa concentração decorre da física do problema. O treinamento de modelos exige alta utilização previsível por curtos períodos, mas a fase de inferência — quando o modelo efetivamente responde aos usuários — é imprevisível e custosa. Segundo o investidor, a Nvidia reporta que cerca de 40% de sua frota é usada para inferência e 60% para treinamento, uma proporção que deve pender para a inferência no longo prazo à medida que o uso diário aumenta.
Para contexto, a BrazilValley aponta que a dinâmica de descompasso entre infraestrutura e software governou o início da era dos computadores pessoais, quando a expansão de capacidade de processamento e a construção de redes precederam em anos a viabilidade comercial de aplicações de massa, um paralelo histórico que ilustra a latência natural nos retornos de ciclos de capital intensivo.
O teto das assinaturas e o imperativo da publicidade
O estrangulamento financeiro é mais evidente nas aplicações voltadas ao consumidor. O ChatGPT alcançou a marca de um bilhão de usuários, monetizados a uma média de US$ 10 por usuário ao ano. Em contraste, a Alphabet extrai cerca de US$ 100 anuais de seus quatro bilhões de usuários, e a Meta gera US$ 70 anuais sobre uma base de três bilhões e meio. O abismo financeiro levanta dúvidas sobre o limite do modelo de assinaturas para financiar a infraestrutura subjacente.
Agrawal defende que o trabalho de conhecimento não será suficiente para atingir a escala e a receita das plataformas obrigatórias ou sociais. A solução matemática para elevar a receita média por usuário de US$ 10 para US$ 100 exigirá a introdução de publicidade nos modelos de IA. O investidor compara o ceticismo atual sobre anúncios em interfaces de chat à dúvida que cercou a capacidade do Facebook de monetizar o formato móvel durante seu IPO, sugerindo que a indústria encontrará o formato adequado para a nova mídia.
O ciclo de inteligência artificial ainda aguarda sua inversão econômica. Até que inovações em chips específicos reduzam o custo do processamento ou que novos modelos de publicidade financiem o uso massivo, o capital continuará preso na base da pirâmide. O desafio imediato não é provar que a tecnologia funciona, mas provar que a economia da inferência consegue sustentar a transição de um experimento de capital intensivo para um negócio de software estruturalmente rentável.
Fonte · Brazil Valley | AI




