A diversificação de chips da OpenAI abre espaço para startups de otimização de hardware

Para contornar a escassez e os altos custos dos processadores da Nvidia, desenvolvedores de inteligência artificial como a OpenAI e a Meta Platforms estão diversificando suas fontes de poder computacional. A estratégia envolve fechar acordos para utilizar uma variedade de chips de servidores de IA, buscando reduzir a dependência de um único fornecedor em um mercado de infraestrutura altamente estrangulado.

No entanto, a transição para novos hardwares não é automática. Laboratórios de IA precisam adaptar o código que treina e executa seus modelos para cada tipo específico de chip utilizado. Segundo relatos de mercado, a OpenAI, organização de pesquisa em IA criadora do ChatGPT, contratou a startup Gimlet Labs para ajudar a otimizar seus modelos para os processadores da Cerebras. A informação teria sido compartilhada pelo próprio CEO da Gimlet, Zain Asgar, indicando que o hardware alternativo já suporta o Codex-Spark, uma versão mais rápida da ferramenta de codificação da OpenAI.

O gargalo de software na adoção de novos hardwares

A necessidade de reescrever e ajustar códigos para diferentes arquiteturas revela uma camada de atrito na corrida pela diversificação de infraestrutura. A transição exige um trabalho intensivo de engenharia para traduzir operações matemáticas complexas para novos ecossistemas de software, fugindo dos padrões já estabelecidos pela indústria ao longo dos últimos anos.

É nesse vácuo que surgem empresas focadas no trabalho de base da otimização. A contratação de terceiros para realizar essa adaptação sugere que mesmo os maiores laboratórios de IA preferem terceirizar parte desse esforço operacional para manter o foco no desenvolvimento de modelos fundacionais. A Cerebras, fabricante de chips de IA que desenvolve processadores de grande escala, ganha tração nesse cenário de busca por alternativas, movimentando-se inclusive para uma aguardada oferta pública inicial (IPO) prevista para esta semana.

A fragmentação da infraestrutura de inferência

O movimento da OpenAI aponta para um futuro onde a infraestrutura de IA será cada vez mais heterogênea. Em vez de um monopólio prático de hardware, o ecossistema caminha para uma arquitetura onde diferentes chips são alocados para tarefas específicas. O uso dos processadores da Cerebras especificamente para o Codex-Spark demonstra como modelos de inferência e geração de código podem se beneficiar de hardwares especializados, buscando otimizar a relação entre custo e latência.

Essa fragmentação também se reflete em outras frentes operacionais e regulatórias da OpenAI. Enquanto a empresa busca eficiência no hardware, também navega por exigências de conformidade regional, como a sinalização de que concederá acesso a um novo modelo cibernético para a União Europeia — um contraste com concorrentes como a Anthropic, que mantêm restrições sobre certos lançamentos, como o modelo Mythos, na região. Juntos, esses sinais indicam um amadurecimento das operações, onde a gestão de infraestrutura física e a adaptação a mercados locais se tornam tão críticas quanto a pesquisa algorítmica.

A viabilidade de alternativas no mercado de chips dependerá, em grande parte, da facilidade com que os desenvolvedores conseguirem portar seus modelos para novas plataformas. O surgimento de startups dedicadas a essa tradução de código indica que o mercado está precificando esse atrito, criando uma nova camada de serviços na cadeia de suprimentos de inteligência artificial.

Com reportagem de Brazil Valley

Source · The Information

A diversificação de chips da OpenAI abre espaço para startups de otimização de hardware

O gargalo de software na adoção de novos hardwares

A fragmentação da infraestrutura de inferência

§ Leia também

A polarização do venture capital nos EUA: IA e biotech dominam megadeals da semana

OpenAI avalia adiar IPO — o fim da euforia cega por IA em Wall Street

Framework Ventures levanta US$ 400 milhões e abandona foco exclusivo em cripto