O gargalo do avanço da inteligência artificial deixou de ser puramente o poder de processamento isolado de um chip e passou a ser a rede que os conecta. À medida que os transistores se aproximam do tamanho de átomos, esbarrando em limites de incerteza termodinâmica e quântica, a indústria de semicondutores optou por construir computadores fisicamente maiores. No entanto, essa expansão revela uma ineficiência estrutural: clusters que chegam a 100 mil GPUs passam boa parte do tempo ociosos, esperando a transferência de dados de chips vizinhos. Em entrevistas recentes nas instalações da Lightmatter em Palo Alto, executivos da companhia detalharam como a transição de elétrons para fótons na comunicação entre processadores tenta resolver esse entrave fundamental.

O gargalo elétrico e o limite físico da margem

O declínio da chamada escala de Dennard — a regra prática de que transistores menores usariam menos energia e rodariam mais rápido, que perdeu força por volta de 2006 — forçou a indústria a repensar a arquitetura. Hoje, o principal obstáculo para o treinamento de modelos de larga escala é o chamado "problema de margem" (shoreline problem). Steve Klinger, VP de produto da Lightmatter, explica que os sinais elétricos de alta velocidade dependem do perímetro físico do chip para escapar e se comunicar com outras unidades. Simplesmente não há mais espaço físico na borda do silício para adicionar as conexões necessárias.

A consequência direta é que os maiores supercomputadores da atualidade não operam como uma máquina coesa, mas como uma rede fragmentada de pequenos computadores amarrados por interconexões de baixa largura de banda. A comunicação elétrica tradicional sofre com resistência, indutância e capacitância, causando atrasos e perda de energia. Para contexto, a BrazilValley aponta que a busca por alternativas à sinalização elétrica em data centers tem mobilizado bilhões de dólares em pesquisa e desenvolvimento por parte das grandes provedoras de nuvem, que buscam extrair o máximo de eficiência de seus investimentos massivos em infraestrutura de IA.

A arquitetura fotônica e o ganho de escala

A proposta da Lightmatter é substituir o substrato de silício tradicional por um que utiliza luz para a transmissão de dados. Nick Harris, CEO e cofundador da empresa, destaca que a luz opera na faixa dos terahertz, em contraste com a casa dos gigahertz da eletrônica convencional. Sem os problemas de resistência e calor dos elétrons, a tecnologia permite que a largura de banda escape de qualquer ponto da área do chip, contornando o limite do perímetro.

O produto central dessa tese é o Passage, um chip de 200 por 200 milímetros capaz de conectar até 48 unidades de processamento. A próxima geração do hardware promete comunicação a mais de 100 terabits por segundo, utilizando 256 fibras ópticas. A engenharia por trás do sistema envolve guias de onda esculpidos no silício com poucas centenas de nanômetros de largura. Ritesh Jane, vice-presidente sênior de engenharia, detalha que dentro de um único guia de onda viajam 16 cores distintas de luz — em torno do comprimento de onda de 1300 nanômetros —, permitindo comunicação paralela impossível de ser replicada por sinais elétricos. Além da interconexão, a companhia desenvolve o Envise, um chip que combina eletrônica com fotônica para realizar as computações em si.

A transição para a fotônica de silício indica que a saturação da Lei de Moore não representa o fim do ganho de escala computacional, mas o esgotamento de um paradigma baseado puramente em elétrons. Se a infraestrutura exige que milhares de processadores ajam como um único supercomputador massivo, a capacidade de eliminar o gargalo de rede torna-se tão crítica quanto o design do processador. Sim Janowski, atual CFO da empresa após sete anos liderando relações com investidores na Nvidia, resume a tese: a capacidade de conectar milhões de chips na velocidade da luz será o vetor fundamental da computação pelas próximas décadas.

Fonte · Brazil Valley | Technology