A formação do Optical Compute Interconnect Multi-Source Agreement (OCI MSA) no início deste ano marcou um ponto de inflexão na infraestrutura de computação de alta performance. Com o apoio de pesos-pesados como AMD, Broadcom, Meta, Microsoft, NVIDIA e OpenAI, o consórcio estabeleceu uma especificação técnica para redes de escala co-empacotadas, ou CPO. O consenso técnico recaiu sobre uma arquitetura de modulação lenta e larga, utilizando o formato não-retorno-a-zero (NRZ) combinado com multiplexação por divisão de comprimento de onda. A primeira geração, OCI GEN1, suporta quatro comprimentos de onda a 50 Gbps por canal, totalizando 200 Gbps por direção em cada fibra, com um roteiro claro que aponta para 1,6 Tbps no futuro.
Embora o acordo tenha encerrado o debate arquitetônico sobre a direção das redes para IA, ele deixou em aberto a questão mais complexa: como sustentar o escalonamento da largura de banda à medida que a demanda por memória e capacidade de processamento cresce exponencialmente. A resposta não reside apenas no design, mas na capacidade de fabricar arrays de lasers de precisão em volumes massivos. A indústria agora enfrenta o desafio de transitar de um modelo de montagem discreta para processos de integração heterogênea, que se assemelham à evolução histórica dos semicondutores CMOS.
O limite da arquitetura atual
A decisão de adotar a modulação NRZ baseia-se em uma lógica rigorosa de eficiência energética. Em taxas de símbolos baixas, o consumo de energia por bit é significativamente menor do que em esquemas mais complexos como o PAM-4, que, embora entregue dois bits por símbolo, exige uma potência óptica muito superior para manter a integridade do sinal. Ao optar pela estratégia de "lento e largo", o consórcio garante que a latência permaneça previsível e os custos de energia sob controle, preservando a eficiência necessária para clusters que já operam no limite térmico.
No entanto, a escalabilidade futura depende da multiplicação de comprimentos de onda dentro da mesma infraestrutura de fibra. Enquanto o OCI GEN1 utiliza quatro comprimentos de onda, o roteiro da indústria, incluindo propostas da NVIDIA e de empresas como a Ayar Labs, aponta para 16 ou mais. O desafio é que cada aumento no número de comprimentos de onda exige um salto qualitativo na fabricação. O que hoje é uma especificação de design deve se tornar um elemento de circuito integrado, sob pena de tornar a montagem de componentes discretos um gargalo financeiro e operacional intransponível.
A era da integração heterogênea
A história da fotônica está seguindo o caminho trilhado pela indústria de semicondutores. Inicialmente, a montagem era puramente discreta, com componentes alinhados manualmente. A segunda era, a da fotônica de silício, trouxe a integração em wafers, mas falhou ao não conseguir incorporar materiais III-V essenciais para lasers e amplificadores ópticos, mantendo um gargalo na interface entre o silício e os componentes externos. A terceira era, a da integração heterogênea, é onde a indústria se encontra agora.
Ao combinar materiais de ganho III-V diretamente com fotônica de silício em um único fluxo de wafer, a indústria pode finalmente tratar lasers e moduladores como elementos de circuito. Isso reduz drasticamente a complexidade da montagem, elimina pontos de falha em alinhamentos de fibra e permite que a produção siga a curva de aprendizado de fundições de semicondutores. A adoção de padrões como o SHIP (Scintil Heterogeneous Integrated Photonics) exemplifica essa mudança, permitindo processos de manufatura que já operam em linhas de produção de 200 mm e planejam a transição para 300 mm.
Implicações para o ecossistema de IA
A capacidade de escalar a largura de banda sem aumentar proporcionalmente a contagem de fibras é o fator determinante para o tamanho dos clusters de IA em 2028 e além. Clusters maiores e com menor latência permitem janelas de contexto estendidas e modelos com mais camadas, o que se traduz diretamente em maior capacidade de raciocínio lógico para as IAs. Para os fornecedores, a pergunta estratégica não é mais apenas sobre o desempenho do chip, mas sobre a capacidade de sua arquitetura de fonte de luz suportar 16 comprimentos de onda sem a necessidade de reengenharia total.
Empresas que não resolverem essa questão de fabricação agora estarão fadadas a reconstruir seus programas de hardware em dois anos, quando a demanda por densidade de largura de banda tornar as soluções atuais obsoletas. O alinhamento dos grandes players em torno do OCI MSA é um primeiro passo necessário, mas a vitória competitiva pertencerá àqueles que dominarem a integração heterogênea como um processo de fundição, e não como uma tarefa de montagem de módulos.
O caminho para o silício fotônico
O que permanece incerto é a velocidade com que as fundições conseguirão escalar essa integração heterogênea para atender à demanda global por datacenters de IA. A transição de protótipos de laboratório para milhões de unidades por mês exige uma maturidade de processo que a fotônica ainda está conquistando. Observar a adoção de plataformas de integração nativa será crucial para entender quais fornecedores manterão a liderança tecnológica.
A arquitetura está definida, mas a execução industrial ditará os vencedores da próxima década. A convergência entre design de rede e processos de fabricação de semicondutores não é apenas uma tendência, é a única rota viável para sustentar o crescimento da inteligência artificial. A indústria agora transita de uma era de montagem manual para uma era de processo de nó, onde a fotônica é finalmente tratada com a elegância do silício.
Com reportagem de Brazil Valley
Source · The Register





