A transição da direção autônoma de um experimento para operação comercial exige uma reavaliação profunda das arquiteturas de inteligência artificial. A Waymo, que ultrapassou 20 milhões de corridas sem motorista — metade delas realizadas em um intervalo de apenas sete meses —, fundamenta essa expansão na rejeição à simplicidade dos modelos "end-to-end" tradicionais. Em vídeo publicado no canal Brazil Valley | Mobility em 1 de maio de 2026, Dmitri Dolgov detalha o sistema que atualmente percorre mais de 4 milhões de milhas autônomas semanalmente. O executivo argumenta que o setor sofre historicamente com ciclos de euforia porque a barreira de entrada técnica é baixa, mas a execução de um produto final com segurança sobre-humana exige infraestruturas de validação que modelos puramente estatísticos não oferecem isoladamente.

A arquitetura do modelo fundacional

A base tecnológica da operação reside no que Dolgov classifica como o modelo fundacional da Waymo. O sistema atua como um modelo multimodal de linguagem, ação e mundo, encarregado de alimentar três pilares da inteligência artificial da empresa: o motorista, o simulador e o crítico. Segundo o executivo, o modelo processa imagens, vídeos, radares e lidars, exigindo uma compreensão rigorosa das propriedades espaciais em três dimensões e da física do trânsito. A integração com modelos de linguagem visual (VLMs) fornece o contexto semântico e social necessário para a navegação urbana.

Para contexto, a BrazilValley aponta que o debate sobre arquiteturas "end-to-end" — onde um único modelo neural mapeia a entrada de sensores diretamente para comandos de direção — divide a indústria automotiva, com algumas empresas apostando exclusivamente nessa via para reduzir a complexidade do código de seus sistemas.

Dolgov reconhece as vantagens de sistemas "end-to-end" na criação de representações ricas entre percepção e planejamento, mas afirma taxativamente que a versão básica dessa arquitetura é insuficiente para atingir escala. A Waymo optou por contornar essa limitação ao aumentar as representações aprendidas da rede com representações intermediárias estruturadas e materializadas. Essa escolha arquitetônica específica permite a validação do agente no mundo físico em tempo real, viabilizando avaliações em loop fechado e funções de recompensa complexas para aprendizado por reforço.

Escala operacional e a métrica de segurança

A maturidade dessa infraestrutura de software permitiu uma transição agressiva no mercado. Após levar oito anos para estabelecer operações em quatro cidades, a empresa recentemente lançou o serviço em outras quatro praças em um único dia. Atualmente operando em 11 cidades americanas, a Waymo prepara operações para Londres e Tóquio ainda este ano. O ganho de escala é suportado pela sexta geração de hardware da companhia, cujo desenvolvimento focou na redução drástica de custos e simplificação para produção em alto volume.

O ritmo de expansão reflete os dados acumulados em mais de 170 milhões de milhas percorridas em total autonomia. Dolgov afirma que o sistema apresenta uma taxa de colisões com ferimentos graves 13 vezes menor que a de motoristas humanos nas mesmas cidades, o que estatisticamente previne um ferimento grave a cada oito dias de operação.

A capacidade de antecipação do software é evidenciada quando a fusão de sensores supera a linha de visão humana. Dolgov relatou um evento em São Francisco onde o sinal do lidar, ao rebater no asfalto por baixo da carroceria de um ônibus, detectou o movimento dos pés de um pedestre oculto. A partir desse retorno esparso de dados, a inteligência artificial previu a trajetória do indivíduo e freou preventivamente antes que ele emergisse na frente do veículo.

A trajetória descrita ilustra a diferença fundamental entre demonstrações tecnológicas e produtos de infraestrutura crítica. Enquanto o desenvolvimento inicial em mobilidade autônoma atrai capital pela facilidade de gerar protótipos funcionais, a viabilidade comercial depende de arquiteturas que priorizem a redundância estruturada e a explicabilidade. O sucesso da expansão internacional e a adoção da nova geração de hardware determinarão se a liderança técnica se traduzirá em um domínio prático do transporte urbano.

Fonte · Brazil Valley | Mobility