A ElevenLabs, startup de inteligência artificial focada em síntese de voz e áudio, está expandindo suas capacidades no segmento musical. Segundo reportagem do TechCrunch, a empresa desenvolve um novo modelo de geração de música que introduz maior controle sobre a edição das faixas. A principal funcionalidade reportada é a capacidade de regenerar seções específicas de uma música sem alterar o restante da composição. O movimento sinaliza uma tentativa de superar uma das limitações da IA generativa para áudio: a dificuldade de realizar ajustes pontuais mantendo a coesão da obra original.

O avanço do controle granular em áudio generativo

Até o momento, a geração de música por inteligência artificial tem operado frequentemente sob uma lógica de recriação total. Quando um usuário não está satisfeito com um trecho específico de uma faixa gerada, a alternativa comum é gerar um áudio inteiramente novo a partir de um prompt ajustado. O modelo em desenvolvimento pela ElevenLabs busca alterar essa dinâmica ao permitir edições isoladas, aproximando a interface de IA do fluxo de trabalho de softwares tradicionais de edição de áudio.

Além da edição segmentada, a ferramenta também suportará a transição de gêneros musicais no meio de uma mesma faixa, de acordo com a publicação. Essa flexibilidade técnica sugere um foco em criadores que demandam ferramentas capazes de refinar composições, e não apenas gerar rascunhos rápidos. Como a evidência atual se baseia em um relato ainda não confirmado oficialmente pela companhia, os detalhes técnicos exatos e o cronograma de lançamento permanecem em aberto.

A expansão de modelos de voz para a edição musical complexa ilustra a busca por maior utilidade prática no setor de áudio generativo. O desenvolvimento contínuo dessas capacidades testará a demanda do mercado por controles mais precisos sobre composições sintéticas.

Com reportagem de Brazil Valley

Source · TechCrunch