Versão 2

A versão 2 da API REST contém métodos que realizam a síntese de fala utilizando streaming. Isso significa que o áudio começa a ser entregue à aplicação assim que o processo de síntese é iniciado. O stream de áudio já pode então ser reproduzido, mesmo antes do áudio ser totalmente sintetizado.

Além disso, a versão 2 oferece métodos de apoio que permitem consultar os encoders e vozes disponiveis, facilitando a criação de aplicações.

Endpoint Resumo
/rest/v2/engineInfo Obtém informações sobre o CPqD Texto Fala.
/rest/v2/encoders Obtém a relação dos encoders de áudio disponíveis.
/rest/v2/voices Obtém a relação das vozes disponíveis.
/rest/v2/synthesize (POST) Converte texto em fala usando o método HTTP POST.
/rest/v2/synthesize (GET) Converte texto em fala usando o método HTTP GET.
/rest/v2/synthesize/ssml Converte documento SSML em fala usando o método HTTP POST.

Nota

Para oferecer maior eficiência, os endpoints de síntese executam síntese via streaming, ou seja, entregam a fala sintetizada na medida em que é gerada. Dessa forma, áudio recebido em formato RIFF WAVE (encoders cujo nome inicia com wav) podem não reproduzir corretamente em alguns players específicos, já que esse não é um formato projetado para streaming de áudio. Caso perceba problemas na reprodução, utilize o formato PCM Linear, que é a versão sem cabeçalho do WAV, ou outro de sua preferência.