Versão 2¶

A versão 2 da API REST contém métodos que realizam a síntese de fala utilizando streaming. Isso significa que o áudio começa a ser entregue à aplicação assim que o processo de síntese é iniciado. O stream de áudio já pode então ser reproduzido, mesmo antes do áudio ser totalmente sintetizado.

Além disso, a versão 2 oferece métodos de apoio que permitem consultar os encoders e vozes disponiveis, facilitando a criação de aplicações.

Endpoint	Resumo
/tts/rest/v2/engineInfo	Obtém informações sobre o Texto Fala.
/tts/rest/v2/encoders	Obtém a relação dos encoders de áudio disponíveis.
/tts/rest/v2/voices	Obtém a relação das vozes disponíveis.
/tts/rest/v2/synthesize `(POST)`	Converte texto em fala usando o método HTTP POST.
/tts/rest/v2/synthesize `(GET)`	Converte texto em fala usando o método HTTP GET.
/tts/rest/v2/synthesize/ssml	Converte documento SSML em fala usando o método HTTP POST.

Nota

Para oferecer maior eficiência, os endpoints de síntese executam síntese via streaming, ou seja, entregam a fala sintetizada na medida em que é gerada. Dessa forma, áudio recebido em formato RIFF WAVE (encoders cujo nome inicia com wav) podem não reproduzir corretamente em alguns players específicos, já que esse não é um formato projetado para streaming de áudio. Caso perceba problemas na reprodução, utilize o formato PCM Linear, que é a versão sem cabeçalho do WAV, ou outro de sua preferência.