Versão 2

A versão 2 da API REST contém métodos que realizam a síntese de fala utilizando streaming. Isso significa que o áudio começa a ser entregue à aplicação assim que o processo de síntese é iniciado. O stream de áudio já pode então ser reproduzido, mesmo antes do áudio ser totalmente sintetizado.

Além disso, a versão 2 oferece métodos de apoio que permitem consultar os encoders e vozes disponiveis, facilitando a criação de aplicações.

Endpoint

Resumo

/tts/rest/v2/engineInfo

Obtém informações sobre o Texto Fala.

/tts/rest/v2/encoders

Obtém a relação dos encoders de áudio disponíveis.

/tts/rest/v2/voices

Obtém a relação das vozes disponíveis.

/tts/rest/v2/synthesize (POST)

Converte texto em fala usando o método HTTP POST.

/tts/rest/v2/synthesize (GET)

Converte texto em fala usando o método HTTP GET.

/tts/rest/v2/synthesize/ssml

Converte documento SSML em fala usando o método HTTP POST.

Nota

Para oferecer maior eficiência, os endpoints de síntese executam síntese via streaming, ou seja, entregam a fala sintetizada na medida em que é gerada. Dessa forma, áudio recebido em formato RIFF WAVE (encoders cujo nome inicia com wav) podem não reproduzir corretamente em alguns players específicos, já que esse não é um formato projetado para streaming de áudio. Caso perceba problemas na reprodução, utilize o formato PCM Linear, que é a versão sem cabeçalho do WAV, ou outro de sua preferência.