Versão 2¶
A versão 2 da API REST contém métodos que realizam a síntese de fala utilizando streaming. Isso significa que o áudio começa a ser entregue à aplicação assim que o processo de síntese é iniciado. O stream de áudio já pode então ser reproduzido, mesmo antes do áudio ser totalmente sintetizado.
Além disso, a versão 2 oferece métodos de apoio que permitem consultar os encoders e vozes disponiveis, facilitando a criação de aplicações.
Endpoint |
Resumo |
Obtém informações sobre o Texto Fala. |
|
Obtém a relação dos encoders de áudio disponíveis. |
|
Obtém a relação das vozes disponíveis. |
|
/tts/rest/v2/synthesize |
Converte texto em fala usando o método HTTP POST. |
/tts/rest/v2/synthesize |
Converte texto em fala usando o método HTTP GET. |
Converte documento SSML em fala usando o método HTTP POST. |
Nota
Para oferecer maior eficiência, os endpoints de síntese executam síntese via streaming, ou seja, entregam a fala sintetizada na medida em que é gerada.
Dessa forma, áudio recebido em formato RIFF WAVE
(encoders cujo nome inicia com wav) podem não reproduzir corretamente em alguns players específicos, já que esse não é um formato projetado para streaming de áudio.
Caso perceba problemas na reprodução, utilize o formato PCM Linear
, que é a versão sem cabeçalho do WAV, ou outro de sua preferência.