Synthesize SSML

Converte texto em fala.

Requisição

POST /rest/v2/synthesize/ssml

HTTP Headers

Accept
Indica o formato do áudio sintetizado. Formatos válidos:
  • audio/x-wav – áudio no formato WAV
  • application/octet-stream – áudio puro sem cabeçalho
Content-Length Indica o número de bytes do conteúdo
Content-Type
Indica o formato do texto enviado. Formato válido:
  • application/ssml+xml
  • application/xml
  • text/xml
X-Cache (opcional) Indica se o áudio pode ser recuperado de memória cache ou se a síntese deve ser realizada (boolean)
X-Encoder (opcional) O nome do encoder de áudio. Veja valores válidos em “/rest/v2/encoders”
X-Volume (opcional) define o volume padrão. Valores aceitos: 0.0 (mudo) a 2.0 (alto). O valor padrão é 1.0.
X-Rate (opcional) define o ritmo padrão. Valores aceitos: 0.3 (lento) a 3.0 (rápido). O valor padrão é 1.0.
Parâmetros da requisição
O corpo da requisição deve ser um objeto XML no padrão SSML (ref: https://www.w3.org/TR/speech-synthesis11 ).
Erros

Os seguintes erros podem ser retornados.

400 o corpo da mensagem na requisição é inválido.
500 erro interno no servidor que impediu o processamento da requisição
Resultado
Stream de bytes de áudio.

Exemplos

Chamada REST:

curl -X POST \
 --header "Accept: application/octet-stream" \
 --header "Content-Type: application/xml" \
 "http://<TTS_SERVER>:9090/rest/v2/synthesize/ssml" \
 --data "@file.xml" \
 > audio.wav

Nota

  • Para testar esse serviço no ambiente de demonstração do CPqD, utilize a URL http://speech.cpqd.com.br/tts seguido do método da API REST.
  • O acesso ao ambiente de demonstração exige uso de uma credencial de acesso fornecida pelo CPqD. Utilize o parâmetro --user username:passwd no comando curl para enviar as credenciais na execução do método.