Synthesize SSML

Converte texto em fala.

Requisição

POST /rest/v2/synthesize/ssml

HTTP Headers

Content-Length

Indica o número de bytes do conteúdo

Content-Type

Indica o formato do texto enviado. Formato válido:
  • application/ssml+xml

  • application/xml

  • text/xml

X-Cache

(opcional) Indica se o áudio pode ser recuperado de memória cache ou se a síntese deve ser realizada (boolean)

X-Encoder

(opcional) O nome do encoder de áudio. Veja valores válidos em “/rest/v2/encoders”

X-Volume

(opcional) define o volume padrão. Valores aceitos: 0.0 (mudo) a 2.0 (alto). O valor padrão é 1.0.

X-Rate

(opcional) define o ritmo padrão. Valores aceitos: 0.3 (lento) a 3.0 (rápido). O valor padrão é 1.0.

X-Account-Tag

(opcional) Indica o utilizador. Esse campo pode ser utilizado para discriminar o consumo de uma equipe, cenário de uso ou subcliente.

Parâmetros da requisição

O corpo da requisição deve ser um objeto XML no padrão SSML (ref: https://www.w3.org/TR/speech-synthesis11 ).

Erros

Os seguintes erros podem ser retornados.

400

o corpo da mensagem na requisição é inválido.

500

erro interno no servidor que impediu o processamento da requisição

Resultado

Stream de bytes de áudio.

Exemplos

Chamada REST:

curl -X POST \
 --header "Content-Type: application/xml" \
 "http://<TTS_SERVER>:9090/rest/v2/synthesize/ssml" \
 --data "@file.xml" \
 > audio.wav

Nota

  • Para testar esse serviço no ambiente de demonstração do CPQD, utilize a URL http://speech.cpqd.com.br/tts seguido do método da API REST.

  • O acesso ao ambiente de demonstração exige uso de uma credencial de acesso fornecida pelo CPQD. Utilize o parâmetro --user username:passwd no comando curl para enviar as credenciais na execução do método.