Synthesize

Converte texto em fala.

Requisição

POST /rest/v2/synthesize

HTTP Headers

Accept
Indica o formato do áudio sintetizado. Formatos válidos:
  • audio/x-wav – áudio no formato WAV
  • application/octet-stream – áudio puro sem cabeçalho
Content-Length Indica o número de bytes do conteúdo
Content-Type
Indica o formato do texto enviado. Formato válido:
  • application/json
Parâmetros da requisição

O corpo da requisição deve ser um objeto JSON com os seguintes atributos.

text o texto a ser convertido em áudio, codificado como URL
voice (opcional) o nome da voz. Veja valores válidos em “/rest/v2/voices”
encoder (opcional) o nome do encoder de áudio. Veja valores válidos em “/rest/v2/encoders”
volume (opcional) define o volume padrão. Valores aceitos: 0.0 (mudo) a 2.0 (alto). O valor padrão é 1.0.
rate (opcional) define o ritmo padrão. Valores aceitos: 0.3 (lento) a 3.0 (rápido). O valor padrão é 1.0.
filename (opcional) o nome do arquivo de áudio no download
cache (opcional) indica se o áudio pode ser recuperado de memória cache ou se a síntese deve ser realizada (boolean)
Erros

Os seguintes erros podem ser retornados.

400 o corpo da mensagem na requisição é inválido.
404 o encoder ou voice utilizado não é válido ou não está disponível
500 erro interno no servidor que impediu o processamento da requisição
Resultado
Stream de bytes de áudio.

Exemplos

Chamada REST:

curl -X POST \
 --header "Accept: application/octet-stream" \
 --header "Content-Type: application/json" \
 "http://<TTS_SERVER>:9090/rest/v2/synthesize" \
 --data "{  \"text\": \"Alô mundo\",  \"voice\": \"rosana-highquality.voice\",  \"encoder\": \"wav/16000/16/1\" }" \
 > audio.wav

Nota

  • Para testar esse serviço no ambiente de demonstração do CPqD, utilize a URL http://speech.cpqd.com.br/tts seguido do método da API REST.
  • O acesso ao ambiente de demonstração exige uso de uma credencial de acesso fornecida pelo CPqD. Utilize o parâmetro --user username:passwd no comando curl para enviar as credenciais na execução do método.