Release Notes

As principais melhorias referentes ao CPqD Texto Fala 4.1 são:

  • Documentação on-line;
  • Novas tags SSML;
  • Tratamentos de pausa e ritmo na síntese HMM.

Mudanças na versão 4.1

Interface Java
API
  • Inclui tratamento de alguns caracteres não ISO, exemplo aspas estilizadas;
  • Possibilita a troca de tecnologia de voz;
  • Corrige problema na codificação de áudio lei-A;
  • Corrige tratamento de mudança de voz;
  • [4.1.2] Corrige algoritmo de conversão da taxa de amostragem (16kHz -> 8kHz);
  • [4.1.3] Corrige compatibilidade com a versão 4.0;
  • [4.1.4] Corrige preenchimento das listas nas funções TTS_EnumerateEncoders e TTS_EnumerateVoices;
  • [4.1.4] Corrige preenchimento do campo Order na estrutura TTS_STREAM_EVENT;
  • [4.1.5] Inclui campo CurrentSessions na estrutura TTS_GetEngineInfo;
  • [4.1.6] Melhorias de tratamento de caracteres;
  • [4.1.6] Corrige bug ao sintetizar textos longos no Android.
SSML
  • Incluído atributo encoder no cabeçalho speak;
  • Criação das tags <expressive> e <custom>;
  • Inclui tratamento para as tags <p> e <s>;
  • Adiciona atributo type para a tag break;
  • Adiciona tratamento do tipo de pausa para elementos say-as com interpreted-as igual a spell (e seus filhos);
  • Corrige tratamento de dois pontos dentro da tag SSML;
  • Inclui espaços entre as tags SSML;
  • Corrige validação de atributos numéricos.
Módulo de síntese
  • Controle da duração do silêncio inicial e final no HMM;
  • Implementa controle de duração de pausas no HMM;
  • Ajusta ritmo padrão das vozes;
  • Corrige tratamento de duração padrão de pausas;
  • Corrige tratamento de sentença vazia no HMM;
  • Corrige fator de ritmo no HMM;
  • Corrige tratamento de erro na interface dos módulos de síntese;
  • Reduz amplitude e banda do ruído inserido em pausas;
  • [4.1.4] Melhorias de desempenho;
  • [4.1.5] Corrige tratamento de queda da aplicação para o caso de fonemas não enviados pelo módulo linguístico;
  • [4.1.6] Corrige bug ao sintetizar textos longos no Android;
  • [4.1.6] Corrige suavização da fala sintetizada.
Módulo linguístico
  • Inclui conjunção “e” na última casa dos números do português;
  • Atualização dos léxicos;
  • Inclui tratamento de fim de linha para texto bruto;
  • Altera regra do hifen na normalização;
  • Corrige regras de normalização;
  • Retira tratamento do léxico caso seja uma tag SSML do tipo spell;
  • Corrige normalizacao y e palavras longas;
  • Altera tabela spell do normalizador português: “i” e “x”;
  • [4.1.1] Tratamento de valores monetários;
  • [4.1.4] Corrige tratamento de pontuação com tag break;
  • [4.1.5] Corrige tratamento do envio dos fonemas da tag break para o plugin de síntese.

Compatibilidade com a versão 4.0

Aplicações utilizando a versão 4.0 do produto, criadas a partir do programa de exemplo fornecido pelo CPqD, precisam ser atualizadas para que possam funcionar com a versão 4.1.1 ou 4.1.2. A atualização não é necessária se estiver migrando da versão 4.0 para 4.1.3 ou superior.

A atualização é simples e consiste em substituir, na aplicação, os arquivos copiados do exemplo 4.0 pelos arquivos contidos no exemplo 4.1. No código fonte da aplicação, também substitua a inclusão dos arquivos types.h e errors.h pelo novo tts.h.

4.0 4.1
types.h tts.h
errors.h
loader.hh loader.hh
loader.cc loader.cc

Interfaces de integração

O CPqD Texto Fala pode ser integrado em aplicações em diversas linguagens ou protocolos. Consulte a seção Interfaces de integração para maiores detalhes.

Ambientes Homologados

A relação dos ambientes oficialmente suportados pelo CPqD Texto Fala pode ser conferida na seção Requisitos de sistema.