Release Notes¶
As principais melhorias referentes ao CPqD Texto Fala 4.1 são:
- Documentação on-line;
- Novas tags SSML;
- Tratamentos de pausa e ritmo na síntese HMM.
Mudanças na versão 4.1¶
- Interface Java
- Melhorias nas funções internas da interface Java;
- Publicação do código fonte da interface Java no GitHub (https://github.com/CPqD/tts-sdk-java);
- [4.1.5] Inclui atributo
currentSessions
na classe EngineInfo.
- API
- Inclui tratamento de alguns caracteres não ISO, exemplo aspas estilizadas;
- Possibilita a troca de tecnologia de voz;
- Corrige problema na codificação de áudio lei-A;
- Corrige tratamento de mudança de voz;
- [4.1.2] Corrige algoritmo de conversão da taxa de amostragem (16kHz -> 8kHz);
- [4.1.3] Corrige compatibilidade com a versão 4.0;
- [4.1.4] Corrige preenchimento das listas nas funções TTS_EnumerateEncoders e TTS_EnumerateVoices;
- [4.1.4] Corrige preenchimento do campo
Order
na estrutura TTS_STREAM_EVENT; - [4.1.5] Inclui campo
CurrentSessions
na estrutura TTS_GetEngineInfo; - [4.1.6] Melhorias de tratamento de caracteres;
- [4.1.6] Corrige bug ao sintetizar textos longos no Android.
- SSML
- Incluído atributo encoder no cabeçalho speak;
- Criação das tags
<expressive>
e<custom>
; - Inclui tratamento para as tags
<p>
e<s>
; - Adiciona atributo type para a tag break;
- Adiciona tratamento do tipo de pausa para elementos
say-as
cominterpreted-as
igual aspell
(e seus filhos); - Corrige tratamento de dois pontos dentro da tag SSML;
- Inclui espaços entre as tags SSML;
- Corrige validação de atributos numéricos.
- Módulo de síntese
- Controle da duração do silêncio inicial e final no HMM;
- Implementa controle de duração de pausas no HMM;
- Ajusta ritmo padrão das vozes;
- Corrige tratamento de duração padrão de pausas;
- Corrige tratamento de sentença vazia no HMM;
- Corrige fator de ritmo no HMM;
- Corrige tratamento de erro na interface dos módulos de síntese;
- Reduz amplitude e banda do ruído inserido em pausas;
- [4.1.4] Melhorias de desempenho;
- [4.1.5] Corrige tratamento de queda da aplicação para o caso de fonemas não enviados pelo módulo linguístico;
- [4.1.6] Corrige bug ao sintetizar textos longos no Android;
- [4.1.6] Corrige suavização da fala sintetizada.
- Módulo linguístico
- Inclui conjunção “e” na última casa dos números do português;
- Atualização dos léxicos;
- Inclui tratamento de fim de linha para texto bruto;
- Altera regra do hifen na normalização;
- Corrige regras de normalização;
- Retira tratamento do léxico caso seja uma tag SSML do tipo spell;
- Corrige normalizacao y e palavras longas;
- Altera tabela spell do normalizador português: “i” e “x”;
- [4.1.1] Tratamento de valores monetários;
- [4.1.4] Corrige tratamento de pontuação com tag break;
- [4.1.5] Corrige tratamento do envio dos fonemas da tag break para o plugin de síntese.
Compatibilidade com a versão 4.0¶
Aplicações utilizando a versão 4.0 do produto, criadas a partir do programa de exemplo fornecido pelo CPqD, precisam ser atualizadas para que possam funcionar com a versão 4.1.1 ou 4.1.2. A atualização não é necessária se estiver migrando da versão 4.0 para 4.1.3 ou superior.
A atualização é simples e consiste em substituir, na aplicação, os arquivos copiados do exemplo 4.0 pelos arquivos contidos no exemplo 4.1. No código fonte da aplicação, também substitua a inclusão dos arquivos types.h
e errors.h
pelo novo tts.h
.
4.0 | 4.1 |
---|---|
types.h | tts.h |
errors.h | |
loader.hh | loader.hh |
loader.cc | loader.cc |
Interfaces de integração¶
O CPqD Texto Fala pode ser integrado em aplicações em diversas linguagens ou protocolos. Consulte a seção Interfaces de integração para maiores detalhes.
Ambientes Homologados¶
A relação dos ambientes oficialmente suportados pelo CPqD Texto Fala pode ser conferida na seção Requisitos de sistema.