Release Notes

Componentes do produto CPqD Texto Fala 4.3.1

Versões dos componentes de software:

Engine MRCP TTS Server
4.3.1 2.1.0 3.2.1
Legenda:
  • Engine: bibliotecas dinâmicas;
  • MRCP: servidor MRCP integrado ao CPqD Texto Fala;
  • TTS Server: servidor com interfaces de integração REST e Websocket.

Versões das vozes:

Adriana Carlos Rosana Paola
2.0 2.0 2.0 1.0

Mudanças na versão 4.3

API
  • Remove proteção via chave de hardware;
  • Incluída codificação do áudio de saída no formato MP3 (através da biblioteca libmp3lame);
  • Aprimora proteção online promovendo mais estabilidade;
  • Publicação do código fonte dos exemplos de uso da biblioteca em C/C++ no GitHub: https://github.com/CPqD/tts-examples-c;
  • [Engine: 4.3.1] Melhoria no modo offline da proteção via Servidor de Licenças.
Módulo de síntese
  • Melhoria nos dicionários de voz (aumento da base de fala e incorporação de parâmetros adicionais);
  • Melhoria no algoritmo de síntese de fala (melhor qualidade de síntese).
Módulo linguístico
  • Correções e evoluções do normalizador do Português (números, horários, durações, quantias, datas, frações e unidades de medida):
    • Redução das pausas entre milhares e centenas;
    • Codificação dos módulos de horários e durações;
    • Melhorias nos módulos de datas e frações;
    • Recodificação dos módulos de quantias estrangeiras e unidades de medida;
    • [Engine 4.3.1] Corrige problema com datas e horas dentro de tags SSML que não sejam say-as.
  • Correções e evoluções do normalizador do Espanhol (números, horários, durações, quantias, datas e frações):
    • Melhorias nos módulos de datas e frações;
    • Codificação dos módulos de horários e durações;
    • Evolução do módulo de números ordinais do espanhol;
    • Recodificação dos módulos de quantias estrangeiras;
    • Redução das pausas entre milhares e centenas;
    • [Engine 4.3.1] Corrige problema com datas e horas dentro de tags SSML que não sejam say-as.
  • [Engine: 4.3.1] Incluí e corrige exceções fonéticas.
Instalador
  • Novo programa de instalação;
  • Pacotes de instalação podem ser reusados entre diferentes licenças.
TTS Server
  • Suporte a áudio MP3;
  • Configuração de volume e ritmo na API REST e WebSocket;
  • Suporte a múltiplas sínteses em uma mesma sessão WebSocket;
  • Adicionado suporte ao comado stop de streaming;
  • Processo assíncrono de síntese na sessão WebSocket.
Base de Voz:
  • [Vozes: 2.0] Correções na rotulação fonética e prosódica.

Mudanças em versões anteriores

Para mais detalhes sobre as mudanças em versões anteriores do produto, consulte o release notes da versão desejada:

Compatibilidade da API com a versões anteriores

Aplicações utilizando a versões anteriores do produto, criadas a partir do programa de exemplo fornecido pelo CPqD, somente precisam ser atualizadas se desejar utilizar algum recurso introduzido na versão atual.

A atualização é simples e consiste em substituir, na aplicação, o arquivos copiados do programa de exemplo antigo pelos arquivos contidos no exemplo.

4.0 4.1 ou superior
types.h tts.h
errors.h
loader.hh loader.hh
loader.cc loader.cc

Interfaces de integração

O CPqD Texto Fala pode ser integrado em aplicações em diversas linguagens ou protocolos. Consulte a seção Interfaces de integração para maiores detalhes.

Ambientes Homologados

A relação dos ambientes oficialmente suportados pelo CPqD Texto Fala pode ser conferida na seção Requisitos de sistema.