Release Notes¶
Componentes do produto CPqD Texto Fala 4.3¶
Versões dos componentes de software:
Engine | MRCP | TTS Server |
---|---|---|
4.3.0 | 2.1.0 | 3.3.0 |
- Legenda:
- Engine: bibliotecas dinâmicas;
- MRCP: servidor MRCP integrado ao CPqD Texto Fala;
- TTS Server: servidor com interfaces de integração REST e Websocket.
Versões das vozes:
Adriana | Carlos | Rosana | Paola |
---|---|---|---|
2.0 | 2.0 | 2.0 | 1.0 |
Mudanças na versão 4.3¶
- API
- Remove proteção via chave de hardware;
- Incluída codificação do áudio de saída no formato MP3 (através da biblioteca libmp3lame);
- Aprimora proteção online promovendo mais estabilidade;
- Publicação do código fonte dos exemplos de uso da biblioteca em C/C++ no GitHub: https://github.com/CPqD/tts-examples-c;
- Módulo de síntese
- Melhoria nos dicionários de voz (aumento da base de fala e incorporação de parâmetros adicionais);
- Melhoria no algoritmo de síntese de fala (melhor qualidade de síntese).
- Módulo linguístico
- Correções e evoluções do normalizador do Português (números, horários, durações, quantias, datas, frações e unidades de medida):
- Redução das pausas entre milhares e centenas;
- Codificação dos módulos de horários e durações;
- Melhorias nos módulos de datas e frações;
- Recodificação dos módulos de quantias estrangeiras e unidades de medida.
- Correções e evoluções do normalizador do Espanhol (números, horários, durações, quantias, datas e frações):
- Melhorias nos módulos de datas e frações;
- Codificação dos módulos de horários e durações;
- Evolução do módulo de números ordinais do espanhol;
- Recodificação dos módulos de quantias estrangeiras;
- Redução das pausas entre milhares e centenas.
- Instalador
- Novo programa de instalação;
- Pacotes de instalação podem ser reusados entre diferentes licenças.
- TTS Server
- Suporte a áudio MP3;
- Configuração de volume e ritmo na API REST e WebSocket;
- Suporte a múltiplas sínteses em uma mesma sessão WebSocket;
- Adicionado suporte ao comado stop de streaming;
- Processo assíncrono de síntese na sessão WebSocket.
- Base de Voz:
- [Vozes: 2.0] Correções na rotulação fonética e prosódica.
Mudanças em versões anteriores¶
Para mais detalhes sobre as mudanças em versões anteriores do produto, consulte o release notes da versão desejada:
Compatibilidade da API com a versões anteriores¶
Aplicações utilizando a versões anteriores do produto, criadas a partir do programa de exemplo fornecido pelo CPqD, somente precisam ser atualizadas se desejar utilizar algum recurso introduzido na versão atual.
A atualização é simples e consiste em substituir, na aplicação, o arquivos copiados do programa de exemplo antigo pelos arquivos contidos no exemplo.
4.0 | 4.1 ou superior |
---|---|
types.h | tts.h |
errors.h | |
loader.hh | loader.hh |
loader.cc | loader.cc |
Interfaces de integração¶
O CPqD Texto Fala pode ser integrado em aplicações em diversas linguagens ou protocolos. Consulte a seção Interfaces de integração para maiores detalhes.
Ambientes Homologados¶
A relação dos ambientes oficialmente suportados pelo CPqD Texto Fala pode ser conferida na seção Requisitos de sistema.