Configuração¶
O CPqD Texto Fala possui um arquivo de configuração chamado tts.conf
, localizado no diretório de instalação do produto. O arquivo de configuração possui uma série de parâmetros necessários para correto funcionamento do CPqD Texto Fala. Vários parâmetros contidos nesse arquivo também podem ser alterados ou recuperados em tempo de execução via API.
Formato do arquivo de configução¶
O arquivo tts.conf
é um arquivo de texto com entradas no formato chave-valor. Parâmetros de configuração são definidos indicando seu nome, o símbolo de igual (=) e o valor. Espaços em branco são ignorados.
O arquivo pode conter linhas em branco, que serão ignoradas. Além disso, é possível incluir comentários usando o símbolo ‘#’ (cerquilha). Um comentário inicia no símbolo ‘#’ e termina na próxima quebra de linha ou final do arquivo.
General.PluginPath = /opt/cpqd/tts
Audio.Encoder = wav/16000/16/1 # Arquivo com cabeçalho RIFF
# Habilita o SSML 1.1
Text.SSML = true
Parâmetros de configuração¶
- General.PluginPath
- Caminho onde estão localizadas as bibliotecas dinâmicas do módulo linguístico e do módulo de síntese, que serão carregadas automaticamente durante a inicialização. Caso essa opção não seja especificada, será utilizado o diretório de instalação do CPqD Texto Fala.
- General.VoicePath
- Caminho onde estão localizados os arquivos de voz (arquivos com extensão
.voice
) que serão carregados automaticamente durante a inicialização. Caso essa opção não seja especificada, será utilizado o diretório de instalação do CPqD Texto Fala. - General.AudioPath
- Caminho onde estão localizados os arquivos de áudio
.wav
que serão utilizados com a tag audio do SSML. - General.DefaultVoice
- Nome da voz padrão a ser utilizada quando nenhuma outra é indicada explicitamente via API ou SSML. O nome da voz é o nome do arquivo sem a extensão
.voice
e seu arquivo correspondente deve constar no parâmetroGeneral.Voices
. - General.Voices
- Lista, separada por espaços, dos arquivos de voz a serem automaticamente carregados na inicialização do CPqD Texto Fala. Caminhos relativos partem do diretório especificado em
General.VoicePath
. Ainda que um ou mais arquivos de voz não possam ser carregados, a inicialização não retornará falha. Uma vez carregadas, as vozes estarão disponíveis e podem ser selecionadas para uso em uma ou mais sessões de síntese, até serem explicitamente descarregadas. Detalhes de erros no carregamento podem ser consultados no arquivo de logtts.log
. - General.Plugins
- Lista, separada por espaços, dos plugins a serem automaticamente carregados na inicialização da API. Os plugins devem estar armazenados no diretório indicado pela entrada
General.PluginPath
. Ainda que um ou mais plugins não puderem ser carregados, a inicialização não retornará falha. Uma vez carregados, os plugins estarão disponíveis até serem explicitamente descarregados. Detalhes de erros podem ser consultados no arquivo de logtts.log
. - Audio.Encoder
Identificador da codificação do áudio de saída desejada. Valores aceitos:
Identificador Descrição Amostragem Bits Canais pcm/16000/16/1 PCM linear 16 kHz 16 Mono pcm/16000/16/2 PCM linear 16 kHz 16 Stereo pcm/8000/16/1 PCM linear 8 kHz 16 Mono pcm/8000/16/2 PCM linear 8 kHz 16 Stereo pcm/8000/8/1 PCM linear 8 kHz 8 Mono pcm/8000/8/2 PCM linear 8 kHz 8 Stereo wav/16000/16/1 PCM linear com cabeçalho RIFF 16 kHz 16 Mono wav/16000/16/2 PCM linear com cabeçalho RIFF 16 kHz 16 Stereo wav/8000/16/1 PCM linear com cabeçalho RIFF 8 kHz 16 Mono wav/8000/16/2 PCM linear com cabeçalho RIFF 8 kHz 16 Stereo wav/8000/8/1 PCM linear com cabeçalho RIFF 8 kHz 8 Mono wav/8000/8/2 PCM linear com cabeçalho RIFF 8 kHz 8 Stereo alaw/8000/8/1 Lei-A 8 kHz 8 Mono alaw/8000/8/2 Lei-A 8 kHz 8 Stereo alaw/16000/8/1 Lei-A 16 kHz 8 Mono alaw/16000/8/2 Lei-A 16 kHz 8 Stereo Os codificadores com prefixo wav se distinguem dos respectivos codificadores pcm apenas pela presença do cabeçalho RIFF, não havendo diferença na codificação propriamente dita.
- Audio.Volume
- Define o volume padrão. Valores aceitos: 0.0 (mudo) a 2.0 (alto). O valor padrão é 1.0.
- Audio.Rate
- Define o ritmo padrão. Valores aceitos: 0.3 (lento) a 3.0 (rápido). O valor padrão é 1.0.
- Audio.Pitch
- Define a entonação (ou pitch) padrão. Valores aceitos: 0.3 (baixo) a 3.0 (alto). O valor padrão é 1.0.
- Audio.BeginSilence
- Duração, em milisegundos, do silêncio de início de sentença. Valores aceitos: de 0 até 30000 (30 segundos). O valor padrão é 30.
- Audio.EndSilence
- Duração, em milisegundos, do silêncio de final da sentença. Valores aceitos: de 0 até 30000 (30 segundos). O valor padrão é 50.
- Online.Sessions
Define o número de sessões que a instância do produto irá requisitar ao Servidor de Licenças.
Os valores válidos vão de 1 até 10000. Se especificado um valor inválido ou a opção for omitida, o Servidor de Licenças decidirá a quantidade a ser entregue.
Note que o valor máximo efetivo desse parâmetro depende da quantidade de sessões disponíveis na licença de uso. Caso seja especificado um valor maior do que o disponível, o TTS retornará um erro.
- Text.SSML
- Ativa ou desativa o suporte ao SSML. Valores aceitos: true ou false. O valor padrão é true.
- Text.BreakLine
- Ativa ou desativa a opção de incluir ponto final na quebra de linha. Valores aceitos: true ou false. O valor padrão é false. Note que se a opção de SSML.Text esteja ativa, a opção Text.BreakLine é desabilitada.
- Log.Level
- Define o nível de detalhes do arquivo de log. Quanto maior o nível de log, mais informações serão exibidas. Os níveis válidos, em ordem crescente, são:
OFF
,FATAL
,ERROR
,WARNING
eINFO
. Caso esta opção esteja comentada o ausente, será utilizado o nívelINFO
. Para impedir a criaçao de logs, use o nívelOFF
.