Reconhecimento¶
Parâmetros gerais relacionados ao reconhecimento de fala podem ser configurados
alterando o arquivo /opt/cpqd/asr/config/engine/engine.conf
.
am.models¶
Descrição: Indica que modelos acústicos devem ser carregados pelo motor ASR na sua inicialização. Atualmente, apenas um modelo pode ser indicado. O valor passado aqui deve ser um dos diretórios contidos no diretório
/opt/cpqd/asr/lang
.Valores: Texto. Valor padrão:
default
.Exemplo:
--am.models=default
lm.preloadModels¶
Descrição: Indica que modelos da língua devem ser pré-carregados pelo motor ASR na sua inicialização. Os modelos carregados aqui nunca serão descarregados da memória e podem ser atualizados apenas com a reinicialização do ASR. Normalmente é usado para carregar o modelo de fala livre ou alguma gramática muito grande.
Valores: O valor deve ser a lista de modelos separados por vírgula.
Exemplo:
--lm.preloadModels=builtin:slm/general
lm.timeToLive¶
Descrição: Tempo máximo depois do qual um modelo da língua será descarregado da memória. Trata-se do tempo de vida do modelo em memória.
Valores: Valor inteiro em minutos. Valor padrão: 60
Exemplo:
--lm.timeToLive=60
lm.timeToIdle¶
Descrição: Tempo depois do qual um modelo da língua será descarregado da memória se não for usado para reconhecimento, ou seja, tempo máximo ocioso.
Valores: Valor inteiro em minutos. Valor padrão: 10
Exemplo:
--lm.timeToIdle=10
decoder.partialResultEnabled¶
Descrição: Indica se resultados parciais estão habilitados. Um resultado parcial é o texto quando o áudio ainda não foi recebido completamnete e nem o reconhecimento foi finalizado.
Valores: «true» ou «false». Valor padrão: «false».
Exemplo:
--decoder.partialResultEnabled=false
decoder.partialResultInterval¶
Descrição: Indica o intervalo de tempo para gerar um resultado parcial.
Valores: Valor inteiro em milissegundos. Valor padrão: 1000
Exemplo:
--decoder.partialResultInterval=1000
noInputTimeout.enabled¶
Descrição: Habilita o temporizador noInputTimeout para todos os reconhecimentos.
Valores: «true» ou «false». Valor padrão: «true».
Exemplo:
--noInputTimeout.enabled=true
noInputTimeout.value¶
Descrição: Tempo máximo de espera pelo início da fala. Depois desse tempo, o sistema finaliza o reconhecimento e retorna NO_INPUT_TIMEOUT.
Valores: Valor em milissegundos. Valor padrão: 10000.
Exemplo:
--noInputTimeout.value=10000
recognitionTimeout.enabled¶
Descrição: Habilita o temporizador recognitionTimeout para todos os reconhecimentos.
Valores: «true» ou «false». Valor padrão: «true».
Exemplo:
--recognitionTimeout.enabled=true
recognitionTimeout.value¶
Descrição: Tempo máximo de espera pelo resultado do reconhecimento. Se o reconhecimento não finalizar até o tempo definido, o sistema finaliza o reconhecimento e retorna RECOGNITION_TIMEOUT.
Valores: Valor inteiro em milissegundos. Valor padrão: 30000
Exemplo:
--recognitionTimeout.value=30000
decoder.confidenceThreshold¶
Descrição: Valor mínimo da pontuação (score) de confiança do reconhecimento, para que ele seja considerado válido
Valores: Número inteiro de 0 a 100. Valor padrão: 30.
Exemplo:
--decoder.confidenceThreshold=30
decoder.startInputTimers¶
Descrição: Inicia automaticamente os temporizadores habilitados (noInputTimeout e recognitionTimeout) juntamente com o início do reconhecimento. Se desativado, os temporizadores habilitados serão iniciados de forma manual, no recebimento da mensagem START INPUT TIMERS.
Valores: «true» ou «false». Valor padrão: «true».
Exemplo:
--decoder.startInputTimers=true
decoder.maxSentences¶
Descrição: Número máximo de resultados prováveis gerados pelo reconhecimento (sentenças alternativas).
Valores: Número inteiro maior que zero. Valor padrão: 1.
Exemplo:
--decoder.maxSentences=1