Reconhecimento

Parâmetros gerais relacionados ao reconhecimento de fala podem ser configurados alterando o arquivo /opt/cpqd/asr/config/engine/engine.conf.

am.models

Descrição: Indica que modelos acústicos devem ser carregados pelo motor ASR na sua inicialização. Atualmente, apenas um modelo pode ser indicado. O valor passado aqui deve ser um dos diretórios contidos no diretório /opt/cpqd/asr/lang.

Valores: Texto. Valor padrão: default.

Exemplo:

--am.models=default

lm.preloadModels

Descrição: Indica que modelos da língua devem ser pré-carregados pelo motor ASR na sua inicialização. Os modelos carregados aqui nunca serão descarregados da memória e podem ser atualizados apenas com a reinicialização do ASR. Normalmente é usado para carregar o modelo de fala livre ou alguma gramática muito grande.

Valores: O valor deve ser a lista de modelos separados por vírgula.

Exemplo:

--lm.preloadModels=builtin:slm/general

lm.timeToLive

Descrição: Tempo máximo depois do qual um modelo da língua será descarregado da memória. Trata-se do tempo de vida do modelo em memória.

Valores: Valor inteiro em minutos. Valor padrão: 60

Exemplo:

--lm.timeToLive=60

lm.timeToIdle

Descrição: Tempo depois do qual um modelo da língua será descarregado da memória se não for usado para reconhecimento, ou seja, tempo máximo ocioso.

Valores: Valor inteiro em minutos. Valor padrão: 10

Exemplo:

--lm.timeToIdle=10

decoder.partialResultEnabled

Descrição: Indica se resultados parciais estão habilitados. Um resultado parcial é o texto quando o áudio ainda não foi recebido completamnete e nem o reconhecimento foi finalizado.

Valores: «true» ou «false». Valor padrão: «false».

Exemplo:

--decoder.partialResultEnabled=false

decoder.partialResultInterval

Descrição: Indica o intervalo de tempo para gerar um resultado parcial.

Valores: Valor inteiro em milissegundos. Valor padrão: 1000

Exemplo:

--decoder.partialResultInterval=1000

noInputTimeout.enabled

Descrição: Habilita o temporizador noInputTimeout para todos os reconhecimentos.

Valores: «true» ou «false». Valor padrão: «true».

Exemplo:

--noInputTimeout.enabled=true

noInputTimeout.value

Descrição: Tempo máximo de espera pelo início da fala. Depois desse tempo, o sistema finaliza o reconhecimento e retorna NO_INPUT_TIMEOUT.

Valores: Valor em milissegundos. Valor padrão: 10000.

Exemplo:

--noInputTimeout.value=10000

recognitionTimeout.enabled

Descrição: Habilita o temporizador recognitionTimeout para todos os reconhecimentos.

Valores: «true» ou «false». Valor padrão: «true».

Exemplo:

--recognitionTimeout.enabled=true

recognitionTimeout.value

Descrição: Tempo máximo de espera pelo resultado do reconhecimento. Se o reconhecimento não finalizar até o tempo definido, o sistema finaliza o reconhecimento e retorna RECOGNITION_TIMEOUT.

Valores: Valor inteiro em milissegundos. Valor padrão: 30000

Exemplo:

--recognitionTimeout.value=30000

decoder.confidenceThreshold

Descrição: Valor mínimo da pontuação (score) de confiança do reconhecimento, para que ele seja considerado válido

Valores: Número inteiro de 0 a 100. Valor padrão: 30.

Exemplo:

--decoder.confidenceThreshold=30

decoder.startInputTimers

Descrição: Inicia automaticamente os temporizadores habilitados (noInputTimeout e recognitionTimeout) juntamente com o início do reconhecimento. Se desativado, os temporizadores habilitados serão iniciados de forma manual, no recebimento da mensagem START INPUT TIMERS.

Valores: «true» ou «false». Valor padrão: «true».

Exemplo:

--decoder.startInputTimers=true

decoder.maxSentences

Descrição: Número máximo de resultados prováveis gerados pelo reconhecimento (sentenças alternativas).

Valores: Número inteiro maior que zero. Valor padrão: 1.

Exemplo:

--decoder.maxSentences=1