Parâmetros de reconhecimento

A sessão de reconhecimento de fala pode ser configurada para se adaptar às características específicas da aplicação. Essa configuração pode ser aplicável a todos os reconhecimentos realizados dentro da mesma sessão, ou apenas para um único reconhecimento.

Para alterar os parâmetros de todos os reconhecimentos dentro de uma sessão, é necessário enviar a mensagem SET PARAMETERS enquanto a sessão estiver no estado IDLE. Tipicamente isso pode ser feito imediatamente após a criação da sessão.

Para alterar os parâmetros de apenas um reconhecimento é necessário enviar os parâmetros dentro do corpo da mensagem START RECOGNITION. Após o fim do reconhecimento, o servidor restabelece os valores anteriores da sessão.

decoder.confidenceThreshold

Descrição: Valor mínimo da pontuação (score) de confiança do reconhecimento, para que ele seja considerado válido

Domínio: Número inteiro, de 0 a 100

decoder.startInputTimers

Descrição: Inicia automaticamente os temporizadores habilitados (noInputTimeout e recognitionTimeout) juntamente com o início do reconhecimento. Se desativado, os temporizadores habilitados serão iniciados de forma manual, no recebimento da mensagem START INPUT TIMERS.

Domínio: Booleano (valor default = true)

decoder.maxSentences

Descrição: Número máximo de resultados prováveis (sentenças alternativas) gerados pelo reconhecimento

Domínio: Número inteiro, positivo

endpointer.headMargin

Descrição: Tempo de silêncio mantido no início do segmento de fala.

Domínio: Número inteiro (em milis)

endpointer.tailMargin

Descrição: Tempo de silêncio mantido no final do segmento de fala.

Domínio: Número inteiro (em milis)

endpointer.waitEnd

Descrição: Duração do silêncio dentro do áudio para a detecção do fim da fala.

Domínio: Número inteiro (em milis)

endpointer.levelMode

Descrição: Forma de cálculo do limiar de amplitude que será interpretado como silêncio:

  1. Ignora a amplitude.
  2. Automático.
  3. Manual.

Domínio: Número (0, 1 ou 2)

endpointer.levelThreshold

Descrição: Limiar de amplitude do sinal que será compreendido como silêncio. Utilizado se levelMode = 2.

Domínio: Número inteiro entre 0 e 100

endpointer.autoLevelLen

Descrição: Duração do trecho inicial de áudio para o cálculo do limiar de silêncio. Utilizado se levelMode = 1.

Domínio: Número inteiro (em milis)

noInputTimeout.enabled

Descrição: Habilita o temporizador noInputTimeout para todos os reconhecimentos.

Domínio: Booleano (valor default = true)

noInputTimeout.value

Descrição: Tempo máximo de espera pelo início da fala.

Domínio: Número inteiro (em milis)

recognitionTimeout.enabled

Descrição: Habilita o temporizador recognitionTimeout para todos os reconhecimentos.

Domínio: Booleano (valor default = true)

recognitionTimeout.value

Descrição: Tempo máximo de espera pelo resultado do reconhecimento.

Domínio: Numero inteiro (em milis)