Modo contínuo

O reconhecimento de fala pode ser realizado de duas maneiras diferentes: “modo frase única” ou “modo contínuo”.

O modo frase única é o modo padrão de funcionamento (decoder.continuousMode=false). O reconhecimento é realizado apenas para o primeiro segmento de fala identificado no áudio, ou seja, todo o áudio posterior a um trecho de silêncio maior que valor do parâmetro endpointer.waitEnd é descartado (veja figura seguinte).

Este modo é normalmente usado em aplicações de diálogo nas quais se espera a resposta curta do usuário a uma pergunta da aplicação. Ele não é apropriado a transcrição de áudios longos com várias frases. Ele é usado com fala livre ou gramáticas.

../_images/single-phrase-recog.png

Fig. 9 Reconhecimento no modo frase única.

No modo contínuo, o reconhecimento é realizado para todos os segmento de fala do áudio de entrada. O reconhecimento geralmente continua até que o áudio seja finalizado (veja figura seguinte).

Este modo é normalmente usado com modelo de fala livre, em aplicações de transcrição de áudio longo, contendo muitas frases e pausas, com reconhecimento em tempo real ou não.

Aviso

Para usar o modo contínuo, a licença deve estar liberada para ele e o parâmetro decoder.continuousMode=true.

O modo contínuo está disponível apenas nas APIs WebSocket e REST e tem uma dinâmica específica de funcionamento. Para maiores informações, consulte as seções sobre modo contínuo na API WebSocket e na API REST.

../_images/continuous-mode-recog.png

Fig. 10 Reconhecimento no modo contínuo.