Modo assíncrono

A API WebSocket permite o uso do modo contínuo no reconhecimento de fala e o áudio pode ser enviado em tempo real. Outras informações na seção Modo contínuo.

Um exemplo de requisição é mostrado abaixo. Para usar o modo contínuo, a licença deve estar liberada e deve-se definir o parâmetro decoder.continuousMode=true.

../_images/continuousmode-ws-1.png

O resultado do reconhecimento de cada segmento de fala é retornado a medida em que é processado:

../_images/continuousmode-ws-2.png

O envio do áudio pode ser finalizado definindo o parâmetro “LastPacket=true”. O resultado do último segmento de fala é retornado com parâmetro “last_segment=true”:

../_images/continuousmode-ws-3.png

O resumo do fluxo do modo contínuo na API WebSocket é apresentado abaixo:

  1. O cliente abre uma conexão WebSocket com o Servidor ASR e envia a mensagem CREATE SESSION.

  2. O servidor ASR indica sucesso através da mensagem RESPONSE.

  3. O cliente inicia o reconhecimento enviando START RECOGNITION, e informa o modelo de língua (normalmente um modelo de fala livre) e o parâmetro “decoder.continuousMode = true”.

  4. O servidor ASR indica sucesso através da mensagem RESPONSE.

  5. O cliente inicia a captura do áudio e envia em blocos através da mensagem SEND AUDIO.

  6. O servidor ASR realiza o reconhecimento de cada bloco e quando possui um resultado envia-o através da mensagem RECOGNITION RESULT.

  7. O cliente finaliza o áudio enviando a mensagem SEND AUDIO com o parâmetro “LastPacket = true”.

  8. O servidor ASR realiza o reconhecimento restante e envia o último resultado através da mensagem RECOGNITION RESULT com o parâmetro “last_segment = true”.

  9. O cliente pode finalizar a sessão com a mensagem RELEASE SESSION ou iniciar outro reconhecimento com a mensagem START RECOGNITION.