Usando fala livre¶
Um modelo da língua define como palavras são combinadas para formar as frases do idioma. Este modelo da língua pode ser um modelo de fala livre ou uma gramática. Modelos para fala livre e gramáticas são construídos e funcionam de maneira diferente.
Um modelo de fala livre é um modelo estatístico treinado a partir de uma grande quantidade de texto:
- o usuário pode falar mais livremente;
- o vocabulário de palavras é grande, embora seja fixo;
O reconhecimento de fala livre tem melhor desempenho quando o contexto de uso é próximo ao contexto do treinamento do modelo.
Quando usar modelo para fala livre ?
- Ditado de mensagens (e-mail, SMS, etc.);
- Respostas abertas do usuário (ex. “explique o que você deseja”);
- Execução de uma busca por texto;
Usando o modelo no reconhecimento¶
Um modelo para fala livre é identificado no reconhecimento de fala através de sua URI. Cada modelo tem sua própria URI de identificação e deve ser previamente instalado na máquina do CPQD ASR.
Cada API ASR possui uma forma específica de informar o modelo da língua. Por exemplo, a URI do modelo de fala livre de uso geral é “builtin:slm/general”. Veja os exemplos seguintes em cada API.
Na API REST, o modelo é usado como mostrado no exemplo seguinte:
POST /asr-server/rest/recognize?lm=builtin:slm/general HTTP/1.1
Host: 127.0.0.1:8025
Accept: */*
Content-Type: audio/wav
Content-Length: ...
<conteúdo binário do áudio>
Com a API REST, podemos usar o comando curl, como no exemplo seguinte:
curl --header "Content-Type: audio/wav" \
--data-binary @/audio/pizza.wav \
http://127.0.0.1:8025/asr-server/rest/recognize?lm=builtin:slm/general
Na API WebSocket, o modelo é usado como mostrado no exemplo seguinte:
C->S: ASR 2.2 START_RECOGNITION
Content-Type: text/uri-list
Content-ID: yes_no
Content-Length: ...
builtin:slm/general
Na API MRCP v2, o modelo é usado como mostrado no exemplo seguinte:
C->S: MRCP/2.0 ... RECOGNIZE 543260
Channel-Identifier:32AECB23433801@speechrecog
Content-Type:text/uri-list
Content-Length:...
builtin:slm/general