Desenvolvimento de aplicações¶
O Reconhecimento de fala pode ser usado em uma variedade de aplicações, por exemplo:
automação de call centers;
controle de dispositivos através da fala;
ditado de mensagens;
interface de fala em aplicativos móveis.
Antes de iniciar o desenvolvimento de sua aplicação, você deve ter acesso a um servidor ASR. Para ter uma instalação do ASR executando no ambiente de sua empresa, entre em contato com o CPQD e requisite os pacotes de instalação e a licença de uso. Você precisará ter claras as seguintes informações:
Qual o idioma desejado ?
Um modelo de reconhecimento de fala treinado para o Português do Brasil não pode ser usado para outro idioma. Verifique se há modelos ASR para o idioma desejado.
Qual a taxa de amostragem do áudio ?
Se a aplicação é de telefonia, o áudio de entrada tem uma taxa de amostragem de 8KHz. Essa informação é necessária para instalar o modelo correto. Um modelo para áudio amostrado à 16 kHz não funcionará em aplicações que envolvam chamadas telefônicas.
Usará reconhecimento de fala livre ?
Reconhecimento de fala usando gramáticas já faz parte da instalação inicial do ASR. Se a sua aplicação necessita transcrever o que foi falado, você deve requisitar o instalador do modelo para fala livre.
Usará integração via MRCP ?
Os requisitos de software e hardware, e as orientações para instalação do ASR podem ser consultados em Instalação.
Caso deseje realizar testes de reconhecimento de fala antes de instalar o servidor ASR, entre em contato com o CPQD e requisite credenciais de acesso ao serviço ASR disponível através da WEB.
Orientações para desenvolver sua aplicação podem ser encontradas em Guia do Usuário.