Desenvolvimento de aplicações

O Reconhecimento de fala pode ser usado em uma variedade de aplicações, por exemplo:

  • automação de call centers;

  • controle de dispositivos através da fala;

  • ditado de mensagens;

  • interface de fala em aplicativos móveis.

Antes de iniciar o desenvolvimento de sua aplicação, você deve ter acesso a um servidor ASR. Para ter uma instalação do ASR executando no ambiente de sua empresa, entre em contato com o CPQD e requisite os pacotes de instalação e a licença de uso. Você precisará ter claras as seguintes informações:

Qual o idioma desejado ?

Um modelo de reconhecimento de fala treinado para o Português do Brasil não pode ser usado para outro idioma. Verifique se há modelos ASR para o idioma desejado.

Qual a taxa de amostragem do áudio ?

Se a aplicação é de telefonia, o áudio de entrada tem uma taxa de amostragem de 8KHz. Essa informação é necessária para instalar o modelo correto. Um modelo para áudio amostrado à 16 kHz não funcionará em aplicações que envolvam chamadas telefônicas.

Usará reconhecimento de fala livre ?

Reconhecimento de fala usando gramáticas já faz parte da instalação inicial do ASR. Se a sua aplicação necessita transcrever o que foi falado, você deve requisitar o instalador do modelo para fala livre.

Usará integração via MRCP ?

A forma de integração com o ASR deve ser escolhida de acordo com o contexto da aplicação. Em aplicações de telefonia com URA, a integração pode estar restrita a padrões como MRCP. Se este for o seu caso, você deve requisitar o instalador do servidor MRCP.

Os requisitos de software e hardware, e as orientações para instalação do ASR podem ser consultados em Instalação.

Caso deseje realizar testes de reconhecimento de fala antes de instalar o servidor ASR, entre em contato com o CPQD e requisite credenciais de acesso ao serviço ASR disponível através da WEB.

Orientações para desenvolver sua aplicação podem ser encontradas em Guia do Usuário.