Pacotes do idioma¶
Um sistema de reconhecimento automático de fala funciona com base em modelos probabilísticos. No caso do CPqD ASR, tais modelos são disponibilizados na forma de pacotes do idioma.
O pacote do idioma usado em uma determinada instalação precisa estar de acordo com as características que se deseja atender. Por exemplo, o pacote do idioma usado em uma instalação para o português brasileiro é diferente daquele usado em uma instalação para o espanhol. Além disso, o pacote do idioma projetado para trabalhar com áudios amostrados à 16 kHz não deve ser usado em aplicações que envolvam chamadas telefônicas (cuja taxa de amostragem é de 8 kHz).
Outro fator importante envolvendo pacotes do idioma é o “contexto“ em que o reconhecimento de fala irá funcionar. Alguns pacotes podem ser mais específicos para alguns contextos, que privilegiam uma determinada área (por exemplo, pacotes específicos para área médica, ou para área esportiva) e pacotes mais gerais, que abrangem diversos contextos, sem enfatizar nenhum. Provavelmente pacotes mais restritos apresentarão uma acurácia maior quando aplicados aos contextos corretos.
O pacote do idioma é distribuído em arquivos am-VERSION.run
(que contém
o modelo acústico) e slm-VERSION.run
(que contém modelo da língua de
fala livre). Para usar o sistema de reconhecimento de fala é obrigatório
instalar pelo menos um modelo acústico. A instalação de modelos da língua de
fala livre é opcional.
Consulte o CPqD para saber qual o pacote do idioma mais indicado para a sua aplicação.