Componentes principais

O ASR é constituído pelos componentes mostrados em Fig. 6. Nem todos os componentes são obrigatórios e sua instalação depende das necessidades da aplicação do cliente.

../_images/asr-deploy.png

Fig. 6 Estrutura de instalação do ASR

Cada componente do ASR possui seu próprio instalador:

Motor ASR

Sua instalação é obrigatória e não depende do idioma usado e nem do áudio de entrada. Seu instalador segue o formato: cpqd-asr-engine-VERSION.run. Antes de sua instalação devem ser verificados os requisitos de software e hardware.

Servidor ASR

Sua instalação é obrigatória e não depende do idioma usado e nem do áudio de entrada. Seu instalador segue o formato: cpqd-asr-server-VERSION.run. Antes de sua instalação devem ser verificados os requisitos de software e hardware.

Modelo acústico

Sua instalação é obrigatória e depende do idioma usado e da taxa de amostragem do áudio. Por exemplo, para o Português do Brasil e áudio de 8kHz (aplicações de telefonia), o instalador segue o formato: am-ptbr-8k-VERSION.run. Para áudio de 16kHz, o instalador segue o formato: am-ptbr-16k-VERSION.run.

Modelo de fala livre

Sua instalação é opcional e depende do modelo acústico instalado. Se a aplicação usará reconhecimento de fala livre, então ele deve ser instalado. Antes de sua instalação devem ser verificados os requisitos de memória. Para cada modelo acústico, há um instalador de modelo de fala livre correspondente. Por exemplo, para o modelo acústico am-ptbr-8k-1.0.6-b3.run, teremos um instalador para modelo de fala livre seguindo o formato slm-ptbr-VERSION-am-ptbr-8k-1.0.6-b1.run, o trecho slm-ptbr-VERSION corresponde à identificação do modelo de fala livre, enquanto o trecho am-ptbr-8k-1.0.6 corresponde ao modelo acústico associado.

Gramáticas builtin

Sua instalação é opcional e depende apenas do idioma adotado. Se a aplicação usará o recurso de gramáticas builtin, então elas devem ser instaladas. Seu instalador segue o formato grammar-ptbr-builtin-VERSION.run.

Classificadores

Já os módulos que estimam idade, gênero e emoção são instalados através de imagens Docker, o qual deve ser, por sua vez, instalado e configurado de antemão. Sua instalação é opcional. Diferentemente do ASR que tem modelos exclusivamente customizados para o idioma alvo, os três sistemas acima mencionados são, em teoria, agnósticos a idioma, embora tenham sofrido customização para obter seu melhor desempenho em Português do Brasil. Para saber mais sobre a instalação dos classificadores verifique a seção Instalação dos classificadores.