Componentes principais¶
O ASR é constituído pelos componentes mostrados em Fig. 6. Nem todos os componentes são obrigatórios e sua instalação depende das necessidades da aplicação do cliente.
Cada componente do ASR possui seu próprio instalador:
- Motor ASR
Sua instalação é obrigatória e não depende do idioma usado e nem do áudio de entrada. Seu instalador segue o formato:
cpqd-asr-engine-VERSION.run
. Antes de sua instalação devem ser verificados os requisitos de software e hardware.- Servidor ASR
Sua instalação é obrigatória e não depende do idioma usado e nem do áudio de entrada. Seu instalador segue o formato:
cpqd-asr-server-VERSION.run
. Antes de sua instalação devem ser verificados os requisitos de software e hardware.- Modelo acústico
Sua instalação é obrigatória e depende do idioma usado e da taxa de amostragem do áudio. Por exemplo, para o Português do Brasil e áudio de 8kHz (aplicações de telefonia), o instalador segue o formato:
am-ptbr-8k-VERSION.run
. Para áudio de 16kHz, o instalador segue o formato:am-ptbr-16k-VERSION.run
.- Modelo de fala livre
Sua instalação é opcional e depende do modelo acústico instalado. Se a aplicação usará reconhecimento de fala livre, então ele deve ser instalado. Antes de sua instalação devem ser verificados os requisitos de memória. Para cada modelo acústico, há um instalador de modelo de fala livre correspondente. Por exemplo, para o modelo acústico
am-ptbr-8k-1.0.6-b3.run
, teremos um instalador para modelo de fala livre seguindo o formatoslm-ptbr-VERSION-am-ptbr-8k-1.0.6-b1.run
, o trechoslm-ptbr-VERSION
corresponde à identificação do modelo de fala livre, enquanto o trechoam-ptbr-8k-1.0.6
corresponde ao modelo acústico associado.- Gramáticas builtin
Sua instalação é opcional e depende apenas do idioma adotado. Se a aplicação usará o recurso de gramáticas builtin, então elas devem ser instaladas. Seu instalador segue o formato
grammar-ptbr-builtin-VERSION.run
.- Classificadores
Já os módulos que estimam idade, gênero e emoção são instalados através de imagens Docker, o qual deve ser, por sua vez, instalado e configurado de antemão. Sua instalação é opcional. Diferentemente do ASR que tem modelos exclusivamente customizados para o idioma alvo, os três sistemas acima mencionados são, em teoria, agnósticos a idioma, embora tenham sofrido customização para obter seu melhor desempenho em Português do Brasil. Para saber mais sobre a instalação dos classificadores verifique a seção Instalação dos classificadores.