Visão Geral do Produto¶
O CPqD Transcrição de Diálogos é formado por um conjunto de microserviços que realizam as diferentes tarefas do processo de transcrição. A adoção de microserviços permite uma maior flexibilidade na instalação do sistema, otimizando o uso de recursos computacionais.
De uma forma geral, os microserviços são tipicamente instalados em dois nós (máquinas) de execução:
- Nó de Controle: nó que contém os serviços de controle do processo de transcrição.
- Nó de Processamento: nó que executa as tarefas computacionalmente mais pesadas da transcrição. O nó de processamento deve ser escalado verticalmente ou horizontalmente de acordo com a necessidade de velocidade de transcrição.
![]()
A imagem acima ilustra de forma conceitual os elementos que compõem o sistema:
- API: representa o serviço que expõe a API REST de controle de arquivos e do processo de transcrição.
- DB Watcher: controla o processo de transcrição, distribuindo os arquivos para os executores do processo.
- Normalization: serviço que converte o formato dos arquivos para o padrão do sistema e realiza a identificação dos canais de áudio.
- Diarization: serviço que identifica os segmentos de fala e a diferenciação de locutor.
- Recognition: serviço que executa o reconhecimento do segmento de fala.