Visão Geral do Produto¶
A Transcrição de Diálogos é formado por um conjunto de microserviços que realizam as diferentes tarefas do processo de transcrição. A adoção de microserviços permite uma maior flexibilidade na instalação do sistema, otimizando o uso de recursos computacionais.
De uma forma geral, os microserviços são tipicamente instalados em dois nós (máquinas) de execução:
Nó de Controle: nó que contém os serviços de controle do processo de transcrição.
Nó de Processamento: nó que executa as tarefas computacionalmente mais pesadas da transcrição. O nó de processamento deve ser escalado verticalmente ou horizontalmente de acordo com a necessidade de velocidade de transcrição.
![]()
A imagem acima ilustra de forma conceitual os elementos que compõem o sistema:
API: representa o serviço que expõe a API REST de controle de arquivos e do processo de transcrição.
Node Manager: controla a criação das instâncias de processamento.
Normalization: serviço que converte o formato dos arquivos para o padrão do sistema e realiza a identificação dos canais de áudio.
Diarization: serviço que identifica os segmentos de fala e a diferenciação de locutor.
Recognition: serviço que executa o reconhecimento do segmento de fala.