Visão Geral do Produto

A Transcrição de Diálogos é formado por um conjunto de microserviços que realizam as diferentes tarefas do processo de transcrição. A adoção de microserviços permite uma maior flexibilidade na instalação do sistema, otimizando o uso de recursos computacionais.

De uma forma geral, os microserviços são tipicamente instalados em dois nós (máquinas) de execução:

  • Nó de Controle: nó que contém os serviços de controle do processo de transcrição.

  • Nó de Processamento: nó que executa as tarefas computacionalmente mais pesadas da transcrição. O nó de processamento deve ser escalado verticalmente ou horizontalmente de acordo com a necessidade de velocidade de transcrição.

_images/transcription-server.PNG

A imagem acima ilustra de forma conceitual os elementos que compõem o sistema:

  • API: representa o serviço que expõe a API REST de controle de arquivos e do processo de transcrição.

  • Node Manager: controla a criação das instâncias de processamento.

  • Normalization: serviço que converte o formato dos arquivos para o padrão do sistema e realiza a identificação dos canais de áudio.

  • Diarization: serviço que identifica os segmentos de fala e a diferenciação de locutor.

  • Recognition: serviço que executa o reconhecimento do segmento de fala.