Visão Geral do Produto

O CPqD Transcrição de Diálogos é formado por um conjunto de microserviços que realizam as diferentes tarefas do processo de transcrição. A adoção de microserviços permite uma maior flexibilidade na instalação do sistema, otimizando o uso de recursos computacionais.

De uma forma geral, os microserviços são tipicamente instalados em dois nós (máquinas) de execução:

  • Nó de Controle: nó que contém os serviços de controle do processo de transcrição.
  • Nó de Processamento: nó que executa as tarefas computacionalmente mais pesadas da transcrição. O nó de processamento deve ser escalado verticalmente ou horizontalmente de acordo com a necessidade de velocidade de transcrição.
_images/transcription-server.PNG

A imagem acima ilustra de forma conceitual os elementos que compõem o sistema:

  • API: representa o serviço que expõe a API REST de controle de arquivos e do processo de transcrição.
  • DB Watcher: controla o processo de transcrição, distribuindo os arquivos para os executores do processo.
  • Normalization: serviço que converte o formato dos arquivos para o padrão do sistema e realiza a identificação dos canais de áudio.
  • Diarization: serviço que identifica os segmentos de fala e a diferenciação de locutor.
  • Recognition: serviço que executa o reconhecimento do segmento de fala.