Guias de Instalação

O sistema é composto por vários módulos que são tipicamente executados em containers Docker. Eles são:

  • API Service: contém a API REST para a execução do processo de transcrição e gerenciamento dos arquivos de áudio.
  • Node Manager: controla o ciclo de vida das instancia de processamento.
  • Normalization Executor: executor da etapa de normalização de arquivo de áudio.
  • Diarization Executor: executor da etapa de diarização de arquivo de áudio normalizado.
  • Recognition Executor: executor da etapa de reconhecimento de fala de segmento de fala diarizado.

Adicionalmente, ele ainda conta com os seguintes elementos:

  • MongoDB: banco de dados do sistema.
  • RabbitMQ: message broker para distribuir a carga de trabalho entre o controle do processo e os executores.
  • InfluxDB: banco de dados de série temporal para registro de métricas.

A instalação típica do sistema em ambiente de produção organiza os módulos em dois tipos de servidores ou nós:

  • Nó de Controle: contém os elementos mais leves do sistema, que normalmente não necessitam de escalabilidade, utiliza portanto poucos recursos de hardware. É formado pelos módulos:
    • API Service.
    • Node Manager.
    • Normalization Executor.
    • MongoDB.
    • RabbitMQ.
  • Nó de Processamento: contém os elementos que consomem uma maior quantidade de recursos de processamento. Possui maior necessidade de hardware e podem ser replicados para aumentar a capacidade do sistema. É formado por:
    • Diarization Executor.
    • Recognition Executor.
  • Requisitos de Instalação

    Todas as máquinas devem possuir:

    • Processadores da plataforma Intel Xeon ou família Core (5ª geração ou superior)
    • Sistema operacional CentOS 7.5 x64
    • Docker Compose e Docker Engine Community

    Para o Nó de Controle, recomenda-se a configuração:

    • 4 vCPU; 8 GB RAM; 50 GB HD e 500 GB HD como disco de trabalho

    Para as máquinas de Processamento, recomenda-se:

    • 16 vCPU; 16 GB RAM; 50 GB HD