Parâmetros da Diarização de Locutor versão v1

diarization.vad.chunk_max_silence

Descrição: Limite máximo de silêncio em segundos. Parâmetro para uso interno.

Valores: Número (float). Valor padrão: 1200.0

Exemplos:

diarization.vad.chunk_max_silence=1200.0
{
  "diarization": {
    "vad": {
      "chunk_max_silence": 1200.0
    }
  }
}

diarization.vad.chunk_max_length

Descrição: Limite máximo de áudio em segundos. Parâmetro para uso interno.

Valores: Número (float). Valor padrão: 3600.0

Exemplos:

diarization.vad.chunk_max_length=3600.0
{
  "diarization": {
    "vad": {
      "chunk_max_length": 3600.0
    }
  }
}

diarization.clustering.enabled

Descrição: Habilita ou desabilita a etapa de clusterização.

Valores: True ou False. Valor padrão: True

Exemplos:

diarization.clustering.enabled=False
{
  "diarization": {
    "clustering": {
      "enabled": true
    }
  }
}

diarization.clustering.threshold

Descrição: Limiar de clusterização. Parâmetro para uso interno.

Valores: Número (float). Valor padrão: -0.4

Exemplos:

diarization.clustering.threshold=-0.4
{
  "diarization": {
    "clustering": {
      "threshold": -0.4
    }
  }
}

diarization.clustering.speakers

Descrição: Número de locutores em cada canal do arquivo de áudio. Ao utilizar este parâmetro, o «diarization.clustering.threshold» não terá efeito.

Valores: Número (int). Valor padrão: None

Exemplo:

diarization.clustering.speakers=2
{
  "diarization": {
    "clustering": {
      "speakers": 2
    }
  }
}

diarization.descriptor.enabled

Aviso

Descritor está em fase experimental.

Descrição: Habilita ou desabilita o classificador de descrição.

Valores: True ou False. Valor padrão: False

Exemplos:

diarization.descriptor.enabled=True
{
  "diarization": {
    "descriptor": {
      "enabled": true
    }
  }
}

Resultado: O resultado é retornado em conjunto com a transcrição em «descriptor».