Interface MRCP para Verificação de Locutor¶
Campos de cabeçalho¶
A tabela abaixo descreve os campos de cabeçalho disponíveis no Servidor MRCP do CPQD para o recurso de Verificação de Locutor. Os métodos estão divididos em dois grupos:
Requisição
Significa que a mensagem será trocada no sentido Cliente -> Servidor
Resposta
Significa que a mensagem será trocada no sentido Servidor -> Cliente
Header |
PARAMS |
Eventos |
Métodos |
|
---|---|---|---|---|
SET/GET |
Requisição |
Resposta |
||
Channel-Identifier |
NÃO |
- |
START-SESSION |
- |
Completion-Cause |
NÃO |
VERIFICATION-COMPLETE |
- |
VERIFY VERIFY-FROM-BUFFER QUERY-VOICEPRINT |
Logging-Tag |
SIM |
- |
SET-PARAMS GET-PARAMS |
- |
No-Input-Timeout |
SIM |
- |
VERIFY |
- |
Start-Input-Timers |
SIM |
- |
VERIFY |
- |
Speech-Complete-Timeout |
SIM |
- |
VERIFY |
- |
Media-Type |
SIM |
- |
VERIFY |
- |
Input-Waveform-URI |
NÃO |
- |
- |
- |
Min-Verification-Score |
SIM |
- |
START-SESSION |
- |
Num-Min-Verification-Phrases |
SIM |
- |
START-SESSION |
- |
Num-Max-Verification-Phrases |
SIM |
- |
START-SESSION |
- |
Repository-URI |
NÃO |
- |
START-SESSION QUERY-VOICEPRINT DELETE-VOICEPRINT |
- |
Verification-Mode |
NÃO |
- |
START-SESSION |
- |
Voiceprint-Exists |
NÃO |
- |
- |
QUERY-VOICEPRINT DELETE-VOICEPRINT |
Voiceprint-Identifier |
NÃO |
- |
START-SESSION QUERY-VOICEPRINT DELETE-VOICEPRINT |
- |
Ver-Buffer-Utterance |
NÃO |
- |
VERIFY |
- |
Vendor-Specific-Parameters |
SIM |
- |
START-SESSION |
- |
Parâmetros de Configuração¶
Os parâmetros abaixo descritos podem ser configurados via SET-PARAMS (válido para toda a sessão) e VERIFY (válido somente para a operação corrente).
- Logging-Tag¶
Esse parâmetro define uma «tag» que é inserida nas linhas de log geradas no servidor. Sempre que definido, o valor atual sobrescreve o anterior e é mantido até o final da sessão. O acesso ao log gerado no servidor é feito por administradores. É recomendado os valores da «tag» possam identificar a origem da requisição MRCP, e evitem o uso de informações sensíveis dos usuários.
- Media-Type¶
Indica ao servidor o formato do áudio capturado.
Domínio:
application/octet-stream (áudio “RAW” em PCM Linear 16bits e 8kHz)
audio/wav
audio/mp3
audio/ogg+opus
- Min-Verification-Score¶
Determina o valor mínimo do score de verificação para o servidor gerar uma decisão «accepted», durante uma operação de verificação de locutor.
Domínio:
Número em ponto flutuante, variando entre -1.0 e 1.0.
- Num-Min-Verification-Phrases¶
Determina o número mínimo de verificações válidas necessárias antes de gerar uma decisão.
Domínio:
Número inteiro, positivo (valor default = 1)
- Num-Max-Verification-Phrases¶
Determina o número máximo de verificações válidas antes de o servidor gerar uma decisão, mesmo que forçada. O servidor não poderá gerar uma decisão «undecided» quando o número máximo de verificações ocorrer.
Domínio:
Número inteiro, positivo (valor default = 1)
- No-Input-Timeout¶
O No-Input-Timeout determina o tempo máximo que o recurso aguardará até o evento de início de fala. Se o parâmetro Start-Input-Timers estiver habilitado no envio da mensagem VERIFY, o No-Input-Timeout começará a contar desde então. Se o parâmetro Start-Input-Timers estiver desabilitado no envio da mensagem VERIFY, o No-Input-Timeout começará a contar a partir do envio da mensagem START-INPUT-TIMERS. Se estourar o No-Input-Timeout, o evento VERIFICATION-COMPLETE será disparado com Completion-Cause igual a «no-input-timeout» (002).
Domínio:
Número inteiro, positivo em milissegundos (valor default = 10000)
- Start-Input-Timers¶
Inicia automaticamente a contagem do No-Input-Timeout juntamente com o recebimento da mensagem VERIFY. Se desativado, o No-Input-Timeout será iniciado de forma manual, no recebimento da mensagem START-INPUT-TIMERS.
Domínio:
Booleano (valor default = true)*
- Speech-Complete-Timeout¶
O Speech-Complete-Timeout determina a duração do silêncio dentro do áudio para a detecção do fim da fala.
- Vendor-Specific-Parameters¶
Utilizado para configurar parâmetros específicos do CPQD. O Vendor-Specific-Parameters tem prioridade sobre os outros parâmetros. Exemplo para configurar o timeout de verificação:
MRCP/2.0 145 SET-PARAMS 1
Channel-Identifier: e13c68ea4f5d11ea@speakverify
Vendor-Specific-Parameters: br.com.cpqd.ver.Verification-Timeout=30000
Completion-Cause¶
Descrição dos Completion-Cause devolvidos pelo sistema
Result-Status |
MRCP v2 |
Descrição |
---|---|---|
SUCCESS |
000 |
A verificação ocorreu sem problemas |
NO_INPUT_TIMEOUT |
002 |
Nenhum pacote de áudio foi recebido no período do No-Input-Timeout |
OUT_OF_SEQUENCE |
006 |
Mensagem fora de sequência esperada |
REPOSITORY_URI_FAILURE |
007 |
Falha no acesso ao repositório de URI |
REPOSITORY_URI_MISSING |
008 |
Falta da informaçao de repositório de URI |
VOICEPRINT_ID_MISSING |
009 |
Falta de identificador de voiceprint |
VOICEPRINT_ID_NOT_EXIST |
010 |
Identificador de voiceprint inexistente no repostitório de URI |
VERIFICATION_TIMEOUT / SPEECH_NOT_USABLE |
011 |
O evento START-OF-INPUT foi disparado e a verificação não foi concluído dentro do período do Verification-Timeout definido em Vendor-Specific-Parameters |
Métodos Disponíveis¶
O Servidor MRCP para Verificação de Locutor suporta as seguintes mensagens:
Métodos |
Servidor |
Descrição |
---|---|---|
SET-PARAMS |
X |
Configura parâmetros recurso para toda a sessão |
GET-PARAMS |
X |
Recupera valores dos parâmetros do recurso no instante da chamada |
QUERY-VOICEPRINT |
X |
Recupera informações sobre um voiceprint em um repositório biométrico |
DELETE-VOICEPRINT |
X |
Apaga um voiceprint armazenado em um repositório biométrico |
START-SESSION |
X |
Cria uma sessão e aloca um recurso de verificação biométrica |
END-SESSION |
X |
Encerra uma sessão e desaloca o recurso de verificação biométrica |
VERIFY |
X |
Solicita uma operação de cadastro ou verificação de locutor |
VERIFY-FROM-BUFFER |
X |
Solicita uma operação de cadastro ou verificação de locutor a partir de um áudio armazenado no buffer de verificação |
VERIFY-ROLLBACK |
X |
Descarta o último áudio armazenados no buffer de verificação. |
CLEAR-BUFFER |
X |
Descarta todos os áudios do buffer de verificação. |
GET-INTERMEDIATE-RESULT |
- |
Recupera o resultado da última verificação |
START-INPUT-TIMERS |
X |
Dispara a contagem do timer No-Input-Timeout e Verification-Timeout |
STOP |
X |
Cancela a verificação em andamento |
Eventos Disponíveis¶
Os eventos do recurso de verificação estão descritos na tabela abaixo:
Eventos |
Servidor |
Descrição |
---|---|---|
START-OF-INPUT |
X |
Ocorre quando o recurso detecta Início de Fala |
VERIFICATION-COMPLETE |
X |
Sinaliza que a verificação foi finalizada |