Guia de Usuário¶
Este guia exemplifica de forma básica as principais operações para realizar a transcrição em arquivos individuais ou em um lote de arquivos. Elas são:
Transcrever arquivos¶
Exemplifica de forma básica as principais operações para transcrever arquivos individuais. Para maiores detalhes consulte o guia da API REST.
Para realizar a transcrição de arquivos individuais de áudio, deve-se realizar os seguintes passos:
1. Realizar o upload e a transcrição dos arquivos
Os arquivos podem ser transferidos pelo método create na API REST.
Exemplo:
curl -X POST "http://localhost:8000/trd/v3/job/create" -H "accept: application/json" -H "Content-Type: multipart/form-data" -F "config=" -F "callback_urls=" -F "upload_file=@<path-to-file>/file1.wav;type=audio/wav"Após utilizar o método create conforme descrito acima, serão devolvidas, como resultado, um json com informações relevantes ao estado do arquivo, como o seu identificador que é encontrado dentro do atributo <id> e informações relevantes ao estado atual do transcrição é pode ser encontrado dentro de <status>.
Exemplo:
{ "job":{ "id":"5fc7baefeee464d8c64c7e1a", "filename":"nas.wav", "status":"QUEUED", "created_at":"2020-12-02T13:03:59.801404-03:00", "callback_urls":[ ], "media":{ "md5":"18eef3c06a975dc8cd1adad4ae662824", "size":72544 }, "config":{ "diarization":{ "vad":{ "chunk_max_silence":1200.0, "chunk_max_length":3600.0 }, "clustering":{ "threshold":-0.4, "enabled": true } }, "recognition":{ "params":{ }, "lm":"builtin:slm/callcenter-small" } } } }
2. Acompanhar o andamento do processo
Cada arquivo possui um atributo de controle que indica o estado atual do processo de transcrição. O atributo de controle possui os valores:
- QUEUED: o arquivo está na fila esperando o inicio do processo de normalização.
- IN_PROGRESS: o arquivo já entrou na pipeline de reconhecido e transcrição.
- FAILED: o arquivo não conseguiu ser transcrito, por falha do sistema ou problemas com o audio.
- STOPPED: o arquivo parou de ser transcrito por intermédio do operador do sistema.
- COMPLETED: o arquivo já foi transcrito.
Exemplo:
curl -X GET "http://localhost:8000/trd/v3/job/status/<id>"
3. Recuperar o resultado da transcrição
Quando o arquivo estiver no estado COMPLETED, a transcrição daquele arquivo é considerada finalizada. A partir desse momento, o resultado da transcrição daquele arquivo pode ser consultado com segurança, pois todos os dados estarão completos.
Exemplo:
curl -X GET "http://localhost:8000/trd/v3/job/result/<id>""
4. Recuperar o resultado da transcrição com tags
Similar de como ocorre com a transcrição de arquivos individuais, podemos também fazer um controle de um grupo de arquivos através de uma <tag>, o upload funciona de forma similar ao item 1, porem podemos adicionar um parâmetro adicional a URL
Exemplo:
curl -X POST "http://localhost:8000/trd/v3/job/create?tag=<tag>" -H "accept: application/json" -H "Content-Type: multipart/form-data" -F "config=" -F "callback_urls=" -F "upload_file=@<path-to-file>/file1.wav;type=audio/wav"
Agora podemos recuperar um grupo de arquivos que possuem a mesma <tag> e o mesmo <status>.
Exemplo:
curl -X GET "http://localhost:8000/trd/v3/query/job?status=<status>&tag=<tag>"