Boas práticas

Muitos dos defeitos comumente percebidos em aplicações baseadas em síntese da fala, decorrem não da qualidade da síntese em si, mas de problemas no texto que é fornecido ao sintetizador pela aplicação. Erros de ortografia e textos mal pontuados quase sempre se refletem em problemas na fala sintetizada.

Seguem algumas sugestões de redação de textos que objetivam maximizar a qualidade da fala produzida.

Grafia das palavras

Para que a qualidade da fala sintetizada seja a melhor possível, é importante que o texto a sintetizar esteja escrito em português correto. Exceto substituições efetuadas na etapa de processamento de texto (dígitos, abreviações, tags SSML etc), o CPQD Texto Fala vocaliza o texto de entrada exatamente como recebido; erros de ortografia refletem-se, em geral, em uma vocalização incorreta, muitas vezes confundida pelo ouvinte como um defeito na fala sintetizada.

Um erro comum em textos em português é a omissão de acentos ou a inclusão de acentos inexistentes. Quando existirem na língua, os acentos devem estar sempre presentes no texto fornecido ao sintetizador. Por exemplo, as palavras “Dário” (com acento) e “Dario” (sem acento) serão vocalizadas de forma diferente.

Alguns erros de grafia comuns e que devem ser evitados:

  • Uso de “c” ao invés de “ç” (cê cedilha). Exemplo: “Goncalves” ao invés de “Gonçalves”; “Lourenco” ao invés de “Lourenço”.
  • Falta do “til”. Exemplo: “Falcao” ao invés de “Falcão”; “Conceiçao” ao invés de “Conceição”.
  • Presença ou ausência do acento agudo. Exemplo: “Amelia” ao invés de “Amélia”; “Cicero” ao invés de “Cícero”.
  • Presença ou ausência do acento circunflexo. Exemplo: “Tania” ao invés de “Tânia”; “Tres de setembro” ao invés de “Três de setembro”.

Existem casos em que a própria ortografia é ambígua no que diz respeito à pronúncia das palavras. Por exemplo, a palavra “sede” pode ser lida com “e” fechado (“Matei a sede com água.”) ou aberto (“Esta é a sede social do clube.”). Neste caso, a desambiguação somente pode ser feita por meio de uma análise semântica. Como o CPQD Texto Fala não conhece o significado do texto lido, ele não é capaz de efetuar esta desambiguação. Para forçar uma dada pronúncia, o usuário pode incluir um acento mesmo que não exista ortograficamente (“sêde” para “e” fechado e “séde” para “e” aberto).

Pontuação

Para que o texto seja lido com as pausas corretas, facilitando a sua compreensão e melhorando a qualidade geral da fala sintetizada, é necessário que o texto possua todos os símbolos de pontuação corretamente colocados.

Isto implica a presença de símbolos de vírgula, ponto final, ponto de interrogação, ponto e vírgula, dois pontos etc. em locais apropriados. Estes símbolos indicam ao sistema os locais em que devem ser inseridas pausas na vocalização, bem como a entonação que deve ser dada à fala sintetizada. É importante também a presença de espaços em branco entre palavras sucessivas.

Por exemplo, os dois textos a seguir serão lidos de forma diferente:

  • O dr.Lourenço atende de 2ª a6ª feira das 8 às 17horas favor marcar consulta pelo telefone 21-21-21-21 (obrigada)
  • O dr. Lourenço atende de 2ª a 6ª feira, das 8 às 17 horas. Favor marcar consulta pelo telefone: 2121-2121. Obrigada.

No primeiro texto, faltam símbolos de pontuação e espaços em branco. Já no segundo, a pontuação está correta e sempre há um espaço entre palavras sucessivas, levando a uma melhor qualidade da fala sintetizada.

Muitas vezes as pausas que são dadas por um locutor ao ler um texto em voz alta não correspondem exatamente à pontuação convencional da língua portuguesa. Por exemplo, considere as frases a seguir:

  • Comprei arroz, feijão, açúcar, sal e leite.
  • Bom dia, José.

Na primeira frase, um locutor geralmente faria uma pausa entre as palavras “sal” e “e”, embora as regras de pontuação do português não recomendem a inclusão de uma vírgula nesse local. Já na segunda frase, o mais natural seria a leitura sem pausa, embora a vírgula entre “dia” e “José” não seja ortograficamente incorreta.

Em casos como os expostos acima, é recomendável pontuar o texto conforme a vocalização desejada, isto é, inserindo pontuação (geralmente uma vírgula) em todos os locais em que se deseja que o sistema faça uma pausa, e omitindo a pontuação (mesmo que ortograficamente correta) quando não se deseja a pausa na vocalização.