Ingenium Núm. 5 - Otoño 2014

Figura 5. Grafica de naturalidad e inteligibilidad.

7. Conclusiones

Según los resultados presentados, se demuestra que la naturalidad corresponde a “voz humana poco natural

tendiente a natural” y la inteligibilidad corresponde a “prácticamente entendible”.

Actualmente el sistema

UrbvoxTTS

es funcional de acuerdo a los resultados de las pruebas. El

sistema puede generar correctamente la lectura de una palabra en español, asegurando la comunicación entre

el dispositivo y el usuario lo cual es el principal objetivo del sistema, sin embargo, podría ser mejorado

elevando los niveles de calidad.

Se detectan como formas para aumentar la calidad de voz, el aumentar la colección de difonemas y el

asegurar la transcripción fonética mediante pruebas extensivas de vocabulario detectando aquellas palabras

que no fueron reproducidas satisfactoriamente y revisando cada módulo para asegurar una salida correcta.

8. Reconocimientos

El Dr. Jesús Manuel Dorador, actualmente es jefe del Departamento de Ingeniería Mecatrónica y profesor

titular “B” de Tiempo Completo en la Facultad de Ingeniería de la UNAM, estuvo de acuerdo con apoyar el

proyecto, involucrando al Dr. Abel Herrera Camacho quien está a cargo del Laboratorio de Señales de Voz

del Posgrado de Ingeniería, en donde fue implementado un sintetizador de voz para un PDA llamado

Pocket

Voz

desarrollado por el estudiante Fernando del Río Ávila, contando con las autorizaciones correspondientes

para tener acceso a la información necesaria como el código fuente, los antecedentes y la aplicación para

realizar diferentes cambios y pruebas. Agradecemos profundamente a todos ellos.

9. Referencias

[1] Lemmetty Sami, Review of Speech Synthesis Technology, Abstract of the Master’s Thesis, Helsinki,

1999.

[2] E. Keller, Improvements in Speech Synthesis, Willey and Sons, Inglaterra,2002.

[3] Dutoit Thierrry, An introduction to text-to-speech synthesis, Kluwer Academic, Holanda, 1997.