Inicio
Conceptos básicos
Breve historia
Procesamiento digital
Aplicaciones

Conclusiones

Como principal conclusión se ha llegado a que las técnicas para el análisis y síntesis de voz usadas actualmente, demuestran ser eficientes hasta cierto grado. Por ejemplo, según estadísticas, la precisión del software de reconocimiento de voz de las generaciones anteriores alcanzó poco más del 90%, con lo que su uso para un aumento de la productividad (se entiende que este software acorta el tiempo de desarrollo de aplicaciones, etc., principalmente debido a que el dictado, como es lógico, se hace de forma más rápida que la de escritura mediante teclado) era cuestionable. Aunque el desarrollo de nuevas técnicas, tales como los modelos ocultos de Markov, etc, han proporcionado un incremento de esta precisión mayor del 95%.

Por otra parte el reconocimiento, por desgracia, no ha seguido un desarrollo paralelo a otras técnicas biométricas, como el reconocimiento del iris, huella dactilar, etc.

Metiéndonos en cuestiones técnicas sobre el tema, la técnica de cuantificación vectorial es muy eficiente, ya que además de requerir poca memoria de almacenamiento, la tasa de reconocimiento es considerablemente alta. Aunque ha de quedar claro que esta técnica esta actualmente en desuso, debido principalmente al uso de los modelos de Markov, bastante más eficientes. Se ha elegido el desarrollo de la técnica de los LPC en esta página, debido a su relativa sencillez y simplicidad.

Por último, como principal ventaja, el uso de este tipo de software no requiere grandes cantidades de dinero, ya que solo es necesario un micrófono con una calidad decente, una tarjeta de sonido, un computador y la capacidad de hablar con claridad en todo momento.

Finalizando este apartado, ahora se van a realizar una comparativa de software de síntesis desarrollado entre el año 2000- 2006.

Texto reproducido: "En un lugar de la Mancha, de cuyo nombre no quiero acordarme, no ha mucho tiempo que vivía un hidalgo de los de lanza en astillero, adarga antigua, rocín flaco y galgo corredor.".

•Audio generado con coolspeaking (Año 2001). Escuchar

•Audio generado con sodelscot (Año 2005-2006). Escuchar

•Audio generado con cotovia:
°Usando la técnica de corpus (Año 2005). Escuchar
°Usando la técnica de difonemas (Año 2005). Escuchar

Como conclusión final: Se puede ver la evolución de este tipo de software. Analizando cada uno de los archivos de audio generados con los diferentes programas, se puede observar que la voz ya no presenta una característica robótica y además presenta una mayor naturalidad en el caso de la voz sintetizada con software llamemosló de "última generación".

El Portal del Webmaster
El Portal del Webmaster
El Portal del Webmaster

Página de teleco



 Downloads
 Links
 Conclusiones
 Experimentos
 Bibliografía
Resumen
Contacte con nosotros
Proyecto de la asignatura de Ingeniería de ondas I .