sábado, 7 de junio de 2014

Historia de los sintetizadores de voz [Parte I]


Además de adentrarnos en el lado “ciber-social” de este ismo virtual, vamos a conocer un poco más sobre el ámbito técnico. Por eso investigaremos y colaboraremos en una pequeña guía de la historia de los sintetizadores de voz.


¿Qué es un sintetizador de voz?


Es un mecanismo que se encarga de la producción artificial del habla humana. Un sintetizador de voz convierte el texto en voz.


Generalmente los sintetizadores de voz tienen memorizados digitalmente cada uno de los fonemas o palabras que son capaces de emitir (por lo que muchos son limitados en cuanto a esto). Los datos que recibe un sintetizador procedente del ordenador corresponden a la identificación de los fonemas o palabras a emitir. Una vez que se analiza el dato, se activa un proceso encargado de generar el sonido correspondiente.

Para lograr la más completa claridad en el habla, lo adecuado es almacenar pronunciaciones de palabras completas. Los sintetizadores de habla son muy útiles para ser usados por aquellas personas con discapacidades; por ejemplo, se utiliza un sintetizador de habla en programas de asistencia como los lectores de pantalla.


 El usuario de sintetizador de voz más conocido: Stephen Hawking.


El primer ejemplo de este sintetizador de voz lo hallamos en 1779, cuando Christian Kratzenstein hizo 5 silbatos que hacían sonar las vocales artificialmente (a,e,i,o,u) . Pocos años más tarde, en 1791, Wolfgang von Kempelen (conocido más por su habilidad como ajedrecista) presentó su "Máquina de Voz Acústico-Mecánica" que podríamos considerar el primer sintetizador de voz ya que podía producir sonidos aislados y algunas combinaciones sonoras.




 Parece un pato que pide agua.




Parece que Kempelen había comenzado a trabajar en esto antes que Kratzenstein y tras 20 años de trabajo, en 1789, publicó el libro “Mecanismo de la palabra humana” (Mechanismus der menschlichen Sprache) donde explica su investigación acerca de la producción de la voz humana y su reproducción artificial mediante su máquina.










Aunque no parezca más que un burdo cajón de madera, dotado de palancas y una bocina los planos muestran cómo el sonido se genera al crear una corriente de aire, controlada por una especie de fuelle, a través del que se “inhala” y se expele el aire, imitando así el sistema de habla humano. Las piezas esenciales de la máquina eran: un fuelle que simulaba los pulmones, un silbato que actuaba como las cuerdas vocales, y un tubo de cuero para simular el tracto vocal.

Su invento no tuvo gran repercusión, puesto que años antes, Kempelen presentó “El turco” un autómata que similaba jugar ajedrez, pero que en realidad era accionado por una persona de baja estatura dentro de su estructura.




"El turco" de Kempeler


Así, pasó mucho tiempo para que otro inventor se lanzara a la hazaña de crear un sintetizador de voz mecánico. En 1837, Charles Wheatstone replica la máquina de Kempelen añadiéndole fuelles y cavidades que simulaban los labios.




En 1835, Joseph Faber inventa “Euphonia” una máquina bastante similar a un clavecín, puesto que consistía de un teclado y pedales, además que algunos modelos tenían máscaras de rostros humanos. Su capacidad no iba más allá del tarareo de algunas canciones. 






Lo del rostro es perturbador.




En la segunda parte nos alejaremos de los sistemas mecánicos, para revisar la historia de los sintetizadores de voz electrónicos: abuelos de Jorge y Miku.