Acceso Habla

Uso de Sistemas de reconocimiento de voz

Para conocer qué es un sistema de reconocimiento de voz vamos a ver un pequeño vídeo de demostración de su funcionamiento.

Demo reconocimiento de voz con Windows Vista

pantalla escritorio vista

Antes de recomendar el acceso al ordenador con un sistema de reconocimiento de voz es recomendable valorar ciertos aspectos del habla del alumno/a, puesto que determinarán las características del sistema a utilizar o la imposibilidad de utilizarlo.

La valoración del habla puede hacerse opcionalmente para cualquier alumno/a, aunque maneje perfectamente el teclado y el ratón, puesto que el sistema de reconocimiento de voz proporciona uno de los accesos más rápidos a la escritura de textos.

Para realizar la valoración del habla no hace falta disponer de un sistema de reconocimiento de voz, pues se valoran parámetros que pueden apreciarse en una comunicación oral.

Aunque conviene posteriormente confirmar su manejo directamente con uno de estos sistemas, sobre todo en el caso de que el alumnado presente alguna disartria.

No todos los sistemas de reconocimiento de voz proporcionan las mismas prestaciones ni exigen las mismas capacidades de habla.

Existen dos tipos de sistemas de reconocimiento de voz:

Sistema de habla continua: Con comandos para control del entorno, por ejemplo instrucciones de manejo del ratón: arriba, abajo, haz clic, etc. Con este sistema se podrá confirmar la capacidad de dictado continuo (dictando unas frases en el procesador de texto).El alumnado tendrá que ser capaz de hablar sin realizar pausas entre palabras y mucho menos dentro de la propia palabra. Además, esto también afecta al reconocimiento de comandos largos.

Sistema de habla discreta: Con comandos de larga extensión como frases y comandos u órdenes simples. Este sistema exige obligatoriamente hacer pausa entre las palabras que se dictan. Permitirá asignar comandos orales más breves a aquellas palabras/comandos de gran longitud que el alumno/a tiene dificultad en pronunciar sin realizar una pausa, por ejemplo "cierra la ventana" como "cerrar". Con esta opción, se puede regular un tiempo mayor de pausa entre palabras, de forma que una pausa menor se desprecia.

Este sistema podrá ser utilizado por los alumnos/as que necesitan hacer una pequeña pausa cuando las palabras/comandos son muy largos. De esta forma no tendrán ningún problema al trabajar con el sistema de reconocimiento, puesto que esa pausa se despreciará.

Además, es posible entrenar el sistema de reconocimiento de voz, no sólo para mejorar el reconocimiento de palabras que no se pronuncian correctamente del todo, sino también para asignar función nula a los sonidos comodín que realice el alumnado.

Cuando el alumnado no puede pronunciar las palabras correctamente, de forma que resulta muy difícil diferenciar palabras distintas, podrá manejar el sistema de reconocimiento de voz en modo comando-control, es decir, no podrá dictar textos complejos pero sí podrá dictar algunas pocas palabras y manejar las opciones de algunas aplicaciones por ejemplo las funciones de un ratón: arriba, abajo, derecha, izquierda, clic, arrastre, doble-clic, alto. La amplitud de los comandos reconocidos dependerá de la capacidad que tenga el alumno para pronunciar palabras que se diferencien fonéticamente.
La utilización de un sistema de reconocimiento de voz para un dictado de texto requiere un mayor control del habla.

Podemos encontrar alumnado con:

Limitaciones en el habla:

  • Capacidad de pronunciación.
  • Cambios en la pronunciación.
  • Sonidos comodín.
  • Cansancio al hablar.

Es frecuente encontrarse con alumnado con dificultades en la articulación de los fonemas y los sinfones (por ejemplo, "pla", "tra"). Esta pronunciación no tiene que ser completamente correcta, pero para poder utilizarlo necesitará un gran periodo de entrenamiento con el sistema hasta que lo reconozca sin errores. A veces, estas dificultades pueden llevarnos a considerar no eficiente el sistema de reconocimiento de voz.

Otro factor que afecta al reconocimiento es la emisión involuntaria de sonidos comodín ("eh"), risas u otros sonidos.

Por último, es importante determinar si el alumnado se fatiga al hablar de forma continuada, al menos para asegurar una sesión de trabajo de diez minutos.

Además de la capacidad para pronunciar diferenciadamente un gran vocabulario, se exigirá que la pronunciación sea estable, es decir, que no haya cambios frecuentes en el volumen, el tono, el ritmo o la entonación.

El sistema de reconocimiento de voz está constantemente adaptándose a la forma de hablar del alumnado, pero si éste realiza cambios constantes en los parámetros básicos el sistema nunca terminará de adaptarse y, por tanto, no se asegura una buena tasa de reconocimiento, es decir, reconocerá siempre con errores.