Cronos Mar del Plata Cronos Mar del Plata

El Clima en MAR DEL PLATA Cronos + GDS Radio

Últimas noticias

El reto (y las ventajas) de que la inteligencia artificial nos reconozca por la voz y por la cara

Hoy en día, es fácil disponer de grabaciones sonoras de personas que hablan de cualquier tema, pero no tanto diciendo una frase específica que permita mejorar la seguridad o la personalización de los sistemas de reconocimiento.

Mundo 16 de marzo de 2023 Victoria Mingote Bueno
8af6ba2a-c3c9-49b4-abc9-0d988ea776e5-scaled-1

El reto (y las ventajas) de que la inteligencia artificial nos reconozca por la voz y por la cara

TZIDO SUN / Shutterstock
Victoria Mingote Bueno, Universidad de Zaragoza

No cabe duda de que la tecnología se ha convertido en parte crucial de nuestras vidas. Los móviles, las tabletas o los ordenadores nos permiten estar en conexión constante con otras personas, crear contenido, hacer transacciones bancarias, adquirir todo tipo de artículos o asistir a una consulta médica desde casa, entre otras muchas cosas.

Un gran problema de esta nueva era online es que personas no deseadas pueden acceder a toda la información de nuestros dispositivos. Y también nos podemos encontrar con dificultades de acceso si no recordamos la contraseña o al buscar información específica en vídeos.

Por eso es tan importante incorporar técnicas de inteligencia artificial que reconozcan rasgos únicos e intransferibles del usuario como su cara o su voz, a modo de “huella digital”. La ventaja sobre la huella dactilar, por ejemplo, es que los dispositivos no precisan una tecnología específica: basta con la cámara y/o el micrófono que ya incorporan casi todos los modelos.

Máquinas que aprenden al estilo de nuestras neuronas

En los últimos años se han producido grandes avances en este campo gracias a las técnicas de aprendizaje profundo basadas en redes neuronales. Estas redes intentan aprender igual que el cerebro, simulando el proceso de aprendizaje por acierto y error que llevan a cabo nuestras neuronas. Por ejemplo, cuando somos bebés, no sabemos distinguir a quién estamos viendo u oyendo. El cerebro aprende a identificarlos con la experiencia.

La clave del proceso es, pues, el entrenamiento. Se trata de ofrecer al sistema un conjunto de datos de entrada, indicándole la información que debe aprender de ellos. Una vez asimile dicha información, sabrá qué debe hacer cuando reciba nuevos datos. En el caso que nos ocupa, voces e imágenes de rostros.

Estas técnicas ya funcionan bastante bien cuando se “alimenta” al sistema con mucha información. Pero ¿qué pasa si queremos crear un sistema de reconocimiento de personas por su voz con pocos datos específicos para la aplicación donde se va a usar?

Identificar la frase exacta

Hoy en día, es fácil disponer de grabaciones sonoras de personas que hablan de cualquier tema, pero no tanto diciendo una frase específica que permita mejorar la seguridad o la personalización de los sistemas de reconocimiento.

Un ejemplo son los asistentes virtuales que solo se activan cuando el dueño dice: ‘Oye, Siri’ u ‘Ok, Google’. Estos aparatos funcionan ya bastante bien hoy en día, pero los desarrolladores no siempre pueden disponer de los inmensos recursos con los que cuentan Apple o Google.

En casos así, con pocos datos adecuados para enseñar al sistema, usar grandes redes neuronales entrenadas de forma genérica no es la mejor solución. El sistema no va a poder diferenciar correctamente entre varios individuos hablando y diciendo una frase específica.

Para abordar este desafío, en el Instituto de Investigación en Ingeniería de Aragón, Universidad de Zaragoza, hemos usado redes neuronales modificadas. En su desarrollo tuvimos en cuenta la importancia de que la persona que habla pronuncie la frase que le corresponde, ya que tratar todas las partes de las grabaciones por igual –como lo hacen las grandes redes neuronales– no es lo ideal en estos casos.

Con este fin, introdujimos modificaciones que permitieran fijar la atención de los sistemas en los distintos segmentos de la frase pronunciada, aparte de reconocer la identidad del locutor. Las redes así creadas han demostrado ser robustas y capaces de diferenciar bastante bien entre diferentes personas diciendo cosas concretas.

Más allá de estos avances, la escasez de datos específicos en determinadas situaciones sigue constituyendo un reto para mejorar la seguridad y la personalización de los sistemas de reconocimiento. Por ejemplo, todavía nos encontramos con problemas cuando la voz del locutor cambia mucho debido a una enfermedad.

Por otra parte, también nos podemos enfrentar al problema opuesto: ¿qué ocurre cuando disponemos de demasiada información y dos rasgos físicos que reconocer?

Reconocimiento simultáneo de voz y rostro

La expansión de dispositivos con cámaras y micrófonos ha aumentado exponencialmente el volumen de vídeos disponibles en los propios aparatos o internet en general. Esas grabaciones son muy valiosas para desarrollar las técnicas de inteligencia artificial: pueden aprovecharse las voces y los rostros para crear sistemas más seguros que identifiquen ambos rasgos a la vez.

Sin embargo, necesitamos saber qué información exacta aparece en los archivos. Hasta ahora ese proceso se ha hecho manualmente y es muy costoso.

En el trabajo citado anteriormente también desarrollamos nuevos sistemas de reconocimiento conjunto de voz y cara que pueden ayudar a analizar y catalogar el contenido audiovisual de manera más eficiente y automática. Por ejemplo, permitiría buscar en un programa de noticias en qué momento ha hablado alguien de algún tema o cuándo ha aparecido en escena, aunque esté en silencio.

En resumen, la tecnología de reconocimiento de voz y rostro ha avanzado mucho en los últimos años y ya es parte de nuestra vida cotidiana, pero aún existen desafíos por delante. Es importante abordarlos para mejorar el acceso y la seguridad de nuestros dispositivos y acercar la tecnología a todas las personas.The Conversation

Victoria Mingote Bueno, Investigadora Postdoctoral del Departamento de Ingeniería Electrónica y Comunicaciones y del Instituto Universitario de Investigación en Ingeniería de Aragón (I3A), Universidad de Zaragoza

Este artículo fue publicado originalmente en The Conversation. Lea el original.

Más Cronos Noticias

Lo más visto

AUTISMUS RELAXING MUSIC TA TA  Felix Pando

FELIX PANDO: MÚSICA-AUTISMO-RELAX

Guillermo Sammartino
General 25 de septiembre de 2023

Los Trastornos del Espectro del Autismo son un grupo de trastornos de origen neurobiológico que afectan a todo el desarrollo de la persona, produciendo unos cambios cualitativos y cuantitativos en su proceso cognitivo, alterando su manera de estar y de relacionarse con su entorno.

16001555897029

Las sustancias químicas que nos engordan y están por todas partes

Raquel Soler Blasco
Salud 25 de septiembre de 2023

¿Y esto puede suceder en el caso de la obesidad? Pues la evidencia científica parece indicar que sí. La exposición a los citados tóxicos durante momentos críticos del desarrollo es capaz de promover cambios epigenéticos, o sea, modificaciones en el ADN que no afectan a la secuencia del mismo.

2001-A-Space-Odyssey-The-hominid-grabs-a-large-bone-and-begins-pounding-the-ground-and-other-bones-a

‘2001: Una odisea del espacio’: una huella imborrable 55 años después de su estreno

Nathan Abrams
Espectáculos 25 de septiembre de 2023

Los alienígenas de la mayoría de las películas de ciencia ficción pretendían simplemente destruir o apoderarse de la humanidad; eran expresiones, por utilizar el título de un ensayo de Susan Sontag, de “la imaginación del desastre”. Hubo algunas excepciones, como la versión cinematográfica de La guerra de los mundos, de Byron Haskin, y El día que la Tierra se detuvo, de Robert Wise.

PrEP-HIV

La nueva revolución sexual se expande por América Latina

SINC
Salud 26 de septiembre de 2023

Tomada a diario, una pastilla previene la infección por VIH. Pese a que la Organización Mundial de la Salud la recomendó en 2015, la adopción de la PrEP (profilaxis previa a la exposición) ha sido lenta en todo el mundo, en especial en los países sudamericanos y del Caribe. Aún así, los médicos son optimistas: creen que podría ser clave para poner fin a la pandemia de VIH/sida en 2030.

La-accion-humana-esta-acabando-con-ramas-enteras-del-arbol-de-la-vida

La acción humana está acabando con ramas enteras del árbol de la vida

SINC
Ecología 26 de septiembre de 2023

En los últimos cinco siglos no solo han desaparecido algunas especies por culpa del hombre, también géneros completos de vertebrados, y todo a un ritmo 35 veces más acelerado que el del último millón de años. Así lo revela un estudio a gran escala donde se apunta que la sexta gran extinción podría ser más grave de lo que se esperaba.

Suscribite a GDS Mar del Plata + Cronos

Suscríbete al newsletter para recibir periódicamente las novedades en tu email

Loading...