Un nuevo software se 'adentra' durante cinco minutos en el futuro

Un robot de cocina, por ejemplo, podría distribuir los ingredientes tan pronto como se necesiten, precalentar el horno a su debido tiempo y, entre tanto, advertir al chef si está a punto de olvidar un paso de preparación.

Un software desarrollado en la Universidad de Bonn consigue ver el futuro: el programa primero aprende una secuencia típica de acciones para predecir con precisión qué ocurrirá a continuación.

 

El mayordomo perfecto, como saben todos los fanáticos de los dramas sociales británicos, tiene una habilidad especial: percibe los deseos de su empleador antes de pronunciarlos. El grupo de trabajo de Jürgen Gall quiere enseñar a las computadoras algo similar: "Queremos predecir el momento y la duración de las acciones, minutos o incluso horas antes de que sucedan", explica en un comunicado.

 

Un robot de cocina, por ejemplo, podría distribuir los ingredientes tan pronto como se necesiten, precalentar el horno a su debido tiempo y, entre tanto, advertir al chef si está a punto de olvidar un paso de preparación. Mientras tanto, la aspiradora automática sabe que no tiene nada que hacer en la cocina en ese momento y, en su lugar, se ocupa de la sala de estar.

 

Los humanos somos muy buenos para anticipar las acciones de los demás. Para las computadoras, esta disciplina todavía está en su infancia. Los investigadores del Instituto de ciencias informáticas en la Universidad de Bonn han logrado un primer éxito: un software de auto-aprendizaje, que determina la hora y la duración de las actividades futuras se pueden estimarse con exactitud sorprendente durante períodos de varios minutos.

 

En su experimento, los científicos sometieron al software de aprendizaje automático a 40 videos en los cuales cocineros prepararon ensaladas diferentes. Cada uno de los registros tenía una duración de aproximadamente 6 minutos y contenía un promedio de 20 acciones diferentes. Los videos también dieron detalles de a qué hora comenzó la acción y cuánto tiempo tomó.

 

La computadora "miró" este total de aproximadamente cuatro horas de videos de ensaladas. El algoritmo así aprendió qué acciones típicamente se siguen en esta tarea y cuánto duran. Esto de ninguna manera es trivial: después de todo, cada cocinero tiene su propio enfoque. Además, la secuencia puede variar según la receta.

 

"Luego probamos el éxito del proceso de aprendizaje", explica Gall. "Para esto, hemos confrontado el software con videos que no habían visto antes". Después de todo, los nuevos cortometrajes encajan en el contexto: también mostraron la preparación de una ensalada. Para la prueba, se le presentó a la computadora qué había en el primer 20 o 30 por ciento de uno de los videos nuevos. Sobre esta base, tuvo que predecir lo que sucedería en el resto de la película.

 

Eso funcionó increíblemente bien, según Gall: "La precisión era de más del 40 por ciento para períodos cortos de pronóstico, pero luego disminuyó a medida que el algoritmo necesitaba mirar más hacia el futuro". Para acciones que duraron más de tres minutos en el futuro, el software actuó correctamente en el 15 por ciento de los casos. Sin embargo, el pronóstico fue solo correcto si la acción y su sincronización se predijeron correctamente.

 

Los investigadores presentarán sus hallazgos en la Conferencia de Visión Digital y Reconocimiento de Patrones más grande del mundo, que se celebrará del 19 al 21 de junio en Salt Lake City, EE.UU.