Tendencias21
Un sistema automático convierte vídeos tediosos en películas interesantes

Un sistema automático convierte vídeos tediosos en películas interesantes

Cada vez existen más herramientas para grabar rutinas diarias, bien sea por interés propio, vigilancia u otros motivos. Sin embargo, esto da lugar a pesadas grabaciones de larga duración que, en la mayoría de los casos, no pueden ser revisadas en detalle. Investigadores de la Universidad de Texas en Austin, Estados Unidos, han desarrollado una técnica capaz de analizar estos vídeos y montar la mejor historia reducida, pero sin perder la coherencia ni información relevante. Por Patricia Pérez.

Un sistema automático convierte vídeos tediosos en películas interesantes

Algún día no muy lejano los ordenadores nos facilitarán automáticamente el videoresumen de un día de nuestra vida, las vacaciones familiares o las ocho horas de patrulla policial, según auguran científicos de la Universidad de Texas (UT) en Austin.

Los investigadores se adelantan así a lo que está por venir, sobre todo cuando se extienda el uso comercial de dispositivos como Looxcie, la primera videocámara con conexión móvil y manos libres, o las novedosas Google Glass, un paso más en la realidad aumentada.

“La cantidad de lo que nosotros llamamos vídeo ‘egocéntrico’, aquel que graba lo que sucede alrededor de la perspectiva de una persona, está a punto de explotar”, avanza Kristen Grauman, profesora asociada de Ciencias de la Computación, en un comunicado de la UT. Por ello, “vamos a necesitar mejores métodos para resumir y seleccionar de entre todos esos datos”, continúa.

La necesidad es cada vez más clara, pues aparecen nuevos dispositivos y escenarios que generan vídeos de gran volumen, por lo que resulta complicado revisarlos al detalle. Además, con los métodos actuales, existe el riesgo de perder información esencial al sintetizar la grabación.

Como alternativa, Grauman y su equipo han desarrollado una avanzada técnica que utiliza aprendizaje automático para analizar los vídeos grabados, de forma que puedan acortarlos mediante clips muy breves o una serie de imágenes fijas que sigan transmitiendo la esencia de la historia. El método, al que han bautizado como videoresumen “Story-driven”, se presentó este verano en la Conferencia IEEE sobre Visión Artificial y Reconocimiento de Patrones.

Este tipo de videoresumen ayudará a las autoridades militares a gestionar las imágenes de las cámaras de los soldados, a los investigadores a seleccionar información a través de vídeos grabados con teléfonos móviles en sucesos como el atentado en el maratón de Boston, o a los mayores que usan esta herramienta en su día a día para compensar pérdidas de memoria.

Un sistema automático convierte vídeos tediosos en películas interesantes

Esencia y coherencia

Diversos estudios demuestran la utilidad que supone para personas con pérdidas de memoria llevar una cámara en su vida diaria, la cual toma una instantánea una vez por minuto de todo aquello que le rodea.

El hecho de revisar esas imágenes al final del día puede ayudarles en su recuperación. Pero, “¿y si en lugar de imágenes seleccionadas por un minuto de diferencia, tuvieran un vídeo o resumen fotográfico cribado con las mejores historias? Tal vez eso les ayudaría aún más”. Ese es el planteamiento de Grauman y el objetivo que persigue con su método.

Para ponerlo en práctica se valieron de grabaciones de más de 12 horas de actividad diaria tomadas por 23 voluntarios que utilizaron cámaras Looxcie. Se trata de dispositivos que se ajustan cómodamente en la oreja como un dispositivo Bluetooth convencional y son capaces de grabar hasta cinco horas seguidas. Se conectan al smartphone para compartir los contenidos generados, y cuestan alrededor de 200 dólares.

El siguiente paso era determinar qué hace buena una historia visual. Los métodos tradicionales para resumir vídeos seleccionan bien una serie de fotogramas clave o aquellas tomas que mejor representan la entrada original. Para ello se basan en factores como la diversidad (fotogramas no redundantes), anomalías (sucesos inusuales), y el espacio temporal. Se tiene en cuenta el movimiento o el color, y se rastrean objetos de interés.

Todo ello consigue reducir el tiempo de visionado, pero para los investigadores se trata de una opción “demasiado limitante”, pues no se atiende al progreso de las acciones. Como resultado, se pueden omitir sucesos importantes -pero cortos en el tiempo-, mientras se mantienen los redundantes -aunque visualmente diversos- que no afectan a la narrativa general.

Por tanto, Grauman y su equipo tienen claro que más allá de mostrar personas, objetos o escenarios importantes, se debe transmitir cómo una cosa lleva a la siguiente. En definitiva, darle coherencia a la narración visual.

Buscar la influencia

Una vez claro el objetivo, el mecanismo consta de dos pasos. El primero implica el uso de técnicas de aprendizaje automático para enseñar al sistema de “puntuación” el significado de los objetos visualizados. Para ello se basan en factores egocéntricos, tales como la frecuencia con la que aparecen ciertos objetos en el centro de la imagen, que es un buen indicador de hacía dónde mira el portador de la cámara, o si los toca con sus manos. De esta forma se seleccionan los fotogramas más importantes.

El siguiente paso fue utilizar dichos fotogramas para buscar aquellos que influyen en los posteriores. Para ello adaptaron un método desarrollado por investigadores de la Universidad Carnegie Mellon, en Estados Unidos, que podía predecir cómo una noticia lleva a la otra, reuniendo una serie de artículos para la transición desde un punto de partida a un punto final conocido.

En el trabajo sobre texto, los investigadores prestaron especial atención a la frecuencia de uso de ciertas palabras y a las correlaciones a través de artículos para cuantificar su influencia. Para su adaptación al vídeo, Grauman y su equipo utilizaron objetos y fotogramas significativos para hacer lo mismo. Así fueron capaces de dar forma a una cadena de vídeos ensamblados eficientemente para rellenar la historia de principio a fin.

A continuación realizaron encuestas para comparar su método con los anteriores, y “entre el 75 y el 90 por ciento de las personas que evaluaron los resúmenes calificaron nuestro sistema como superior», asegura la profesora.

La misma considera que a medida que las técnicas para sumariar vídeos sigan mejorando, se convertirán en una valiosa herramienta no sólo para aquellos con necesidades muy especializadas, como los investigadores policiales y los que sufren pérdida de memoria, sino también para los usuarios habituales de Internet.

De hecho, mejorar la exploración de vídeo en la web es una de las aplicaciones que se augura al sistema. Grauman puso como ejemplo la posibilidad de visualizar 50 imágenes en una página web. “Es manejable, ya que se pueden desplazar hacia arriba o abajo y verlas todos de una sola pasada. Ahora imagínese tratando de ver 50 vídeos online; simplemente no es viable”, sentencia. Ahí radica su próximo reto.

RedacciónT21

Hacer un comentario

RSS Lo último de Tendencias21

  • Los abrazos alivian la ansiedad y la depresión, según un nuevo estudio 18 abril, 2024
    Los abrazos y otras formas de contacto físico pueden ayudar con la salud mental en personas de todas las edades, según una nueva revisión de 212 estudios previos. Aunque esto ya estaba claro, los expertos aún no habían podido determinar qué tipo de contacto es el que genera más ventajas y por qué.
    Pablo Javier Piacente
  • Corrientes de estrellas y materia oscura diseñaron a la Vía Láctea 18 abril, 2024
    Restos de galaxias absorbidas por la Vía Láctea conforman corrientes estelares que la diseñaron a lo lardo de su historia. Algunas de esas fusiones podrían arrojar luz sobre el misterio de la materia oscura.
    Pablo Javier Piacente
  • Ya vivimos en un mundo de ciencia ficción 18 abril, 2024
    El Meta World Congress celebrado la semana pasada en Madrid ha dejado claro que los mundos virtuales y los videojuegos son el laboratorio de un Metaverso cada vez más inteligente y que la tecnología inmersiva cambiará el teatro y los conciertos. Un proceso de fusión de inteligencias llevará a la creatividad artificial a mezclarse con […]
    ALEJANDRO SACRISTÁN (enviado especial)
  • Descubren el pan más antiguo en Turquía: tiene 8.600 años 17 abril, 2024
    Un equipo de arqueólogos ha descubierto el pan más antiguo conocido en todo el mundo, que data del año 6600 a. C. Fue identificado en Çatalhöyük, un destacado asentamiento neolítico en Anatolia central, Turquía.
    Pablo Javier Piacente
  • Detectan un enorme agujero negro dormido en nuestra galaxia 17 abril, 2024
    El agujero negro de masa estelar más monstruoso de la Vía Láctea es un gigante dormido que acecha cerca de la Tierra, según un nuevo estudio. Con una masa casi 33 veces mayor que la del Sol, esta colosal estructura cósmica yace oculta a menos de 2.000 años luz de nuestro planeta, en la constelación […]
    Pablo Javier Piacente
  • Los pájaros reviven en sus sueños experiencias reales 17 abril, 2024
    Una investigación increíble ha descubierto que los pájaros a veces sueñan que están defendiendo su territorio frente a rivales, mostrándose con una cresta erizada de plumas y con un trino asociado al enfrentamiento.
    Redacción T21
  • Descubren cómo Plutón consiguió su corazón 16 abril, 2024
    El misterio de cómo Plutón consiguió una característica gigante en forma de corazón en su superficie finalmente ha sido resuelto: los científicos lograron reproducir con éxito la forma inusual con simulaciones numéricas, atribuyéndola a un impacto gigante y lento en ángulo oblicuo. Se trató de una colisión con un cuerpo planetario de unos 700 kilómetros […]
    Pablo Javier Piacente
  • La vida podría existir desde los inicios del Universo 16 abril, 2024
    El físico Avi Loeb sostiene en un reciente artículo que los elementos para el desarrollo de la vida tal como la conocemos podrían estar presentes en el cosmos desde la formación de las primeras estrellas, unos 100 millones de años después del Big Bang. También postula que esta hipótesis podría comprobarse si la misión Dragonfly […]
    Pablo Javier Piacente
  • Crean un acelerador de partículas en miniatura con aplicaciones médicas 16 abril, 2024
    Investigadores alemanes han desarrollado un acelerador de electrones que mide poco menos de medio milímetro de largo y 0,2 micrómetros de ancho, es decir, menos de una milésima de milímetro. Tiene aplicaciones en la investigación básica y permitirá crear nuevas herramientas de radioterapia. Entrevista con sus protagonistas, Peter Hommelhoff y Stefanie Kraus.
    Oscar William Murzewitz (Welt der Physik)/T21
  • Revelan la primera molécula fractal en la naturaleza 15 abril, 2024
    Los científicos han descubierto una molécula en la naturaleza que sigue un patrón geométrico de autosimilitud, conocido como fractal. La enzima microbiana denominada citrato sintasa es la primera estructura fractal molecular ensamblada directamente en la naturaleza que ha logrado identificarse hasta el momento. Los especialistas creen que este fractal puede representar un accidente evolutivo.
    Pablo Javier Piacente