
- “La tienda estaba abierta la semana pasada”.
- “El coche ya no está aparcado aquí”.
- “Han movido una mesa que antes estaba frente a la puerta”.
Una memoria visual artificial para mejorar la orientación
El proyecto StateScribe está siendo desarrollado por investigadores de esta universidad (Ruei-Che Chang, Xirui Jiang, Rosiana Natalie, Hao Chen, Vlad Roznyatovskiy, Jianzhong Zhang, Kang G. Shin, Ke Sun y Anhong Guo) centrados en visión artificial y modelos multimodales de inteligencia artificial. La idea principal consiste en crear una especie de “memoria visual contextual” que ayude a interpretar mejor los cambios del entorno a lo largo del tiempo.
Actualmente, muchos asistentes accesibles basados en IA pueden describir lo que una cámara está viendo en tiempo real. Sin embargo, normalmente no recuerdan cómo era ese lugar anteriormente ni comparan situaciones pasadas con el presente.
StateScribe busca precisamente cubrir esa limitación almacenando información contextual, comparando escenas y generando avisos útiles sobre cambios relevantes.
Cómo funciona StateScribe
Según explica la investigación, el sistema combina: modelos de visión artificial, memoria temporal y generación de lenguaje natural.
La IA analiza imágenes captadas en distintos momentos y detecta modificaciones importantes en el entorno. Después transforma esa información en mensajes comprensibles para el usuario.
El objetivo no es únicamente describir objetos, sino ofrecer contexto útil sobre el paso del tiempo y las diferencias detectadas entre visitas anteriores y la situación actual.
Por ejemplo, el sistema podría indicar si una puerta está ahora cerrada, si desapareció una referencia importante o si un establecimiento cambió de ubicación.
Un posible avance para la autonomía de personas ciegas
Aunque StateScribe todavía se encuentra en fase de investigación, sus posibles aplicaciones prácticas son muy interesantes para accesibilidad y orientación.
Para muchas personas ciegas, la memoria espacial y las referencias del entorno son fundamentales en desplazamientos cotidianos. Cambios aparentemente pequeños pueden afectar significativamente a la movilidad: obras, mobiliario desplazado, vehículos aparcados, entradas modificadas o elementos temporales.
Un sistema capaz de recordar lugares y avisar de esos cambios podría complementar herramientas ya existentes como: bastones inteligentes, apps de navegación accesible, asistentes por voz o gafas inteligentes con IA.
Más allá de la descripción en tiempo real
En los últimos años han aparecido numerosas herramientas basadas en inteligencia artificial capaces de describir escenas, leer textos o identificar objetos. Sin embargo, gran parte de estas soluciones trabajan únicamente con información instantánea.
StateScribe introduce una idea diferente: dotar a la IA de una memoria contextual que permita comparar pasado y presente.
Esto abre nuevas posibilidades para orientación autónoma, navegación más contextual, recordatorios espaciales e incluso asistencia personalizada basada en hábitos y rutas frecuentes.
La accesibilidad impulsa nuevas líneas de investigación en IA
El desarrollo de tecnologías accesibles basadas en inteligencia artificial está creciendo rápidamente en universidades y laboratorios de investigación de todo el mundo.
Actualmente existen proyectos centrados en navegación autónoma, descripción avanzada de imágenes, reconocimiento de objetos, interpretación de escenas y guía contextual para personas ciegas.
StateScribe se suma ahora a esta tendencia apostando por algo todavía poco explorado: la memoria visual aplicada a accesibilidad.
Aunque todavía no hay fecha para una posible llegada comercial, el proyecto demuestra cómo la inteligencia artificial continúa abriendo nuevas posibilidades para mejorar la autonomía y la interacción con el entorno de personas con discapacidad visual.
Os compartimos un pdf con el estudio original: PDF
Si te ha gustado esta noticia no te pierdas las últimas novedades en tiflotectnología en nuestro apartado de noticias y redes sociales.
FUENTES: Arxiv
