Por primera vez, los científicos han reconstruido con éxito un vídeo de 10 segundos de un ratón utilizando únicamente su actividad cerebral, abriendo una nueva ventana para comprender cómo el cerebro codifica y procesa la experiencia visual. Este logro proviene de un equipo de investigación dirigido por el University College London (UCL). El artículo correspondiente fue publicado recientemente en la revista "eLife".

En los últimos años, el campo de la neurociencia ha seguido centrándose en cómo el cerebro humano "empalma" el mundo que vemos a partir de las señales recibidas por los ojos. Estudios anteriores mostraron principalmente a voluntarios imágenes o videos en equipos de imágenes como resonancia magnética funcional, y luego intentaron decodificar información visual de la actividad cerebral hasta un solo píxel. Este trabajo continúa con este objetivo general, pero optó por rastrear la actividad de la corteza visual mediante el registro a nivel de una sola célula en ratones para obtener una imagen más detallada de la representación visual del cerebro.
Utilizando únicamente datos de actividad de la corteza visual de los ratones, el equipo pudo reconstruir clips de vídeo de los ratones vistos anteriormente con una calidad sorprendente. El primer autor del artículo, Joel Bauer del UCL Sainsbury Wellcome Centre, dijo que querían encontrar una forma más general y realista de explorar cómo el cerebro da sentido a lo que ve. Muchos métodos existentes sólo pueden hacer inferencias basadas en condiciones o estímulos específicos, y son difíciles de generalizar a escenas visuales más naturales y complejas, mientras que los nuevos métodos intentan capturar directamente lo que el cerebro representa y compararlo con la realidad.
En términos de tecnología específica, el equipo de investigación adoptó un "modelo de codificación neuronal dinámica". El modelo, desarrollado originalmente por otro equipo para la competencia Sensorium 2023, se utilizó para predecir la intensidad de la actividad en cada neurona mientras los ratones veían una película, teniendo en cuenta factores como los movimientos espontáneos del animal y el diámetro de la pupila. El equipo de la UCL mejoró aún más el modelo basándose en el mismo conjunto de datos: compararon dos tipos de actividad neuronal: la actividad predicha por el modelo cuando los ratones miraban una "pantalla en blanco" y la actividad real medida mediante tecnología de imágenes microscópicas. Este método de imágenes puede identificar con precisión qué neuronas se activan en momentos específicos en función de los cambios en las concentraciones locales de calcio dentro de la célula.
A medida que se ejecuta el modelo, los investigadores parten de una "película en blanco" y utilizan el algoritmo para ajustar continuamente cada píxel hasta que el vídeo generado sea estadísticamente muy consistente con el vídeo que los ratones realmente vieron. Después de completar el entrenamiento, el modelo pudo reconstruir un videoclip de aproximadamente 10 segundos de duración basándose en la actividad cerebral de ratones que miraban un video nuevo. Vale la pena señalar que estos videos utilizados para la reconstrucción no participaron en el entrenamiento del modelo, lo que refleja mejor la versatilidad del método.
Ball señaló que el detalle de los vídeos reconstruidos mejoró significativamente después de agregar datos de más neuronas individuales, lo que subraya la importancia de obtener datos neuronales más completos. Para evaluar la reconstrucción, el equipo utilizó una métrica de correlación de píxeles, comparando cada píxel de cada fotograma de la película original con el píxel correspondiente de la película reconstruida. Los resultados muestran que las diferencias en espacio y tiempo entre los dos son relativamente limitadas, lo que indica que este tipo de "traducción de películas" basada en la actividad cerebral puede lograr una precisión muy alta.
En el futuro, los investigadores planean recopilar datos cerebrales con mayor resolución y cobertura más amplia para respaldar una reconstrucción visual de la escena más clara y amplia. En términos de aplicación, esperan utilizar esta tecnología especialmente para explorar la "desviación de la percepción-realidad": es decir, por qué y cómo la representación visual en el cerebro se desvía de la imagen objetiva que tenemos delante. Ball señaló que los humanos no tenemos una "copia del mundo" completamente real en el cerebro. La información visual se amplifica, comprime o distorsiona selectivamente durante la transmisión y el procesamiento. Esta desviación no es un simple error, sino un mecanismo funcional utilizado por el cerebro para interpretar y mejorar la información percibida.
Este estudio sobre la reconstrucción de películas visuales en ratones sienta las bases para trabajos similares en animales más complejos e incluso en humanos en el futuro. Con el desarrollo continuo de la tecnología de imágenes, los modelos computacionales y los métodos de análisis de datos, los científicos podrán lograr una comprensión más profunda de cómo "vemos" el mundo y se espera que proporcionen nuevo apoyo teórico para el diagnóstico y tratamiento de las discapacidades visuales, las interfaces cerebro-computadora y los sistemas inmersivos de percepción artificial.