Las ilusiones ópticas pueden engañar a la inteligencia artificial, al igual que nos engañan a nosotros.
hace 2 semanas

Existen muchísimas ilusiones visuales que han cautivado nuestra imaginación durante décadas: una mujer anciana que se transforma en una joven, un dibujo que puede ser un pato o un conejo según cómo lo mires y, por supuesto, ¿hace falta mencionar aquel famoso vestido azul y negro (o blanco y dorado)? Seguro que tú también te viste envuelto en alguna de esas discusiones interminables con tus amigos o familiares sobre qué color estabais viendo realmente en la pantalla de vuestro móvil.
Las ilusiones visuales son divertidas y fascinantes, pero esconden una pregunta profunda: ¿por qué caemos en ellas? A pesar de los avances en neurología, los científicos aún no lo saben con total certeza. Sin embargo, las nuevas investigaciones sobre Inteligencia Artificial (IA) podrían ofrecer algunas pistas reveladoras sobre el funcionamiento de nuestra propia mente. Eiji Watanabe, un neurofisiólogo del Instituto Nacional de Biología Básica en Okazaki City, Japón, ha descubierto recientemente que la IA puede caer en las mismas ilusiones que nos engañan a los humanos. Este hallazgo no es solo una curiosidad tecnológica, sino que representa una herramienta fundamental para que los científicos comprendan finalmente por qué nuestra percepción nos traiciona.
- La percepción de las ilusiones visuales en máquinas
- Cómo procesamos los humanos las ilusiones
- El papel de los movimientos oculares en el engaño
- La edad como factor determinante en la percepción
- La inteligencia artificial como creadora de ilusiones
- Hacia una comprensión profunda del cerebro humano
- Fuentes
La percepción de las ilusiones visuales en máquinas
Existe una ilusión visual muy famosa llamada las serpientes giratorias. Cuando observas fijamente la imagen de círculos concéntricos superpuestos, los patrones (las serpientes) parecen girar lentamente. Sin embargo, en el momento en que enfocas tu vista en un solo punto, cualquier punto de la imagen, las serpientes se congelan instantáneamente, como si acabaran de notar que las estás observando. Es una experiencia visual impactante, aunque para algunas personas puede resultar un poco mareante o incluso inducir dolor de cabeza si se observa durante demasiado tiempo.
Pero, ¿qué pensaría una IA de todo esto? Watanabe y sus colegas se hicieron la misma pregunta y decidieron presentar las serpientes giratorias a PredNet, una red neuronal profunda diseñada para procesar datos visuales. Lo interesante es que PredNet no fue entrenada específicamente para entender ilusiones, sino para procesar secuencias de vídeo convencionales. Sorprendentemente, la IA fue engañada de la misma forma que nosotros. PredNet interpretó que las serpientes se movían, aunque, a diferencia de los humanos, no era capaz de detener el movimiento enfocándose en un punto específico. Cuando se le mostró una versión modificada de la imagen que no engaña a los humanos, la IA tampoco detectó movimiento, lo que demuestra una correlación asombrosa entre la visión biológica y la artificial.
Este fenómeno sugiere que el error de percepción no es un fallo exclusivo de la biología orgánica, sino que podría ser una consecuencia intrínseca de cómo cualquier sistema complejo procesa la información visual. Al estudiar cómo PredNet "ve" estas imágenes, los investigadores pueden diseccionar los algoritmos internos de la red para ver en qué momento exacto se produce la señal de movimiento inexistente. Si logramos entender el "bug" en el software de la IA, estaremos mucho más cerca de entender el "bug" en nuestro propio cerebro.
Cómo procesamos los humanos las ilusiones
Según Watanabe, estos resultados respaldan la teoría de la percepción conocida como codificación predictiva (también llamada procesamiento predictivo). Esta idea sugiere que cuando procesamos información sensorial, como la entrada visual que llega a nuestros ojos, nuestro cerebro no se limita a registrar pasivamente lo que hay fuera. En lugar de eso, el cerebro predice constantemente lo que espera ver y luego ajusta esas predicciones basándose en la información que no encaja con lo esperado. Es un sistema de retroalimentación constante donde la realidad que percibes es, en gran medida, una construcción de tus propias expectativas internas.
Debido a que el cerebro es un órgano que consume mucha energía, no puede permitirse el lujo de construir cada imagen desde cero en cada milisegundo. Sería un gasto de recursos ineficiente. Por ello, utiliza este "atajo" predictivo para procesar la información de manera rápida y fluida. Sin embargo, esta eficiencia tiene un precio: errores ocasionales. Cuando nos enfrentamos a ilusiones visuales muy convincentes, el cerebro aplica sus reglas predictivas habituales a un estímulo diseñado para romperlas, lo que resulta en una percepción distorsionada de la realidad.
La red PredNet funciona de una manera muy similar a como lo hace tu cerebro bajo esta teoría. De forma parecida a como Chat GPT calcula cuál será probablemente la siguiente palabra en una frase, PredNet intenta predecir qué ocurrirá en el siguiente fotograma de un vídeo basándose en lo que sucedió en el anterior. Esta capacidad de anticipación es lo que permite a los sistemas de IA navegar por el mundo o reconocer objetos en movimiento, pero también es la razón por la que caen en la trampa de las serpientes giratorias. La similitud en el procesamiento visual entre humanos y máquinas podría ser la clave no solo para entender las ilusiones, sino para comprender la arquitectura general del cerebro humano. En su artículo publicado en Frontiers in Psychology, Watanabe y su equipo discuten cómo el uso de estas ilusiones sensoriales como indicador de la percepción humana podría permitir que las redes neuronales profundas contribuyan al desarrollo de futuras investigaciones cerebrales de vanguardia.
El papel de los movimientos oculares en el engaño
La investigación de Watanabe ha abierto la puerta a muchas preguntas interesantes, tal como señaló Susana Martínez-Conde, una reconocida neurocientífica del SUNY Downstate Medical Center que estudia la percepción. Martínez-Conde y su laboratorio han publicado numerosos estudios sobre ilusiones visuales, incluyendo la famosa ilusión de las serpientes. Para ella, el hecho de que una IA pueda replicar este comportamiento es un hito, pero recuerda que en los humanos existen componentes físicos que la IA todavía no replica del todo.
En un estudio de 2012 publicado en el Journal of Neuroscience, los investigadores demostraron que para que la ilusión de las serpientes giratorias funcione en nosotros, se necesita un evento desencadenante: los movimientos oculares involuntarios llamados sacádicos o microsacádicos. Si pudieras mantener tus ojos completamente inmóviles, la ilusión dejaría de funcionar. Estos pequeños movimientos son constantes y necesarios para que nuestra visión no se desvanezca, pero en el caso de ciertas imágenes geométricas, confunden al sistema de detección de movimiento de nuestra corteza visual.
Es fascinante pensar que algo tan pequeño como un movimiento ocular imperceptible pueda alterar por completo nuestra percepción de si algo está estático o en movimiento. Esto nos lleva a cuestionarnos hasta qué punto nuestra visión del mundo depende de factores mecánicos de los que no somos conscientes. Martínez-Conde ha expresado su interés en ver cómo Watanabe y sus colegas podrían utilizar sus modelos de IA para explorar estos escenarios mecánicos, integrando quizás simulaciones de movimientos oculares en las redes neuronales para ver si la ilusión se intensifica o cambia de naturaleza.
La edad como factor determinante en la percepción
Otro aspecto sorprendente de las ilusiones visuales es que no todos las percibimos de la misma manera. Se ha descubierto que la edad juega un papel fundamental en la capacidad de ser engañado por las serpientes giratorias. Las personas jóvenes tienen una probabilidad mucho mayor de ver el movimiento que las personas mayores. Esto sugiere que nuestro sistema visual cambia drásticamente con el paso del tiempo, posiblemente perdiendo sensibilidad ante ciertos estímulos o alterando la forma en que el cerebro procesa las señales predictivas.
Un estudio de 2016 publicado en Eye and Brain comparó a dos grupos de personas: uno con una edad media de 23 años y otro con una edad media de 74 años. Los resultados fueron asombrosos. El 100 por cien de los jóvenes percibió el movimiento de las serpientes, mientras que solo el 16 por ciento del grupo de mayores vio que la imagen se movía. Nadie sabe con total seguridad por qué ocurre esto, pero plantea dudas fascinantes sobre el envejecimiento neuronal y la plasticidad del sistema visual. ¿Se vuelve el cerebro mayor "menos predictivo" o simplemente sus sensores físicos ya no captan los detalles necesarios para activar la ilusión?
Este tipo de variaciones demográficas son un campo fértil para la experimentación con IA. Si pudiéramos ajustar los parámetros de una red neuronal para que simule un "cerebro envejecido" (quizás reduciendo la velocidad de procesamiento o la precisión de las conexiones), podríamos observar si la IA también deja de ver el movimiento en las serpientes. Esto nos daría una herramienta diagnóstica y de investigación sin precedentes para entender enfermedades degenerativas de la vista o del sistema nervioso central.
La inteligencia artificial como creadora de ilusiones
Si bien la investigación de Watanabe se centra en cómo la IA percibe las ilusiones existentes, Martínez-Conde destaca que existe un horizonte aún más emocionante: el uso de la IA para crear ilusiones visuales totalmente nuevas. Históricamente, las ilusiones han sido fruto del ingenio de artistas, matemáticos o psicólogos que, mediante el ensayo y el error, lograban dar con patrones que desafiaban la lógica visual. Sin embargo, el potencial de la máquina para generar combinaciones infinitas supera cualquier capacidad humana.
Un equipo de investigadores ya ha comenzado a utilizar la IA para construir una nueva base de datos de ilusiones que es mucho más extensa que cualquier cosa que haya existido previamente. Al alimentar a un algoritmo con los principios de lo que nos engaña, la IA puede realizar ingeniería inversa para diseñar imágenes que exploten nuestras debilidades perceptivas de formas que ni siquiera podemos imaginar todavía. El valor de la IA no reside únicamente en entender cómo funcionan las ilusiones actuales, sino en generar nuevos estímulos que nos ayuden a mapear las fronteras de nuestra percepción.
Imagina las aplicaciones de esto en campos como el diseño gráfico, la seguridad vial o la arquitectura. Entender qué patrones visuales pueden causar confusión o, por el contrario, qué estímulos pueden captar mejor nuestra atención de forma predictiva, podría ayudar a diseñar entornos más seguros y eficaces. La IA se convierte así en un espejo que nos devuelve una imagen de nuestras propias limitaciones cognitivas, permitiéndonos aprender de ellas.
Hacia una comprensión profunda del cerebro humano
La convergencia entre la neurociencia y la inteligencia artificial está marcando el inicio de una nueva era en la investigación científica. Al final del día, el hecho de que una máquina de silicio y un cerebro de carbono caigan en el mismo truco visual nos dice algo fundamental sobre la naturaleza de la inteligencia y la percepción. No se trata solo de un error de software o de biología, sino de una característica de los sistemas que intentan interpretar un mundo caótico a partir de datos limitados.
El uso de redes neuronales como modelos del cerebro nos permite realizar experimentos que serían imposibles o poco éticos en humanos. Podemos "apagar" partes de la red, alterar su entrenamiento o modificar su estructura para observar los efectos en su percepción. Cada vez que una IA es engañada por una ilusión visual, nos está dando una lección sobre cómo nosotros mismos construimos la realidad que vemos cada mañana al despertar. A medida que avancemos en el desarrollo de estas tecnologías, es muy probable que las ilusiones dejen de ser simples curiosidades para convertirse en las llaves que abran los secretos mejor guardados de nuestra mente.
A través de la colaboración entre expertos en computación y neurocientíficos, estamos empezando a ver el mundo no como es, sino como nuestro cerebro (y ahora nuestras máquinas) necesitan que sea para poder funcionar. Las serpientes que giran en tu pantalla son mucho más que un dibujo; son el testimonio de una maquinaria predictiva asombrosa que compartes con la tecnología más avanzada del planeta.
Fuentes
https://www.frontiersin.org/articles/10.3389/fpsyg.2018.00345/full
https://www.jneurosci.org/content/32/17/6043
https://www.ncbi.nlm.nih.gov/pmc/articles/PMC4853123/
https://www.discovermagazine.com/mind/ai-can-fall-for-visual-illusions-just-like-humans

Deja una respuesta