Veo veo: Pensamientos en imágenes

Tecno13/03/2023

Un equipo de la Universidad de Osaka de Japón usó inteligencia artificial para recrear imágenes a partir de actividad cerebral.

Los investigadores les presentaron fotos a los participantes, les hicieron una resonancia magnética y usaron Stable Difussion, un modelo similar a DALL-E 2, para reconstruir las imágenes que habían visto.

Esta tecnología podría usarse para registrar sueños o explorar cómo los animales perciben el mundo.

La IA incluso puede generar imágenes originales basadas solo en una descripción escrita, pero incluso eso puede no ser el límite de su potencial: el próximo gran desarrollo en IA podría ser comprender las señales cerebrales y dar vida a lo que sucede en su cabeza.

Durante años, científicos de todo el mundo han demostrado que las computadoras y los algoritmos pueden entender las ondas cerebrales y darles sentido visual a través de máquinas de resonancia magnética funcional (fMRI), los mismos dispositivos que usan los médicos para mapear la actividad neuronal durante un escáner cerebral. . Ya en 2008, los investigadores ya estaban utilizando el aprendizaje automático para capturar y decodificar la actividad cerebral .

Pero en los últimos años, los investigadores de IA han centrado su atención en cómo los modelos de inteligencia artificial pueden replicar lo que sucede en el cerebro humano y mostrar los pensamientos de las personas a través de texto , y también se están realizando esfuerzos para replicar pensamientos a través de imágenes .

Un par de investigadores de la Universidad de Osaka en Japón dicen que han creado un nuevo modelo de IA que puede hacer exactamente eso, pero más rápido y con mayor precisión que otros intentos. Según se informa, el nuevo modelo captura la actividad neuronal con una precisión de alrededor del 80% al probar un nuevo método que combina descripciones escritas y visuales de las imágenes vistas por los sujetos de prueba, lo que simplifica significativamente el proceso de reproducción de pensamientos de la IA.

Los neurocientíficos de sistemas Yu Takagi y Shinji Nishimoto presentaron sus hallazgos en un artículo preimpreso publicado en diciembre que fue aceptado la semana pasada para su presentación en la Conferencia sobre visión artificial y reconocimiento de patrones de este año en Vancouver, uno de los lugares más influyentes para la investigación informática. Un representante de CVPR confirmó a Fortune que el documento ha sido aceptado.

El aspecto novedoso del estudio de Takagi y Nishimoto es que utilizaron un algoritmo llamado Stable Diffusion para generar imágenes. Stable Diffusion es un modelo de texto a imagen de aprendizaje profundo propiedad de Stability AI con sede en Londres que se lanzó públicamenteel año pasado, y es un competidor directo de otros generadores de texto a imagen de IA comoDALL-E 2, que también fue lanzado el año pasado por el creador de ChatGPT, OpenAI.

Cuando las personas ven una foto o una imagen, dos conjuntos diferentes de lóbulos en el cerebro capturan todo sobre el contenido de la imagen, incluida su perspectiva, color y escala. El uso de una máquina fMRI en el momento de máxima actividad neuronal puede registrar la información generada por estos lóbulos. Takagi y Nishimoto pasaron los datos de fMRI a través de sus dos modelos complementarios, que tradujeron la información en texto. Entonces Stable Diffusion convirtió ese texto en imágenes.

Aunque la investigación es significativa, no podrá comprar un lector de mentes con inteligencia artificial en el hogar en el corto plazo. Debido a que las ondas cerebrales de cada sujeto eran diferentes, los investigadores tuvieron que crear nuevos modelos para cada una de las cuatro personas que se sometieron al experimento de la Universidad de Minnesota. Ese proceso requeriría múltiples sesiones de escaneo cerebral, y los neurocientíficos señalaron que es probable que la tecnología no esté lista para aplicaciones fuera de la investigación.

Te puede interesar