En los últimos años la inteligencia artificial avanzó a pasos agigantados, especialmente en el procesamiento del lenguaje. Pero todavía hay una diferencia clave entre cómo aprenden las personas y cómo aprenden los modelos actuales. Un niño puede entender muy rápido conceptos que a los sistemas de IA todavía les cuesta mucho «entender», con cierto nivel de eficiencia, sin mencionar de que no tienen un entendimiento propiamente dicho.
A partir de esto surge una pregunta fascinante que me he estado haciendo desde mi primer aproximación a la inteligencia artificial (en su momento fue en la visión artificial) años atrás: ¿Y si la IA pudiera funcionar como el cerebro humano? Hoy en día, con los chatbots, parece que la IA piensa, pero no. Su proceso es muy distinto al de una red neuronal biológica.
Me topé con este estudio de Meta (ex Facebook), que persigue esta línea de investigación junto con centros científicos como NeuroSpin y el INRIA. El objetivo es comparar cómo reaccionan el cerebro humano y los modelos de lenguaje ante las mismas palabras, frases e historias, para encontrar patrones comunes y también diferencias clave.
Lo que descubrieron hasta ahora es bastante revelador. Los modelos de lenguaje que más se parecen al cerebro son aquellos que se entrenan para predecir palabras a partir del contexto, como cuando completamos mentalmente una frase tipo “había una vez…”. Este principio, conocido como aprendizaje autosupervisado, parece ser central tanto en la IA moderna como en la forma en que las personas aprendemos lenguaje.
Pero también aparecen límites claros. Mientras que la mayoría de los modelos actuales se concentran en predecir la próxima palabra inmediata, el cerebro humano va mucho más allá. Hay regiones del cerebro que anticipan ideas completas, giros de una historia o el sentido general de lo que viene, incluso varios pasos por adelantado. No solo predecimos la próxima palabra, sino el próximo concepto. Esa capacidad de “predicción a largo plazo” sigue siendo un gran desafío para la IA.
Para llegar a estas conclusiones, los investigadores analizaron enormes volúmenes de datos de neuroimagen obtenidos con técnicas como fMRI y magnetoencefalografía. Estas herramientas permiten observar qué zonas del cerebro se activan y en qué momento exacto, incluso milisegundo a milisegundo, mientras una persona lee o escucha una historia. Gracias al uso de deep learning, hoy es posible procesar esa complejidad y comparar directamente esas señales con las representaciones internas de los modelos de lenguaje.
Uno de los hallazgos más interesantes es que el cerebro procesa el lenguaje de forma jerárquica, de un modo sorprendentemente parecido a como lo hacen las redes neuronales modernas. Primero aparecen representaciones visuales o auditivas básicas, luego formas más abstractas como palabras, y finalmente significados más complejos ligados a frases e ideas. Esta similitud refuerza la idea de que la IA no va tan desencaminada, pero también muestra dónde puede mejorar.
Meta y sus colaboradores están yendo un paso más allá: están creando nuevos conjuntos de datos de neuroimagen que planean liberar como código abierto, junto con modelos y publicaciones científicas. La apuesta es clara: que la neurociencia y la inteligencia artificial se retroalimenten. Entender mejor el cerebro puede llevar a modelos de IA más eficientes, y al mismo tiempo la IA puede convertirse en una herramienta clave para descifrar cómo pensamos y entendemos el lenguaje.
En definitiva, este enfoque sugiere que el camino hacia una inteligencia artificial más “humana” no pasa solo por hacer modelos más grandes, sino por aprender de la máquina más sofisticada que conocemos: el cerebro. Y aunque todavía estamos lejos de comprenderlo del todo, estas investigaciones muestran que ese diálogo entre tecnología y neurociencia recién está empezando.
