Por: Cade Metz
Reportero de Tecnología para
The New York Times
La IA está lista para avanzar a un ritmo rápido, volviéndose más poderosa y extendiéndose al mundo físico.
En un evento celebrado en San Francisco en noviembre, le preguntaron a Sam Altman, director ejecutivo de la empresa de inteligencia artificial OpenAI, qué sorpresas depararía este campo en 2024.
Los chatbots en línea como ChatGPT de OpenAI tendrán “un avance inesperado”, respondió de inmediato Altman.
Sentado a su lado, James Manyika, un ejecutivo de Google, asintió y dijo: “Estoy de acuerdo”.
El sector de la IA este año se va a definir por una característica principal: una mejora extraordinariamente rápida de la tecnología a medida que los avances se acumulen, permitiendo a la IA generar nuevos tipos de medios, imitar el razonamiento humano de nuevas maneras y filtrarse en el mundo físico a través de un nuevo tipo de robots.
En los próximos meses, los generadores de imágenes basados en IA, como DALL-E y Midjourney, ofrecerán al instante videos e imágenes fijas. Además, se fusionarán gradualmente con chatbots como ChatGPT.
Esto significa que los chatbots irán mucho más allá del texto digital y manejarán fotos, videos, diagramas, gráficos y otros medios. Su comportamiento se parecerá cada vez más al razonamiento humano y realizarán tareas cada vez más complejas en campos como las matemáticas y la ciencia. A medida que la tecnología avance hacia los robots, también ayudará a resolver problemas más allá del mundo digital.
Muchos de estos avances ya han empezado a surgir en los principales laboratorios de investigación y en productos tecnológicos. Pero en 2024, la potencia de estos productos crecerá de manera significativa y será utilizada por mucha más gente.
“El veloz progreso de la IA continuará”, dijo David Luan, director ejecutivo de Adept, una empresa emergente de IA. “Es inevitable”.
OpenAI, Google y otras empresas tecnológicas están haciendo avanzar la IA mucho más rápido que otras tecnologías debido al modo en que se construyen los sistemas subyacentes.
La mayoría de las aplicaciones de software son creadas por ingenieros, una línea de código informático a la vez, un proceso que suele ser lento y tedioso. Las empresas están mejorando la IA más rápidamente porque la tecnología se basa en redes neuronales, sistemas matemáticos que pueden aprender habilidades analizando datos digitales. Al detectar patrones en datos como artículos de Wikipedia, libros y textos digitales extraídos de internet, una red neuronal puede aprender a generar texto por sí sola.
Este año, las empresas de tecnología planean alimentar los sistemas de IA con más datos —incluidas imágenes, sonidos y más texto— de los que las personas pueden comprender. A medida que estos sistemas aprendan las relaciones entre estos diversos tipos de datos, aprenderán a resolver problemas cada vez más complejos, preparándolos para la vida en el mundo físico.
(El mes pasado, The New York Times demandó a OpenAI y Microsoft por infracción de derechos de autor de contenido de noticias relacionado con sistemas de IA).
Nada de esto significa que la IA podrá igualar al cerebro humano en el futuro cercano. Si bien las compañías de IA y los empresarios buscan crear lo que llaman “inteligencia artificial general” —una máquina que puede hacer cualquier cosa que el cerebro humano pueda hacer— esto sigue siendo una tarea de enormes proporciones. A pesar de sus rápidos avances, la IA sigue estando en sus etapas iniciales.
A continuación, una guía de cómo va a cambiar la IA este año, empezando por los avances a más corto plazo, que conducirán a nuevos progresos en sus capacidades.
Videos instantáneos
Hasta ahora, las aplicaciones basadas en IA generaban sobre todo texto e imágenes fijas en respuesta a instrucciones. Por ejemplo, DALL-E puede crear imágenes fotorrealistas en cuestión de segundos a partir de peticiones como “un rinoceronte zambulléndose en el puente Golden Gate”.
Pero es probable que este año empresas como OpenAI, Google, Meta y Runway, con sede en Nueva York, desplieguen generadores de imágenes que permitan también crear videos. Estas empresas ya han creado prototipos de herramientas capaces de elaborar videos al instante a partir de instrucciones de texto breves.
Es probable que las empresas tecnológicas incorporen los poderes de los generadores de imágenes y videos a los chatbots, haciéndolos más potentes.
Chatbots ‘multimodales’
Los chatbots y los generadores de imágenes, desarrollados en un principio como herramientas separadas, se están fusionando gradualmente. El año pasado, cuando OpenAI presentó una nueva versión de ChatGPT, el chatbot podía generar imágenes además de texto.
Las empresas de IA están creando sistemas “multimodales”, lo que significa que la IA puede manejar varios tipos de elementos multimedia. Estos sistemas adquieren destrezas analizando fotos, textos y, potencialmente, otros tipos de medios, como diagramas, gráficos, sonidos y videos, para luego poder producir sus propios textos, imágenes y sonidos.
Pero eso no es todo. Como los sistemas también aprenden las relaciones entre distintos tipos de medios, serán capaces de entender un tipo de medio y responder con otro. En otras palabras, alguien podrá introducir una imagen en el chatbot y este responder con texto.
“La tecnología se volverá más inteligente y más útil”, afirmó Ahmad Al-Dahle, quien dirige el grupo de IA generativa en Meta. “Hará más cosas”.
Los chatbots multimodales se equivocarán, del mismo modo que los chatbots de solo texto cometen errores. Las empresas de tecnología están trabajando para reducir los errores mientras se esfuerzan por crear chatbots que puedan razonar como un humano.
Mejor ‘razonamiento’
Cuando Altman habla de que la IA está avanzando, se refiere a los chatbots que son mejores “razonando”, por lo que pueden asumir tareas más complejas, como resolver problemas matemáticos complicados y generar programas informáticos detallados.
El objetivo es construir sistemas capaces de resolver un problema de manera lógica y minuciosa mediante una serie de pasos discretos, cada uno de ellos construyendo el siguiente. Así es como razonan los humanos, al menos en algunos casos.
Los principales científicos discrepan sobre si los chatbots pueden realmente llegar a razonar así. Algunos sostienen que estos sistemas solo parecen razonar cuando repiten comportamientos que han visto en los datos de internet. Pero OpenAI y otros están construyendo sistemas que pueden responder de un modo más fiable a preguntas complejas relacionadas con materias como las matemáticas, la programación informática, la física y otras ciencias.
“A medida que los sistemas sean más fiables, se harán más populares”, dijo Nick Frosst, antiguo investigador de Google que codirige Cohere, una empresa de IA.
Si los chatbots razonan mejor, podrán convertirse en “agentes de IA”.
‘Agente de IA’
A medida que las empresas enseñan a los sistemas de IA a resolver problemas complejos paso a paso, también pueden mejorar la capacidad de los chatbots para utilizar aplicaciones de software y sitios web en tu nombre.
Los investigadores están, en esencia, transformando los chatbots en un nuevo tipo de sistema autónomo llamado “agente de IA”. Esto significa que los chatbots pueden utilizar aplicaciones de software, sitios web y otras herramientas en línea, como hojas de cálculo, calendarios en línea y sitios de viajes. De este modo, las personas podrían delegar a los chatbots el tedioso trabajo de oficina. Pero estos agentes también podrían eliminar por completo algunos puestos de trabajo.
Los chatbots ya actúan como agentes a pequeña escala. Pueden programar reuniones, editar archivos, analizar datos y elaborar gráficos de barras. Pero estas herramientas no siempre funcionan tan bien como deberían. Los agentes fracasan por completo cuando se aplican a tareas más complejas.
Este año, las empresas de IA están preparadas para presentar agentes más fiables. “Deberías poder delegar en un agente cualquier trabajo informático tedioso del día a día”, afirmó Luan.
Esto podría incluir el seguimiento de los gastos en una aplicación como QuickBooks o el registro de los días de vacaciones en una aplicación como Workday. A largo plazo, se extenderá más allá del software y los servicios de internet y se adentrará en el mundo de la robótica.
Robots más inteligentes
En el pasado, los robots se programaban para realizar la misma tarea una y otra vez, como recoger cajas que siempre tenían el mismo tamaño y forma. Pero con el mismo tipo de tecnología en la que se basan los chatbots, los investigadores están dotando a los robots de la capacidad de realizar tareas más complejas, incluidas algunas que nunca antes habían visto.
Del mismo modo que los chatbots pueden aprender a predecir la siguiente palabra de una frase analizando grandes cantidades de texto digital, un robot puede aprender a predecir lo que ocurrirá en el mundo físico analizando innumerables videos de objetos que se pinchan, levantan y mueven.
“Estas tecnologías pueden absorber enormes cantidades de datos. Y a medida que absorben datos, pueden aprender cómo funciona el mundo, cómo funciona la física, cómo se interactúa con los objetos”, dijo Peter Chen, exinvestigador de OpenAI que dirige Covariant, una empresa emergente de robótica.
Este año, la IA potenciará a los robots que operan entre bastidores, como los brazos mecánicos que doblan camisas en una lavandería o clasifican pilas de cosas en un almacén. Titanes de la tecnología como Elon Musk también trabajan para introducir robots humanoides en los hogares.
Fuente: Metz, C. (12 de enero de 2024). ¿Cómo se perfila el avance de la inteligencia artificial en 2024? The New York Times. https://www.nytimes.com/es/2024/01/12/espanol/inteligencia-artificial-2024.html