El auge de los agentes de IA multimodales

Las empresas tecnológicas están invirtiendo grandes cantidades de dinero en la creación de nuevos modelos y algoritmos de inteligencia artificial multimodal que pueden aprender, razonar y tomar decisiones de manera autónoma después de recopilar y analizar datos.

 

El proceso de datos y el aprendizaje automático están acelerando el desarrollo de la inteligencia artificial a un ritmo vertiginoso. Mientras que primeros asistentes de IA, como Siri o Alexa, se limitaban a interacciones simples, con la entrada en escena del ChatGPT todo el mundo empezó a hablar de la nueva generación de asistentes de inteligencia artificial que podían efectuar tasas más complejas.

El objetivo era crear un sistema capaz de ejecutar una amplia gama de tareas, como un asistente humano. Sin embargo, estos asistentes no iban más allá del proceso de datos textuales, limitando su uso práctico. Se trata de un enfoque que queda lejos de la manera en que los humanos comprendemos el mundo, utilizando múltiples canales sensoriales simultáneamente.

Así pues, la evolución de la IA se enfoca hacia nuevos algoritmos que pueden procesar e integrar información de varias modalidades, incluidos imágenes, audio y video, para mejorar la interacción. Muchos expertos, entre ellos Sam Altman, CEO de Open AI, afirman que los agentes de IA multimodales son la próxima gran revolución que hará que las herramientas de IA estén todavía más integradas en nuestra vida cotidiana que el smartphone.

El futuro de los agentes multimodales

En términos prácticos, un agente de IA multimodal puede, por ejemplo, analizar un texto mientras procesa una imagen, el lenguaje hablado, o un clip de audio para dar una respuesta más completa y precisa, tanto a través de la voz como de texto. De este modo se abren nuevas posibilidades en varios campos: desde la educación y la salud hasta el e-commerce y el servicio al cliente.

Según David Barber, director del Centro de inteligencia artificial de la University College de Londres, estos agentes también podrían agilizar los procesos de empresas y organismos públicos, de forma que un agente de IA podría funcionar como un bote de atención al cliente más complejo.

A diferencia de la actual generación de asistentes basados en modelos lingüísticos que solo pueden generar la siguiente palabra probable en una frase, un agente de IA tendría la capacidad de actuar de manera autónoma a partir de órdenes en lenguaje natural y procesar tareas de atención al cliente sin supervisión, como por ejemplo analizar correos electrónicos de quejas de clientes y, accediendo a la base de datos de gestión, procesarlos según las políticas de la empresa.

Así mismo, los agentes de IA multimodales pueden analizar el comportamiento de compra de los consumidores, incluyendo su interacción con varios medios, para ofrecer recomendaciones de productos más personalizadas. Se trata de una aplicación práctica que también sería útil en entornos educativos, transformando la experiencia de aprendizaje al proporcionar contenido personalizado e interactivo.

Quizás uno de los usos más obvios de esta última evolución de la IA son los vehículos autónomos que pueden circular con una intervención humana limitada. Si bien es cierto que todavía estamos lejos de que estos vehículos puedan presumir de un funcionamiento autónomo total, los agentes de IA ya son parte integrante de su funcionamiento, percibiendo el entorno del coche y tomando decisiones con conocimiento de causa.

En el ámbito de la medicina, no solo puede mejorar la atención al paciente al integrar varios tipos de datos, sino que puede ayudar a los profesionales de la salud a diagnosticar enfermedades, identificar patrones y sugerir posibles tratamientos mediante el análisis de imágenes médicas, datos vitales y del historial clínico del paciente. Aun así, como en las otras posibles aplicaciones que manejan grandes cantidades de datos personales, será necesario abordar cuestiones de privacidad, seguridad y éticas para garantizar la aceptación del público.

11Onze es la fintech comunitaria de Cataluña. Abre una cuenta descargando la app El Canut para Android o iOS. ¡Únete a la revolución!

Si te ha gustado este artículo, te recomendamos:

Tecnología

La evolución de la inteligencia artificial

4min lectura

La inteligencia artificial (IA) es una tecnología cada...

Tecnología

Aprendizaje automático y ética

4min lectura

El aprendizaje automático es una rama de la...

Tecnología

¿Puedo ser despedido por un algoritmo?

4min lectura

Los sistemas digitales que usan la inteligencia artificial...



Equip Editorial Equip Editorial
  1. Joan Santacruz CarlúsJoan Santacruz Carlús says:

Deja una respuesta

App Store Google Play