Un año de Chat GPT y de Innovación Aumentada

Post escrito por Ángela Medina.

Hace un año fuimos testigos del nacimiento de ChatGPT, una herramienta que pronto se convirtió en sinónimo de avance e innovación en el ámbito de la inteligencia artificial.

En Innolandia queremos conmemorar este primer aniversario con un repaso de los modelos de Procesamiento del Lenguaje Natural que han traído a ChatGPT hasta aquí.

Desde los años sesenta hasta los vertiginosos avances y perfeccionamientos que ha sufrido la herramienta estos últimos meses.

¿Nos acompañas?

chatgpt

Por si aún no te ha quedado del todo claro…

Aunque estos conceptos ocupan cada vez más espacio en el sentido común, nunca esta demás aclarar la terminología que hasta hace poco solo nos pertenecía a los frikis que sabíamos de ordenadores.

La inteligencia artificial es la simulación de procesos de inteligencia humana mediante máquinas.

Sin embargo, cuando hablamos de Chat GPT estamos hablando de una rama de la Inteligencia Artificial muy concreta que se dedica a crear contenidos completamente nuevos a partir de contenidos existentes, la Inteligencia Artificial Generativa.

Esta utiliza algoritmos de aprendizaje automático (Machine Learning), que toman grandes cantidades de datos de entrenamiento y las analiza en función de correlaciones y patrones.

Estos patrones se utilizan para predecir resultados en función de los datos de entrenamiento proporcionados, y generar así el menú semanal que le pido cada domingo a Chat GPT para no comerme la cabeza pensando qué cocinaré el miércoles.

Los años sesenta: ELIZA precedente en la IA conversacional

La historia de la inteligencia artificial conversacional comenzó con ELIZA, desarrollada por Joseph Weizenbaum en el MIT entre 1964 y 1966. ELIZA fue uno de los primeros intentos de simular una conversación humana a través de una máquina, utilizando una metodología de concordancia y sustitución de patrones.

El “show” más famoso de ELIZA, era simular un psicoterapeuta rogeriano. Esta corriente terapéutica se basa en la creencia de que el terapeuta, al posicionarse frente al paciente, no lo debe guiar.

Debe estar ahí mientras él mismo lleva el curso de su proceso terapéutico.

Parece una tarea fácil para el comienzo de la IA conversacional, ¿no? ELIZA reflejaba las palabras del paciente al paciente, y utilizaba reglas dictadas en un guion para responder con preguntas centradas en las entradas de los usuarios.

Aunque sus capacidades eran básicas, ELIZA sentó las bases para el futuro de la IA en la interacción humana.

2015: Open AI, del GPT-1 al GPT-3

A finales de 2015 se fundó Open AI, un laboratorio de Inteligencia Artificial, a manos de Ilya Sutskever, Greg Brockman, Trevor Blackwell, Vicki Cheung, Andrej Karpathy, Durk Kingma, Jessica Livingston, John Schulman, Pamela Vagata, Wojciech Zaremba, Sam Altman y Elon Musk.

Si no os suena este último como miembro actual, es porque abandonó la compañía 3 años después por desavenencias internas.

Rencillas aparte, el objetivo de Open AI era coger carrerilla en el desarrollo de la inteligencia artificial.

La trayectoria de sus modelos de comenzó en 2018 con GPT-1 (todavía no hemos llegado a Chat GPT, pero nos estamos acercando). Ahora vamos a revisar algunos de los conceptos clave:

GPT son las siglas de “Generative Pre-trained Transformer”, en Castellano, “Transformador Pre-entrenado Generativo”.
“Transformer” es el modelo de aprendizaje automático que corre detrás, diseñado para llevar a cabo tareas de Procesamiento del Lenguaje Natural.
“Pre-entrenado” hace referencia a que el modelo está entrenado con datos, y “Generativo” a la capacidad de crear contenido nuevo.

Hasta aquí todo claro?

Seguimos.

El crecimiento de estos modelos ha sido absolutamente brutal:

GPT-1 era un modelo con 117 millones de parámetros que estableció las bases de la arquitectura de los futuros modelos de lenguaje.
GPT-2, lanzado en 2019, amplió esta capacidad a 1.500 millones de parámetros, mejorando significativamente la generación de texto.
En 2020, GPT-3 llevó esta evolución aún más lejos con 175.000 millones de parámetros, logrando una capacidad de generación de texto casi indistinguible de la de un humano.

En Innolandia, Ángel escribió su primer post con IA en julio de 2022, utilizando el playground de GPT3.

Después de este asombroso avance en los modelos, ahora sí, llegó la hora de lanzar todo este avance en forma de producto…

Noviembre 2022: lanzamiento de Chat GPT. del modelo a la aplicación

El 30 de noviembre del 2022, estos modelos de Machine Learning culminan en una aplicación con una sencilla interfaz de usuario, a través de la cual personas ajenas a la programación podían beneficiarse del potencial de los modelos de GPT: Chat GPT.

A diferencia de los modelos GPT anteriores, Chat GPT no es solo un modelo de lenguaje, sino una aplicación en sí misma diseñada para interactuar de forma más directa y práctica con los usuarios.

Mientras que GPT-3 y versiones anteriores representaban la base técnica, Chat GPT se presentó como un producto más acabado y accesible, destacando la evolución de un modelo de lenguaje a una herramienta de conversación integral.

El GPT que subyacía a esta aplicación era 3.5, una beta del 4 que decidieron probar directamente con los usuarios.

Marzo 2023: Chat GPT Plus (GPT-4)

Pocos meses después, en marzo de 2023, Open AI presenta GPT-4 al mundo a través de Chat GPT Plus, la versión de pago de Chat GPT.

Desde aquí, todo tomo un ritmo vertiginoso.

Un modelo sensiblemente mejorado que pronto se convertiría en objeto de numerosos avances e integraciones.

En Innolandia el 7 de marzo lanzamos nuestra primera edición del curso de innovación aumentada, a día de hoy ya llevamos seis ediciones realizadas y preparando una séptima.

Septiembre 2023: integración con DALL-E

DALL-E es el juguete de Open AI de generación de imágenes al que los usuarios de ChatGPT Plus accedíamos a través de una interfaz propia.

Al menos hasta septiembre de este año, cuando no solo sacaron una versión mejorada del modelo de generación de imágenes (DALL-E 3), sino que además la integraron en la interfaz de ChatGPT.

Antes, los usuarios tenían que ajustar cuidadosamente las instrucciones textuales para obtener el resultado de imagen deseado.

Ahora, Chat GPT iteraba sobre nuestra petición para darle un prompt riguroso a Dall-e.

Esto fue el fin de la simple y llana interfaz de DALL-E, y el principio de un frenético avance hacía la multimodalidad. Permíteme un pequeño paréntesis en esta historia.

Multimodalidad, un concepto fundamental

El concepto de multimodalidad hace referencia a la capacidad para entender, procesar e interactuar con múltiples tipos de datos o modalidades.

Estas modalidades pueden incluir texto, imagen, sonido, vídeo y otros tipos de datos sensoriales.

Los modelos multimodales están diseñados para captar la complejidad del mundo real, donde la información no viene en una sola forma.

Acercan la inteligencia artificial a la inteligencia humana. Sigamos viendo como ChatGPT ha ido dando pasos en esta dirección.

Octubre 2023: visión

Hasta el momento Chat GPT no podía procesar o interpretar imágenes.

Esta limitación cambió con la incorporación otros modelos de inteligencia artificial que sí tienen esa capacidad.

Este cambio permitía que ChatGPT accediera a funciones como identificar objetos en imágenes, describir escenas y reconocer texto dentro de las imágenes. Con esta actualización, ChatGPT adquirió una nueva habilidad similar a un sentido humano: la vista.

Noviembre 2023: Integración de interfaces y MyGPT

Sin embargo, aunque las capacidades de esta herramienta cada vez eran más asombrosas, todas ellas funcionaban en interfaces independientes.

No podíamos subir imágenes en el mismo sitio en el que las creábamos, ni pedir un archivo de Excel en el que numerase los elementos que aparecen en la misma.

Estas limitaciones se volvieron cosa del pasado en noviembre, cuando todas estas funcionalidades se habilitaron en la misma interfaz.

Un solo chat en el que crear y analizar imágenes y documentos, conversar… Ahora puedes crear una imagen con DALL-E y, en el mismo chat, tener una conversación fluida con ChatGPT para refinar tu obra de arte.

Con esta última actualización apareció una novedad que no ha pasado nada desapercibida: la aparición de My GPT.

Este nuevo juguete permite a los usuarios crear versiones personalizadas de ChatGPT para tareas específicas. Pone al alcance de cualquier mano la creación de asistentes personalizados, a través de sencillas conversaciones en lenguaje natural.

¡Puedes crear una aplicación sin necesidad de programar!

Recapitulando…

Tal y como hemos visto en esta retrospectiva, Open AI no hace más que dar pasos en dirección a la multimodalidad.

En menos de dos meses han dotado de vista a ChatGPT, en la misma interfaz en la que podemos buscar en internet, generar imágenes y al analizar datos.

No están andando en esta dirección, ¡están corriendo! Poco a poco ChatGPT se está convirtiendo en un humando super dotado, que comparte con nosotros cada vez más dimensiones de la experiencia del mundo real.

Desde el 30 de noviembre de 2022 hasta el 30 de noviembre de 2023, ChatGPT ha experimentado una evolución notable.

Si por algo hay que felicitarle, es por brindarnos 12 meses de rápido desarrollo y expansión en el campo de la Inteligencia Artificial Generativa.

Desde los humildes comienzos de ELIZA hasta la sofisticación de GPT-4 y las innovaciones continuas en ChatGPT, hemos sido testigos de una transformación impresionante en la IA conversacional.

Desde luego el futuro de la IAG promete ser emocionante y revolucionario como lo está siendo el presente.

En Innolandia, cada día estamos aprendiendo cosas nuevas sobre la inteligencia artificial, porque nos gusta aplicar sobre nosotros primero, lo que le recomendamos a nuestros clientes.

Ya sabes, nos aplicamos nuestra propia medicina.

Pero si algo hemos aprendido es que saber utilizar la IA Generativa (no sólo ChatGPT) se basa en 3 habilidades fundamentales:

Aprender a preguntar y hablar con la máquina (se llama prompting)
Identificar los casos de uso más adecuados, porque no vale para todo
Y aplicar el pensamiento crítico, para saber gestionar la información.

Estas son las capacidades que enseñamos en nuestros cursos de Innovación Aumentada: Cómo aplicar la inteligencia artificial generativa en los procesos de innovación.

En Abierto o in-company.

Sólo tienes que suscribirte en la caja de abajo y te informaremos de la próxima fecha. seguramente en Enero 2024.

Porque sí, implementar ChatGPT en tu organización es un proyecto de innovación, que tienes que liderar tú. Si dejas a la gente de IT o a los de Administración, lo que harán será bloquearlo.