ChatGPT (acrónimo del inglés Chat Generative Pre-Trained Transformer) es una aplicación de chatbot de inteligencia artificial desarrollada en 2022 por OpenAI. El chatbot es un modelo de lenguaje especializado en el diálogo que se ajusta con técnicas de aprendizaje supervisadas y de refuerzo. Está compuesto por los modelos GPT-4o mini (opción gratis) y GPT-4o (opción de pago), y sus previews GPT-o1 y GPT-o1 mini.
ChatGPT se lanzó el 30 de noviembre de 2022 y ha llamado la atención por sus respuestas detalladas y articuladas. Sin embargo, numerosos estudios han demostrado que ChatGPT es propenso a errores fácticos y exhibe sesgos lingüísticos, de género, raciales y políticos en el contenido que genera. El servicio se lanzó inicialmente como gratuito para el público, con planes de monetizarlo más adelante. El 4 de diciembre, OpenAI calculaba que ChatGPT ya tenía más de un millón de usuarios. El 14 de marzo de 2023 se lanzó GPT-4. El 6 de noviembre de 2023, OpenAI publicó que cien millones de personas utilizan ChatGPT semanalmente.
El acceso al servicio está limitado en países como China, Rusia, Irán y partes de África. El acceso a ChatGPT fue bloqueado, temporalmente, en Italia por las autoridades al entender que hubo una violación de datos y la base jurídica para utilizar datos personales.
El 19 de octubre de 2023, ChatGPT-4 se integró con el modelo de generación de imágenes DALL·E 3, lo que permitió a los usuarios de ChatGPT Plus crear imágenes directamente dentro del chat, utilizando descripciones textuales. Esa integración facilitó una experiencia fluida, combinando las capacidades avanzadas de generación de texto de GPT-4 con las poderosas herramientas visuales de DALL·E 3. A partir de ese momento, los usuarios pudieron generar imágenes de alta calidad a partir de instrucciones detalladas, sin tener que recurrir a una plataforma separada. Además, en el mismo período, se incrementó la disponibilidad gradual del modelo para otros usuarios y se planeó su expansión a través de la API más adelante.
A finales de marzo de 2023, ChatGPT integró el uso de plugins, entre los que se incluye uno que le da la posibilidad de que este navegue por internet. Algunas compañías como Kayak o Expedia lanzaron su propio plugin. El 4 de enero de 2024, OpenAI anunció que lanzaría su propia «GPT Store» antes de finales de enero. Los desarrolladores podrán publicar y comercializar allí GPT independientes. El requisito previo es una cuenta GPT 4 (privada o como solución empresarial). El 10 de enero de 2024, OpenAI puso a disposición del público la «GPT Store» anunciada anteriormente.
Desde su lanzamiento, ChatGPT ha experimentado una evolución significativa en términos de su capacidad para comprender contextos complejos y adaptarse a distintos tipos de conversaciones. Eso se debe en parte a actualizaciones periódicas que han mejorado su capacidad para generar respuestas más coherentes y relevantes. Además, se han implementado filtros de verificación de información para abordar las preocupaciones iniciales sobre la precisión fáctica. Esos filtros, basados en fuentes confiables y verificadas, buscan proporcionar respuestas más precisas y confiables a los usuarios. Aun así, según varios estudios las respuestas de ChatGPT pueden basarse en informaciones falsas de Internet o en invenciones, conocidas como alucinaciones, de la aplicación.
Asimismo, OpenAI ha dedicado esfuerzos considerables para expandir la capacidad multilingüe de ChatGPT, permitiendo una comunicación más fluida y natural en una gama más amplia de idiomas. Esa expansión facilita la interacción con usuarios de diferentes regiones y culturas pues mejora la calidad de las traducciones en línea.
ChatGPT se perfeccionó sobre GPT-3.5 mediante el aprendizaje supervisado y el aprendizaje por refuerzo. Ambos enfoques utilizaron entrenadores humanos para mejorar el rendimiento del modelo de la IA. En el caso del aprendizaje supervisado, se dotó al modelo de conversaciones en las que los formadores jugaban en ambos lados: el usuario y el asistente de IA. En el caso de refuerzo, los entrenadores humanos primero clasificaron las respuestas que el modelo había creado en una conversación anterior. Esas clasificaciones se usaron para crear «modelos de recompensa» en los que el modelo se ajustó aún más usando varias iteraciones de optimización de política próxima (PPO). Los algoritmos de optimización de políticas proximales presentan un beneficio rentable para confiar en los algoritmos de optimización de políticas de región; niegan muchas de las operaciones computacionalmente costosas con un rendimiento más rápido. Los modelos fueron entrenados en colaboración con Microsoft en su infraestructura de supercomputación Azure.
En comparación con su predecesor, InstructGPT, ChatGPT intenta reducir las respuestas dañinas y engañosas; en un ejemplo, mientras que InstructGPT acepta el mensaje «Cuénteme sobre cuándo llegó Cristóbal Colón a los Estados Unidos en 2015» como veraz, ChatGPT usa información sobre los viajes de Colón e información sobre el mundo moderno, incluidas las percepciones de Colón para construir una respuesta que asume qué pasaría si Colón llegara a los Estados Unidos en 2015. Los datos de capacitación de ChatGPT incluyen páginas e información sobre los fenómenos de Internet y los lenguajes de programación, como los sistemas de tablones de anuncios y el lenguaje de programación Python.
A diferencia de la mayoría de los chatbots, ChatGPT tiene estado, recuerda las indicaciones anteriores que se le dieron en la misma conversación, lo que, según han sugerido algunos periodistas, permitirá que ChatGPT se use como un terapeuta personalizado. En un esfuerzo por evitar que se presenten y se produzcan resultados ofensivos desde ChatGPT, las consultas se filtran a través de una API de moderación y se descartan las indicaciones potencialmente racistas o sexistas.
ChatGPT tiene múltiples limitaciones. El modelo de recompensa de ChatGPT, diseñado en torno a la supervisión humana, puede optimizarse en exceso y, por lo tanto, dificultar el rendimiento, lo que también se conoce como la ley de Goodhart. Además, ChatGPT tiene un conocimiento limitado de los eventos que ocurrieron después de 2021 y no puede proporcionar información sobre algunas celebridades. En el entrenamiento, los revisores prefirieron respuestas más largas, independientemente de la comprensión real o el contenido fáctico. Los datos de entrenamiento también pueden sufrir sesgos algorítmicos; las indicaciones que incluyen descripciones vagas de personas, como un director ejecutivo, podrían generar una respuesta que asume que esa persona, por ejemplo, es un hombre blanco.
El 17 de enero de 2023 Microsoft anunció que iban a implementar ChatGPT como API en sus servicios de Azure. Microsoft anunció una nueva versión de Bing el 7 de febrero de 2023, cuya característica destacada es su chatbot de IA que funciona con la tecnología de ChatGPT. Esa notificación se produjo un día después de que Google anunciara su chatbot de IA, Google Bard. El 4 de mayo de 2023, Microsoft puso el nuevo Bing a disposición de cualquiera que esté dispuesto a iniciar sesión en Bing con su cuenta de Microsoft.
Referencias
- Enciclopedia británica. https://www.britannica.com/technology/ChatGPT
- Wikipedia. https://es.wikipedia.org/wiki/ChatGPT