Compartir

Carlos del Porto Blanco

Lo que todos tenemos que hacer es asegurarnos de que estamos usando la Inteligencia Artificial de una manera que sea en beneficio de la humanidad, no en detrimento de la humanidad”. Tim Cook, presidente ejecutivo de Apple Computer.

Ya Cuba tiene un Modelo de Lenguaje Pequeño (LSM) para Inteligencia Artificial Generativa, este ha sido creado por un colectivo de profesores y estudiantes de la Facultad de Matemática y Computación, Matcom, de la Universidad de la Habana. Este resultado no es obra del azar o de un golpe de suerte es la consecuencia de la voluntad política del país en el área de las ciencias, específicamente de la computación, ya en el 1962 el Che decía “El mundo camina hacía la era electrónica… Todo indica que esta ciencia se constituirá en algo así como una medida de desarrollo; quien la domine será un país de vanguardia. Vamos a volcar nuestros esfuerzos en este sentido con audacia revolucionaria”.

En 1968, Cuba se convierte en el segundo país de Latinoamérica en lograr una computadora analógica, la Silna 999, en el 1970 se fabrica la computadora CID-201A, con tecnología 100% cubana, una de las primeras en lograrlo en Iberoamérica, este equipo se encontraba a solo cinco años de distancia tecnológica de las famosas PDP estadounidenses. Durante la década de los 70 se desarrollan en la Isla los lenguajes de programación Focal-CID, Leal y LAPD, en el los años 80 se logra el primer gestor de bases de datos Lorca y el Sistema Experto Aries. Estos desarrollos muestran que siempre ha existido talento isleño en esta área del conocimiento.

Pero, lo primero, es lo primero, dejando a un lado los antecedentes, entremos en materia, empecemos, ¿qué es un modelo? (ver, La sigla del momento, los LLM. https://www.radioreloj.cu/noticias-radio-reloj/ciencia/la-sigla-del-momento-los-llm/) es un tipo de modelo de lenguaje de inteligencia artificial que se diseña para procesar y generar lenguaje natural. Utilizan redes neuronales profundas, una técnica de aprendizaje automático que imita el funcionamiento del cerebro humano. Esos modelos, disruptivos, se entrenan con enormes cantidades de datos textuales procedentes de internet, libros, artículos y otras fuentes. Estos modelos son los que están detrás de aplicaciones muy utilizadas hoy en día como: DeepSeek, Qwen, Perplexity, ChatGPT, Gemini, Copilot y otros.

CecilIA tuvo su presentación durante el mes de mayo en la Convención Saber UH. El grupo de desarrollo está liderado por el Dr. Yudivián Almeida Cruz, director del Grupo de Inteligencia Artificial y Ciencia de Datos de MatCom, la Dra. Suilán Estévez Velarde, decana de la propia facultad, y el Dr. Alejandro Piad Morffis; uno de los vicedecanos de la misma institución.

CecilIA, nombre que muestra cubanía por los cuatro costados, necesita hacer gala del término y para ello se entrenó, para su debut, con 2.7 Gb de información (200 mil millones de caracteres o mil millones de tokens); integrados por 400 obras de la literatura cubana, artículos enciclopédicos, discursos de dirigentes del país y la Gaceta Oficial. Eso se realizó durante tres días.

Con el objetivo de mejorar el rendimiento de la aplicación se solicitó a las instituciones que ofrezcan datos, entre ellos guiones de productos audiovisuales. Algunos de los que se utilizarán son los del icónico personaje de la cinematografía cubana, Elpidio Valdés, que le daría un sabor muy cubano a las respuestas del modelo. “Eso hay que verlo compay”, por ejemplo.

¿Quién soporta las respuestas que da la bella mulata cibernética cubana? La variante escogida, fue un Modelo de Lenguaje Pequeño, el modelo español Salamandra, entrenado para el idioma español, accesible para Cuba por requerir costos mucho más bajos que los Modelos de Lenguaje Grande (LLM) al necesitar menos hardware, energía eléctrica, tiempo de entrenamiento y datos de entrenamiento. Otro elemento a considerar es que muchos de los modelos se desarrollan en países altamente industrializados y por esa razón ya vienen con un sesgo cultural, lingüístico e ideológico propio de las viejas metrópolis, por lo tanto, perpetúan valores principios e ideas de esos centros de poder. El desarrollo de un modelo propio, con contenidos propios va en la dirección no sólo de la independencia tecnológica, sino también de la preservación de los valores del país.

Ahora se está en la etapa de entrenamiento del modelo con mucha más información propia de país, para que las respuestas que otorgue seas las adecuadas a nuestra idiosincrasia, y el ajuste fino, como imaginará el lector este es un proceso iterativo, debido a que todos los días hay nuevas informaciones en todas las áreas l conocimiento que deben alimentar a Nuestra CecilIA, así que manos a la obra, compay.