La UPV-EHU crea el modelo de lenguaje más grande para el euskera: Latxa
Crean Latxa: el innovador modelo de inteligencia artificial para el euskera
Introducción
El centro HiTZ de la Universidad del País Vasco (UPV-EHU) ha anunciado la creación de Latxa, un revolucionario modelo de inteligencia artificial destinado a facilitar la comunicación en euskera. Este desarrollo contribuirá al fortalecimiento de la lengua vasca en el ámbito digital y promoverá la investigación y creación de nuevas herramientas y aplicaciones basadas en esta lengua.
¿Qué es Latxa?
Latxa es el mayor modelo del lenguaje para el euskera, diseñado para ser utilizado en diversas aplicaciones de inteligencia artificial, como los «chatbots». Estos sistemas automatizados simulan una conversación real y ofrecen respuestas automáticas a los usuarios en función de su interacción. Latxa está basado en los modelos LLaMA de Meta y comprende entre 7 y 70 mil millones de parámetros.
Modelos de inteligencia artificial y brecha lingüística
Un gran modelo del lenguaje, o LLM en inglés (Large Language Model), es un tipo de sistema de inteligencia artificial que utiliza técnicas de aprendizaje automático para comprender y generar lenguaje humano. Los LLM son muy efectivos en idiomas con muchos recursos, como el inglés, pero no lo son tanto en idiomas menos cuantiosos, como el euskera. Esta situación crea una brecha tecnológica entre los idiomas más y menos desarrollados a nivel digital.
Objetivos y aplicaciones de Latxa
El objetivo principal de Latxa es reducir la brecha tecnológica entre el euskera y otras lenguas con más recursos en el ámbito digital. Para ello, se espera que este modelo promueva investigaciones, innovaciones y desarrollos de productos y aplicaciones basadas en LLMs para el euskera. Los modelos generados se publicarán de forma abierta, permitiendo que expertos y técnicos los utilicen y adapten a sus necesidades específicas.
Investigación en curso y mejoras futuras
Aunque Latxa representa un avance significativo, todavía hay trabajo por hacer. El director de HiTZ, Eneko Agirre, señala que actualmente están investigando modelos que puedan seguir instrucciones de usuarios en euskera, y que aún no está claro si se logrará una calidad similar a la de los modelos GPT en inglés o castellano. No obstante, Agirre afirma que el objetivo principal es seguir mejorando y creando versiones más avanzadas de Latxa mediante la investigación continua.