Comprender y traducir 204 idiomas: esto debería ser posible con el modelo de lenguaje de IA de un grupo de investigación internacional. La atención se centra principalmente en los idiomas menos conocidos.
Existen alrededor de 7.000 idiomas diferentes en todo el mundo. Sin embargo, los modelos de lenguajes de IA más populares a menudo hablan sólo una fracción de 30 hasta 80 idiomas. Un grupo de investigación internacional en nombre del grupo Meta de Facebook e Instagram quiere cambiar esto. Su nuevo modelo de IA puede manejar 204 idiomas. Con este programa de traducción universal pronto será posible comunicarse con «cualquier persona en cualquier parte del mundo y en cualquier idioma», escribe la empresa. Pero ¿cómo debería funcionar?
Wikipedia ya utiliza el modelo de IA
Más de 20 millones de personas hablan lingála en África Central, pero sólo hay unos pocos miles de artículos en este idioma en Wikipedia. Incluso hoy, en 2024, cualquiera que pueda hablar sólo unos pocos idiomas comunes se beneficiará poco del acceso a Internet. Esto es exactamente lo que pueden cambiar los buenos programas de traducción de IA. Wikipedia ya utiliza el modelo de IA NLBB de Meta. Los empleados de Wikipedia utilizan la herramienta de inteligencia artificial, por ejemplo, al traducir y editar artículos. La visión es que en el futuro las personas puedan comunicarse entre sí a pesar de hablar diferentes idiomas.
Cómo la inteligencia artificial aprende nuevos idiomas
Para que en el futuro los modelos de IA puedan hablar incluso idiomas menos hablados, se modificará especialmente la formación. Para los idiomas más comunes, el modelo de IA puede acceder a millones de ejemplos de texto. Para las llamadas lenguas de menores recursos, a veces sólo hay unos pocos miles de ejemplos. Por eso el equipo de investigación desarrolló un algoritmo que reconoce paralelos entre diferentes idiomas. La herramienta de IA fue entrenada especialmente con estas similitudes.
Pero lo que es mucho más importante es que el modelo de traducción en general no empeore a pesar de los nuevos idiomas. Hasta ahora, incluso las traducciones de idiomas muy comunes han empeorado en los modelos de IA si la IA se entrenó previamente con conjuntos de datos de idiomas raros. Los expertos hablan de sobreajuste.
Por lo tanto, la IA puede hablar varios idiomas en general, pero es un poco más débil en idiomas individuales. Para evitar esta degradación del rendimiento, el modelo se dividió y los lenguajes más raros se entrenaron en función de los lenguajes más comunes.
Porque la IA debe controlarse desde el principio
Para evitar contenido ofensivo y vulgar, es necesario crear reglas y listas. Para ello, el equipo de investigación crea una lista negativa para cada idioma. Y la calidad de la traducción de la IA se evalúa comparándola con oraciones traducidas manualmente. En comparación con los modelos de IA anteriores, Meta cree que tiene una clara ventaja. Esta comparación es difícil de entender. Sin embargo, otros proveedores ofrecen menos idiomas en sus herramientas de traducción. Por ejemplo, el modelo NLBB de Meta actualmente admite 71 idiomas más que Google Translate.
libros de gramática debería mejorar aún más la inteligencia artificial
La herramienta de IA ahora traduce incluso idiomas que requieren menos recursos con una calidad constante. «Sin embargo, la calidad de estas traducciones sigue siendo mucho peor», escribe el investigador de inteligencia artificial David Adelani en un artículo en la revista «Nature» sobre el proyecto de investigación. En el futuro, la IA podría recibir libros de gramática durante su entrenamiento. El uso de diccionarios también es concebible, como lo demuestra un nuevo estudio prepublicado sobre el enfoque de Google con su modelo de inteligencia artificial Gemini.
Meta ha lanzado su modelo de IA bajo una licencia de código abierto. Quizás algún día todos tengan igual acceso a Internet, independientemente del idioma que hablen. Parece ser sólo cuestión de tiempo que podamos comunicarnos con todo el mundo, sin barreras idiomáticas.
La mayoría de los viajes de camiones a Alemania pueden realizarse eléctricamente
El recubrimiento hace que los módulos solares en los desiertos
La casa de madera más alta del mundo está en construcción en los Estados Unidos.
SUVS & CO. – El capó se está volviendo más alto y, por lo tanto, pone en peligro a los peatones

