Las tablillas cuneiformes de arcilla de los sumerios, hititas y babilonios se encuentran entre los documentos escritos más antiguos del mundo. Los investigadores han desarrollado un nuevo método de inteligencia artificial para descifrar los textos, que datan de hace 5.000 años. Primero entrenaron una IA para separar los personajes individuales en un tablero entre sí. El segundo paso fue interpretar estos caracteres cuneiformes. El proceso podría ayudar a descifrar las tablillas cuneiformes más rápidamente en el futuro y también a compararlas entre sí.
Las primeras versiones de la escritura cuneiforme fueron desarrolladas por los sumerios en Mesopotamia alrededor del año 3300 aC Muchos de estos símbolos consistían en pictografías que inicialmente parecían escritura pictórica, pero con el tiempo se volvieron cada vez más abstractas y se convirtieron en símbolos fonéticos y silábicos estilizados. A lo largo de milenios, la escritura cuneiforme se extendió por gran parte del Cercano y Medio Oriente y formó la base de los escritos de los acadios, asirios, hititas y babilonios.
Son los detalles los que cuentan.
Los arqueólogos ya han descubierto decenas de miles de tablillas cuneiformes durante las excavaciones en la zona de expansión de estas culturas. De los desciframientos de la escritura se desprende que el contenido de estas tablillas cubre una amplia gama de temas: “En ellas se encuentra de todo: desde listas de compras hasta sentencias judiciales. Las tabletas permiten vislumbrar el pasado del hombre hace varios milenios”, explica Hubert Mara, de la Universidad Martin Luther Halle-Wittenberg (MLU). «Sin embargo, muchas tablillas cuneiformes están muy gastadas y son difíciles de descifrar incluso para ojos entrenados».
Particularmente difícil, pero crucial para el significado de los caracteres, es la cuestión de si una huella representa una línea incisa y una cuña triangular. Para interpretar correctamente las señales se necesitan no sólo unas condiciones de iluminación óptimas, sino también muchos conocimientos básicos. Por si fuera poco, el sistema de escritura de la época era muy complejo y se utilizaba en varios idiomas. “Hasta ahora, acceder al contenido de las tablillas cuneiformes era difícil: hay que saber exactamente qué se busca y dónde”, afirma Mara. A pesar de los primeros intentos con programas adaptativos, estos sólo produjeron resultados moderados, especialmente con tablillas cuneiformes mal conservadas.
Descifrado en dos pasos
Luego, Mara y su equipo investigaron hasta qué punto la inteligencia artificial puede ayudar a descifrar textos cuneiformes. Para ello, los investigadores desarrollaron un sistema de dos etapas, entrenado a partir de alrededor de 200 escaneos 3D de tablillas cuneiformes e información adicional sobre los sistemas de escritura. En una primera etapa, el sistema de inteligencia artificial aprendió a reconocer y separar caracteres individuales y sus componentes en una tableta escrita. El siguiente paso fue analizar los caracteres individuales con más detalle y distinguir entre líneas y muescas en forma de cuña.
En conjunto, este proceso permite descifrar y digitalizar textos cuneiformes de forma similar al método OCR (reconocimiento óptico de caracteres) que ya se utiliza para fotografías y escaneos digitales de documentos modernos. En las pruebas iniciales, el prototipo del nuevo sistema de inteligencia artificial ya pudo descifrar tablillas cuneiformes de diferentes épocas, informan Mara y su equipo. Su ayuda de descifrado digital fue particularmente precisa con tablillas cuneiformes más pequeñas, pero mostró pequeñas debilidades en las áreas marginales de bloques de texto más grandes.
Más preciso que los métodos anteriores
En general, el nuevo sistema de IA de dos etapas funcionó mejor que los métodos anteriores, que a menudo utilizaban algoritmos adaptativos. Dado que estos modelos de IA normalmente se entrenaban únicamente a partir de fotografías de los tableros, todavía existía un problema con la precisión del descifrado, como explica el equipo. Por el contrario, su nuevo sistema de inteligencia artificial aprendió de escaneos 3D, pero también pudo descifrar fotografías de tablillas cuneiformes. «Sorprendentemente, nuestro sistema funciona muy bien incluso con fotografías que en realidad representan material fuente más pobre», informa Ernst Stötzner de MLU.
Una vez convertidos en texto digital, los caracteres cuneiformes se vuelven más fáciles de leer. Al mismo tiempo, el descifrado digital permite buscar en el contenido de muchos paneles y compararlos entre sí. Esto abre perspectivas de investigación completamente nuevas, como explican los investigadores. Hasta ahora, su prototipo sólo domina dos de las doce lenguas cuneiformes conocidas. Pero el sistema de IA es ampliable y también se puede entrenar para utilizar otros idiomas y caracteres.
Fuente: Universidad Martín Lutero Halle-Wittenberg; Artículo técnico: GCH 2023 – Taller Eurográfico sobre Gráfica y Patrimonio Cultural, doi: 10.2312/gch.20231157