Un equipo multidisciplinar, en el que han participado investigadores y tecnólogos de varios países, ha logrado desarrollar una nueva herramienta computacional
Ciudad de México. - La inteligencia artificial ha demostrado ser capaz de descifrar características del lenguaje, una cualidad que hasta ahora se consideraba que era exclusiva de los humanos, un avance que puede facilitar el estudio de la lengua y acelerar la obtención de información sobre el uso de las palabras y cómo se procesan.
Un equipo multidisciplinar, en el que han participado investigadores y tecnólogos de varios países, ha logrado desarrollar una nueva herramienta computacional, basada en la inteligencia artificial y disponible en abierto, que explora cómo los 'grandes modelos de lenguaje' (LLM, por sus siglas en ingles) permiten complementar y ampliar los métodos tradicionales de generación de datos.
En el trabajo, que ha sido coordinado por el profesor de la Escuela Técnica Superior de Ingenieros de Telecomunicaciones la Universidad Politécnica de Madrid (UPM) en España Javier Conde, han colaborado investigadores de la Universidad de Gante (Bélgica), el Politécnico de Milán (Italia), el Instituto Tecnológico de Massachusetts, la Universidad de California en San Diego (EE UU) y la Universidad de Hong Kong (China).
El trabajo que han desarrollado complementa y amplía los métodos tradicionales de generación de datos que se utilizan por ejemplo en el campo de la "psicolingüística" y pueden contribuir por lo tanto a mejorar la educación, el diagnóstico de trastornos del lenguaje, el desarrollo de tecnologías inclusivas o el acceso a la información en distintos idiomas.
Analizar la carga emocional de las palabras
Los estudios psicolingüísticos suelen basarse en valoraciones humanas para fijar normas sobre la familiaridad, la concreción o la carga emocional que tienen las palabras, pero son procesos muy costosos y lentos y por lo tanto muy difíciles de realizar, pero los investigadores han demostrado ahora que los 'grandes modelos de lenguaje' ofrecen una alternativa capaz de descifrar esas características de una forma muy eficiente.
“Los modelos de lenguaje abren nuevas oportunidades para investigar cómo pensamos y procesamos las palabras, pero también exigen cautela", ha manifestado Javier Conde, y ha insistido en que no se trata de sustituir a los participantes humanos, sino de complementar su papel y de ampliar las posibilidades de la investigación y ha valorado la utilidad que puede tener esta herramienta para psicólogos, lingüistas y científicos cognitivos.
En declaraciones a EFE, Javier Conde ha subrayado la relevancia de hacer un uso responsable y de la supervisión humana para validar los resultados, y ha subrayado que el sistema es capaz de generar una colección de datos a partir de los grandes modelos de lenguaje y extraer conclusiones sobre características muy definidas, como la familiaridad o la emotividad que muestran las personas ante una determinada palabra.
Aplicaciones prácticas de la herramienta
¿Aplicaciones prácticas? Conde apunta, en el ámbito de la educación y el aprendizaje de idiomas, la posibilidad de determinar qué palabras son más adecuadas según la edad o el nivel del estudiante; en el ámbito del marketing la de identificar las palabras que generan más interés y emociones. Y aunque la guía que han desarrollado podría también ayudar a diseñar herramientas de diagnóstico precoz para detectar algún tipo de trastorno, como la dislexia o la depresión, ha subrayado que no ha sido diseñada con ese objetivo.
Sí comprobaron cómo las inteligencias artificiales podían predecir rasgos del lenguaje humano aunque no hayan sido específicamente entrenadas para ello, y cómo los podían realizar estudios limitando a solo unas decenas el número de individuos que participaban en ensayos que antes requerían la participación de cientos o miles de personas.
"Ahora podemos entender cómo procesan las personas el lenguaje; cómo lo entendemos", ha explicado el investigador, quien ha observado que los principales estudios sobre el procesamiento del lenguaje se hacen casi siempre en inglés y ha valorado la posibilidad que esta nueva herramienta computacional tiene de hacerlos en español, donde los estudios son menos numerosos, y de conocer cómo procesan los hispanohablantes el lenguaje en escenarios hasta ahora inexplorados.
El software que sustenta la herramienta es libre y lo puede descargar cualquier persona, y Javier Conde, consciente de las reticencias y suspicacias que despierta en muchos ocasiones la inteligencia artificial, ha insistido en la necesaria supervisión humana para validar cualquier resultado.