
Germán Ríos Toledo, profesor-investigador de la carrera de Ingeniería en Sistemas Computacionales del Instituto Tecnológico de Tuxtla Gutiérrez, publicó recientemente un artículo de investigación en la revista internacional AI, bajo el título “Learning the Style via Mixed SN-Grams: An Evaluation in Authorship Attribution”.
La revista AI es una publicación de acceso abierto y revisada por pares, especializada en Inteligencia Artificial, cuenta con un Factor de Impacto de 3.1 (2023) y se encuentra clasificada en el cuartil Q2 del Journal Citation Reports (JCR), su enfoque abarca diversas áreas de la IA, como el aprendizaje automático, aprendizaje profundo, percepción, planificación y robótica inteligente.
En esta publicación colaboraron Madaín Pérez Patricio y Juan Antonio de Jesús Osuna Coutiño, investigadores del área de Sistemas Inteligentes en la Agroindustria, adscritos al Doctorado en Ingenierías de este instituto. Así como los doctores Juan Pablo Francisco Posadas Durán y Erick Velázquez Lozada, de la Escuela Superior de Ingeniería Mecánica y Eléctrica, Unidad Zacatenco del Instituto Politécnico Nacional y el doctor Fernando Pech May del Tecnológico Superior de los Ríos.

El artículo aborda un tema de gran relevancia en el campo del Procesamiento de Lenguaje Natural: la Atribución de Autoría, técnica utilizada para identificar al autor de un texto entre un conjunto de candidatos. La investigación se enfoca particularmente en el estilo sintáctico que cada autor utiliza al escribir, utilizando árboles sintácticos generados por analizadores como Stanford, Stanza o Spacy.
Mediante un algoritmo desarrollado por los investigadores, estos árboles son recorridos para generar n-gramas sintácticos mixtos que capturan patrones estructurales de las oraciones. La información obtenida se almacena en diccionarios como tuplas (sn-grama, frecuencia), se exporta a archivos .csv, y finalmente se utiliza para entrenar modelos de Aprendizaje Automático como Máquinas de Soporte Vectorial (SVM) y Regresión Logística (LR).

Los resultados del estudio mostraron un desempeño superior a otros métodos del estado del arte basados en aprendizaje automático tradicional. Incluso, en comparación con algoritmos de aprendizaje profundo, el enfoque propuesto alcanzó niveles de precisión muy cercanos. Esto demuestra que la forma en que un individuo estructura las oraciones contiene rasgos distintivos capaces de identificar con alta probabilidad al autor de un texto.
Cabe destacar que esta publicación representa un logro significativo para los autores y para el Instituto Tecnológico de Tuxtla Gutiérrez, al posicionarse en el ámbito internacional de la investigación en Inteligencia Artificial y Procesamiento de Lenguaje Natural.
El artículo completo se encuentra disponible en https://www.mdpi.com/2673-2688/6/5/104
“Ciencia y Tecnología con Sentido Humano”
Departamento de Comunicación y Difusión
TecNM Tuxtla Gutiérrez




