1
tesis de maestría
Publicado 2024
Enlace
Enlace
En el presente trabajo de investigación intitulada: “MODELO DE EXTRACCIÓN AUTOMÁTICA DE GLOSARIO DE TÉRMINOS UTILIZANDO TÉCNICAS DE PROCESAMIENTO DE LENGUAJE NATURAL Y CLUSTERING”, para abordar la complejidad y esfuerzo manual que representa la extracción de términos para glosarios a partir de requisitos funcionales en proyectos de desarrollo de software a gran escala, proponemos un enfoque automatizado para la extracción y agrupamiento de términos de glosario. El método combina técnicas de pre-procesamiento y heurísticas para la identificación de términos, junto con embeddings generados con FastText para medir similitudes semánticas. Para el agrupamiento se emplearon los algoritmos -means, Expectation Maximization (EM) y Clusterización Jerárquica. La técnica fue aplicada a un conjunto de 2966 requisitos obteniéndose 318 grupos semánticos, y su eficacia fue evalua...