Recuperación de textos de propiedades medicinales mediante indexación semántica latente e índices invertidos

Descripción del Articulo

Desde tiempos remotos, el tratamiento de enfermedades con plantas medicinales ha sido una práctica muy común en las comunidades rurales. La terminología utilizada difiere textualmente, sin embargo se pueden relacionar en función de sus conceptos. Para ello se utiliza técnicas como la indexación semá...

Descripción completa

Detalles Bibliográficos
Autor: Cortez Vasquez, Augusto Parcemom
Formato: artículo
Fecha de Publicación:2019
Institución:Universidad Católica los Ángeles de Chimbote
Repositorio:Revistas - Universidad Católica los Ángeles de Chimbote
Lenguaje:español
OAI Identifier:oai:revistas.uladech.edu.pe:article/2037
Enlace del recurso:https://revistas.uladech.edu.pe/index.php/increscendo/article/view/2037
Nivel de acceso:acceso abierto
Materia:Categorización de textos, índices invertidos, string kernel. indexación semántica latente , propiedades medicinales de plantas
Descripción
Sumario:Desde tiempos remotos, el tratamiento de enfermedades con plantas medicinales ha sido una práctica muy común en las comunidades rurales. La terminología utilizada difiere textualmente, sin embargo se pueden relacionar en función de sus conceptos. Para ello se utiliza técnicas como la indexación semántica latente que busca categorizar conceptos más que textos, asimismo se utiliza la técnica de índices invertidos con el fin de asociar los textos que contengan términos a consultar por los usuarios. El enfoque de clasificación considera  que dado un conjunto de documentos D y un conjunto de categorías C, encontrar una función haga corresponder a un documento d tomado de D,  una categoría determinada c en C. Para ello realiza un análisis léxico que identifique  las subsecuencias de  lexemas de d, luego mediante un análisis string kernel encuentre el grado de similitud entre dos textos. Se utilizan asimismo la técnica de punteros invertidos a fin de encontrar documentos que contienen los términos a consultar. Dos textos son más similares mientras tengas más subsecuencias en común. Se presenta una aplicación de clasificación que haga corresponder a un documento (texto de propiedades medicinales de una planta) una categoría C que serán las propiedades mismas de las plantas. 
Nota importante:
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).