Categorización de textos utilizando análisis stringkernel e indexación semántica latente: Aplicación de textos de propiedades medicinales de plantas

Cortez Vásquez, Augusto

Categorización de textos utilizando análisis stringkernel e indexación semántica latente: Aplicación de textos de propiedades medicinales de plantas

Descripción del Articulo

Debido a la abundante información existente se hace necesario organizar, mantener y procesar toda información disponible a partir de un conocimiento más profundo del lenguaje. Un clasificador de textos (CT) consiste en etiquetar un texto o documento con una o varias categorías temáticas predefinidas...

Descripción completa

Detalles Bibliográficos
Autor:	Cortez Vásquez, Augusto
Formato:	artículo
Fecha de Publicación:	2017
Institución:	Universidad Ricardo Palma
Repositorio:	Revista URP - Paideia XXI
Lenguaje:	español
OAI Identifier:	oai:oai.revistas.urp.edu.pe:article/913
Enlace del recurso:	http://revistas.urp.edu.pe/index.php/Paideia/article/view/913
Nivel de acceso:	acceso abierto

Descripción
Sumario:	Debido a la abundante información existente se hace necesario organizar, mantener y procesar toda información disponible a partir de un conocimiento más profundo del lenguaje. Un clasificador de textos (CT) consiste en etiquetar un texto o documento con una o varias categorías temáticas predefinidas. El enfoque de clasificación considera que dado un conjunto de documentos D y un conjunto de categorías C, encontrar una función haga corresponder a un documento d tomado de D, una categoría determinada c en C. Para ello realiza un análisis léxico que identifique las subsecuencias de lexemas de d; luego, mediante un análisis stringkernel encuentre el grado de similitud entre dos textos.Dos textos son más similares mientras tengan más subsecuencias en común.

Categorización de textos utilizando análisis stringkernel e indexación semántica latente: Aplicación de textos de propiedades medicinales de plantas

Nota importante:
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).

Categorización de textos utilizando análisis stringkernel e indexación semántica latente: Aplicación de textos de propiedades medicinales de plantas

Descripción del Articulo

Ejemplares Similares