Categorización de textos utilizando análisis stringkernel e indexación semántica latente: Aplicación de textos de propiedades medicinales de plantas

Descripción del Articulo

Debido a la abundante información existente se hace necesario organizar, mantener y procesar toda información disponible a partir de un conocimiento más profundo del lenguaje. Un clasificador de textos (CT) consiste en etiquetar un texto o documento con una o varias categorías temáticas predefinidas...

Descripción completa

Detalles Bibliográficos
Autor: Cortez Vásquez, Augusto
Formato: artículo
Fecha de Publicación:2017
Institución:Universidad Ricardo Palma
Repositorio:Revista URP - Paideia XXI
Lenguaje:español
OAI Identifier:oai:oai.revistas.urp.edu.pe:article/913
Enlace del recurso:http://revistas.urp.edu.pe/index.php/Paideia/article/view/913
Nivel de acceso:acceso abierto
id 2519-5700_13756bd1e7be5620ea3003941085fb41
oai_identifier_str oai:oai.revistas.urp.edu.pe:article/913
network_acronym_str 2519-5700
repository_id_str
network_name_str Revista URP - Paideia XXI
spelling Categorización de textos utilizando análisis stringkernel e indexación semántica latente: Aplicación de textos de propiedades medicinales de plantasCortez Vásquez, AugustoDebido a la abundante información existente se hace necesario organizar, mantener y procesar toda información disponible a partir de un conocimiento más profundo del lenguaje. Un clasificador de textos (CT) consiste en etiquetar un texto o documento con una o varias categorías temáticas predefinidas. El enfoque de clasificación considera que dado un conjunto de documentos D y un conjunto de categorías C, encontrar una función haga corresponder a un documento d tomado de D, una categoría determinada c en C. Para ello realiza un análisis léxico que identifique las subsecuencias de lexemas de d; luego, mediante un análisis stringkernel encuentre el grado de similitud entre dos textos.Dos textos son más similares mientras tengan más subsecuencias en común.Universidad Ricardo Palma2017-09-16info:eu-repo/semantics/articleinfo:eu-repo/semantics/publishedVersionArticulo evaluado por paresapplication/pdfhttp://revistas.urp.edu.pe/index.php/Paideia/article/view/91310.31381/paideia.v4i5.913Paideia XXI; Vol. 4 Núm. 5 (2014): Paideia XXI; 113 - 1232519-57002221-777010.31381/paideia.v4i5reponame:Revista URP - Paideia XXIinstname:Universidad Ricardo Palmainstacron:URPspahttp://revistas.urp.edu.pe/index.php/Paideia/article/view/913/83110.31381/paideia.v4i5.913.g831Derechos de autor 2017 Paideiainfo:eu-repo/semantics/openAccess2021-05-29T16:30:11Zmail@mail.com -
dc.title.none.fl_str_mv Categorización de textos utilizando análisis stringkernel e indexación semántica latente: Aplicación de textos de propiedades medicinales de plantas
title Categorización de textos utilizando análisis stringkernel e indexación semántica latente: Aplicación de textos de propiedades medicinales de plantas
spellingShingle Categorización de textos utilizando análisis stringkernel e indexación semántica latente: Aplicación de textos de propiedades medicinales de plantas
Cortez Vásquez, Augusto
title_short Categorización de textos utilizando análisis stringkernel e indexación semántica latente: Aplicación de textos de propiedades medicinales de plantas
title_full Categorización de textos utilizando análisis stringkernel e indexación semántica latente: Aplicación de textos de propiedades medicinales de plantas
title_fullStr Categorización de textos utilizando análisis stringkernel e indexación semántica latente: Aplicación de textos de propiedades medicinales de plantas
title_full_unstemmed Categorización de textos utilizando análisis stringkernel e indexación semántica latente: Aplicación de textos de propiedades medicinales de plantas
title_sort Categorización de textos utilizando análisis stringkernel e indexación semántica latente: Aplicación de textos de propiedades medicinales de plantas
dc.creator.none.fl_str_mv Cortez Vásquez, Augusto
author Cortez Vásquez, Augusto
author_facet Cortez Vásquez, Augusto
author_role author
dc.description.none.fl_txt_mv Debido a la abundante información existente se hace necesario organizar, mantener y procesar toda información disponible a partir de un conocimiento más profundo del lenguaje. Un clasificador de textos (CT) consiste en etiquetar un texto o documento con una o varias categorías temáticas predefinidas. El enfoque de clasificación considera que dado un conjunto de documentos D y un conjunto de categorías C, encontrar una función haga corresponder a un documento d tomado de D, una categoría determinada c en C. Para ello realiza un análisis léxico que identifique las subsecuencias de lexemas de d; luego, mediante un análisis stringkernel encuentre el grado de similitud entre dos textos.Dos textos son más similares mientras tengan más subsecuencias en común.
description Debido a la abundante información existente se hace necesario organizar, mantener y procesar toda información disponible a partir de un conocimiento más profundo del lenguaje. Un clasificador de textos (CT) consiste en etiquetar un texto o documento con una o varias categorías temáticas predefinidas. El enfoque de clasificación considera que dado un conjunto de documentos D y un conjunto de categorías C, encontrar una función haga corresponder a un documento d tomado de D, una categoría determinada c en C. Para ello realiza un análisis léxico que identifique las subsecuencias de lexemas de d; luego, mediante un análisis stringkernel encuentre el grado de similitud entre dos textos.Dos textos son más similares mientras tengan más subsecuencias en común.
publishDate 2017
dc.date.none.fl_str_mv 2017-09-16
dc.type.none.fl_str_mv info:eu-repo/semantics/article
info:eu-repo/semantics/publishedVersion
Articulo evaluado por pares
format article
status_str publishedVersion
dc.identifier.none.fl_str_mv http://revistas.urp.edu.pe/index.php/Paideia/article/view/913
10.31381/paideia.v4i5.913
url http://revistas.urp.edu.pe/index.php/Paideia/article/view/913
identifier_str_mv 10.31381/paideia.v4i5.913
dc.language.none.fl_str_mv spa
language spa
dc.relation.none.fl_str_mv http://revistas.urp.edu.pe/index.php/Paideia/article/view/913/831
10.31381/paideia.v4i5.913.g831
dc.rights.none.fl_str_mv Derechos de autor 2017 Paideia
info:eu-repo/semantics/openAccess
rights_invalid_str_mv Derechos de autor 2017 Paideia
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Universidad Ricardo Palma
publisher.none.fl_str_mv Universidad Ricardo Palma
dc.source.none.fl_str_mv Paideia XXI; Vol. 4 Núm. 5 (2014): Paideia XXI; 113 - 123
2519-5700
2221-7770
10.31381/paideia.v4i5
reponame:Revista URP - Paideia XXI
instname:Universidad Ricardo Palma
instacron:URP
reponame_str Revista URP - Paideia XXI
collection Revista URP - Paideia XXI
instname_str Universidad Ricardo Palma
instacron_str URP
institution URP
repository.name.fl_str_mv -
repository.mail.fl_str_mv mail@mail.com
_version_ 1701110958844280832
score 13.887938
Nota importante:
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).