Categorización de textos utilizando análisis stringkernel e indexación semántica latente: Aplicación de textos de propiedades medicinales de plantas
Descripción del Articulo
Debido a la abundante información existente se hace necesario organizar, mantener y procesar toda información disponible a partir de un conocimiento más profundo del lenguaje. Un clasificador de textos (CT) consiste en etiquetar un texto o documento con una o varias categorías temáticas predefinidas...
Autor: | |
---|---|
Formato: | artículo |
Fecha de Publicación: | 2017 |
Institución: | Universidad Ricardo Palma |
Repositorio: | Revista URP - Paideia XXI |
Lenguaje: | español |
OAI Identifier: | oai:oai.revistas.urp.edu.pe:article/913 |
Enlace del recurso: | http://revistas.urp.edu.pe/index.php/Paideia/article/view/913 |
Nivel de acceso: | acceso abierto |
id |
2519-5700_13756bd1e7be5620ea3003941085fb41 |
---|---|
oai_identifier_str |
oai:oai.revistas.urp.edu.pe:article/913 |
network_acronym_str |
2519-5700 |
repository_id_str |
|
network_name_str |
Revista URP - Paideia XXI |
spelling |
Categorización de textos utilizando análisis stringkernel e indexación semántica latente: Aplicación de textos de propiedades medicinales de plantasCortez Vásquez, AugustoDebido a la abundante información existente se hace necesario organizar, mantener y procesar toda información disponible a partir de un conocimiento más profundo del lenguaje. Un clasificador de textos (CT) consiste en etiquetar un texto o documento con una o varias categorías temáticas predefinidas. El enfoque de clasificación considera que dado un conjunto de documentos D y un conjunto de categorías C, encontrar una función haga corresponder a un documento d tomado de D, una categoría determinada c en C. Para ello realiza un análisis léxico que identifique las subsecuencias de lexemas de d; luego, mediante un análisis stringkernel encuentre el grado de similitud entre dos textos.Dos textos son más similares mientras tengan más subsecuencias en común.Universidad Ricardo Palma2017-09-16info:eu-repo/semantics/articleinfo:eu-repo/semantics/publishedVersionArticulo evaluado por paresapplication/pdfhttp://revistas.urp.edu.pe/index.php/Paideia/article/view/91310.31381/paideia.v4i5.913Paideia XXI; Vol. 4 Núm. 5 (2014): Paideia XXI; 113 - 1232519-57002221-777010.31381/paideia.v4i5reponame:Revista URP - Paideia XXIinstname:Universidad Ricardo Palmainstacron:URPspahttp://revistas.urp.edu.pe/index.php/Paideia/article/view/913/83110.31381/paideia.v4i5.913.g831Derechos de autor 2017 Paideiainfo:eu-repo/semantics/openAccess2021-05-29T16:30:11Zmail@mail.com - |
dc.title.none.fl_str_mv |
Categorización de textos utilizando análisis stringkernel e indexación semántica latente: Aplicación de textos de propiedades medicinales de plantas |
title |
Categorización de textos utilizando análisis stringkernel e indexación semántica latente: Aplicación de textos de propiedades medicinales de plantas |
spellingShingle |
Categorización de textos utilizando análisis stringkernel e indexación semántica latente: Aplicación de textos de propiedades medicinales de plantas Cortez Vásquez, Augusto |
title_short |
Categorización de textos utilizando análisis stringkernel e indexación semántica latente: Aplicación de textos de propiedades medicinales de plantas |
title_full |
Categorización de textos utilizando análisis stringkernel e indexación semántica latente: Aplicación de textos de propiedades medicinales de plantas |
title_fullStr |
Categorización de textos utilizando análisis stringkernel e indexación semántica latente: Aplicación de textos de propiedades medicinales de plantas |
title_full_unstemmed |
Categorización de textos utilizando análisis stringkernel e indexación semántica latente: Aplicación de textos de propiedades medicinales de plantas |
title_sort |
Categorización de textos utilizando análisis stringkernel e indexación semántica latente: Aplicación de textos de propiedades medicinales de plantas |
dc.creator.none.fl_str_mv |
Cortez Vásquez, Augusto |
author |
Cortez Vásquez, Augusto |
author_facet |
Cortez Vásquez, Augusto |
author_role |
author |
dc.description.none.fl_txt_mv |
Debido a la abundante información existente se hace necesario organizar, mantener y procesar toda información disponible a partir de un conocimiento más profundo del lenguaje. Un clasificador de textos (CT) consiste en etiquetar un texto o documento con una o varias categorías temáticas predefinidas. El enfoque de clasificación considera que dado un conjunto de documentos D y un conjunto de categorías C, encontrar una función haga corresponder a un documento d tomado de D, una categoría determinada c en C. Para ello realiza un análisis léxico que identifique las subsecuencias de lexemas de d; luego, mediante un análisis stringkernel encuentre el grado de similitud entre dos textos.Dos textos son más similares mientras tengan más subsecuencias en común. |
description |
Debido a la abundante información existente se hace necesario organizar, mantener y procesar toda información disponible a partir de un conocimiento más profundo del lenguaje. Un clasificador de textos (CT) consiste en etiquetar un texto o documento con una o varias categorías temáticas predefinidas. El enfoque de clasificación considera que dado un conjunto de documentos D y un conjunto de categorías C, encontrar una función haga corresponder a un documento d tomado de D, una categoría determinada c en C. Para ello realiza un análisis léxico que identifique las subsecuencias de lexemas de d; luego, mediante un análisis stringkernel encuentre el grado de similitud entre dos textos.Dos textos son más similares mientras tengan más subsecuencias en común. |
publishDate |
2017 |
dc.date.none.fl_str_mv |
2017-09-16 |
dc.type.none.fl_str_mv |
info:eu-repo/semantics/article info:eu-repo/semantics/publishedVersion Articulo evaluado por pares |
format |
article |
status_str |
publishedVersion |
dc.identifier.none.fl_str_mv |
http://revistas.urp.edu.pe/index.php/Paideia/article/view/913 10.31381/paideia.v4i5.913 |
url |
http://revistas.urp.edu.pe/index.php/Paideia/article/view/913 |
identifier_str_mv |
10.31381/paideia.v4i5.913 |
dc.language.none.fl_str_mv |
spa |
language |
spa |
dc.relation.none.fl_str_mv |
http://revistas.urp.edu.pe/index.php/Paideia/article/view/913/831 10.31381/paideia.v4i5.913.g831 |
dc.rights.none.fl_str_mv |
Derechos de autor 2017 Paideia info:eu-repo/semantics/openAccess |
rights_invalid_str_mv |
Derechos de autor 2017 Paideia |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.publisher.none.fl_str_mv |
Universidad Ricardo Palma |
publisher.none.fl_str_mv |
Universidad Ricardo Palma |
dc.source.none.fl_str_mv |
Paideia XXI; Vol. 4 Núm. 5 (2014): Paideia XXI; 113 - 123 2519-5700 2221-7770 10.31381/paideia.v4i5 reponame:Revista URP - Paideia XXI instname:Universidad Ricardo Palma instacron:URP |
reponame_str |
Revista URP - Paideia XXI |
collection |
Revista URP - Paideia XXI |
instname_str |
Universidad Ricardo Palma |
instacron_str |
URP |
institution |
URP |
repository.name.fl_str_mv |
-
|
repository.mail.fl_str_mv |
mail@mail.com |
_version_ |
1701110958844280832 |
score |
13.887938 |
Nota importante:
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).