Herramienta de análisis y clasificación de complejidad de textos en español

Descripción del Articulo

La selección de textos es una de las responsabilidades principales de los profesores dentro del planeamiento del orden de exposición a textos para sus alumnos. Debido a la gran cantidad de textos disponibles y la diversidad de géneros y temas, esta tarea demanda mucho tiempo y está ligada a aspectos...

Descripción completa

Detalles Bibliográficos
Autores: Pérez Urcia, Walter, Quispesaravia Ildefonso, André Raúl
Formato: tesis de grado
Fecha de Publicación:2015
Institución:Pontificia Universidad Católica del Perú
Repositorio:PUCP-Institucional
Lenguaje:español
OAI Identifier:oai:repositorio.pucp.edu.pe:20.500.14657/148928
Enlace del recurso:http://hdl.handle.net/20.500.12404/6042
Nivel de acceso:acceso abierto
Materia:Procesamiento de textos
Programas para computadoras--Medición
Lingüística computacional
https://purl.org/pe-repo/ocde/ford#1.02.00
id RPUC_64e5a457ea91d9b6edbced5382141d39
oai_identifier_str oai:repositorio.pucp.edu.pe:20.500.14657/148928
network_acronym_str RPUC
network_name_str PUCP-Institucional
repository_id_str 2905
spelling Alva Manchego, Fernando EmilioPérez Urcia, WalterQuispesaravia Ildefonso, André Raúl2015-06-04T16:44:15Z2015-06-04T16:44:15Z20152015-06-04http://hdl.handle.net/20.500.12404/6042La selección de textos es una de las responsabilidades principales de los profesores dentro del planeamiento del orden de exposición a textos para sus alumnos. Debido a la gran cantidad de textos disponibles y la diversidad de géneros y temas, esta tarea demanda mucho tiempo y está ligada a aspectos subjetivos del evaluador. Esto es un problema, sobre el cual proponemos una alternativa de automatización. Se toma como proyecto la implementación de una herramienta de análisis y clasificación de complejidad de tetos en español. Con ello se busca brindar una alternativa automatizada al problema de escalabilidad en complejidad de textos. Esto se refiere a la necesidad de tener un orden de textos evaluados por complejidad. Para ello evaluamos la complejidad utilizando las métricas de Coh-Metrix adaptadas al español. Este conjunto de métricas evalúa textos en inglés de acuerdo a los estudios de coherencia y cohesión que los autores de Coh-Metrix desarrollaron. En base a esta adatapación de Coh-Metrix se desarrolló un clasificador basado en técnicas de aprenizaje de máquina y un conjunto de textos en español conformado por fábulas y cuentos previamente clasificados. Finalmente estos componentes fueron unidos en una herraamienta web para la accesibilidad pública de la herramienta desarrollada.spaPontificia Universidad Católica del PerúPEinfo:eu-repo/semantics/openAccesshttp://creativecommons.org/licenses/by-nc-nd/2.5/pe/Procesamiento de textosProgramas para computadoras--MediciónLingüística computacionalhttps://purl.org/pe-repo/ocde/ford#1.02.00Herramienta de análisis y clasificación de complejidad de textos en españolinfo:eu-repo/semantics/bachelorThesisTesis de licenciaturareponame:PUCP-Institucionalinstname:Pontificia Universidad Católica del Perúinstacron:PUCPIngeniero InformáticoTítulo ProfesionalPontificia Universidad Católica del Perú. Facultad de Ciencias e Ingeniería.Ingeniería Informática612286https://purl.org/pe-repo/renati/level#tituloProfesionalhttps://purl.org/pe-repo/renati/type#tesis20.500.14657/148928oai:repositorio.pucp.edu.pe:20.500.14657/1489282024-10-06 15:32:19.233http://creativecommons.org/licenses/by-nc-nd/2.5/pe/info:eu-repo/semantics/openAccessmetadata.onlyhttps://repositorio.pucp.edu.peRepositorio Institucional de la PUCPrepositorio@pucp.pe
dc.title.es_ES.fl_str_mv Herramienta de análisis y clasificación de complejidad de textos en español
title Herramienta de análisis y clasificación de complejidad de textos en español
spellingShingle Herramienta de análisis y clasificación de complejidad de textos en español
Pérez Urcia, Walter
Procesamiento de textos
Programas para computadoras--Medición
Lingüística computacional
https://purl.org/pe-repo/ocde/ford#1.02.00
title_short Herramienta de análisis y clasificación de complejidad de textos en español
title_full Herramienta de análisis y clasificación de complejidad de textos en español
title_fullStr Herramienta de análisis y clasificación de complejidad de textos en español
title_full_unstemmed Herramienta de análisis y clasificación de complejidad de textos en español
title_sort Herramienta de análisis y clasificación de complejidad de textos en español
author Pérez Urcia, Walter
author_facet Pérez Urcia, Walter
Quispesaravia Ildefonso, André Raúl
author_role author
author2 Quispesaravia Ildefonso, André Raúl
author2_role author
dc.contributor.advisor.fl_str_mv Alva Manchego, Fernando Emilio
dc.contributor.author.fl_str_mv Pérez Urcia, Walter
Quispesaravia Ildefonso, André Raúl
dc.subject.es_ES.fl_str_mv Procesamiento de textos
Programas para computadoras--Medición
Lingüística computacional
topic Procesamiento de textos
Programas para computadoras--Medición
Lingüística computacional
https://purl.org/pe-repo/ocde/ford#1.02.00
dc.subject.ocde.es_ES.fl_str_mv https://purl.org/pe-repo/ocde/ford#1.02.00
description La selección de textos es una de las responsabilidades principales de los profesores dentro del planeamiento del orden de exposición a textos para sus alumnos. Debido a la gran cantidad de textos disponibles y la diversidad de géneros y temas, esta tarea demanda mucho tiempo y está ligada a aspectos subjetivos del evaluador. Esto es un problema, sobre el cual proponemos una alternativa de automatización. Se toma como proyecto la implementación de una herramienta de análisis y clasificación de complejidad de tetos en español. Con ello se busca brindar una alternativa automatizada al problema de escalabilidad en complejidad de textos. Esto se refiere a la necesidad de tener un orden de textos evaluados por complejidad. Para ello evaluamos la complejidad utilizando las métricas de Coh-Metrix adaptadas al español. Este conjunto de métricas evalúa textos en inglés de acuerdo a los estudios de coherencia y cohesión que los autores de Coh-Metrix desarrollaron. En base a esta adatapación de Coh-Metrix se desarrolló un clasificador basado en técnicas de aprenizaje de máquina y un conjunto de textos en español conformado por fábulas y cuentos previamente clasificados. Finalmente estos componentes fueron unidos en una herraamienta web para la accesibilidad pública de la herramienta desarrollada.
publishDate 2015
dc.date.accessioned.es_ES.fl_str_mv 2015-06-04T16:44:15Z
dc.date.available.es_ES.fl_str_mv 2015-06-04T16:44:15Z
dc.date.created.es_ES.fl_str_mv 2015
dc.date.issued.fl_str_mv 2015-06-04
dc.type.es_ES.fl_str_mv info:eu-repo/semantics/bachelorThesis
dc.type.other.none.fl_str_mv Tesis de licenciatura
format bachelorThesis
dc.identifier.uri.none.fl_str_mv http://hdl.handle.net/20.500.12404/6042
url http://hdl.handle.net/20.500.12404/6042
dc.language.iso.es_ES.fl_str_mv spa
language spa
dc.rights.es_ES.fl_str_mv info:eu-repo/semantics/openAccess
dc.rights.uri.*.fl_str_mv http://creativecommons.org/licenses/by-nc-nd/2.5/pe/
eu_rights_str_mv openAccess
rights_invalid_str_mv http://creativecommons.org/licenses/by-nc-nd/2.5/pe/
dc.publisher.es_ES.fl_str_mv Pontificia Universidad Católica del Perú
dc.publisher.country.es_ES.fl_str_mv PE
dc.source.none.fl_str_mv reponame:PUCP-Institucional
instname:Pontificia Universidad Católica del Perú
instacron:PUCP
instname_str Pontificia Universidad Católica del Perú
instacron_str PUCP
institution PUCP
reponame_str PUCP-Institucional
collection PUCP-Institucional
repository.name.fl_str_mv Repositorio Institucional de la PUCP
repository.mail.fl_str_mv repositorio@pucp.pe
_version_ 1835639146415128576
score 13.913218
Nota importante:
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).