Herramienta de análisis y clasificación de complejidad de textos en español
Descripción del Articulo
La selección de textos es una de las responsabilidades principales de los profesores dentro del planeamiento del orden de exposición a textos para sus alumnos. Debido a la gran cantidad de textos disponibles y la diversidad de géneros y temas, esta tarea demanda mucho tiempo y está ligada a aspectos...
| Autores: | , |
|---|---|
| Formato: | tesis de grado |
| Fecha de Publicación: | 2015 |
| Institución: | Pontificia Universidad Católica del Perú |
| Repositorio: | PUCP-Institucional |
| Lenguaje: | español |
| OAI Identifier: | oai:repositorio.pucp.edu.pe:20.500.14657/148928 |
| Enlace del recurso: | http://hdl.handle.net/20.500.12404/6042 |
| Nivel de acceso: | acceso abierto |
| Materia: | Procesamiento de textos Programas para computadoras--Medición Lingüística computacional https://purl.org/pe-repo/ocde/ford#1.02.00 |
| id |
RPUC_64e5a457ea91d9b6edbced5382141d39 |
|---|---|
| oai_identifier_str |
oai:repositorio.pucp.edu.pe:20.500.14657/148928 |
| network_acronym_str |
RPUC |
| network_name_str |
PUCP-Institucional |
| repository_id_str |
2905 |
| spelling |
Alva Manchego, Fernando EmilioPérez Urcia, WalterQuispesaravia Ildefonso, André Raúl2015-06-04T16:44:15Z2015-06-04T16:44:15Z20152015-06-04http://hdl.handle.net/20.500.12404/6042La selección de textos es una de las responsabilidades principales de los profesores dentro del planeamiento del orden de exposición a textos para sus alumnos. Debido a la gran cantidad de textos disponibles y la diversidad de géneros y temas, esta tarea demanda mucho tiempo y está ligada a aspectos subjetivos del evaluador. Esto es un problema, sobre el cual proponemos una alternativa de automatización. Se toma como proyecto la implementación de una herramienta de análisis y clasificación de complejidad de tetos en español. Con ello se busca brindar una alternativa automatizada al problema de escalabilidad en complejidad de textos. Esto se refiere a la necesidad de tener un orden de textos evaluados por complejidad. Para ello evaluamos la complejidad utilizando las métricas de Coh-Metrix adaptadas al español. Este conjunto de métricas evalúa textos en inglés de acuerdo a los estudios de coherencia y cohesión que los autores de Coh-Metrix desarrollaron. En base a esta adatapación de Coh-Metrix se desarrolló un clasificador basado en técnicas de aprenizaje de máquina y un conjunto de textos en español conformado por fábulas y cuentos previamente clasificados. Finalmente estos componentes fueron unidos en una herraamienta web para la accesibilidad pública de la herramienta desarrollada.spaPontificia Universidad Católica del PerúPEinfo:eu-repo/semantics/openAccesshttp://creativecommons.org/licenses/by-nc-nd/2.5/pe/Procesamiento de textosProgramas para computadoras--MediciónLingüística computacionalhttps://purl.org/pe-repo/ocde/ford#1.02.00Herramienta de análisis y clasificación de complejidad de textos en españolinfo:eu-repo/semantics/bachelorThesisTesis de licenciaturareponame:PUCP-Institucionalinstname:Pontificia Universidad Católica del Perúinstacron:PUCPIngeniero InformáticoTítulo ProfesionalPontificia Universidad Católica del Perú. Facultad de Ciencias e Ingeniería.Ingeniería Informática612286https://purl.org/pe-repo/renati/level#tituloProfesionalhttps://purl.org/pe-repo/renati/type#tesis20.500.14657/148928oai:repositorio.pucp.edu.pe:20.500.14657/1489282024-10-06 15:32:19.233http://creativecommons.org/licenses/by-nc-nd/2.5/pe/info:eu-repo/semantics/openAccessmetadata.onlyhttps://repositorio.pucp.edu.peRepositorio Institucional de la PUCPrepositorio@pucp.pe |
| dc.title.es_ES.fl_str_mv |
Herramienta de análisis y clasificación de complejidad de textos en español |
| title |
Herramienta de análisis y clasificación de complejidad de textos en español |
| spellingShingle |
Herramienta de análisis y clasificación de complejidad de textos en español Pérez Urcia, Walter Procesamiento de textos Programas para computadoras--Medición Lingüística computacional https://purl.org/pe-repo/ocde/ford#1.02.00 |
| title_short |
Herramienta de análisis y clasificación de complejidad de textos en español |
| title_full |
Herramienta de análisis y clasificación de complejidad de textos en español |
| title_fullStr |
Herramienta de análisis y clasificación de complejidad de textos en español |
| title_full_unstemmed |
Herramienta de análisis y clasificación de complejidad de textos en español |
| title_sort |
Herramienta de análisis y clasificación de complejidad de textos en español |
| author |
Pérez Urcia, Walter |
| author_facet |
Pérez Urcia, Walter Quispesaravia Ildefonso, André Raúl |
| author_role |
author |
| author2 |
Quispesaravia Ildefonso, André Raúl |
| author2_role |
author |
| dc.contributor.advisor.fl_str_mv |
Alva Manchego, Fernando Emilio |
| dc.contributor.author.fl_str_mv |
Pérez Urcia, Walter Quispesaravia Ildefonso, André Raúl |
| dc.subject.es_ES.fl_str_mv |
Procesamiento de textos Programas para computadoras--Medición Lingüística computacional |
| topic |
Procesamiento de textos Programas para computadoras--Medición Lingüística computacional https://purl.org/pe-repo/ocde/ford#1.02.00 |
| dc.subject.ocde.es_ES.fl_str_mv |
https://purl.org/pe-repo/ocde/ford#1.02.00 |
| description |
La selección de textos es una de las responsabilidades principales de los profesores dentro del planeamiento del orden de exposición a textos para sus alumnos. Debido a la gran cantidad de textos disponibles y la diversidad de géneros y temas, esta tarea demanda mucho tiempo y está ligada a aspectos subjetivos del evaluador. Esto es un problema, sobre el cual proponemos una alternativa de automatización. Se toma como proyecto la implementación de una herramienta de análisis y clasificación de complejidad de tetos en español. Con ello se busca brindar una alternativa automatizada al problema de escalabilidad en complejidad de textos. Esto se refiere a la necesidad de tener un orden de textos evaluados por complejidad. Para ello evaluamos la complejidad utilizando las métricas de Coh-Metrix adaptadas al español. Este conjunto de métricas evalúa textos en inglés de acuerdo a los estudios de coherencia y cohesión que los autores de Coh-Metrix desarrollaron. En base a esta adatapación de Coh-Metrix se desarrolló un clasificador basado en técnicas de aprenizaje de máquina y un conjunto de textos en español conformado por fábulas y cuentos previamente clasificados. Finalmente estos componentes fueron unidos en una herraamienta web para la accesibilidad pública de la herramienta desarrollada. |
| publishDate |
2015 |
| dc.date.accessioned.es_ES.fl_str_mv |
2015-06-04T16:44:15Z |
| dc.date.available.es_ES.fl_str_mv |
2015-06-04T16:44:15Z |
| dc.date.created.es_ES.fl_str_mv |
2015 |
| dc.date.issued.fl_str_mv |
2015-06-04 |
| dc.type.es_ES.fl_str_mv |
info:eu-repo/semantics/bachelorThesis |
| dc.type.other.none.fl_str_mv |
Tesis de licenciatura |
| format |
bachelorThesis |
| dc.identifier.uri.none.fl_str_mv |
http://hdl.handle.net/20.500.12404/6042 |
| url |
http://hdl.handle.net/20.500.12404/6042 |
| dc.language.iso.es_ES.fl_str_mv |
spa |
| language |
spa |
| dc.rights.es_ES.fl_str_mv |
info:eu-repo/semantics/openAccess |
| dc.rights.uri.*.fl_str_mv |
http://creativecommons.org/licenses/by-nc-nd/2.5/pe/ |
| eu_rights_str_mv |
openAccess |
| rights_invalid_str_mv |
http://creativecommons.org/licenses/by-nc-nd/2.5/pe/ |
| dc.publisher.es_ES.fl_str_mv |
Pontificia Universidad Católica del Perú |
| dc.publisher.country.es_ES.fl_str_mv |
PE |
| dc.source.none.fl_str_mv |
reponame:PUCP-Institucional instname:Pontificia Universidad Católica del Perú instacron:PUCP |
| instname_str |
Pontificia Universidad Católica del Perú |
| instacron_str |
PUCP |
| institution |
PUCP |
| reponame_str |
PUCP-Institucional |
| collection |
PUCP-Institucional |
| repository.name.fl_str_mv |
Repositorio Institucional de la PUCP |
| repository.mail.fl_str_mv |
repositorio@pucp.pe |
| _version_ |
1835639146415128576 |
| score |
13.917434 |
Nota importante:
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).