Herramienta de análisis y clasificación de complejidad de textos en español

Descripción del Articulo

La selección de textos es una de las responsabilidades principales de los profesores dentro del planeamiento del orden de exposición a textos para sus alumnos. Debido a la gran cantidad de textos disponibles y la diversidad de géneros y temas, esta tarea demanda mucho tiempo y está ligada a aspectos...

Descripción completa

Detalles Bibliográficos
Autores: Pérez Urcia, Walter, Quispesaravia Ildefonso, André Raúl
Formato: tesis de grado
Fecha de Publicación:2015
Institución:Pontificia Universidad Católica del Perú
Repositorio:PUCP-Tesis
Lenguaje:español
OAI Identifier:oai:tesis.pucp.edu.pe:20.500.12404/6042
Enlace del recurso:http://hdl.handle.net/20.500.12404/6042
Nivel de acceso:acceso abierto
Materia:Procesamiento de textos
Programas para computadoras--Medición
Lingüística computacional
https://purl.org/pe-repo/ocde/ford#1.02.00
id PUCP_35bb68d416b5ef020e52defb75d40c33
oai_identifier_str oai:tesis.pucp.edu.pe:20.500.12404/6042
network_acronym_str PUCP
network_name_str PUCP-Tesis
repository_id_str .
dc.title.es_ES.fl_str_mv Herramienta de análisis y clasificación de complejidad de textos en español
title Herramienta de análisis y clasificación de complejidad de textos en español
spellingShingle Herramienta de análisis y clasificación de complejidad de textos en español
Pérez Urcia, Walter
Procesamiento de textos
Programas para computadoras--Medición
Lingüística computacional
https://purl.org/pe-repo/ocde/ford#1.02.00
title_short Herramienta de análisis y clasificación de complejidad de textos en español
title_full Herramienta de análisis y clasificación de complejidad de textos en español
title_fullStr Herramienta de análisis y clasificación de complejidad de textos en español
title_full_unstemmed Herramienta de análisis y clasificación de complejidad de textos en español
title_sort Herramienta de análisis y clasificación de complejidad de textos en español
author Pérez Urcia, Walter
author_facet Pérez Urcia, Walter
Quispesaravia Ildefonso, André Raúl
author_role author
author2 Quispesaravia Ildefonso, André Raúl
author2_role author
dc.contributor.advisor.fl_str_mv Alva Manchego, Fernando Emilio
dc.contributor.author.fl_str_mv Pérez Urcia, Walter
Quispesaravia Ildefonso, André Raúl
dc.subject.es_ES.fl_str_mv Procesamiento de textos
Programas para computadoras--Medición
Lingüística computacional
topic Procesamiento de textos
Programas para computadoras--Medición
Lingüística computacional
https://purl.org/pe-repo/ocde/ford#1.02.00
dc.subject.ocde.es_ES.fl_str_mv https://purl.org/pe-repo/ocde/ford#1.02.00
description La selección de textos es una de las responsabilidades principales de los profesores dentro del planeamiento del orden de exposición a textos para sus alumnos. Debido a la gran cantidad de textos disponibles y la diversidad de géneros y temas, esta tarea demanda mucho tiempo y está ligada a aspectos subjetivos del evaluador. Esto es un problema, sobre el cual proponemos una alternativa de automatización. Se toma como proyecto la implementación de una herramienta de análisis y clasificación de complejidad de tetos en español. Con ello se busca brindar una alternativa automatizada al problema de escalabilidad en complejidad de textos. Esto se refiere a la necesidad de tener un orden de textos evaluados por complejidad. Para ello evaluamos la complejidad utilizando las métricas de Coh-Metrix adaptadas al español. Este conjunto de métricas evalúa textos en inglés de acuerdo a los estudios de coherencia y cohesión que los autores de Coh-Metrix desarrollaron. En base a esta adatapación de Coh-Metrix se desarrolló un clasificador basado en técnicas de aprenizaje de máquina y un conjunto de textos en español conformado por fábulas y cuentos previamente clasificados. Finalmente estos componentes fueron unidos en una herraamienta web para la accesibilidad pública de la herramienta desarrollada.
publishDate 2015
dc.date.accessioned.es_ES.fl_str_mv 2015-06-04T16:44:15Z
dc.date.available.es_ES.fl_str_mv 2015-06-04T16:44:15Z
dc.date.created.es_ES.fl_str_mv 2015
dc.date.issued.fl_str_mv 2015-06-04
dc.type.es_ES.fl_str_mv info:eu-repo/semantics/bachelorThesis
format bachelorThesis
dc.identifier.uri.none.fl_str_mv http://hdl.handle.net/20.500.12404/6042
url http://hdl.handle.net/20.500.12404/6042
dc.language.iso.es_ES.fl_str_mv spa
language spa
dc.relation.ispartof.fl_str_mv SUNEDU
dc.rights.es_ES.fl_str_mv info:eu-repo/semantics/openAccess
dc.rights.uri.*.fl_str_mv http://creativecommons.org/licenses/by-nc-nd/2.5/pe/
eu_rights_str_mv openAccess
rights_invalid_str_mv http://creativecommons.org/licenses/by-nc-nd/2.5/pe/
dc.publisher.es_ES.fl_str_mv Pontificia Universidad Católica del Perú
dc.publisher.country.es_ES.fl_str_mv PE
dc.source.none.fl_str_mv reponame:PUCP-Tesis
instname:Pontificia Universidad Católica del Perú
instacron:PUCP
instname_str Pontificia Universidad Católica del Perú
instacron_str PUCP
institution PUCP
reponame_str PUCP-Tesis
collection PUCP-Tesis
bitstream.url.fl_str_mv https://tesis.pucp.edu.pe/bitstreams/4c8adaf0-07a3-441d-989f-70806a6f54ab/download
https://tesis.pucp.edu.pe/bitstreams/7931fcce-bfa8-4bbc-bcc0-b34cc7715415/download
https://tesis.pucp.edu.pe/bitstreams/85675f45-710d-4e32-a7f1-4ed06741d07f/download
https://tesis.pucp.edu.pe/bitstreams/9b802eb2-ce84-43fc-aa65-7681d5296876/download
https://tesis.pucp.edu.pe/bitstreams/b2808578-a6a1-49c6-898a-ff5ca05c3d48/download
https://tesis.pucp.edu.pe/bitstreams/499ac6f8-5594-4b3a-82a2-497163334d23/download
https://tesis.pucp.edu.pe/bitstreams/dfcf57d9-8a45-4d63-bad3-03cafff2b4f4/download
bitstream.checksum.fl_str_mv 8a4605be74aa9ea9d79846c1fba20a33
fb57ff357884b475e3e4f1156e13af15
8f4b9319f3327d9206f3f482e3d4e4aa
c5823867abb56b99a73fc46328e7a911
8d5682da6d8faae36dd1c58b84d56185
814637cfce725f2efe2fd2d3a5db4cf7
ff6e8f82e0869aa506749811a1434200
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
MD5
MD5
MD5
MD5
repository.name.fl_str_mv Repositorio de Tesis PUCP
repository.mail.fl_str_mv raul.sifuentes@pucp.pe
_version_ 1834737006584791040
spelling Alva Manchego, Fernando EmilioPérez Urcia, WalterQuispesaravia Ildefonso, André Raúl2015-06-04T16:44:15Z2015-06-04T16:44:15Z20152015-06-04http://hdl.handle.net/20.500.12404/6042La selección de textos es una de las responsabilidades principales de los profesores dentro del planeamiento del orden de exposición a textos para sus alumnos. Debido a la gran cantidad de textos disponibles y la diversidad de géneros y temas, esta tarea demanda mucho tiempo y está ligada a aspectos subjetivos del evaluador. Esto es un problema, sobre el cual proponemos una alternativa de automatización. Se toma como proyecto la implementación de una herramienta de análisis y clasificación de complejidad de tetos en español. Con ello se busca brindar una alternativa automatizada al problema de escalabilidad en complejidad de textos. Esto se refiere a la necesidad de tener un orden de textos evaluados por complejidad. Para ello evaluamos la complejidad utilizando las métricas de Coh-Metrix adaptadas al español. Este conjunto de métricas evalúa textos en inglés de acuerdo a los estudios de coherencia y cohesión que los autores de Coh-Metrix desarrollaron. En base a esta adatapación de Coh-Metrix se desarrolló un clasificador basado en técnicas de aprenizaje de máquina y un conjunto de textos en español conformado por fábulas y cuentos previamente clasificados. Finalmente estos componentes fueron unidos en una herraamienta web para la accesibilidad pública de la herramienta desarrollada.TesisspaPontificia Universidad Católica del PerúPEinfo:eu-repo/semantics/openAccesshttp://creativecommons.org/licenses/by-nc-nd/2.5/pe/Procesamiento de textosProgramas para computadoras--MediciónLingüística computacionalhttps://purl.org/pe-repo/ocde/ford#1.02.00Herramienta de análisis y clasificación de complejidad de textos en españolinfo:eu-repo/semantics/bachelorThesisreponame:PUCP-Tesisinstname:Pontificia Universidad Católica del Perúinstacron:PUCPSUNEDUIngeniero InformáticoTítulo ProfesionalPontificia Universidad Católica del Perú. Facultad de Ciencias e Ingeniería.Ingeniería Informática612286https://purl.org/pe-repo/renati/level#tituloProfesionalhttps://purl.org/pe-repo/renati/type#tesisLICENSElicense.txtlicense.txttext/plain; charset=utf-81748https://tesis.pucp.edu.pe/bitstreams/4c8adaf0-07a3-441d-989f-70806a6f54ab/download8a4605be74aa9ea9d79846c1fba20a33MD53falseAnonymousREADORIGINALPEREZ_WALTER_QUISPESARAVIA_ANDRÉ_HERRAMIENTA_TEXTO.pdfPEREZ_WALTER_QUISPESARAVIA_ANDRÉ_HERRAMIENTA_TEXTO.pdfapplication/pdf1598434https://tesis.pucp.edu.pe/bitstreams/7931fcce-bfa8-4bbc-bcc0-b34cc7715415/downloadfb57ff357884b475e3e4f1156e13af15MD51trueAnonymousREADPEREZ_WALTER_QUISPESARAVIA_ANDRÉ_HERRAMIENTA_TEXTO_ANEXO.pdfPEREZ_WALTER_QUISPESARAVIA_ANDRÉ_HERRAMIENTA_TEXTO_ANEXO.pdfapplication/pdf1196956https://tesis.pucp.edu.pe/bitstreams/85675f45-710d-4e32-a7f1-4ed06741d07f/download8f4b9319f3327d9206f3f482e3d4e4aaMD52falseAnonymousREADTEXTPEREZ_WALTER_QUISPESARAVIA_ANDRÉ_HERRAMIENTA_TEXTO.pdf.txtPEREZ_WALTER_QUISPESARAVIA_ANDRÉ_HERRAMIENTA_TEXTO.pdf.txtExtracted texttext/plain115582https://tesis.pucp.edu.pe/bitstreams/9b802eb2-ce84-43fc-aa65-7681d5296876/downloadc5823867abb56b99a73fc46328e7a911MD58falseAnonymousREADPEREZ_WALTER_QUISPESARAVIA_ANDRÉ_HERRAMIENTA_TEXTO_ANEXO.pdf.txtPEREZ_WALTER_QUISPESARAVIA_ANDRÉ_HERRAMIENTA_TEXTO_ANEXO.pdf.txtExtracted texttext/plain8546https://tesis.pucp.edu.pe/bitstreams/b2808578-a6a1-49c6-898a-ff5ca05c3d48/download8d5682da6d8faae36dd1c58b84d56185MD510falseAnonymousREADTHUMBNAILPEREZ_WALTER_QUISPESARAVIA_ANDRÉ_HERRAMIENTA_TEXTO.pdf.jpgPEREZ_WALTER_QUISPESARAVIA_ANDRÉ_HERRAMIENTA_TEXTO.pdf.jpgIM Thumbnailimage/jpeg29773https://tesis.pucp.edu.pe/bitstreams/499ac6f8-5594-4b3a-82a2-497163334d23/download814637cfce725f2efe2fd2d3a5db4cf7MD59falseAnonymousREADPEREZ_WALTER_QUISPESARAVIA_ANDRÉ_HERRAMIENTA_TEXTO_ANEXO.pdf.jpgPEREZ_WALTER_QUISPESARAVIA_ANDRÉ_HERRAMIENTA_TEXTO_ANEXO.pdf.jpgIM Thumbnailimage/jpeg47410https://tesis.pucp.edu.pe/bitstreams/dfcf57d9-8a45-4d63-bad3-03cafff2b4f4/downloadff6e8f82e0869aa506749811a1434200MD511falseAnonymousREAD20.500.12404/6042oai:tesis.pucp.edu.pe:20.500.12404/60422025-03-12 17:58:49.736http://creativecommons.org/licenses/by-nc-nd/2.5/pe/info:eu-repo/semantics/openAccessopen.accesshttps://tesis.pucp.edu.peRepositorio de Tesis PUCPraul.sifuentes@pucp.peTk9URTogUExBQ0UgWU9VUiBPV04gTElDRU5TRSBIRVJFClRoaXMgc2FtcGxlIGxpY2Vuc2UgaXMgcHJvdmlkZWQgZm9yIGluZm9ybWF0aW9uYWwgcHVycG9zZXMgb25seS4KCk5PTi1FWENMVVNJVkUgRElTVFJJQlVUSU9OIExJQ0VOU0UKCkJ5IHNpZ25pbmcgYW5kIHN1Ym1pdHRpbmcgdGhpcyBsaWNlbnNlLCB5b3UgKHRoZSBhdXRob3Iocykgb3IgY29weXJpZ2h0Cm93bmVyKSBncmFudHMgdG8gRFNwYWNlIFVuaXZlcnNpdHkgKERTVSkgdGhlIG5vbi1leGNsdXNpdmUgcmlnaHQgdG8gcmVwcm9kdWNlLAp0cmFuc2xhdGUgKGFzIGRlZmluZWQgYmVsb3cpLCBhbmQvb3IgZGlzdHJpYnV0ZSB5b3VyIHN1Ym1pc3Npb24gKGluY2x1ZGluZwp0aGUgYWJzdHJhY3QpIHdvcmxkd2lkZSBpbiBwcmludCBhbmQgZWxlY3Ryb25pYyBmb3JtYXQgYW5kIGluIGFueSBtZWRpdW0sCmluY2x1ZGluZyBidXQgbm90IGxpbWl0ZWQgdG8gYXVkaW8gb3IgdmlkZW8uCgpZb3UgYWdyZWUgdGhhdCBEU1UgbWF5LCB3aXRob3V0IGNoYW5naW5nIHRoZSBjb250ZW50LCB0cmFuc2xhdGUgdGhlCnN1Ym1pc3Npb24gdG8gYW55IG1lZGl1bSBvciBmb3JtYXQgZm9yIHRoZSBwdXJwb3NlIG9mIHByZXNlcnZhdGlvbi4KCllvdSBhbHNvIGFncmVlIHRoYXQgRFNVIG1heSBrZWVwIG1vcmUgdGhhbiBvbmUgY29weSBvZiB0aGlzIHN1Ym1pc3Npb24gZm9yCnB1cnBvc2VzIG9mIHNlY3VyaXR5LCBiYWNrLXVwIGFuZCBwcmVzZXJ2YXRpb24uCgpZb3UgcmVwcmVzZW50IHRoYXQgdGhlIHN1Ym1pc3Npb24gaXMgeW91ciBvcmlnaW5hbCB3b3JrLCBhbmQgdGhhdCB5b3UgaGF2ZQp0aGUgcmlnaHQgdG8gZ3JhbnQgdGhlIHJpZ2h0cyBjb250YWluZWQgaW4gdGhpcyBsaWNlbnNlLiBZb3UgYWxzbyByZXByZXNlbnQKdGhhdCB5b3VyIHN1Ym1pc3Npb24gZG9lcyBub3QsIHRvIHRoZSBiZXN0IG9mIHlvdXIga25vd2xlZGdlLCBpbmZyaW5nZSB1cG9uCmFueW9uZSdzIGNvcHlyaWdodC4KCklmIHRoZSBzdWJtaXNzaW9uIGNvbnRhaW5zIG1hdGVyaWFsIGZvciB3aGljaCB5b3UgZG8gbm90IGhvbGQgY29weXJpZ2h0LAp5b3UgcmVwcmVzZW50IHRoYXQgeW91IGhhdmUgb2J0YWluZWQgdGhlIHVucmVzdHJpY3RlZCBwZXJtaXNzaW9uIG9mIHRoZQpjb3B5cmlnaHQgb3duZXIgdG8gZ3JhbnQgRFNVIHRoZSByaWdodHMgcmVxdWlyZWQgYnkgdGhpcyBsaWNlbnNlLCBhbmQgdGhhdApzdWNoIHRoaXJkLXBhcnR5IG93bmVkIG1hdGVyaWFsIGlzIGNsZWFybHkgaWRlbnRpZmllZCBhbmQgYWNrbm93bGVkZ2VkCndpdGhpbiB0aGUgdGV4dCBvciBjb250ZW50IG9mIHRoZSBzdWJtaXNzaW9uLgoKSUYgVEhFIFNVQk1JU1NJT04gSVMgQkFTRUQgVVBPTiBXT1JLIFRIQVQgSEFTIEJFRU4gU1BPTlNPUkVEIE9SIFNVUFBPUlRFRApCWSBBTiBBR0VOQ1kgT1IgT1JHQU5JWkFUSU9OIE9USEVSIFRIQU4gRFNVLCBZT1UgUkVQUkVTRU5UIFRIQVQgWU9VIEhBVkUKRlVMRklMTEVEIEFOWSBSSUdIVCBPRiBSRVZJRVcgT1IgT1RIRVIgT0JMSUdBVElPTlMgUkVRVUlSRUQgQlkgU1VDSApDT05UUkFDVCBPUiBBR1JFRU1FTlQuCgpEU1Ugd2lsbCBjbGVhcmx5IGlkZW50aWZ5IHlvdXIgbmFtZShzKSBhcyB0aGUgYXV0aG9yKHMpIG9yIG93bmVyKHMpIG9mIHRoZQpzdWJtaXNzaW9uLCBhbmQgd2lsbCBub3QgbWFrZSBhbnkgYWx0ZXJhdGlvbiwgb3RoZXIgdGhhbiBhcyBhbGxvd2VkIGJ5IHRoaXMKbGljZW5zZSwgdG8geW91ciBzdWJtaXNzaW9uLgo=
score 13.931592
Nota importante:
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).