Algoritmo para la corrección de textos en español basados en los algoritmos Metaphone y Distancia de Levenshtein

Descripción del Articulo

El problema general de la investigación fue: ¿Cuál fue el efecto de un algoritmo de corrección de textos en español basado en los algoritmos Metaphone y Distancia de Levenshtein en la corrección de errores ortográficos, gramaticales y de estilo? El objetivo general fue determinar el efecto del algor...

Descripción completa

Detalles Bibliográficos
Autores: Mego Lizana, Jhonn Anthony, Cespedes Bravo, Segundo Manuel
Formato: tesis de grado
Fecha de Publicación:2021
Institución:Universidad Cesar Vallejo
Repositorio:UCV-Institucional
Lenguaje:español
OAI Identifier:oai:repositorio.ucv.edu.pe:20.500.12692/92285
Enlace del recurso:https://hdl.handle.net/20.500.12692/92285
Nivel de acceso:acceso abierto
Materia:Sistema de corrección de contexto
Sistema de información
Algoritmo de corrección de textos
https://purl.org/pe-repo/ocde/ford#2.02.04
id UCVV_7f9a1bb26b7cbc93dc6934b9939ba7b8
oai_identifier_str oai:repositorio.ucv.edu.pe:20.500.12692/92285
network_acronym_str UCVV
network_name_str UCV-Institucional
repository_id_str 3741
dc.title.es_PE.fl_str_mv Algoritmo para la corrección de textos en español basados en los algoritmos Metaphone y Distancia de Levenshtein
title Algoritmo para la corrección de textos en español basados en los algoritmos Metaphone y Distancia de Levenshtein
spellingShingle Algoritmo para la corrección de textos en español basados en los algoritmos Metaphone y Distancia de Levenshtein
Mego Lizana, Jhonn Anthony
Sistema de corrección de contexto
Sistema de información
Algoritmo de corrección de textos
https://purl.org/pe-repo/ocde/ford#2.02.04
title_short Algoritmo para la corrección de textos en español basados en los algoritmos Metaphone y Distancia de Levenshtein
title_full Algoritmo para la corrección de textos en español basados en los algoritmos Metaphone y Distancia de Levenshtein
title_fullStr Algoritmo para la corrección de textos en español basados en los algoritmos Metaphone y Distancia de Levenshtein
title_full_unstemmed Algoritmo para la corrección de textos en español basados en los algoritmos Metaphone y Distancia de Levenshtein
title_sort Algoritmo para la corrección de textos en español basados en los algoritmos Metaphone y Distancia de Levenshtein
author Mego Lizana, Jhonn Anthony
author_facet Mego Lizana, Jhonn Anthony
Cespedes Bravo, Segundo Manuel
author_role author
author2 Cespedes Bravo, Segundo Manuel
author2_role author
dc.contributor.advisor.fl_str_mv Amorós Chávez, Gladys Jacqueline
dc.contributor.author.fl_str_mv Mego Lizana, Jhonn Anthony
Cespedes Bravo, Segundo Manuel
dc.subject.es_PE.fl_str_mv Sistema de corrección de contexto
Sistema de información
Algoritmo de corrección de textos
topic Sistema de corrección de contexto
Sistema de información
Algoritmo de corrección de textos
https://purl.org/pe-repo/ocde/ford#2.02.04
dc.subject.ocde.es_PE.fl_str_mv https://purl.org/pe-repo/ocde/ford#2.02.04
description El problema general de la investigación fue: ¿Cuál fue el efecto de un algoritmo de corrección de textos en español basado en los algoritmos Metaphone y Distancia de Levenshtein en la corrección de errores ortográficos, gramaticales y de estilo? El objetivo general fue determinar el efecto del algoritmo MC Corrector de textos en español en la corrección de errores ortográficos, gramaticales y de estilo en base a los algoritmos Metaphone y Distancia de Levenshtein. La investigación tuvo un enfoque cuantitativo, un diseño experimental y un tipo de diseño pre-experimental. El desarrollo del algoritmo MC Corrector para la corrección de textos en español con errores ortográficos, gramaticales y de estilo fue posible gracias a su unión con el algoritmo Metaphone y Distancia de Levenshtein, en el cual se extrajeron 100 párrafos del sitio web “enclavedeciencia” de la Real Academia Española para realizar las pruebas. El instrumento utilizado para esta investigación fue una hoja de recolección de datos, la herramienta es Excel y la técnica es la observación. Los resultados obtenidos del algoritmo MC Correcto en errores ortográficos corregidos es de un 93%, gramaticales de un 100%, y de estilo en un 100%. Por tanto, se pudo determinar un efecto positivo del algoritmo MC en los errores ortográficos, gramaticales y de estilo corregidos. Así también cabe resaltar que se utilizaron una mayor cantidad de textos para precisar los resultados. Por consiguiente, se recomendó una mayor investigación e innovación en la corrección contextual y de muletillas, ya que no se encontró investigaciones profundas ni algoritmos para estos tipos de errores, así también se recomendó la realización de un algoritmo que genere palabras relacionadas en base al contexto, para el reforzamiento del algoritmo MC Corrector en la corrección contextual
publishDate 2021
dc.date.accessioned.none.fl_str_mv 2022-08-02T18:39:52Z
dc.date.available.none.fl_str_mv 2022-08-02T18:39:52Z
dc.date.issued.fl_str_mv 2021
dc.type.es_PE.fl_str_mv info:eu-repo/semantics/bachelorThesis
format bachelorThesis
dc.identifier.uri.none.fl_str_mv https://hdl.handle.net/20.500.12692/92285
url https://hdl.handle.net/20.500.12692/92285
dc.language.iso.es_PE.fl_str_mv spa
language spa
dc.relation.ispartof.fl_str_mv SUNEDU
dc.rights.es_PE.fl_str_mv info:eu-repo/semantics/openAccess
dc.rights.uri.es_PE.fl_str_mv https://creativecommons.org/licenses/by/4.0/
eu_rights_str_mv openAccess
rights_invalid_str_mv https://creativecommons.org/licenses/by/4.0/
dc.format.es_PE.fl_str_mv application/pdf
dc.publisher.es_PE.fl_str_mv Universidad César Vallejo
dc.publisher.country.es_PE.fl_str_mv PE
dc.source.es_PE.fl_str_mv Repositorio Institucional - UCV
Universidad César Vallejo
dc.source.none.fl_str_mv reponame:UCV-Institucional
instname:Universidad Cesar Vallejo
instacron:UCV
instname_str Universidad Cesar Vallejo
instacron_str UCV
institution UCV
reponame_str UCV-Institucional
collection UCV-Institucional
bitstream.url.fl_str_mv https://repositorio.ucv.edu.pe/bitstream/20.500.12692/92285/1/Mego_LJA-Cespedes_BSM-SD.pdf
https://repositorio.ucv.edu.pe/bitstream/20.500.12692/92285/2/Mego_LJA-Cespedes_BSM.pdf
https://repositorio.ucv.edu.pe/bitstream/20.500.12692/92285/3/license.txt
https://repositorio.ucv.edu.pe/bitstream/20.500.12692/92285/4/Mego_LJA-Cespedes_BSM-SD.pdf.txt
https://repositorio.ucv.edu.pe/bitstream/20.500.12692/92285/6/Mego_LJA-Cespedes_BSM.pdf.txt
https://repositorio.ucv.edu.pe/bitstream/20.500.12692/92285/5/Mego_LJA-Cespedes_BSM-SD.pdf.jpg
https://repositorio.ucv.edu.pe/bitstream/20.500.12692/92285/7/Mego_LJA-Cespedes_BSM.pdf.jpg
bitstream.checksum.fl_str_mv dd07efcbc80ce637cc6158e9454aa55c
77fffc1d51324649f2e7e7aa197636b0
8a4605be74aa9ea9d79846c1fba20a33
c8c717bcd0b8df674ce696396d533fe2
cf91d7a75bc97b8d2eae443b1aeaf624
6c959c891a5386d8a794616e71f3f953
6c959c891a5386d8a794616e71f3f953
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
MD5
MD5
MD5
MD5
repository.name.fl_str_mv Repositorio de la Universidad César Vallejo
repository.mail.fl_str_mv repositorio@ucv.edu.pe
_version_ 1807923426192523264
spelling Amorós Chávez, Gladys JacquelineMego Lizana, Jhonn AnthonyCespedes Bravo, Segundo Manuel2022-08-02T18:39:52Z2022-08-02T18:39:52Z2021https://hdl.handle.net/20.500.12692/92285El problema general de la investigación fue: ¿Cuál fue el efecto de un algoritmo de corrección de textos en español basado en los algoritmos Metaphone y Distancia de Levenshtein en la corrección de errores ortográficos, gramaticales y de estilo? El objetivo general fue determinar el efecto del algoritmo MC Corrector de textos en español en la corrección de errores ortográficos, gramaticales y de estilo en base a los algoritmos Metaphone y Distancia de Levenshtein. La investigación tuvo un enfoque cuantitativo, un diseño experimental y un tipo de diseño pre-experimental. El desarrollo del algoritmo MC Corrector para la corrección de textos en español con errores ortográficos, gramaticales y de estilo fue posible gracias a su unión con el algoritmo Metaphone y Distancia de Levenshtein, en el cual se extrajeron 100 párrafos del sitio web “enclavedeciencia” de la Real Academia Española para realizar las pruebas. El instrumento utilizado para esta investigación fue una hoja de recolección de datos, la herramienta es Excel y la técnica es la observación. Los resultados obtenidos del algoritmo MC Correcto en errores ortográficos corregidos es de un 93%, gramaticales de un 100%, y de estilo en un 100%. Por tanto, se pudo determinar un efecto positivo del algoritmo MC en los errores ortográficos, gramaticales y de estilo corregidos. Así también cabe resaltar que se utilizaron una mayor cantidad de textos para precisar los resultados. Por consiguiente, se recomendó una mayor investigación e innovación en la corrección contextual y de muletillas, ya que no se encontró investigaciones profundas ni algoritmos para estos tipos de errores, así también se recomendó la realización de un algoritmo que genere palabras relacionadas en base al contexto, para el reforzamiento del algoritmo MC Corrector en la corrección contextualLima EsteEscuela de Ingeniería de SistemasSistema de Información y ComunicacionesBiodiversidad, cambio climático y calidad ambientalInnovación tecnológica y desarrollo sostenibleEducación de calidadapplication/pdfspaUniversidad César VallejoPEinfo:eu-repo/semantics/openAccesshttps://creativecommons.org/licenses/by/4.0/Repositorio Institucional - UCVUniversidad César Vallejoreponame:UCV-Institucionalinstname:Universidad Cesar Vallejoinstacron:UCVSistema de corrección de contextoSistema de informaciónAlgoritmo de corrección de textoshttps://purl.org/pe-repo/ocde/ford#2.02.04Algoritmo para la corrección de textos en español basados en los algoritmos Metaphone y Distancia de Levenshteininfo:eu-repo/semantics/bachelorThesisSUNEDUIngeniería de SistemasUniversidad César Vallejo. Facultad de Ingeniería y ArquitecturaIngeniero de Sistemas41481800https://orcid.org/0000-0003-3937-11197621340475913830612076Hilario Falcon, Francisco ManuelAvila Lopez, Bernaro PatricioAmorós Chávez, Gladys Jacquelinehttps://purl.org/pe-repo/renati/level#tituloProfesionalhttps://purl.org/pe-repo/renati/type#tesisORIGINALMego_LJA-Cespedes_BSM-SD.pdfMego_LJA-Cespedes_BSM-SD.pdfapplication/pdf2828949https://repositorio.ucv.edu.pe/bitstream/20.500.12692/92285/1/Mego_LJA-Cespedes_BSM-SD.pdfdd07efcbc80ce637cc6158e9454aa55cMD51Mego_LJA-Cespedes_BSM.pdfMego_LJA-Cespedes_BSM.pdfapplication/pdf2871258https://repositorio.ucv.edu.pe/bitstream/20.500.12692/92285/2/Mego_LJA-Cespedes_BSM.pdf77fffc1d51324649f2e7e7aa197636b0MD52LICENSElicense.txtlicense.txttext/plain; charset=utf-81748https://repositorio.ucv.edu.pe/bitstream/20.500.12692/92285/3/license.txt8a4605be74aa9ea9d79846c1fba20a33MD53TEXTMego_LJA-Cespedes_BSM-SD.pdf.txtMego_LJA-Cespedes_BSM-SD.pdf.txtExtracted texttext/plain140183https://repositorio.ucv.edu.pe/bitstream/20.500.12692/92285/4/Mego_LJA-Cespedes_BSM-SD.pdf.txtc8c717bcd0b8df674ce696396d533fe2MD54Mego_LJA-Cespedes_BSM.pdf.txtMego_LJA-Cespedes_BSM.pdf.txtExtracted texttext/plain146597https://repositorio.ucv.edu.pe/bitstream/20.500.12692/92285/6/Mego_LJA-Cespedes_BSM.pdf.txtcf91d7a75bc97b8d2eae443b1aeaf624MD56THUMBNAILMego_LJA-Cespedes_BSM-SD.pdf.jpgMego_LJA-Cespedes_BSM-SD.pdf.jpgGenerated Thumbnailimage/jpeg4499https://repositorio.ucv.edu.pe/bitstream/20.500.12692/92285/5/Mego_LJA-Cespedes_BSM-SD.pdf.jpg6c959c891a5386d8a794616e71f3f953MD55Mego_LJA-Cespedes_BSM.pdf.jpgMego_LJA-Cespedes_BSM.pdf.jpgGenerated Thumbnailimage/jpeg4499https://repositorio.ucv.edu.pe/bitstream/20.500.12692/92285/7/Mego_LJA-Cespedes_BSM.pdf.jpg6c959c891a5386d8a794616e71f3f953MD5720.500.12692/92285oai:repositorio.ucv.edu.pe:20.500.12692/922852022-08-04 22:04:34.758Repositorio de la Universidad César Vallejorepositorio@ucv.edu.peTk9URTogUExBQ0UgWU9VUiBPV04gTElDRU5TRSBIRVJFClRoaXMgc2FtcGxlIGxpY2Vuc2UgaXMgcHJvdmlkZWQgZm9yIGluZm9ybWF0aW9uYWwgcHVycG9zZXMgb25seS4KCk5PTi1FWENMVVNJVkUgRElTVFJJQlVUSU9OIExJQ0VOU0UKCkJ5IHNpZ25pbmcgYW5kIHN1Ym1pdHRpbmcgdGhpcyBsaWNlbnNlLCB5b3UgKHRoZSBhdXRob3Iocykgb3IgY29weXJpZ2h0Cm93bmVyKSBncmFudHMgdG8gRFNwYWNlIFVuaXZlcnNpdHkgKERTVSkgdGhlIG5vbi1leGNsdXNpdmUgcmlnaHQgdG8gcmVwcm9kdWNlLAp0cmFuc2xhdGUgKGFzIGRlZmluZWQgYmVsb3cpLCBhbmQvb3IgZGlzdHJpYnV0ZSB5b3VyIHN1Ym1pc3Npb24gKGluY2x1ZGluZwp0aGUgYWJzdHJhY3QpIHdvcmxkd2lkZSBpbiBwcmludCBhbmQgZWxlY3Ryb25pYyBmb3JtYXQgYW5kIGluIGFueSBtZWRpdW0sCmluY2x1ZGluZyBidXQgbm90IGxpbWl0ZWQgdG8gYXVkaW8gb3IgdmlkZW8uCgpZb3UgYWdyZWUgdGhhdCBEU1UgbWF5LCB3aXRob3V0IGNoYW5naW5nIHRoZSBjb250ZW50LCB0cmFuc2xhdGUgdGhlCnN1Ym1pc3Npb24gdG8gYW55IG1lZGl1bSBvciBmb3JtYXQgZm9yIHRoZSBwdXJwb3NlIG9mIHByZXNlcnZhdGlvbi4KCllvdSBhbHNvIGFncmVlIHRoYXQgRFNVIG1heSBrZWVwIG1vcmUgdGhhbiBvbmUgY29weSBvZiB0aGlzIHN1Ym1pc3Npb24gZm9yCnB1cnBvc2VzIG9mIHNlY3VyaXR5LCBiYWNrLXVwIGFuZCBwcmVzZXJ2YXRpb24uCgpZb3UgcmVwcmVzZW50IHRoYXQgdGhlIHN1Ym1pc3Npb24gaXMgeW91ciBvcmlnaW5hbCB3b3JrLCBhbmQgdGhhdCB5b3UgaGF2ZQp0aGUgcmlnaHQgdG8gZ3JhbnQgdGhlIHJpZ2h0cyBjb250YWluZWQgaW4gdGhpcyBsaWNlbnNlLiBZb3UgYWxzbyByZXByZXNlbnQKdGhhdCB5b3VyIHN1Ym1pc3Npb24gZG9lcyBub3QsIHRvIHRoZSBiZXN0IG9mIHlvdXIga25vd2xlZGdlLCBpbmZyaW5nZSB1cG9uCmFueW9uZSdzIGNvcHlyaWdodC4KCklmIHRoZSBzdWJtaXNzaW9uIGNvbnRhaW5zIG1hdGVyaWFsIGZvciB3aGljaCB5b3UgZG8gbm90IGhvbGQgY29weXJpZ2h0LAp5b3UgcmVwcmVzZW50IHRoYXQgeW91IGhhdmUgb2J0YWluZWQgdGhlIHVucmVzdHJpY3RlZCBwZXJtaXNzaW9uIG9mIHRoZQpjb3B5cmlnaHQgb3duZXIgdG8gZ3JhbnQgRFNVIHRoZSByaWdodHMgcmVxdWlyZWQgYnkgdGhpcyBsaWNlbnNlLCBhbmQgdGhhdApzdWNoIHRoaXJkLXBhcnR5IG93bmVkIG1hdGVyaWFsIGlzIGNsZWFybHkgaWRlbnRpZmllZCBhbmQgYWNrbm93bGVkZ2VkCndpdGhpbiB0aGUgdGV4dCBvciBjb250ZW50IG9mIHRoZSBzdWJtaXNzaW9uLgoKSUYgVEhFIFNVQk1JU1NJT04gSVMgQkFTRUQgVVBPTiBXT1JLIFRIQVQgSEFTIEJFRU4gU1BPTlNPUkVEIE9SIFNVUFBPUlRFRApCWSBBTiBBR0VOQ1kgT1IgT1JHQU5JWkFUSU9OIE9USEVSIFRIQU4gRFNVLCBZT1UgUkVQUkVTRU5UIFRIQVQgWU9VIEhBVkUKRlVMRklMTEVEIEFOWSBSSUdIVCBPRiBSRVZJRVcgT1IgT1RIRVIgT0JMSUdBVElPTlMgUkVRVUlSRUQgQlkgU1VDSApDT05UUkFDVCBPUiBBR1JFRU1FTlQuCgpEU1Ugd2lsbCBjbGVhcmx5IGlkZW50aWZ5IHlvdXIgbmFtZShzKSBhcyB0aGUgYXV0aG9yKHMpIG9yIG93bmVyKHMpIG9mIHRoZQpzdWJtaXNzaW9uLCBhbmQgd2lsbCBub3QgbWFrZSBhbnkgYWx0ZXJhdGlvbiwgb3RoZXIgdGhhbiBhcyBhbGxvd2VkIGJ5IHRoaXMKbGljZW5zZSwgdG8geW91ciBzdWJtaXNzaW9uLgo=
score 13.995663
Nota importante:
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).