Algoritmo para la corrección de textos en español basados en los algoritmos Metaphone y Distancia de Levenshtein
Descripción del Articulo
El problema general de la investigación fue: ¿Cuál fue el efecto de un algoritmo de corrección de textos en español basado en los algoritmos Metaphone y Distancia de Levenshtein en la corrección de errores ortográficos, gramaticales y de estilo? El objetivo general fue determinar el efecto del algor...
| Autores: | , |
|---|---|
| Formato: | tesis de grado |
| Fecha de Publicación: | 2021 |
| Institución: | Universidad Cesar Vallejo |
| Repositorio: | UCV-Institucional |
| Lenguaje: | español |
| OAI Identifier: | oai:repositorio.ucv.edu.pe:20.500.12692/92285 |
| Enlace del recurso: | https://hdl.handle.net/20.500.12692/92285 |
| Nivel de acceso: | acceso abierto |
| Materia: | Sistema de corrección de contexto Sistema de información Algoritmo de corrección de textos https://purl.org/pe-repo/ocde/ford#2.02.04 |
| id |
UCVV_7f9a1bb26b7cbc93dc6934b9939ba7b8 |
|---|---|
| oai_identifier_str |
oai:repositorio.ucv.edu.pe:20.500.12692/92285 |
| network_acronym_str |
UCVV |
| network_name_str |
UCV-Institucional |
| repository_id_str |
3741 |
| dc.title.es_PE.fl_str_mv |
Algoritmo para la corrección de textos en español basados en los algoritmos Metaphone y Distancia de Levenshtein |
| title |
Algoritmo para la corrección de textos en español basados en los algoritmos Metaphone y Distancia de Levenshtein |
| spellingShingle |
Algoritmo para la corrección de textos en español basados en los algoritmos Metaphone y Distancia de Levenshtein Mego Lizana, Jhonn Anthony Sistema de corrección de contexto Sistema de información Algoritmo de corrección de textos https://purl.org/pe-repo/ocde/ford#2.02.04 |
| title_short |
Algoritmo para la corrección de textos en español basados en los algoritmos Metaphone y Distancia de Levenshtein |
| title_full |
Algoritmo para la corrección de textos en español basados en los algoritmos Metaphone y Distancia de Levenshtein |
| title_fullStr |
Algoritmo para la corrección de textos en español basados en los algoritmos Metaphone y Distancia de Levenshtein |
| title_full_unstemmed |
Algoritmo para la corrección de textos en español basados en los algoritmos Metaphone y Distancia de Levenshtein |
| title_sort |
Algoritmo para la corrección de textos en español basados en los algoritmos Metaphone y Distancia de Levenshtein |
| author |
Mego Lizana, Jhonn Anthony |
| author_facet |
Mego Lizana, Jhonn Anthony Cespedes Bravo, Segundo Manuel |
| author_role |
author |
| author2 |
Cespedes Bravo, Segundo Manuel |
| author2_role |
author |
| dc.contributor.advisor.fl_str_mv |
Amorós Chávez, Gladys Jacqueline |
| dc.contributor.author.fl_str_mv |
Mego Lizana, Jhonn Anthony Cespedes Bravo, Segundo Manuel |
| dc.subject.es_PE.fl_str_mv |
Sistema de corrección de contexto Sistema de información Algoritmo de corrección de textos |
| topic |
Sistema de corrección de contexto Sistema de información Algoritmo de corrección de textos https://purl.org/pe-repo/ocde/ford#2.02.04 |
| dc.subject.ocde.es_PE.fl_str_mv |
https://purl.org/pe-repo/ocde/ford#2.02.04 |
| description |
El problema general de la investigación fue: ¿Cuál fue el efecto de un algoritmo de corrección de textos en español basado en los algoritmos Metaphone y Distancia de Levenshtein en la corrección de errores ortográficos, gramaticales y de estilo? El objetivo general fue determinar el efecto del algoritmo MC Corrector de textos en español en la corrección de errores ortográficos, gramaticales y de estilo en base a los algoritmos Metaphone y Distancia de Levenshtein. La investigación tuvo un enfoque cuantitativo, un diseño experimental y un tipo de diseño pre-experimental. El desarrollo del algoritmo MC Corrector para la corrección de textos en español con errores ortográficos, gramaticales y de estilo fue posible gracias a su unión con el algoritmo Metaphone y Distancia de Levenshtein, en el cual se extrajeron 100 párrafos del sitio web “enclavedeciencia” de la Real Academia Española para realizar las pruebas. El instrumento utilizado para esta investigación fue una hoja de recolección de datos, la herramienta es Excel y la técnica es la observación. Los resultados obtenidos del algoritmo MC Correcto en errores ortográficos corregidos es de un 93%, gramaticales de un 100%, y de estilo en un 100%. Por tanto, se pudo determinar un efecto positivo del algoritmo MC en los errores ortográficos, gramaticales y de estilo corregidos. Así también cabe resaltar que se utilizaron una mayor cantidad de textos para precisar los resultados. Por consiguiente, se recomendó una mayor investigación e innovación en la corrección contextual y de muletillas, ya que no se encontró investigaciones profundas ni algoritmos para estos tipos de errores, así también se recomendó la realización de un algoritmo que genere palabras relacionadas en base al contexto, para el reforzamiento del algoritmo MC Corrector en la corrección contextual |
| publishDate |
2021 |
| dc.date.accessioned.none.fl_str_mv |
2022-08-02T18:39:52Z |
| dc.date.available.none.fl_str_mv |
2022-08-02T18:39:52Z |
| dc.date.issued.fl_str_mv |
2021 |
| dc.type.es_PE.fl_str_mv |
info:eu-repo/semantics/bachelorThesis |
| format |
bachelorThesis |
| dc.identifier.uri.none.fl_str_mv |
https://hdl.handle.net/20.500.12692/92285 |
| url |
https://hdl.handle.net/20.500.12692/92285 |
| dc.language.iso.es_PE.fl_str_mv |
spa |
| language |
spa |
| dc.relation.ispartof.fl_str_mv |
SUNEDU |
| dc.rights.es_PE.fl_str_mv |
info:eu-repo/semantics/openAccess |
| dc.rights.uri.es_PE.fl_str_mv |
https://creativecommons.org/licenses/by/4.0/ |
| eu_rights_str_mv |
openAccess |
| rights_invalid_str_mv |
https://creativecommons.org/licenses/by/4.0/ |
| dc.format.es_PE.fl_str_mv |
application/pdf |
| dc.publisher.es_PE.fl_str_mv |
Universidad César Vallejo |
| dc.publisher.country.es_PE.fl_str_mv |
PE |
| dc.source.es_PE.fl_str_mv |
Repositorio Institucional - UCV Universidad César Vallejo |
| dc.source.none.fl_str_mv |
reponame:UCV-Institucional instname:Universidad Cesar Vallejo instacron:UCV |
| instname_str |
Universidad Cesar Vallejo |
| instacron_str |
UCV |
| institution |
UCV |
| reponame_str |
UCV-Institucional |
| collection |
UCV-Institucional |
| bitstream.url.fl_str_mv |
https://repositorio.ucv.edu.pe/bitstream/20.500.12692/92285/1/Mego_LJA-Cespedes_BSM-SD.pdf https://repositorio.ucv.edu.pe/bitstream/20.500.12692/92285/2/Mego_LJA-Cespedes_BSM.pdf https://repositorio.ucv.edu.pe/bitstream/20.500.12692/92285/3/license.txt https://repositorio.ucv.edu.pe/bitstream/20.500.12692/92285/4/Mego_LJA-Cespedes_BSM-SD.pdf.txt https://repositorio.ucv.edu.pe/bitstream/20.500.12692/92285/6/Mego_LJA-Cespedes_BSM.pdf.txt https://repositorio.ucv.edu.pe/bitstream/20.500.12692/92285/5/Mego_LJA-Cespedes_BSM-SD.pdf.jpg https://repositorio.ucv.edu.pe/bitstream/20.500.12692/92285/7/Mego_LJA-Cespedes_BSM.pdf.jpg |
| bitstream.checksum.fl_str_mv |
dd07efcbc80ce637cc6158e9454aa55c 77fffc1d51324649f2e7e7aa197636b0 8a4605be74aa9ea9d79846c1fba20a33 c8c717bcd0b8df674ce696396d533fe2 cf91d7a75bc97b8d2eae443b1aeaf624 6c959c891a5386d8a794616e71f3f953 6c959c891a5386d8a794616e71f3f953 |
| bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 MD5 MD5 MD5 MD5 |
| repository.name.fl_str_mv |
Repositorio de la Universidad César Vallejo |
| repository.mail.fl_str_mv |
repositorio@ucv.edu.pe |
| _version_ |
1807923426192523264 |
| spelling |
Amorós Chávez, Gladys JacquelineMego Lizana, Jhonn AnthonyCespedes Bravo, Segundo Manuel2022-08-02T18:39:52Z2022-08-02T18:39:52Z2021https://hdl.handle.net/20.500.12692/92285El problema general de la investigación fue: ¿Cuál fue el efecto de un algoritmo de corrección de textos en español basado en los algoritmos Metaphone y Distancia de Levenshtein en la corrección de errores ortográficos, gramaticales y de estilo? El objetivo general fue determinar el efecto del algoritmo MC Corrector de textos en español en la corrección de errores ortográficos, gramaticales y de estilo en base a los algoritmos Metaphone y Distancia de Levenshtein. La investigación tuvo un enfoque cuantitativo, un diseño experimental y un tipo de diseño pre-experimental. El desarrollo del algoritmo MC Corrector para la corrección de textos en español con errores ortográficos, gramaticales y de estilo fue posible gracias a su unión con el algoritmo Metaphone y Distancia de Levenshtein, en el cual se extrajeron 100 párrafos del sitio web “enclavedeciencia” de la Real Academia Española para realizar las pruebas. El instrumento utilizado para esta investigación fue una hoja de recolección de datos, la herramienta es Excel y la técnica es la observación. Los resultados obtenidos del algoritmo MC Correcto en errores ortográficos corregidos es de un 93%, gramaticales de un 100%, y de estilo en un 100%. Por tanto, se pudo determinar un efecto positivo del algoritmo MC en los errores ortográficos, gramaticales y de estilo corregidos. Así también cabe resaltar que se utilizaron una mayor cantidad de textos para precisar los resultados. Por consiguiente, se recomendó una mayor investigación e innovación en la corrección contextual y de muletillas, ya que no se encontró investigaciones profundas ni algoritmos para estos tipos de errores, así también se recomendó la realización de un algoritmo que genere palabras relacionadas en base al contexto, para el reforzamiento del algoritmo MC Corrector en la corrección contextualLima EsteEscuela de Ingeniería de SistemasSistema de Información y ComunicacionesBiodiversidad, cambio climático y calidad ambientalInnovación tecnológica y desarrollo sostenibleEducación de calidadapplication/pdfspaUniversidad César VallejoPEinfo:eu-repo/semantics/openAccesshttps://creativecommons.org/licenses/by/4.0/Repositorio Institucional - UCVUniversidad César Vallejoreponame:UCV-Institucionalinstname:Universidad Cesar Vallejoinstacron:UCVSistema de corrección de contextoSistema de informaciónAlgoritmo de corrección de textoshttps://purl.org/pe-repo/ocde/ford#2.02.04Algoritmo para la corrección de textos en español basados en los algoritmos Metaphone y Distancia de Levenshteininfo:eu-repo/semantics/bachelorThesisSUNEDUIngeniería de SistemasUniversidad César Vallejo. Facultad de Ingeniería y ArquitecturaIngeniero de Sistemas41481800https://orcid.org/0000-0003-3937-11197621340475913830612076Hilario Falcon, Francisco ManuelAvila Lopez, Bernaro PatricioAmorós Chávez, Gladys Jacquelinehttps://purl.org/pe-repo/renati/level#tituloProfesionalhttps://purl.org/pe-repo/renati/type#tesisORIGINALMego_LJA-Cespedes_BSM-SD.pdfMego_LJA-Cespedes_BSM-SD.pdfapplication/pdf2828949https://repositorio.ucv.edu.pe/bitstream/20.500.12692/92285/1/Mego_LJA-Cespedes_BSM-SD.pdfdd07efcbc80ce637cc6158e9454aa55cMD51Mego_LJA-Cespedes_BSM.pdfMego_LJA-Cespedes_BSM.pdfapplication/pdf2871258https://repositorio.ucv.edu.pe/bitstream/20.500.12692/92285/2/Mego_LJA-Cespedes_BSM.pdf77fffc1d51324649f2e7e7aa197636b0MD52LICENSElicense.txtlicense.txttext/plain; charset=utf-81748https://repositorio.ucv.edu.pe/bitstream/20.500.12692/92285/3/license.txt8a4605be74aa9ea9d79846c1fba20a33MD53TEXTMego_LJA-Cespedes_BSM-SD.pdf.txtMego_LJA-Cespedes_BSM-SD.pdf.txtExtracted texttext/plain140183https://repositorio.ucv.edu.pe/bitstream/20.500.12692/92285/4/Mego_LJA-Cespedes_BSM-SD.pdf.txtc8c717bcd0b8df674ce696396d533fe2MD54Mego_LJA-Cespedes_BSM.pdf.txtMego_LJA-Cespedes_BSM.pdf.txtExtracted texttext/plain146597https://repositorio.ucv.edu.pe/bitstream/20.500.12692/92285/6/Mego_LJA-Cespedes_BSM.pdf.txtcf91d7a75bc97b8d2eae443b1aeaf624MD56THUMBNAILMego_LJA-Cespedes_BSM-SD.pdf.jpgMego_LJA-Cespedes_BSM-SD.pdf.jpgGenerated Thumbnailimage/jpeg4499https://repositorio.ucv.edu.pe/bitstream/20.500.12692/92285/5/Mego_LJA-Cespedes_BSM-SD.pdf.jpg6c959c891a5386d8a794616e71f3f953MD55Mego_LJA-Cespedes_BSM.pdf.jpgMego_LJA-Cespedes_BSM.pdf.jpgGenerated Thumbnailimage/jpeg4499https://repositorio.ucv.edu.pe/bitstream/20.500.12692/92285/7/Mego_LJA-Cespedes_BSM.pdf.jpg6c959c891a5386d8a794616e71f3f953MD5720.500.12692/92285oai:repositorio.ucv.edu.pe:20.500.12692/922852022-08-04 22:04:34.758Repositorio de la Universidad César Vallejorepositorio@ucv.edu.peTk9URTogUExBQ0UgWU9VUiBPV04gTElDRU5TRSBIRVJFClRoaXMgc2FtcGxlIGxpY2Vuc2UgaXMgcHJvdmlkZWQgZm9yIGluZm9ybWF0aW9uYWwgcHVycG9zZXMgb25seS4KCk5PTi1FWENMVVNJVkUgRElTVFJJQlVUSU9OIExJQ0VOU0UKCkJ5IHNpZ25pbmcgYW5kIHN1Ym1pdHRpbmcgdGhpcyBsaWNlbnNlLCB5b3UgKHRoZSBhdXRob3Iocykgb3IgY29weXJpZ2h0Cm93bmVyKSBncmFudHMgdG8gRFNwYWNlIFVuaXZlcnNpdHkgKERTVSkgdGhlIG5vbi1leGNsdXNpdmUgcmlnaHQgdG8gcmVwcm9kdWNlLAp0cmFuc2xhdGUgKGFzIGRlZmluZWQgYmVsb3cpLCBhbmQvb3IgZGlzdHJpYnV0ZSB5b3VyIHN1Ym1pc3Npb24gKGluY2x1ZGluZwp0aGUgYWJzdHJhY3QpIHdvcmxkd2lkZSBpbiBwcmludCBhbmQgZWxlY3Ryb25pYyBmb3JtYXQgYW5kIGluIGFueSBtZWRpdW0sCmluY2x1ZGluZyBidXQgbm90IGxpbWl0ZWQgdG8gYXVkaW8gb3IgdmlkZW8uCgpZb3UgYWdyZWUgdGhhdCBEU1UgbWF5LCB3aXRob3V0IGNoYW5naW5nIHRoZSBjb250ZW50LCB0cmFuc2xhdGUgdGhlCnN1Ym1pc3Npb24gdG8gYW55IG1lZGl1bSBvciBmb3JtYXQgZm9yIHRoZSBwdXJwb3NlIG9mIHByZXNlcnZhdGlvbi4KCllvdSBhbHNvIGFncmVlIHRoYXQgRFNVIG1heSBrZWVwIG1vcmUgdGhhbiBvbmUgY29weSBvZiB0aGlzIHN1Ym1pc3Npb24gZm9yCnB1cnBvc2VzIG9mIHNlY3VyaXR5LCBiYWNrLXVwIGFuZCBwcmVzZXJ2YXRpb24uCgpZb3UgcmVwcmVzZW50IHRoYXQgdGhlIHN1Ym1pc3Npb24gaXMgeW91ciBvcmlnaW5hbCB3b3JrLCBhbmQgdGhhdCB5b3UgaGF2ZQp0aGUgcmlnaHQgdG8gZ3JhbnQgdGhlIHJpZ2h0cyBjb250YWluZWQgaW4gdGhpcyBsaWNlbnNlLiBZb3UgYWxzbyByZXByZXNlbnQKdGhhdCB5b3VyIHN1Ym1pc3Npb24gZG9lcyBub3QsIHRvIHRoZSBiZXN0IG9mIHlvdXIga25vd2xlZGdlLCBpbmZyaW5nZSB1cG9uCmFueW9uZSdzIGNvcHlyaWdodC4KCklmIHRoZSBzdWJtaXNzaW9uIGNvbnRhaW5zIG1hdGVyaWFsIGZvciB3aGljaCB5b3UgZG8gbm90IGhvbGQgY29weXJpZ2h0LAp5b3UgcmVwcmVzZW50IHRoYXQgeW91IGhhdmUgb2J0YWluZWQgdGhlIHVucmVzdHJpY3RlZCBwZXJtaXNzaW9uIG9mIHRoZQpjb3B5cmlnaHQgb3duZXIgdG8gZ3JhbnQgRFNVIHRoZSByaWdodHMgcmVxdWlyZWQgYnkgdGhpcyBsaWNlbnNlLCBhbmQgdGhhdApzdWNoIHRoaXJkLXBhcnR5IG93bmVkIG1hdGVyaWFsIGlzIGNsZWFybHkgaWRlbnRpZmllZCBhbmQgYWNrbm93bGVkZ2VkCndpdGhpbiB0aGUgdGV4dCBvciBjb250ZW50IG9mIHRoZSBzdWJtaXNzaW9uLgoKSUYgVEhFIFNVQk1JU1NJT04gSVMgQkFTRUQgVVBPTiBXT1JLIFRIQVQgSEFTIEJFRU4gU1BPTlNPUkVEIE9SIFNVUFBPUlRFRApCWSBBTiBBR0VOQ1kgT1IgT1JHQU5JWkFUSU9OIE9USEVSIFRIQU4gRFNVLCBZT1UgUkVQUkVTRU5UIFRIQVQgWU9VIEhBVkUKRlVMRklMTEVEIEFOWSBSSUdIVCBPRiBSRVZJRVcgT1IgT1RIRVIgT0JMSUdBVElPTlMgUkVRVUlSRUQgQlkgU1VDSApDT05UUkFDVCBPUiBBR1JFRU1FTlQuCgpEU1Ugd2lsbCBjbGVhcmx5IGlkZW50aWZ5IHlvdXIgbmFtZShzKSBhcyB0aGUgYXV0aG9yKHMpIG9yIG93bmVyKHMpIG9mIHRoZQpzdWJtaXNzaW9uLCBhbmQgd2lsbCBub3QgbWFrZSBhbnkgYWx0ZXJhdGlvbiwgb3RoZXIgdGhhbiBhcyBhbGxvd2VkIGJ5IHRoaXMKbGljZW5zZSwgdG8geW91ciBzdWJtaXNzaW9uLgo= |
| score |
13.995663 |
Nota importante:
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).