Detección de patrones de personas desaparecidas mediante técnicas de aprendizaje no supervisado

Descripción del Articulo

La desaparición de personas es una de las preocupaciones principales tanto a nivel nacional como mundial, estás se pueden dar debido a la trata de personas, tráfico de órganos, entre otros. Dentro de los grupos de personas desaparecidas existe uno cuyas características alertan más a la sociedad, por...

Descripción completa

Detalles Bibliográficos
Autor: Rimachi Costillas, Roy Joseph
Formato: tesis de grado
Fecha de Publicación:2022
Institución:Universidad Andina del Cusco
Repositorio:UAC-Institucional
Lenguaje:español
OAI Identifier:oai:repositorio.uandina.edu.pe:20.500.12557/5050
Enlace del recurso:https://hdl.handle.net/20.500.12557/5050
Nivel de acceso:acceso abierto
Materia:Aprendizaje supervisado
Costo de recursos
Conjunto de datos
https://purl.org/pe-repo/ocde/ford#2.02.04
id UACI_26467e9c977ef3bb3b8d63fd25b31b90
oai_identifier_str oai:repositorio.uandina.edu.pe:20.500.12557/5050
network_acronym_str UACI
network_name_str UAC-Institucional
repository_id_str 4842
dc.title.es_PE.fl_str_mv Detección de patrones de personas desaparecidas mediante técnicas de aprendizaje no supervisado
title Detección de patrones de personas desaparecidas mediante técnicas de aprendizaje no supervisado
spellingShingle Detección de patrones de personas desaparecidas mediante técnicas de aprendizaje no supervisado
Rimachi Costillas, Roy Joseph
Aprendizaje supervisado
Costo de recursos
Conjunto de datos
https://purl.org/pe-repo/ocde/ford#2.02.04
title_short Detección de patrones de personas desaparecidas mediante técnicas de aprendizaje no supervisado
title_full Detección de patrones de personas desaparecidas mediante técnicas de aprendizaje no supervisado
title_fullStr Detección de patrones de personas desaparecidas mediante técnicas de aprendizaje no supervisado
title_full_unstemmed Detección de patrones de personas desaparecidas mediante técnicas de aprendizaje no supervisado
title_sort Detección de patrones de personas desaparecidas mediante técnicas de aprendizaje no supervisado
author Rimachi Costillas, Roy Joseph
author_facet Rimachi Costillas, Roy Joseph
author_role author
dc.contributor.advisor.fl_str_mv Molero Delgado, Iván
dc.contributor.author.fl_str_mv Rimachi Costillas, Roy Joseph
dc.subject.es_PE.fl_str_mv Aprendizaje supervisado
Costo de recursos
Conjunto de datos
topic Aprendizaje supervisado
Costo de recursos
Conjunto de datos
https://purl.org/pe-repo/ocde/ford#2.02.04
dc.subject.ocde.es_PE.fl_str_mv https://purl.org/pe-repo/ocde/ford#2.02.04
description La desaparición de personas es una de las preocupaciones principales tanto a nivel nacional como mundial, estás se pueden dar debido a la trata de personas, tráfico de órganos, entre otros. Dentro de los grupos de personas desaparecidas existe uno cuyas características alertan más a la sociedad, por lo cual requieren una respuesta más rápida y eficiente; a este grupo se le denomina personas en situación de vulnerabilidad y está conformado por niños, niñas, adolescentes, personas adultas mayores y personas con discapacidad física, mental o sensorial. El aprendizaje no supervisado por otro lado forma parte del aprendizaje automático que a su vez es parte del campo de la Inteligencia Artificial, esta rama busca recolectar o generar conocimiento a través de la información albergada en los datos sin la necesidad de etiquetarlos. Los algoritmos de aprendizaje no supervisado cotidianamente son parte de soluciones tecnológicas que permiten segmentar o descubrir patrones de un conjunto de datos. Dichos patrones han servido a múltiples campos para desarrollar estrategias focalizadas por grupo, incrementando así la eficacia de los procesos que se encargan de combatir una problemática determinada. Los datos recolectados de menores desaparecidos contienen múltiples atributos como: edad, genero, raza, color de ojos, color de cabello, tipo de nariz, tipo de boca, etc. Entre estos campos solo existe una etiqueta cuyo valor puede ser “desaparecido” o “encontrado”, esta etiqueta no solventa la aplicación de técnicas de aprendizaje supervisado; debido a esto se opto por utilizar técnicas de aprendizaje no supervisado que surgen como una alternativa viable para analizar los datos. Además, este tipo de aprendizaje debido a su enfoque que no requiere de etiquetas en los datos disminuye el costo de recursos. Por esta razón la investigación busca describir o mostrar conocimiento sobre los patrones que puedan ser detectados dentro del conjunto de datos haciendo uso de las técnicas de aprendizaje no supervisado. Por consiguiente, para aplicar las técnicas de aprendizaje no supervisado primero fue necesario extraer todos los datos albergados en la página web utilizando la técnica de web scraping que nos permitió obtener todos los datos sobre el perfil del menor. También, debido a que el conjunto de datos recolectado contenía inconsistencias entre sus registros, se preprocesaron con técnicas del proceso KDD para obtener la mayor cantidad de registros validos para el estudio. Finalmente, el análisis de los datos se llevo a cabo variando entre múltiples números de clústeres determinados por el método del codo, para así pasarlos al algoritmo k-means y así determinar mediante métricas de validación la cantidad adecuada para el conjunto de datos.
publishDate 2022
dc.date.accessioned.none.fl_str_mv 2022-12-22T20:37:02Z
dc.date.available.none.fl_str_mv 2022-12-22T20:37:02Z
dc.date.issued.fl_str_mv 2022-06-14
dc.type.es_PE.fl_str_mv info:eu-repo/semantics/bachelorThesis
format bachelorThesis
dc.identifier.uri.none.fl_str_mv https://hdl.handle.net/20.500.12557/5050
url https://hdl.handle.net/20.500.12557/5050
dc.language.iso.es_PE.fl_str_mv spa
language spa
dc.relation.ispartof.fl_str_mv SUNEDU
dc.rights.es_PE.fl_str_mv info:eu-repo/semantics/openAccess
dc.rights.uri.es_PE.fl_str_mv https://creativecommons.org/licenses/by-nc-nd/4.0/
eu_rights_str_mv openAccess
rights_invalid_str_mv https://creativecommons.org/licenses/by-nc-nd/4.0/
dc.format.es_PE.fl_str_mv application/pdf
dc.publisher.es_PE.fl_str_mv Universidad Andina del Cusco
dc.publisher.country.es_PE.fl_str_mv PE
dc.source.none.fl_str_mv reponame:UAC-Institucional
instname:Universidad Andina del Cusco
instacron:UAC
instname_str Universidad Andina del Cusco
instacron_str UAC
institution UAC
reponame_str UAC-Institucional
collection UAC-Institucional
bitstream.url.fl_str_mv https://repositorio.uandina.edu.pe/bitstreams/a1292bef-fc35-482f-931f-e5345c57a95d/download
https://repositorio.uandina.edu.pe/bitstreams/ef407888-d46f-4675-8a81-2cf308054c69/download
https://repositorio.uandina.edu.pe/bitstreams/de54477f-2c25-4c50-957d-8d942eb13f31/download
https://repositorio.uandina.edu.pe/bitstreams/6775ecd0-741a-4713-819f-3fdbb753731e/download
bitstream.checksum.fl_str_mv 8a4605be74aa9ea9d79846c1fba20a33
552f2079705da87b727eb1a43b66b5a2
ead1c2066ed3f702e5480fe941b231ff
ac6c9f061083b8f2ce61dba2c28b6c45
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
MD5
repository.name.fl_str_mv Repositorio Digital Universidad Andina del Cusco
repository.mail.fl_str_mv jbenavides@uandina.edu.pe
_version_ 1845976535020863488
spelling Molero Delgado, Ivánbf93d912-c176-4cc4-b3d6-be81d77565a4Rimachi Costillas, Roy Joseph2022-12-22T20:37:02Z2022-12-22T20:37:02Z2022-06-14https://hdl.handle.net/20.500.12557/5050La desaparición de personas es una de las preocupaciones principales tanto a nivel nacional como mundial, estás se pueden dar debido a la trata de personas, tráfico de órganos, entre otros. Dentro de los grupos de personas desaparecidas existe uno cuyas características alertan más a la sociedad, por lo cual requieren una respuesta más rápida y eficiente; a este grupo se le denomina personas en situación de vulnerabilidad y está conformado por niños, niñas, adolescentes, personas adultas mayores y personas con discapacidad física, mental o sensorial. El aprendizaje no supervisado por otro lado forma parte del aprendizaje automático que a su vez es parte del campo de la Inteligencia Artificial, esta rama busca recolectar o generar conocimiento a través de la información albergada en los datos sin la necesidad de etiquetarlos. Los algoritmos de aprendizaje no supervisado cotidianamente son parte de soluciones tecnológicas que permiten segmentar o descubrir patrones de un conjunto de datos. Dichos patrones han servido a múltiples campos para desarrollar estrategias focalizadas por grupo, incrementando así la eficacia de los procesos que se encargan de combatir una problemática determinada. Los datos recolectados de menores desaparecidos contienen múltiples atributos como: edad, genero, raza, color de ojos, color de cabello, tipo de nariz, tipo de boca, etc. Entre estos campos solo existe una etiqueta cuyo valor puede ser “desaparecido” o “encontrado”, esta etiqueta no solventa la aplicación de técnicas de aprendizaje supervisado; debido a esto se opto por utilizar técnicas de aprendizaje no supervisado que surgen como una alternativa viable para analizar los datos. Además, este tipo de aprendizaje debido a su enfoque que no requiere de etiquetas en los datos disminuye el costo de recursos. Por esta razón la investigación busca describir o mostrar conocimiento sobre los patrones que puedan ser detectados dentro del conjunto de datos haciendo uso de las técnicas de aprendizaje no supervisado. Por consiguiente, para aplicar las técnicas de aprendizaje no supervisado primero fue necesario extraer todos los datos albergados en la página web utilizando la técnica de web scraping que nos permitió obtener todos los datos sobre el perfil del menor. También, debido a que el conjunto de datos recolectado contenía inconsistencias entre sus registros, se preprocesaron con técnicas del proceso KDD para obtener la mayor cantidad de registros validos para el estudio. Finalmente, el análisis de los datos se llevo a cabo variando entre múltiples números de clústeres determinados por el método del codo, para así pasarlos al algoritmo k-means y así determinar mediante métricas de validación la cantidad adecuada para el conjunto de datos.The disappearance of people is one of the main concerns both nationally and globally, these can occur due to human trafficking, organ trafficking, among others. Within the groups of disappeared persons there is one whose characteristics alert society more, for which they require a faster and more efficient response; This group is called people in vulnerable situations and is made up of boys, girls, adolescents, older adults and people with physical, mental or sensory disabilities. Unsupervised learning on the other hand is part of machine learning which in turn is part of the field of Artificial Intelligence, this branch seeks to collect or generate knowledge through the information stored in the data without the need to label it. Unsupervised learning algorithms daily are part of technological solutions that allow you to segment or discover patterns in a data set. These patterns have served multiple fields to develop group strategies, thus increasing the effectiveness of the processes that are responsible for combating a specific problem. The data collected from missing minors contains multiple attributes such as: age, sex, race, eye color, hair color, type of nose, type of mouth, etc. Among these fields there is only one label whose value can "disappear" or "found". This label does not address the application of supervised learning techniques; Due to this, it was decided to use unsupervised learning techniques that emerge as a viable alternative to analyze the data. In addition, this type of learning due to its approach that does not require labels on the data reduces the cost of resources. For this reason, the research seeks to describe or show knowledge about the patterns that can be detected within the data set using unsupervised learning techniques. Therefore, to apply unsupervised learning techniques, it was first necessary to extract all the data stored in the web page using the web scraping technique that allowed us to obtain all the data from the child's profile. Furthermore, since the collected data set contained inconsistencies between their records, they were preprocessed with KDD processing techniques to obtain the largest number of valid records for the study. Finally, the data analysis was performed by varying between multiple numbers of clusters determined by the elbow method, in order to pass them to the k-means algorithm and thus determine the appropriate amount for the data set through validation metrics.application/pdfspaUniversidad Andina del CuscoPEinfo:eu-repo/semantics/openAccesshttps://creativecommons.org/licenses/by-nc-nd/4.0/Aprendizaje supervisadoCosto de recursosConjunto de datoshttps://purl.org/pe-repo/ocde/ford#2.02.04Detección de patrones de personas desaparecidas mediante técnicas de aprendizaje no supervisadoinfo:eu-repo/semantics/bachelorThesisreponame:UAC-Institucionalinstname:Universidad Andina del Cuscoinstacron:UACSUNEDUIngeniero de SistemasUniversidad Andina del Cusco. Facultad de Ingeniería y ArquitecturaIngeniería de Sistemas25705893https://orcid.org/0000-0003-0568-056272516927612076Acurio Gutiérrez, María IsabelEspetia Huamanga, HugoRivas Mago, Lornel AntonioGonzales Condori, Harry Yeisonhttps://purl.org/pe-repo/renati/level#tituloProfesionalhttps://purl.org/pe-repo/renati/type#tesisLICENSElicense.txtlicense.txttext/plain; charset=utf-81748https://repositorio.uandina.edu.pe/bitstreams/a1292bef-fc35-482f-931f-e5345c57a95d/download8a4605be74aa9ea9d79846c1fba20a33MD52ORIGINALRoy_Tesis_bachiller_2022.pdfRoy_Tesis_bachiller_2022.pdfapplication/pdf2541768https://repositorio.uandina.edu.pe/bitstreams/ef407888-d46f-4675-8a81-2cf308054c69/download552f2079705da87b727eb1a43b66b5a2MD51TEXTRoy_Tesis_bachiller_2022.pdf.txtRoy_Tesis_bachiller_2022.pdf.txtExtracted texttext/plain; charset=utf-8103928https://repositorio.uandina.edu.pe/bitstreams/de54477f-2c25-4c50-957d-8d942eb13f31/downloadead1c2066ed3f702e5480fe941b231ffMD55THUMBNAILRoy_Tesis_bachiller_2022.pdf.jpgRoy_Tesis_bachiller_2022.pdf.jpgGenerated Thumbnailimage/jpeg17599https://repositorio.uandina.edu.pe/bitstreams/6775ecd0-741a-4713-819f-3fdbb753731e/downloadac6c9f061083b8f2ce61dba2c28b6c45MD5620.500.12557/5050oai:repositorio.uandina.edu.pe:20.500.12557/50502024-10-01 22:36:57.22https://creativecommons.org/licenses/by-nc-nd/4.0/info:eu-repo/semantics/openAccessopen.accesshttps://repositorio.uandina.edu.peRepositorio Digital Universidad Andina del Cuscojbenavides@uandina.edu.peTk9URTogUExBQ0UgWU9VUiBPV04gTElDRU5TRSBIRVJFClRoaXMgc2FtcGxlIGxpY2Vuc2UgaXMgcHJvdmlkZWQgZm9yIGluZm9ybWF0aW9uYWwgcHVycG9zZXMgb25seS4KCk5PTi1FWENMVVNJVkUgRElTVFJJQlVUSU9OIExJQ0VOU0UKCkJ5IHNpZ25pbmcgYW5kIHN1Ym1pdHRpbmcgdGhpcyBsaWNlbnNlLCB5b3UgKHRoZSBhdXRob3Iocykgb3IgY29weXJpZ2h0Cm93bmVyKSBncmFudHMgdG8gRFNwYWNlIFVuaXZlcnNpdHkgKERTVSkgdGhlIG5vbi1leGNsdXNpdmUgcmlnaHQgdG8gcmVwcm9kdWNlLAp0cmFuc2xhdGUgKGFzIGRlZmluZWQgYmVsb3cpLCBhbmQvb3IgZGlzdHJpYnV0ZSB5b3VyIHN1Ym1pc3Npb24gKGluY2x1ZGluZwp0aGUgYWJzdHJhY3QpIHdvcmxkd2lkZSBpbiBwcmludCBhbmQgZWxlY3Ryb25pYyBmb3JtYXQgYW5kIGluIGFueSBtZWRpdW0sCmluY2x1ZGluZyBidXQgbm90IGxpbWl0ZWQgdG8gYXVkaW8gb3IgdmlkZW8uCgpZb3UgYWdyZWUgdGhhdCBEU1UgbWF5LCB3aXRob3V0IGNoYW5naW5nIHRoZSBjb250ZW50LCB0cmFuc2xhdGUgdGhlCnN1Ym1pc3Npb24gdG8gYW55IG1lZGl1bSBvciBmb3JtYXQgZm9yIHRoZSBwdXJwb3NlIG9mIHByZXNlcnZhdGlvbi4KCllvdSBhbHNvIGFncmVlIHRoYXQgRFNVIG1heSBrZWVwIG1vcmUgdGhhbiBvbmUgY29weSBvZiB0aGlzIHN1Ym1pc3Npb24gZm9yCnB1cnBvc2VzIG9mIHNlY3VyaXR5LCBiYWNrLXVwIGFuZCBwcmVzZXJ2YXRpb24uCgpZb3UgcmVwcmVzZW50IHRoYXQgdGhlIHN1Ym1pc3Npb24gaXMgeW91ciBvcmlnaW5hbCB3b3JrLCBhbmQgdGhhdCB5b3UgaGF2ZQp0aGUgcmlnaHQgdG8gZ3JhbnQgdGhlIHJpZ2h0cyBjb250YWluZWQgaW4gdGhpcyBsaWNlbnNlLiBZb3UgYWxzbyByZXByZXNlbnQKdGhhdCB5b3VyIHN1Ym1pc3Npb24gZG9lcyBub3QsIHRvIHRoZSBiZXN0IG9mIHlvdXIga25vd2xlZGdlLCBpbmZyaW5nZSB1cG9uCmFueW9uZSdzIGNvcHlyaWdodC4KCklmIHRoZSBzdWJtaXNzaW9uIGNvbnRhaW5zIG1hdGVyaWFsIGZvciB3aGljaCB5b3UgZG8gbm90IGhvbGQgY29weXJpZ2h0LAp5b3UgcmVwcmVzZW50IHRoYXQgeW91IGhhdmUgb2J0YWluZWQgdGhlIHVucmVzdHJpY3RlZCBwZXJtaXNzaW9uIG9mIHRoZQpjb3B5cmlnaHQgb3duZXIgdG8gZ3JhbnQgRFNVIHRoZSByaWdodHMgcmVxdWlyZWQgYnkgdGhpcyBsaWNlbnNlLCBhbmQgdGhhdApzdWNoIHRoaXJkLXBhcnR5IG93bmVkIG1hdGVyaWFsIGlzIGNsZWFybHkgaWRlbnRpZmllZCBhbmQgYWNrbm93bGVkZ2VkCndpdGhpbiB0aGUgdGV4dCBvciBjb250ZW50IG9mIHRoZSBzdWJtaXNzaW9uLgoKSUYgVEhFIFNVQk1JU1NJT04gSVMgQkFTRUQgVVBPTiBXT1JLIFRIQVQgSEFTIEJFRU4gU1BPTlNPUkVEIE9SIFNVUFBPUlRFRApCWSBBTiBBR0VOQ1kgT1IgT1JHQU5JWkFUSU9OIE9USEVSIFRIQU4gRFNVLCBZT1UgUkVQUkVTRU5UIFRIQVQgWU9VIEhBVkUKRlVMRklMTEVEIEFOWSBSSUdIVCBPRiBSRVZJRVcgT1IgT1RIRVIgT0JMSUdBVElPTlMgUkVRVUlSRUQgQlkgU1VDSApDT05UUkFDVCBPUiBBR1JFRU1FTlQuCgpEU1Ugd2lsbCBjbGVhcmx5IGlkZW50aWZ5IHlvdXIgbmFtZShzKSBhcyB0aGUgYXV0aG9yKHMpIG9yIG93bmVyKHMpIG9mIHRoZQpzdWJtaXNzaW9uLCBhbmQgd2lsbCBub3QgbWFrZSBhbnkgYWx0ZXJhdGlvbiwgb3RoZXIgdGhhbiBhcyBhbGxvd2VkIGJ5IHRoaXMKbGljZW5zZSwgdG8geW91ciBzdWJtaXNzaW9uLgo=
score 13.04064
Nota importante:
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).