Detección de patrones de personas desaparecidas mediante técnicas de aprendizaje no supervisado
Descripción del Articulo
La desaparición de personas es una de las preocupaciones principales tanto a nivel nacional como mundial, estás se pueden dar debido a la trata de personas, tráfico de órganos, entre otros. Dentro de los grupos de personas desaparecidas existe uno cuyas características alertan más a la sociedad, por...
Autor: | |
---|---|
Formato: | tesis de grado |
Fecha de Publicación: | 2022 |
Institución: | Universidad Andina del Cusco |
Repositorio: | UAC-Institucional |
Lenguaje: | español |
OAI Identifier: | oai:repositorio.uandina.edu.pe:20.500.12557/5050 |
Enlace del recurso: | https://hdl.handle.net/20.500.12557/5050 |
Nivel de acceso: | acceso abierto |
Materia: | Aprendizaje supervisado Costo de recursos Conjunto de datos https://purl.org/pe-repo/ocde/ford#2.02.04 |
id |
UACI_26467e9c977ef3bb3b8d63fd25b31b90 |
---|---|
oai_identifier_str |
oai:repositorio.uandina.edu.pe:20.500.12557/5050 |
network_acronym_str |
UACI |
network_name_str |
UAC-Institucional |
repository_id_str |
4842 |
dc.title.es_PE.fl_str_mv |
Detección de patrones de personas desaparecidas mediante técnicas de aprendizaje no supervisado |
title |
Detección de patrones de personas desaparecidas mediante técnicas de aprendizaje no supervisado |
spellingShingle |
Detección de patrones de personas desaparecidas mediante técnicas de aprendizaje no supervisado Rimachi Costillas, Roy Joseph Aprendizaje supervisado Costo de recursos Conjunto de datos https://purl.org/pe-repo/ocde/ford#2.02.04 |
title_short |
Detección de patrones de personas desaparecidas mediante técnicas de aprendizaje no supervisado |
title_full |
Detección de patrones de personas desaparecidas mediante técnicas de aprendizaje no supervisado |
title_fullStr |
Detección de patrones de personas desaparecidas mediante técnicas de aprendizaje no supervisado |
title_full_unstemmed |
Detección de patrones de personas desaparecidas mediante técnicas de aprendizaje no supervisado |
title_sort |
Detección de patrones de personas desaparecidas mediante técnicas de aprendizaje no supervisado |
author |
Rimachi Costillas, Roy Joseph |
author_facet |
Rimachi Costillas, Roy Joseph |
author_role |
author |
dc.contributor.advisor.fl_str_mv |
Molero Delgado, Iván |
dc.contributor.author.fl_str_mv |
Rimachi Costillas, Roy Joseph |
dc.subject.es_PE.fl_str_mv |
Aprendizaje supervisado Costo de recursos Conjunto de datos |
topic |
Aprendizaje supervisado Costo de recursos Conjunto de datos https://purl.org/pe-repo/ocde/ford#2.02.04 |
dc.subject.ocde.es_PE.fl_str_mv |
https://purl.org/pe-repo/ocde/ford#2.02.04 |
description |
La desaparición de personas es una de las preocupaciones principales tanto a nivel nacional como mundial, estás se pueden dar debido a la trata de personas, tráfico de órganos, entre otros. Dentro de los grupos de personas desaparecidas existe uno cuyas características alertan más a la sociedad, por lo cual requieren una respuesta más rápida y eficiente; a este grupo se le denomina personas en situación de vulnerabilidad y está conformado por niños, niñas, adolescentes, personas adultas mayores y personas con discapacidad física, mental o sensorial. El aprendizaje no supervisado por otro lado forma parte del aprendizaje automático que a su vez es parte del campo de la Inteligencia Artificial, esta rama busca recolectar o generar conocimiento a través de la información albergada en los datos sin la necesidad de etiquetarlos. Los algoritmos de aprendizaje no supervisado cotidianamente son parte de soluciones tecnológicas que permiten segmentar o descubrir patrones de un conjunto de datos. Dichos patrones han servido a múltiples campos para desarrollar estrategias focalizadas por grupo, incrementando así la eficacia de los procesos que se encargan de combatir una problemática determinada. Los datos recolectados de menores desaparecidos contienen múltiples atributos como: edad, genero, raza, color de ojos, color de cabello, tipo de nariz, tipo de boca, etc. Entre estos campos solo existe una etiqueta cuyo valor puede ser “desaparecido” o “encontrado”, esta etiqueta no solventa la aplicación de técnicas de aprendizaje supervisado; debido a esto se opto por utilizar técnicas de aprendizaje no supervisado que surgen como una alternativa viable para analizar los datos. Además, este tipo de aprendizaje debido a su enfoque que no requiere de etiquetas en los datos disminuye el costo de recursos. Por esta razón la investigación busca describir o mostrar conocimiento sobre los patrones que puedan ser detectados dentro del conjunto de datos haciendo uso de las técnicas de aprendizaje no supervisado. Por consiguiente, para aplicar las técnicas de aprendizaje no supervisado primero fue necesario extraer todos los datos albergados en la página web utilizando la técnica de web scraping que nos permitió obtener todos los datos sobre el perfil del menor. También, debido a que el conjunto de datos recolectado contenía inconsistencias entre sus registros, se preprocesaron con técnicas del proceso KDD para obtener la mayor cantidad de registros validos para el estudio. Finalmente, el análisis de los datos se llevo a cabo variando entre múltiples números de clústeres determinados por el método del codo, para así pasarlos al algoritmo k-means y así determinar mediante métricas de validación la cantidad adecuada para el conjunto de datos. |
publishDate |
2022 |
dc.date.accessioned.none.fl_str_mv |
2022-12-22T20:37:02Z |
dc.date.available.none.fl_str_mv |
2022-12-22T20:37:02Z |
dc.date.issued.fl_str_mv |
2022-06-14 |
dc.type.es_PE.fl_str_mv |
info:eu-repo/semantics/bachelorThesis |
format |
bachelorThesis |
dc.identifier.uri.none.fl_str_mv |
https://hdl.handle.net/20.500.12557/5050 |
url |
https://hdl.handle.net/20.500.12557/5050 |
dc.language.iso.es_PE.fl_str_mv |
spa |
language |
spa |
dc.relation.ispartof.fl_str_mv |
SUNEDU |
dc.rights.es_PE.fl_str_mv |
info:eu-repo/semantics/openAccess |
dc.rights.uri.es_PE.fl_str_mv |
https://creativecommons.org/licenses/by-nc-nd/4.0/ |
eu_rights_str_mv |
openAccess |
rights_invalid_str_mv |
https://creativecommons.org/licenses/by-nc-nd/4.0/ |
dc.format.es_PE.fl_str_mv |
application/pdf |
dc.publisher.es_PE.fl_str_mv |
Universidad Andina del Cusco |
dc.publisher.country.es_PE.fl_str_mv |
PE |
dc.source.none.fl_str_mv |
reponame:UAC-Institucional instname:Universidad Andina del Cusco instacron:UAC |
instname_str |
Universidad Andina del Cusco |
instacron_str |
UAC |
institution |
UAC |
reponame_str |
UAC-Institucional |
collection |
UAC-Institucional |
bitstream.url.fl_str_mv |
https://repositorio.uandina.edu.pe/bitstreams/a1292bef-fc35-482f-931f-e5345c57a95d/download https://repositorio.uandina.edu.pe/bitstreams/ef407888-d46f-4675-8a81-2cf308054c69/download https://repositorio.uandina.edu.pe/bitstreams/de54477f-2c25-4c50-957d-8d942eb13f31/download https://repositorio.uandina.edu.pe/bitstreams/6775ecd0-741a-4713-819f-3fdbb753731e/download |
bitstream.checksum.fl_str_mv |
8a4605be74aa9ea9d79846c1fba20a33 552f2079705da87b727eb1a43b66b5a2 ead1c2066ed3f702e5480fe941b231ff ac6c9f061083b8f2ce61dba2c28b6c45 |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 MD5 |
repository.name.fl_str_mv |
Repositorio Digital Universidad Andina del Cusco |
repository.mail.fl_str_mv |
jbenavides@uandina.edu.pe |
_version_ |
1845976535020863488 |
spelling |
Molero Delgado, Ivánbf93d912-c176-4cc4-b3d6-be81d77565a4Rimachi Costillas, Roy Joseph2022-12-22T20:37:02Z2022-12-22T20:37:02Z2022-06-14https://hdl.handle.net/20.500.12557/5050La desaparición de personas es una de las preocupaciones principales tanto a nivel nacional como mundial, estás se pueden dar debido a la trata de personas, tráfico de órganos, entre otros. Dentro de los grupos de personas desaparecidas existe uno cuyas características alertan más a la sociedad, por lo cual requieren una respuesta más rápida y eficiente; a este grupo se le denomina personas en situación de vulnerabilidad y está conformado por niños, niñas, adolescentes, personas adultas mayores y personas con discapacidad física, mental o sensorial. El aprendizaje no supervisado por otro lado forma parte del aprendizaje automático que a su vez es parte del campo de la Inteligencia Artificial, esta rama busca recolectar o generar conocimiento a través de la información albergada en los datos sin la necesidad de etiquetarlos. Los algoritmos de aprendizaje no supervisado cotidianamente son parte de soluciones tecnológicas que permiten segmentar o descubrir patrones de un conjunto de datos. Dichos patrones han servido a múltiples campos para desarrollar estrategias focalizadas por grupo, incrementando así la eficacia de los procesos que se encargan de combatir una problemática determinada. Los datos recolectados de menores desaparecidos contienen múltiples atributos como: edad, genero, raza, color de ojos, color de cabello, tipo de nariz, tipo de boca, etc. Entre estos campos solo existe una etiqueta cuyo valor puede ser “desaparecido” o “encontrado”, esta etiqueta no solventa la aplicación de técnicas de aprendizaje supervisado; debido a esto se opto por utilizar técnicas de aprendizaje no supervisado que surgen como una alternativa viable para analizar los datos. Además, este tipo de aprendizaje debido a su enfoque que no requiere de etiquetas en los datos disminuye el costo de recursos. Por esta razón la investigación busca describir o mostrar conocimiento sobre los patrones que puedan ser detectados dentro del conjunto de datos haciendo uso de las técnicas de aprendizaje no supervisado. Por consiguiente, para aplicar las técnicas de aprendizaje no supervisado primero fue necesario extraer todos los datos albergados en la página web utilizando la técnica de web scraping que nos permitió obtener todos los datos sobre el perfil del menor. También, debido a que el conjunto de datos recolectado contenía inconsistencias entre sus registros, se preprocesaron con técnicas del proceso KDD para obtener la mayor cantidad de registros validos para el estudio. Finalmente, el análisis de los datos se llevo a cabo variando entre múltiples números de clústeres determinados por el método del codo, para así pasarlos al algoritmo k-means y así determinar mediante métricas de validación la cantidad adecuada para el conjunto de datos.The disappearance of people is one of the main concerns both nationally and globally, these can occur due to human trafficking, organ trafficking, among others. Within the groups of disappeared persons there is one whose characteristics alert society more, for which they require a faster and more efficient response; This group is called people in vulnerable situations and is made up of boys, girls, adolescents, older adults and people with physical, mental or sensory disabilities. Unsupervised learning on the other hand is part of machine learning which in turn is part of the field of Artificial Intelligence, this branch seeks to collect or generate knowledge through the information stored in the data without the need to label it. Unsupervised learning algorithms daily are part of technological solutions that allow you to segment or discover patterns in a data set. These patterns have served multiple fields to develop group strategies, thus increasing the effectiveness of the processes that are responsible for combating a specific problem. The data collected from missing minors contains multiple attributes such as: age, sex, race, eye color, hair color, type of nose, type of mouth, etc. Among these fields there is only one label whose value can "disappear" or "found". This label does not address the application of supervised learning techniques; Due to this, it was decided to use unsupervised learning techniques that emerge as a viable alternative to analyze the data. In addition, this type of learning due to its approach that does not require labels on the data reduces the cost of resources. For this reason, the research seeks to describe or show knowledge about the patterns that can be detected within the data set using unsupervised learning techniques. Therefore, to apply unsupervised learning techniques, it was first necessary to extract all the data stored in the web page using the web scraping technique that allowed us to obtain all the data from the child's profile. Furthermore, since the collected data set contained inconsistencies between their records, they were preprocessed with KDD processing techniques to obtain the largest number of valid records for the study. Finally, the data analysis was performed by varying between multiple numbers of clusters determined by the elbow method, in order to pass them to the k-means algorithm and thus determine the appropriate amount for the data set through validation metrics.application/pdfspaUniversidad Andina del CuscoPEinfo:eu-repo/semantics/openAccesshttps://creativecommons.org/licenses/by-nc-nd/4.0/Aprendizaje supervisadoCosto de recursosConjunto de datoshttps://purl.org/pe-repo/ocde/ford#2.02.04Detección de patrones de personas desaparecidas mediante técnicas de aprendizaje no supervisadoinfo:eu-repo/semantics/bachelorThesisreponame:UAC-Institucionalinstname:Universidad Andina del Cuscoinstacron:UACSUNEDUIngeniero de SistemasUniversidad Andina del Cusco. Facultad de Ingeniería y ArquitecturaIngeniería de Sistemas25705893https://orcid.org/0000-0003-0568-056272516927612076Acurio Gutiérrez, María IsabelEspetia Huamanga, HugoRivas Mago, Lornel AntonioGonzales Condori, Harry Yeisonhttps://purl.org/pe-repo/renati/level#tituloProfesionalhttps://purl.org/pe-repo/renati/type#tesisLICENSElicense.txtlicense.txttext/plain; charset=utf-81748https://repositorio.uandina.edu.pe/bitstreams/a1292bef-fc35-482f-931f-e5345c57a95d/download8a4605be74aa9ea9d79846c1fba20a33MD52ORIGINALRoy_Tesis_bachiller_2022.pdfRoy_Tesis_bachiller_2022.pdfapplication/pdf2541768https://repositorio.uandina.edu.pe/bitstreams/ef407888-d46f-4675-8a81-2cf308054c69/download552f2079705da87b727eb1a43b66b5a2MD51TEXTRoy_Tesis_bachiller_2022.pdf.txtRoy_Tesis_bachiller_2022.pdf.txtExtracted texttext/plain; charset=utf-8103928https://repositorio.uandina.edu.pe/bitstreams/de54477f-2c25-4c50-957d-8d942eb13f31/downloadead1c2066ed3f702e5480fe941b231ffMD55THUMBNAILRoy_Tesis_bachiller_2022.pdf.jpgRoy_Tesis_bachiller_2022.pdf.jpgGenerated Thumbnailimage/jpeg17599https://repositorio.uandina.edu.pe/bitstreams/6775ecd0-741a-4713-819f-3fdbb753731e/downloadac6c9f061083b8f2ce61dba2c28b6c45MD5620.500.12557/5050oai:repositorio.uandina.edu.pe:20.500.12557/50502024-10-01 22:36:57.22https://creativecommons.org/licenses/by-nc-nd/4.0/info:eu-repo/semantics/openAccessopen.accesshttps://repositorio.uandina.edu.peRepositorio Digital Universidad Andina del Cuscojbenavides@uandina.edu.peTk9URTogUExBQ0UgWU9VUiBPV04gTElDRU5TRSBIRVJFClRoaXMgc2FtcGxlIGxpY2Vuc2UgaXMgcHJvdmlkZWQgZm9yIGluZm9ybWF0aW9uYWwgcHVycG9zZXMgb25seS4KCk5PTi1FWENMVVNJVkUgRElTVFJJQlVUSU9OIExJQ0VOU0UKCkJ5IHNpZ25pbmcgYW5kIHN1Ym1pdHRpbmcgdGhpcyBsaWNlbnNlLCB5b3UgKHRoZSBhdXRob3Iocykgb3IgY29weXJpZ2h0Cm93bmVyKSBncmFudHMgdG8gRFNwYWNlIFVuaXZlcnNpdHkgKERTVSkgdGhlIG5vbi1leGNsdXNpdmUgcmlnaHQgdG8gcmVwcm9kdWNlLAp0cmFuc2xhdGUgKGFzIGRlZmluZWQgYmVsb3cpLCBhbmQvb3IgZGlzdHJpYnV0ZSB5b3VyIHN1Ym1pc3Npb24gKGluY2x1ZGluZwp0aGUgYWJzdHJhY3QpIHdvcmxkd2lkZSBpbiBwcmludCBhbmQgZWxlY3Ryb25pYyBmb3JtYXQgYW5kIGluIGFueSBtZWRpdW0sCmluY2x1ZGluZyBidXQgbm90IGxpbWl0ZWQgdG8gYXVkaW8gb3IgdmlkZW8uCgpZb3UgYWdyZWUgdGhhdCBEU1UgbWF5LCB3aXRob3V0IGNoYW5naW5nIHRoZSBjb250ZW50LCB0cmFuc2xhdGUgdGhlCnN1Ym1pc3Npb24gdG8gYW55IG1lZGl1bSBvciBmb3JtYXQgZm9yIHRoZSBwdXJwb3NlIG9mIHByZXNlcnZhdGlvbi4KCllvdSBhbHNvIGFncmVlIHRoYXQgRFNVIG1heSBrZWVwIG1vcmUgdGhhbiBvbmUgY29weSBvZiB0aGlzIHN1Ym1pc3Npb24gZm9yCnB1cnBvc2VzIG9mIHNlY3VyaXR5LCBiYWNrLXVwIGFuZCBwcmVzZXJ2YXRpb24uCgpZb3UgcmVwcmVzZW50IHRoYXQgdGhlIHN1Ym1pc3Npb24gaXMgeW91ciBvcmlnaW5hbCB3b3JrLCBhbmQgdGhhdCB5b3UgaGF2ZQp0aGUgcmlnaHQgdG8gZ3JhbnQgdGhlIHJpZ2h0cyBjb250YWluZWQgaW4gdGhpcyBsaWNlbnNlLiBZb3UgYWxzbyByZXByZXNlbnQKdGhhdCB5b3VyIHN1Ym1pc3Npb24gZG9lcyBub3QsIHRvIHRoZSBiZXN0IG9mIHlvdXIga25vd2xlZGdlLCBpbmZyaW5nZSB1cG9uCmFueW9uZSdzIGNvcHlyaWdodC4KCklmIHRoZSBzdWJtaXNzaW9uIGNvbnRhaW5zIG1hdGVyaWFsIGZvciB3aGljaCB5b3UgZG8gbm90IGhvbGQgY29weXJpZ2h0LAp5b3UgcmVwcmVzZW50IHRoYXQgeW91IGhhdmUgb2J0YWluZWQgdGhlIHVucmVzdHJpY3RlZCBwZXJtaXNzaW9uIG9mIHRoZQpjb3B5cmlnaHQgb3duZXIgdG8gZ3JhbnQgRFNVIHRoZSByaWdodHMgcmVxdWlyZWQgYnkgdGhpcyBsaWNlbnNlLCBhbmQgdGhhdApzdWNoIHRoaXJkLXBhcnR5IG93bmVkIG1hdGVyaWFsIGlzIGNsZWFybHkgaWRlbnRpZmllZCBhbmQgYWNrbm93bGVkZ2VkCndpdGhpbiB0aGUgdGV4dCBvciBjb250ZW50IG9mIHRoZSBzdWJtaXNzaW9uLgoKSUYgVEhFIFNVQk1JU1NJT04gSVMgQkFTRUQgVVBPTiBXT1JLIFRIQVQgSEFTIEJFRU4gU1BPTlNPUkVEIE9SIFNVUFBPUlRFRApCWSBBTiBBR0VOQ1kgT1IgT1JHQU5JWkFUSU9OIE9USEVSIFRIQU4gRFNVLCBZT1UgUkVQUkVTRU5UIFRIQVQgWU9VIEhBVkUKRlVMRklMTEVEIEFOWSBSSUdIVCBPRiBSRVZJRVcgT1IgT1RIRVIgT0JMSUdBVElPTlMgUkVRVUlSRUQgQlkgU1VDSApDT05UUkFDVCBPUiBBR1JFRU1FTlQuCgpEU1Ugd2lsbCBjbGVhcmx5IGlkZW50aWZ5IHlvdXIgbmFtZShzKSBhcyB0aGUgYXV0aG9yKHMpIG9yIG93bmVyKHMpIG9mIHRoZQpzdWJtaXNzaW9uLCBhbmQgd2lsbCBub3QgbWFrZSBhbnkgYWx0ZXJhdGlvbiwgb3RoZXIgdGhhbiBhcyBhbGxvd2VkIGJ5IHRoaXMKbGljZW5zZSwgdG8geW91ciBzdWJtaXNzaW9uLgo= |
score |
13.04064 |
Nota importante:
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).