Aplicación del algoritmo "Random Forest" para un modelo de clasificación sobre la tenencia de anemia de niños del Perú

Descripción del Articulo

En este trabajo de investigación se ha elaborado y aplicado el algoritmo “random forest” para un modelo de clasificación, con la finalidad de predecir la tenencia de anemia en niños de 6 a 35 meses de edad nacidos en todo el Perú, utilizando la base de datos recolectada a través de la Encuesta Demog...

Descripción completa

Detalles Bibliográficos
Autor: Céspedes Panduro, Bernardo
Formato: tesis doctoral
Fecha de Publicación:2022
Institución:Universidad Nacional del Santa
Repositorio:UNS - Institucional
Lenguaje:español
OAI Identifier:oai:repositorio.uns.edu.pe:20.500.14278/4007
Enlace del recurso:https://hdl.handle.net/20.500.14278/4007
Nivel de acceso:acceso abierto
Materia:Tenencia de anemia
Random forest
Balanceo de datos
Indicador área bajo la curva
Sensibilidad
Modelo de clasificación
id UNSR_56c9a07113192c308265253ce0eaf5b3
oai_identifier_str oai:repositorio.uns.edu.pe:20.500.14278/4007
network_acronym_str UNSR
network_name_str UNS - Institucional
repository_id_str 3819
dc.title.es_PE.fl_str_mv Aplicación del algoritmo "Random Forest" para un modelo de clasificación sobre la tenencia de anemia de niños del Perú
title Aplicación del algoritmo "Random Forest" para un modelo de clasificación sobre la tenencia de anemia de niños del Perú
spellingShingle Aplicación del algoritmo "Random Forest" para un modelo de clasificación sobre la tenencia de anemia de niños del Perú
Céspedes Panduro, Bernardo
Tenencia de anemia
Random forest
Balanceo de datos
Indicador área bajo la curva
Sensibilidad
Modelo de clasificación
title_short Aplicación del algoritmo "Random Forest" para un modelo de clasificación sobre la tenencia de anemia de niños del Perú
title_full Aplicación del algoritmo "Random Forest" para un modelo de clasificación sobre la tenencia de anemia de niños del Perú
title_fullStr Aplicación del algoritmo "Random Forest" para un modelo de clasificación sobre la tenencia de anemia de niños del Perú
title_full_unstemmed Aplicación del algoritmo "Random Forest" para un modelo de clasificación sobre la tenencia de anemia de niños del Perú
title_sort Aplicación del algoritmo "Random Forest" para un modelo de clasificación sobre la tenencia de anemia de niños del Perú
author Céspedes Panduro, Bernardo
author_facet Céspedes Panduro, Bernardo
author_role author
dc.contributor.advisor.fl_str_mv Aguilar Marin, Pablo
dc.contributor.author.fl_str_mv Céspedes Panduro, Bernardo
dc.subject.es_PE.fl_str_mv Tenencia de anemia
Random forest
Balanceo de datos
Indicador área bajo la curva
Sensibilidad
Modelo de clasificación
topic Tenencia de anemia
Random forest
Balanceo de datos
Indicador área bajo la curva
Sensibilidad
Modelo de clasificación
description En este trabajo de investigación se ha elaborado y aplicado el algoritmo “random forest” para un modelo de clasificación, con la finalidad de predecir la tenencia de anemia en niños de 6 a 35 meses de edad nacidos en todo el Perú, utilizando la base de datos recolectada a través de la Encuesta Demográfica y de Salud Familiar (ENDES) por el Instituto Nacional de Estadística e Informática (INEI), durante los años 2015 al 2019, conformada por 57410 registros de encuestados. Se seleccionaron 33 variables independientes de todas las que recoge la ENDES. Se plantearon seis procedimientos alternativos utilizando una combinación de los criterios de balanceo de datos y reajuste de parámetros para la predicción de anemia, obteniéndose valores de los indicadores, Área Bajo la Curva (AUC), nivel de especificidad y nivel de sensibilidad para cada uno de ellos. De los seis procedimientos, el que mejor predijo la tenencia de anemia con valores para los indicadores de especificidad (63,6%) y sensibilidad (65,9%) más similares fue el que utiliza datos balanceados con un reajuste de los parámetros, reduciendo la cantidad de arboles y con selección de variables. Las 5 variables independientes más importantes para este modelo en la tenencia de anemia son: variables relacionadas con el niño (edad del niño, en meses), variables sociodemográficas (altitud del conglomerado, en metros), variables del cuidado materno e infantil (número de visitas prenatales por embarazo, meses de embarazo del primer control prenatal y talla de la madre en centímetros).
publishDate 2022
dc.date.accessioned.none.fl_str_mv 2022-09-27T18:01:24Z
dc.date.available.none.fl_str_mv 2022-09-27T18:01:24Z
dc.date.issued.fl_str_mv 2022-03-11
dc.type.es_PE.fl_str_mv info:eu-repo/semantics/doctoralThesis
format doctoralThesis
dc.identifier.uri.none.fl_str_mv https://hdl.handle.net/20.500.14278/4007
url https://hdl.handle.net/20.500.14278/4007
dc.language.iso.es_PE.fl_str_mv spa
language spa
dc.relation.ispartof.fl_str_mv SUNEDU
dc.rights.es_PE.fl_str_mv info:eu-repo/semantics/openAccess
dc.rights.uri.*.fl_str_mv http://creativecommons.org/licenses/by-nc-nd/3.0/us/
eu_rights_str_mv openAccess
rights_invalid_str_mv http://creativecommons.org/licenses/by-nc-nd/3.0/us/
dc.format.es_PE.fl_str_mv application/pdf
dc.publisher.es_PE.fl_str_mv Universidad Nacional del Santa
dc.source.es_PE.fl_str_mv Repositorio Institucional - UNS
dc.source.none.fl_str_mv reponame:UNS - Institucional
instname:Universidad Nacional del Santa
instacron:UNS
instname_str Universidad Nacional del Santa
instacron_str UNS
institution UNS
reponame_str UNS - Institucional
collection UNS - Institucional
bitstream.url.fl_str_mv http://repositorio.uns.edu.pe/bitstream/20.500.14278/4007/6/52476.pdf.jpg
http://repositorio.uns.edu.pe/bitstream/20.500.14278/4007/1/52476.pdf
http://repositorio.uns.edu.pe/bitstream/20.500.14278/4007/2/license_rdf
http://repositorio.uns.edu.pe/bitstream/20.500.14278/4007/3/license.txt
http://repositorio.uns.edu.pe/bitstream/20.500.14278/4007/5/52476.pdf.txt
bitstream.checksum.fl_str_mv 3c318102abb104fb0bf674de9d4fbad8
0355f5d225d01efa83d642c111ff6a29
bb87e2fb4674c76d0d2e9ed07fbb9c86
c52066b9c50a8f86be96c82978636682
53a078ac887f8f2dc8e80c780025a22c
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
MD5
MD5
repository.name.fl_str_mv DSpace Universidad Nacional del Santa
repository.mail.fl_str_mv repositorio@uns.edu.pe
_version_ 1838823405328007168
spelling Aguilar Marin, PabloCéspedes Panduro, Bernardo2022-09-27T18:01:24Z2022-09-27T18:01:24Z2022-03-11https://hdl.handle.net/20.500.14278/4007En este trabajo de investigación se ha elaborado y aplicado el algoritmo “random forest” para un modelo de clasificación, con la finalidad de predecir la tenencia de anemia en niños de 6 a 35 meses de edad nacidos en todo el Perú, utilizando la base de datos recolectada a través de la Encuesta Demográfica y de Salud Familiar (ENDES) por el Instituto Nacional de Estadística e Informática (INEI), durante los años 2015 al 2019, conformada por 57410 registros de encuestados. Se seleccionaron 33 variables independientes de todas las que recoge la ENDES. Se plantearon seis procedimientos alternativos utilizando una combinación de los criterios de balanceo de datos y reajuste de parámetros para la predicción de anemia, obteniéndose valores de los indicadores, Área Bajo la Curva (AUC), nivel de especificidad y nivel de sensibilidad para cada uno de ellos. De los seis procedimientos, el que mejor predijo la tenencia de anemia con valores para los indicadores de especificidad (63,6%) y sensibilidad (65,9%) más similares fue el que utiliza datos balanceados con un reajuste de los parámetros, reduciendo la cantidad de arboles y con selección de variables. Las 5 variables independientes más importantes para este modelo en la tenencia de anemia son: variables relacionadas con el niño (edad del niño, en meses), variables sociodemográficas (altitud del conglomerado, en metros), variables del cuidado materno e infantil (número de visitas prenatales por embarazo, meses de embarazo del primer control prenatal y talla de la madre en centímetros).Tesisapplication/pdfspaUniversidad Nacional del Santainfo:eu-repo/semantics/openAccesshttp://creativecommons.org/licenses/by-nc-nd/3.0/us/Repositorio Institucional - UNSreponame:UNS - Institucionalinstname:Universidad Nacional del Santainstacron:UNS Tenencia de anemiaRandom forestBalanceo de datosIndicador área bajo la curvaSensibilidadModelo de clasificaciónAplicación del algoritmo "Random Forest" para un modelo de clasificación sobre la tenencia de anemia de niños del Perúinfo:eu-repo/semantics/doctoralThesisSUNEDUDoctor en Estadística MatemáticaUniversidad Nacional del Santa. Escuela de posgradoDoctoradoEstadística Matemáticahttps://orcid.org/0000-0001-6096-401018071385https://purl.org/pe-repo/renati/type#tesishttps://purl.org/pe-repo/renati/nivel#doctor542048Rubio Jacobo, Luis AlbertoTesen Arroyo, AlfonsoAguilar Marin, Pablo17615559THUMBNAIL52476.pdf.jpg52476.pdf.jpgGenerated Thumbnailimage/jpeg5653http://repositorio.uns.edu.pe/bitstream/20.500.14278/4007/6/52476.pdf.jpg3c318102abb104fb0bf674de9d4fbad8MD56ORIGINAL52476.pdf52476.pdfapplication/pdf16744098http://repositorio.uns.edu.pe/bitstream/20.500.14278/4007/1/52476.pdf0355f5d225d01efa83d642c111ff6a29MD51CC-LICENSElicense_rdflicense_rdfapplication/rdf+xml; charset=utf-81232http://repositorio.uns.edu.pe/bitstream/20.500.14278/4007/2/license_rdfbb87e2fb4674c76d0d2e9ed07fbb9c86MD52LICENSElicense.txtlicense.txttext/plain; charset=utf-81327http://repositorio.uns.edu.pe/bitstream/20.500.14278/4007/3/license.txtc52066b9c50a8f86be96c82978636682MD53TEXT52476.pdf.txt52476.pdf.txtExtracted texttext/plain244050http://repositorio.uns.edu.pe/bitstream/20.500.14278/4007/5/52476.pdf.txt53a078ac887f8f2dc8e80c780025a22cMD5520.500.14278/4007oai:repositorio.uns.edu.pe:20.500.14278/40072024-08-15 15:53:45.897DSpace Universidad Nacional del Santarepositorio@uns.edu.pe77u/TGljZW5jaWEgZGUgVXNvCiAKRWwgUmVwb3NpdG9yaW8gSW5zdGl0dWNpb25hbCwgZGlmdW5kZSBtZWRpYW50ZSBsb3MgdHJhYmFqb3MgZGUgaW52ZXN0aWdhY2nDs24gcHJvZHVjaWRvcyBwb3IgbG9zIG1pZW1icm9zIGRlIGxhIHVuaXZlcnNpZGFkLiBFbCBjb250ZW5pZG8gZGUgbG9zIGRvY3VtZW50b3MgZGlnaXRhbGVzIGVzIGRlIGFjY2VzbyBhYmllcnRvIHBhcmEgdG9kYSBwZXJzb25hIGludGVyZXNhZGEuCgpTZSBhY2VwdGEgbGEgZGlmdXNpw7NuIHDDumJsaWNhIGRlIGxhIG9icmEsIHN1IGNvcGlhIHkgZGlzdHJpYnVjacOzbi4gUGFyYSBlc3RvIGVzIG5lY2VzYXJpbyBxdWUgc2UgY3VtcGxhIGNvbiBsYXMgc2lndWllbnRlcyBjb25kaWNpb25lczoKCkVsIG5lY2VzYXJpbyByZWNvbm9jaW1pZW50byBkZSBsYSBhdXRvcsOtYSBkZSBsYSBvYnJhLCBpZGVudGlmaWNhbmRvIG9wb3J0dW5hIHkgY29ycmVjdGFtZW50ZSBhIGxhIHBlcnNvbmEgcXVlIHBvc2VhIGxvcyBkZXJlY2hvcyBkZSBhdXRvci4KCk5vIGVzdMOhIHBlcm1pdGlkbyBlbCB1c28gaW5kZWJpZG8gZGVsIHRyYWJham8gZGUgaW52ZXN0aWdhY2nDs24gY29uIGZpbmVzIGRlIGx1Y3JvIG8gY3VhbHF1aWVyIHRpcG8gZGUgYWN0aXZpZGFkIHF1ZSBwcm9kdXpjYSBnYW5hbmNpYXMgYSBsYXMgcGVyc29uYXMgcXVlIGxvIGRpZnVuZGVuIHNpbiBlbCBjb25zZW50aW1pZW50byBkZWwgYXV0b3IgKGF1dG9yIGxlZ2FsKS4KCkxvcyBkZXJlY2hvcyBtb3JhbGVzIGRlbCBhdXRvciBubyBzb24gYWZlY3RhZG9zIHBvciBsYSBwcmVzZW50ZSBsaWNlbmNpYSBkZSB1c28uCgpEZXJlY2hvcyBkZSBhdXRvcgoKTGEgdW5pdmVyc2lkYWQgbm8gcG9zZWUgbG9zIGRlcmVjaG9zIGRlIHByb3BpZWRhZCBpbnRlbGVjdHVhbC4gTG9zIGRlcmVjaG9zIGRlIGF1dG9yIHNlIGVuY3VlbnRyYW4gcHJvdGVnaWRvcyBwb3IgbGEgbGVnaXNsYWNpw7NuIHBlcnVhbmE6IExleSBzb2JyZSBlbCBEZXJlY2hvIGRlIEF1dG9yIHByb211bGdhZG8gZW4gMTk5NiAoRC5MLiBOwrA4MjIpLCBMZXkgcXVlIG1vZGlmaWNhIGxvcyBhcnTDrWN1bG9zIDE4OMKwIHkgMTg5wrAgZGVsIGRlY3JldG8gbGVnaXNsYXRpdm8gTsKwODIyLCBMZXkgc29icmUgZGVyZWNob3MgZGUgYXV0b3IgcHJvbXVsZ2FkbyBlbiAyMDA1IChMZXkgTsKwMjg1MTcpLCBEZWNyZXRvIExlZ2lzbGF0aXZvIHF1ZSBhcHJ1ZWJhIGxhIG1vZGlmaWNhY2nDs24gZGVsIERlY3JldG8gTGVnaXNsYXRpdm8gTsKwODIyLCBMZXkgc29icmUgZWwgRGVyZWNobyBkZSBBdXRvciBwcm9tdWxnYWRvIGVuIDIwMDggKEQuTC4gTsKwMTA3NikuCg==
score 13.914502
Nota importante:
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).