Aplicación del algoritmo "Random Forest" para un modelo de clasificación sobre la tenencia de anemia de niños del Perú
Descripción del Articulo
En este trabajo de investigación se ha elaborado y aplicado el algoritmo “random forest” para un modelo de clasificación, con la finalidad de predecir la tenencia de anemia en niños de 6 a 35 meses de edad nacidos en todo el Perú, utilizando la base de datos recolectada a través de la Encuesta Demog...
Autor: | |
---|---|
Formato: | tesis doctoral |
Fecha de Publicación: | 2022 |
Institución: | Universidad Nacional del Santa |
Repositorio: | UNS - Institucional |
Lenguaje: | español |
OAI Identifier: | oai:repositorio.uns.edu.pe:20.500.14278/4007 |
Enlace del recurso: | https://hdl.handle.net/20.500.14278/4007 |
Nivel de acceso: | acceso abierto |
Materia: | Tenencia de anemia Random forest Balanceo de datos Indicador área bajo la curva Sensibilidad Modelo de clasificación |
id |
UNSR_56c9a07113192c308265253ce0eaf5b3 |
---|---|
oai_identifier_str |
oai:repositorio.uns.edu.pe:20.500.14278/4007 |
network_acronym_str |
UNSR |
network_name_str |
UNS - Institucional |
repository_id_str |
3819 |
dc.title.es_PE.fl_str_mv |
Aplicación del algoritmo "Random Forest" para un modelo de clasificación sobre la tenencia de anemia de niños del Perú |
title |
Aplicación del algoritmo "Random Forest" para un modelo de clasificación sobre la tenencia de anemia de niños del Perú |
spellingShingle |
Aplicación del algoritmo "Random Forest" para un modelo de clasificación sobre la tenencia de anemia de niños del Perú Céspedes Panduro, Bernardo Tenencia de anemia Random forest Balanceo de datos Indicador área bajo la curva Sensibilidad Modelo de clasificación |
title_short |
Aplicación del algoritmo "Random Forest" para un modelo de clasificación sobre la tenencia de anemia de niños del Perú |
title_full |
Aplicación del algoritmo "Random Forest" para un modelo de clasificación sobre la tenencia de anemia de niños del Perú |
title_fullStr |
Aplicación del algoritmo "Random Forest" para un modelo de clasificación sobre la tenencia de anemia de niños del Perú |
title_full_unstemmed |
Aplicación del algoritmo "Random Forest" para un modelo de clasificación sobre la tenencia de anemia de niños del Perú |
title_sort |
Aplicación del algoritmo "Random Forest" para un modelo de clasificación sobre la tenencia de anemia de niños del Perú |
author |
Céspedes Panduro, Bernardo |
author_facet |
Céspedes Panduro, Bernardo |
author_role |
author |
dc.contributor.advisor.fl_str_mv |
Aguilar Marin, Pablo |
dc.contributor.author.fl_str_mv |
Céspedes Panduro, Bernardo |
dc.subject.es_PE.fl_str_mv |
Tenencia de anemia Random forest Balanceo de datos Indicador área bajo la curva Sensibilidad Modelo de clasificación |
topic |
Tenencia de anemia Random forest Balanceo de datos Indicador área bajo la curva Sensibilidad Modelo de clasificación |
description |
En este trabajo de investigación se ha elaborado y aplicado el algoritmo “random forest” para un modelo de clasificación, con la finalidad de predecir la tenencia de anemia en niños de 6 a 35 meses de edad nacidos en todo el Perú, utilizando la base de datos recolectada a través de la Encuesta Demográfica y de Salud Familiar (ENDES) por el Instituto Nacional de Estadística e Informática (INEI), durante los años 2015 al 2019, conformada por 57410 registros de encuestados. Se seleccionaron 33 variables independientes de todas las que recoge la ENDES. Se plantearon seis procedimientos alternativos utilizando una combinación de los criterios de balanceo de datos y reajuste de parámetros para la predicción de anemia, obteniéndose valores de los indicadores, Área Bajo la Curva (AUC), nivel de especificidad y nivel de sensibilidad para cada uno de ellos. De los seis procedimientos, el que mejor predijo la tenencia de anemia con valores para los indicadores de especificidad (63,6%) y sensibilidad (65,9%) más similares fue el que utiliza datos balanceados con un reajuste de los parámetros, reduciendo la cantidad de arboles y con selección de variables. Las 5 variables independientes más importantes para este modelo en la tenencia de anemia son: variables relacionadas con el niño (edad del niño, en meses), variables sociodemográficas (altitud del conglomerado, en metros), variables del cuidado materno e infantil (número de visitas prenatales por embarazo, meses de embarazo del primer control prenatal y talla de la madre en centímetros). |
publishDate |
2022 |
dc.date.accessioned.none.fl_str_mv |
2022-09-27T18:01:24Z |
dc.date.available.none.fl_str_mv |
2022-09-27T18:01:24Z |
dc.date.issued.fl_str_mv |
2022-03-11 |
dc.type.es_PE.fl_str_mv |
info:eu-repo/semantics/doctoralThesis |
format |
doctoralThesis |
dc.identifier.uri.none.fl_str_mv |
https://hdl.handle.net/20.500.14278/4007 |
url |
https://hdl.handle.net/20.500.14278/4007 |
dc.language.iso.es_PE.fl_str_mv |
spa |
language |
spa |
dc.relation.ispartof.fl_str_mv |
SUNEDU |
dc.rights.es_PE.fl_str_mv |
info:eu-repo/semantics/openAccess |
dc.rights.uri.*.fl_str_mv |
http://creativecommons.org/licenses/by-nc-nd/3.0/us/ |
eu_rights_str_mv |
openAccess |
rights_invalid_str_mv |
http://creativecommons.org/licenses/by-nc-nd/3.0/us/ |
dc.format.es_PE.fl_str_mv |
application/pdf |
dc.publisher.es_PE.fl_str_mv |
Universidad Nacional del Santa |
dc.source.es_PE.fl_str_mv |
Repositorio Institucional - UNS |
dc.source.none.fl_str_mv |
reponame:UNS - Institucional instname:Universidad Nacional del Santa instacron:UNS |
instname_str |
Universidad Nacional del Santa |
instacron_str |
UNS |
institution |
UNS |
reponame_str |
UNS - Institucional |
collection |
UNS - Institucional |
bitstream.url.fl_str_mv |
http://repositorio.uns.edu.pe/bitstream/20.500.14278/4007/6/52476.pdf.jpg http://repositorio.uns.edu.pe/bitstream/20.500.14278/4007/1/52476.pdf http://repositorio.uns.edu.pe/bitstream/20.500.14278/4007/2/license_rdf http://repositorio.uns.edu.pe/bitstream/20.500.14278/4007/3/license.txt http://repositorio.uns.edu.pe/bitstream/20.500.14278/4007/5/52476.pdf.txt |
bitstream.checksum.fl_str_mv |
3c318102abb104fb0bf674de9d4fbad8 0355f5d225d01efa83d642c111ff6a29 bb87e2fb4674c76d0d2e9ed07fbb9c86 c52066b9c50a8f86be96c82978636682 53a078ac887f8f2dc8e80c780025a22c |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 MD5 MD5 |
repository.name.fl_str_mv |
DSpace Universidad Nacional del Santa |
repository.mail.fl_str_mv |
repositorio@uns.edu.pe |
_version_ |
1838823405328007168 |
spelling |
Aguilar Marin, PabloCéspedes Panduro, Bernardo2022-09-27T18:01:24Z2022-09-27T18:01:24Z2022-03-11https://hdl.handle.net/20.500.14278/4007En este trabajo de investigación se ha elaborado y aplicado el algoritmo “random forest” para un modelo de clasificación, con la finalidad de predecir la tenencia de anemia en niños de 6 a 35 meses de edad nacidos en todo el Perú, utilizando la base de datos recolectada a través de la Encuesta Demográfica y de Salud Familiar (ENDES) por el Instituto Nacional de Estadística e Informática (INEI), durante los años 2015 al 2019, conformada por 57410 registros de encuestados. Se seleccionaron 33 variables independientes de todas las que recoge la ENDES. Se plantearon seis procedimientos alternativos utilizando una combinación de los criterios de balanceo de datos y reajuste de parámetros para la predicción de anemia, obteniéndose valores de los indicadores, Área Bajo la Curva (AUC), nivel de especificidad y nivel de sensibilidad para cada uno de ellos. De los seis procedimientos, el que mejor predijo la tenencia de anemia con valores para los indicadores de especificidad (63,6%) y sensibilidad (65,9%) más similares fue el que utiliza datos balanceados con un reajuste de los parámetros, reduciendo la cantidad de arboles y con selección de variables. Las 5 variables independientes más importantes para este modelo en la tenencia de anemia son: variables relacionadas con el niño (edad del niño, en meses), variables sociodemográficas (altitud del conglomerado, en metros), variables del cuidado materno e infantil (número de visitas prenatales por embarazo, meses de embarazo del primer control prenatal y talla de la madre en centímetros).Tesisapplication/pdfspaUniversidad Nacional del Santainfo:eu-repo/semantics/openAccesshttp://creativecommons.org/licenses/by-nc-nd/3.0/us/Repositorio Institucional - UNSreponame:UNS - Institucionalinstname:Universidad Nacional del Santainstacron:UNS Tenencia de anemiaRandom forestBalanceo de datosIndicador área bajo la curvaSensibilidadModelo de clasificaciónAplicación del algoritmo "Random Forest" para un modelo de clasificación sobre la tenencia de anemia de niños del Perúinfo:eu-repo/semantics/doctoralThesisSUNEDUDoctor en Estadística MatemáticaUniversidad Nacional del Santa. Escuela de posgradoDoctoradoEstadística Matemáticahttps://orcid.org/0000-0001-6096-401018071385https://purl.org/pe-repo/renati/type#tesishttps://purl.org/pe-repo/renati/nivel#doctor542048Rubio Jacobo, Luis AlbertoTesen Arroyo, AlfonsoAguilar Marin, Pablo17615559THUMBNAIL52476.pdf.jpg52476.pdf.jpgGenerated Thumbnailimage/jpeg5653http://repositorio.uns.edu.pe/bitstream/20.500.14278/4007/6/52476.pdf.jpg3c318102abb104fb0bf674de9d4fbad8MD56ORIGINAL52476.pdf52476.pdfapplication/pdf16744098http://repositorio.uns.edu.pe/bitstream/20.500.14278/4007/1/52476.pdf0355f5d225d01efa83d642c111ff6a29MD51CC-LICENSElicense_rdflicense_rdfapplication/rdf+xml; charset=utf-81232http://repositorio.uns.edu.pe/bitstream/20.500.14278/4007/2/license_rdfbb87e2fb4674c76d0d2e9ed07fbb9c86MD52LICENSElicense.txtlicense.txttext/plain; charset=utf-81327http://repositorio.uns.edu.pe/bitstream/20.500.14278/4007/3/license.txtc52066b9c50a8f86be96c82978636682MD53TEXT52476.pdf.txt52476.pdf.txtExtracted texttext/plain244050http://repositorio.uns.edu.pe/bitstream/20.500.14278/4007/5/52476.pdf.txt53a078ac887f8f2dc8e80c780025a22cMD5520.500.14278/4007oai:repositorio.uns.edu.pe:20.500.14278/40072024-08-15 15:53:45.897DSpace Universidad Nacional del Santarepositorio@uns.edu.pe77u/TGljZW5jaWEgZGUgVXNvCiAKRWwgUmVwb3NpdG9yaW8gSW5zdGl0dWNpb25hbCwgZGlmdW5kZSBtZWRpYW50ZSBsb3MgdHJhYmFqb3MgZGUgaW52ZXN0aWdhY2nDs24gcHJvZHVjaWRvcyBwb3IgbG9zIG1pZW1icm9zIGRlIGxhIHVuaXZlcnNpZGFkLiBFbCBjb250ZW5pZG8gZGUgbG9zIGRvY3VtZW50b3MgZGlnaXRhbGVzIGVzIGRlIGFjY2VzbyBhYmllcnRvIHBhcmEgdG9kYSBwZXJzb25hIGludGVyZXNhZGEuCgpTZSBhY2VwdGEgbGEgZGlmdXNpw7NuIHDDumJsaWNhIGRlIGxhIG9icmEsIHN1IGNvcGlhIHkgZGlzdHJpYnVjacOzbi4gUGFyYSBlc3RvIGVzIG5lY2VzYXJpbyBxdWUgc2UgY3VtcGxhIGNvbiBsYXMgc2lndWllbnRlcyBjb25kaWNpb25lczoKCkVsIG5lY2VzYXJpbyByZWNvbm9jaW1pZW50byBkZSBsYSBhdXRvcsOtYSBkZSBsYSBvYnJhLCBpZGVudGlmaWNhbmRvIG9wb3J0dW5hIHkgY29ycmVjdGFtZW50ZSBhIGxhIHBlcnNvbmEgcXVlIHBvc2VhIGxvcyBkZXJlY2hvcyBkZSBhdXRvci4KCk5vIGVzdMOhIHBlcm1pdGlkbyBlbCB1c28gaW5kZWJpZG8gZGVsIHRyYWJham8gZGUgaW52ZXN0aWdhY2nDs24gY29uIGZpbmVzIGRlIGx1Y3JvIG8gY3VhbHF1aWVyIHRpcG8gZGUgYWN0aXZpZGFkIHF1ZSBwcm9kdXpjYSBnYW5hbmNpYXMgYSBsYXMgcGVyc29uYXMgcXVlIGxvIGRpZnVuZGVuIHNpbiBlbCBjb25zZW50aW1pZW50byBkZWwgYXV0b3IgKGF1dG9yIGxlZ2FsKS4KCkxvcyBkZXJlY2hvcyBtb3JhbGVzIGRlbCBhdXRvciBubyBzb24gYWZlY3RhZG9zIHBvciBsYSBwcmVzZW50ZSBsaWNlbmNpYSBkZSB1c28uCgpEZXJlY2hvcyBkZSBhdXRvcgoKTGEgdW5pdmVyc2lkYWQgbm8gcG9zZWUgbG9zIGRlcmVjaG9zIGRlIHByb3BpZWRhZCBpbnRlbGVjdHVhbC4gTG9zIGRlcmVjaG9zIGRlIGF1dG9yIHNlIGVuY3VlbnRyYW4gcHJvdGVnaWRvcyBwb3IgbGEgbGVnaXNsYWNpw7NuIHBlcnVhbmE6IExleSBzb2JyZSBlbCBEZXJlY2hvIGRlIEF1dG9yIHByb211bGdhZG8gZW4gMTk5NiAoRC5MLiBOwrA4MjIpLCBMZXkgcXVlIG1vZGlmaWNhIGxvcyBhcnTDrWN1bG9zIDE4OMKwIHkgMTg5wrAgZGVsIGRlY3JldG8gbGVnaXNsYXRpdm8gTsKwODIyLCBMZXkgc29icmUgZGVyZWNob3MgZGUgYXV0b3IgcHJvbXVsZ2FkbyBlbiAyMDA1IChMZXkgTsKwMjg1MTcpLCBEZWNyZXRvIExlZ2lzbGF0aXZvIHF1ZSBhcHJ1ZWJhIGxhIG1vZGlmaWNhY2nDs24gZGVsIERlY3JldG8gTGVnaXNsYXRpdm8gTsKwODIyLCBMZXkgc29icmUgZWwgRGVyZWNobyBkZSBBdXRvciBwcm9tdWxnYWRvIGVuIDIwMDggKEQuTC4gTsKwMTA3NikuCg== |
score |
13.914502 |
Nota importante:
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).