Bosques aleatorios como extensión de los árboles de clasificación con los programas R y Python

Descripción del Articulo

This article presents the application of the non-parametric Random Forest method through supervised learning, as an extension of classification trees. The Random Forest algorithm arises as the grouping of several classification trees. Basically it randomly selects a number of variables with which ea...

Descripción completa

Detalles Bibliográficos
Autores: Medina Merino, Rosa Fátima, Ñique Chacón, Carmen Ismelda
Formato: artículo
Fecha de Publicación:2017
Institución:Universidad de Lima
Repositorio:ULIMA-Institucional
Lenguaje:español
OAI Identifier:oai:repositorio.ulima.edu.pe:20.500.12724/5560
Enlace del recurso:https://hdl.handle.net/20.500.12724/5560
Nivel de acceso:acceso abierto
Materia:Árboles (Teoría de grafos)
Python (Lenguaje de programación)
Algoritmos de computadoras
Trees (Graph theory)
Python (computer program language)
Computer algorithms
id RULI_27af490785f3d998ed3b1815a3efd453
oai_identifier_str oai:repositorio.ulima.edu.pe:20.500.12724/5560
network_acronym_str RULI
network_name_str ULIMA-Institucional
repository_id_str 3883
dc.title.es_ES.fl_str_mv Bosques aleatorios como extensión de los árboles de clasificación con los programas R y Python
dc.title.alternative.es_ES.fl_str_mv Random Forests as an extension of the classification trees with the R and Python programs
title Bosques aleatorios como extensión de los árboles de clasificación con los programas R y Python
spellingShingle Bosques aleatorios como extensión de los árboles de clasificación con los programas R y Python
Medina Merino, Rosa Fátima
Árboles (Teoría de grafos)
Python (Lenguaje de programación)
Algoritmos de computadoras
Trees (Graph theory)
Python (computer program language)
Computer algorithms
title_short Bosques aleatorios como extensión de los árboles de clasificación con los programas R y Python
title_full Bosques aleatorios como extensión de los árboles de clasificación con los programas R y Python
title_fullStr Bosques aleatorios como extensión de los árboles de clasificación con los programas R y Python
title_full_unstemmed Bosques aleatorios como extensión de los árboles de clasificación con los programas R y Python
title_sort Bosques aleatorios como extensión de los árboles de clasificación con los programas R y Python
author Medina Merino, Rosa Fátima
author_facet Medina Merino, Rosa Fátima
Ñique Chacón, Carmen Ismelda
author_role author
author2 Ñique Chacón, Carmen Ismelda
author2_role author
dc.contributor.other.none.fl_str_mv Medina Merino, Rosa Fátima
dc.contributor.author.fl_str_mv Medina Merino, Rosa Fátima
Ñique Chacón, Carmen Ismelda
dc.subject.es.fl_str_mv Árboles (Teoría de grafos)
Python (Lenguaje de programación)
Algoritmos de computadoras
topic Árboles (Teoría de grafos)
Python (Lenguaje de programación)
Algoritmos de computadoras
Trees (Graph theory)
Python (computer program language)
Computer algorithms
dc.subject.en.fl_str_mv Trees (Graph theory)
Python (computer program language)
Computer algorithms
description This article presents the application of the non-parametric Random Forest method through supervised learning, as an extension of classification trees. The Random Forest algorithm arises as the grouping of several classification trees. Basically it randomly selects a number of variables with which each individual tree is constructed and predictions are made with these variables that will later be weighted through the calculation of the most voted class of these trees that were generated, to finally do the prediction by Random Forest. For the application, we worked with 3168 recorded voices, for which the results of an acoustic analysis are presented, registering variables such as frequency, spectrum, modulation, among others, seeking to obtain a pattern of identification and classification according to gender through a voice identifier. The data record used is in open access and can be downloaded from the Kaggle web platform via <https://www.kaggle.com/primaryobjects/voicegende>r. For the development of the algorithm’s model, the statistical program R was used. Additionally, applications were made with Python by the development of classification algorithms.
publishDate 2017
dc.date.accessioned.none.fl_str_mv 2018-01-27T14:51:14Z
dc.date.issued.fl_str_mv 2017
dc.type.none.fl_str_mv info:eu-repo/semantics/article
dc.type.other.none.fl_str_mv Artículo
format article
dc.identifier.citation.es_ES.fl_str_mv Medina-Merino, R., & Ñique-Chacón, C. (2017). Bosques aleatorios como extensión de los árboles de clasificación con los programas R y Python. Interfases, (10), 165-189. doi:http://dx.doi.org/10.26439/interfases2017.n10.1775
dc.identifier.issn.none.fl_str_mv 1993-4912
dc.identifier.uri.none.fl_str_mv https://hdl.handle.net/20.500.12724/5560
dc.identifier.journal.none.fl_str_mv Interfases
identifier_str_mv Medina-Merino, R., & Ñique-Chacón, C. (2017). Bosques aleatorios como extensión de los árboles de clasificación con los programas R y Python. Interfases, (10), 165-189. doi:http://dx.doi.org/10.26439/interfases2017.n10.1775
1993-4912
Interfases
url https://hdl.handle.net/20.500.12724/5560
dc.language.iso.none.fl_str_mv spa
language spa
dc.relation.uri.es.fl_str_mv https://revistas.ulima.edu.pe/index.php/Interfases/article/view/1775/1828
dc.rights.*.fl_str_mv info:eu-repo/semantics/openAccess
dc.rights.uri.*.fl_str_mv https://creativecommons.org/licenses/by-nc-sa/4.0/
eu_rights_str_mv openAccess
rights_invalid_str_mv https://creativecommons.org/licenses/by-nc-sa/4.0/
dc.format.es.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Universidad de Lima
dc.publisher.country.none.fl_str_mv PE
publisher.none.fl_str_mv Universidad de Lima
dc.source.none.fl_str_mv Repositorio Institucional - Ulima
Universidad de Lima
reponame:ULIMA-Institucional
instname:Universidad de Lima
instacron:ULIMA
instname_str Universidad de Lima
instacron_str ULIMA
institution ULIMA
reponame_str ULIMA-Institucional
collection ULIMA-Institucional
bitstream.url.fl_str_mv https://repositorio.ulima.edu.pe/bitstream/20.500.12724/5560/2/license.txt
bitstream.checksum.fl_str_mv 8a4605be74aa9ea9d79846c1fba20a33
bitstream.checksumAlgorithm.fl_str_mv MD5
repository.name.fl_str_mv Repositorio Universidad de Lima
repository.mail.fl_str_mv repositorio@ulima.edu.pe
_version_ 1846612249411584000
spelling Medina Merino, Rosa FátimaÑique Chacón, Carmen IsmeldaMedina Merino, Rosa Fátima2018-01-27T14:51:14Z2017Medina-Merino, R., & Ñique-Chacón, C. (2017). Bosques aleatorios como extensión de los árboles de clasificación con los programas R y Python. Interfases, (10), 165-189. doi:http://dx.doi.org/10.26439/interfases2017.n10.17751993-4912https://hdl.handle.net/20.500.12724/5560InterfasesThis article presents the application of the non-parametric Random Forest method through supervised learning, as an extension of classification trees. The Random Forest algorithm arises as the grouping of several classification trees. Basically it randomly selects a number of variables with which each individual tree is constructed and predictions are made with these variables that will later be weighted through the calculation of the most voted class of these trees that were generated, to finally do the prediction by Random Forest. For the application, we worked with 3168 recorded voices, for which the results of an acoustic analysis are presented, registering variables such as frequency, spectrum, modulation, among others, seeking to obtain a pattern of identification and classification according to gender through a voice identifier. The data record used is in open access and can be downloaded from the Kaggle web platform via <https://www.kaggle.com/primaryobjects/voicegende>r. For the development of the algorithm’s model, the statistical program R was used. Additionally, applications were made with Python by the development of classification algorithms.El presente artículo presenta la aplicación del método no paramétrico Random Forest mediante el aprendizaje supervisado, como una extensión de los árboles de clasificación. El algoritmo de Random Forest surge como la agrupación de varios árboles de clasificación; básicamente selecciona de manera aleatoria una cantidad de variables con las cuales se construye cada uno de los árboles individuales, y se realizan predicciones con estas variables que posteriormente serán ponderadas a través del cálculo de la clase más votada de los árboles que se generaron, para finalmente hacer la predicción por Random Forest. Para la aplicación se trabajó con 3168 registros de voz grabados, para los cuales se presentan los resultados de un análisis acústico, registrándose variables tales como frecuencia, espectro, modulación, entre otras, con lo cual se busca obtener un patrón de identificación y clasificación según género a través de un identificador de voz. El registro de datos utilizado es de acceso libre y puede ser descargado desde la plataforma web de Kaggle a través del enlace <https://www.kaggle.com/primaryobjects/voicegender>. Para el desarrollo del algoritmo del modelo, se recurrió al programa estadístico R. Adicionalmente, se realizaron aplicaciones con Python mediante el desarrollo de algoritmos de clasificación.application/pdfspaUniversidad de LimaPEhttps://revistas.ulima.edu.pe/index.php/Interfases/article/view/1775/1828info:eu-repo/semantics/openAccesshttps://creativecommons.org/licenses/by-nc-sa/4.0/Repositorio Institucional - UlimaUniversidad de Limareponame:ULIMA-Institucionalinstname:Universidad de Limainstacron:ULIMAÁrboles (Teoría de grafos)Python (Lenguaje de programación)Algoritmos de computadorasTrees (Graph theory)Python (computer program language)Computer algorithmsBosques aleatorios como extensión de los árboles de clasificación con los programas R y PythonRandom Forests as an extension of the classification trees with the R and Python programsinfo:eu-repo/semantics/articleArtículoLICENSElicense.txtlicense.txttext/plain; charset=utf-81748https://repositorio.ulima.edu.pe/bitstream/20.500.12724/5560/2/license.txt8a4605be74aa9ea9d79846c1fba20a33MD5220.500.12724/5560oai:repositorio.ulima.edu.pe:20.500.12724/55602024-10-23 11:34:48.094Repositorio Universidad de Limarepositorio@ulima.edu.peTk9URTogUExBQ0UgWU9VUiBPV04gTElDRU5TRSBIRVJFClRoaXMgc2FtcGxlIGxpY2Vuc2UgaXMgcHJvdmlkZWQgZm9yIGluZm9ybWF0aW9uYWwgcHVycG9zZXMgb25seS4KCk5PTi1FWENMVVNJVkUgRElTVFJJQlVUSU9OIExJQ0VOU0UKCkJ5IHNpZ25pbmcgYW5kIHN1Ym1pdHRpbmcgdGhpcyBsaWNlbnNlLCB5b3UgKHRoZSBhdXRob3Iocykgb3IgY29weXJpZ2h0Cm93bmVyKSBncmFudHMgdG8gRFNwYWNlIFVuaXZlcnNpdHkgKERTVSkgdGhlIG5vbi1leGNsdXNpdmUgcmlnaHQgdG8gcmVwcm9kdWNlLAp0cmFuc2xhdGUgKGFzIGRlZmluZWQgYmVsb3cpLCBhbmQvb3IgZGlzdHJpYnV0ZSB5b3VyIHN1Ym1pc3Npb24gKGluY2x1ZGluZwp0aGUgYWJzdHJhY3QpIHdvcmxkd2lkZSBpbiBwcmludCBhbmQgZWxlY3Ryb25pYyBmb3JtYXQgYW5kIGluIGFueSBtZWRpdW0sCmluY2x1ZGluZyBidXQgbm90IGxpbWl0ZWQgdG8gYXVkaW8gb3IgdmlkZW8uCgpZb3UgYWdyZWUgdGhhdCBEU1UgbWF5LCB3aXRob3V0IGNoYW5naW5nIHRoZSBjb250ZW50LCB0cmFuc2xhdGUgdGhlCnN1Ym1pc3Npb24gdG8gYW55IG1lZGl1bSBvciBmb3JtYXQgZm9yIHRoZSBwdXJwb3NlIG9mIHByZXNlcnZhdGlvbi4KCllvdSBhbHNvIGFncmVlIHRoYXQgRFNVIG1heSBrZWVwIG1vcmUgdGhhbiBvbmUgY29weSBvZiB0aGlzIHN1Ym1pc3Npb24gZm9yCnB1cnBvc2VzIG9mIHNlY3VyaXR5LCBiYWNrLXVwIGFuZCBwcmVzZXJ2YXRpb24uCgpZb3UgcmVwcmVzZW50IHRoYXQgdGhlIHN1Ym1pc3Npb24gaXMgeW91ciBvcmlnaW5hbCB3b3JrLCBhbmQgdGhhdCB5b3UgaGF2ZQp0aGUgcmlnaHQgdG8gZ3JhbnQgdGhlIHJpZ2h0cyBjb250YWluZWQgaW4gdGhpcyBsaWNlbnNlLiBZb3UgYWxzbyByZXByZXNlbnQKdGhhdCB5b3VyIHN1Ym1pc3Npb24gZG9lcyBub3QsIHRvIHRoZSBiZXN0IG9mIHlvdXIga25vd2xlZGdlLCBpbmZyaW5nZSB1cG9uCmFueW9uZSdzIGNvcHlyaWdodC4KCklmIHRoZSBzdWJtaXNzaW9uIGNvbnRhaW5zIG1hdGVyaWFsIGZvciB3aGljaCB5b3UgZG8gbm90IGhvbGQgY29weXJpZ2h0LAp5b3UgcmVwcmVzZW50IHRoYXQgeW91IGhhdmUgb2J0YWluZWQgdGhlIHVucmVzdHJpY3RlZCBwZXJtaXNzaW9uIG9mIHRoZQpjb3B5cmlnaHQgb3duZXIgdG8gZ3JhbnQgRFNVIHRoZSByaWdodHMgcmVxdWlyZWQgYnkgdGhpcyBsaWNlbnNlLCBhbmQgdGhhdApzdWNoIHRoaXJkLXBhcnR5IG93bmVkIG1hdGVyaWFsIGlzIGNsZWFybHkgaWRlbnRpZmllZCBhbmQgYWNrbm93bGVkZ2VkCndpdGhpbiB0aGUgdGV4dCBvciBjb250ZW50IG9mIHRoZSBzdWJtaXNzaW9uLgoKSUYgVEhFIFNVQk1JU1NJT04gSVMgQkFTRUQgVVBPTiBXT1JLIFRIQVQgSEFTIEJFRU4gU1BPTlNPUkVEIE9SIFNVUFBPUlRFRApCWSBBTiBBR0VOQ1kgT1IgT1JHQU5JWkFUSU9OIE9USEVSIFRIQU4gRFNVLCBZT1UgUkVQUkVTRU5UIFRIQVQgWU9VIEhBVkUKRlVMRklMTEVEIEFOWSBSSUdIVCBPRiBSRVZJRVcgT1IgT1RIRVIgT0JMSUdBVElPTlMgUkVRVUlSRUQgQlkgU1VDSApDT05UUkFDVCBPUiBBR1JFRU1FTlQuCgpEU1Ugd2lsbCBjbGVhcmx5IGlkZW50aWZ5IHlvdXIgbmFtZShzKSBhcyB0aGUgYXV0aG9yKHMpIG9yIG93bmVyKHMpIG9mIHRoZQpzdWJtaXNzaW9uLCBhbmQgd2lsbCBub3QgbWFrZSBhbnkgYWx0ZXJhdGlvbiwgb3RoZXIgdGhhbiBhcyBhbGxvd2VkIGJ5IHRoaXMKbGljZW5zZSwgdG8geW91ciBzdWJtaXNzaW9uLgo=
score 13.098099
Nota importante:
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).