Optimización del clasificador “Naive Bayes” usando árbol de decisión C4.5

Descripción del Articulo

El clasificador Naive Bayes es uno de los modelos de clasificación más efectivos, debido a su simplicidad, resistencia al ruido, poco tiempo de procesamiento y alto poder predictivo. El clasificador Naive Bayes asume una fuerte suposición de independencia entre las variables predictoras dada la clas...

Descripción completa

Detalles Bibliográficos
Autor: Alarcón Jaimes, Carlos
Formato: tesis de maestría
Fecha de Publicación:2015
Institución:Universidad Nacional Mayor de San Marcos
Repositorio:UNMSM-Tesis
Lenguaje:español
OAI Identifier:oai:cybertesis.unmsm.edu.pe:20.500.12672/4183
Enlace del recurso:https://hdl.handle.net/20.500.12672/4183
Nivel de acceso:acceso abierto
Materia:Redes bayesianas
Clasificador bayesiano
Naive Bayes
Árbol de decisión C4.5
https://purl.org/pe-repo/ocde/ford#1.01.00
id UNMS_5dc65d4804b1d9d80715797cd80da6a6
oai_identifier_str oai:cybertesis.unmsm.edu.pe:20.500.12672/4183
network_acronym_str UNMS
network_name_str UNMSM-Tesis
repository_id_str 410
dc.title.none.fl_str_mv Optimización del clasificador “Naive Bayes” usando árbol de decisión C4.5
title Optimización del clasificador “Naive Bayes” usando árbol de decisión C4.5
spellingShingle Optimización del clasificador “Naive Bayes” usando árbol de decisión C4.5
Alarcón Jaimes, Carlos
Redes bayesianas
Clasificador bayesiano
Naive Bayes
Árbol de decisión C4.5
https://purl.org/pe-repo/ocde/ford#1.01.00
title_short Optimización del clasificador “Naive Bayes” usando árbol de decisión C4.5
title_full Optimización del clasificador “Naive Bayes” usando árbol de decisión C4.5
title_fullStr Optimización del clasificador “Naive Bayes” usando árbol de decisión C4.5
title_full_unstemmed Optimización del clasificador “Naive Bayes” usando árbol de decisión C4.5
title_sort Optimización del clasificador “Naive Bayes” usando árbol de decisión C4.5
author Alarcón Jaimes, Carlos
author_facet Alarcón Jaimes, Carlos
author_role author
dc.contributor.advisor.fl_str_mv Cambillo Moyano, Emma Norma
dc.contributor.author.fl_str_mv Alarcón Jaimes, Carlos
dc.subject.none.fl_str_mv Redes bayesianas
Clasificador bayesiano
Naive Bayes
Árbol de decisión C4.5
topic Redes bayesianas
Clasificador bayesiano
Naive Bayes
Árbol de decisión C4.5
https://purl.org/pe-repo/ocde/ford#1.01.00
dc.subject.ocde.none.fl_str_mv https://purl.org/pe-repo/ocde/ford#1.01.00
description El clasificador Naive Bayes es uno de los modelos de clasificación más efectivos, debido a su simplicidad, resistencia al ruido, poco tiempo de procesamiento y alto poder predictivo. El clasificador Naive Bayes asume una fuerte suposición de independencia entre las variables predictoras dada la clase, lo que generalmente no se cumple. Muchas investigaciones buscan mejorar el poder predictivo del clasificador relajando esta suposición de independencia, como el escoger un subconjunto de variables que sean independientes o aproximadamente independientes. En este trabajo, se presenta un método que busca optimizar el clasificador Naive Bayes usando el árbol de decisión C4.5. Este método, selecciona un subconjunto de variables del conjunto de datos usando el árbol de decisión C4.5 inducido y luego aplica el clasificador Naive Bayes a estas variables seleccionadas. Con el uso previo del árbol de decisión C4.5 se consigue remover las variables redundantes y/o irrelevantes del conjunto de datos y escoger las que son más informativas en tareas de clasificación, y de esta forma mejorar el poder predictivo del clasificador. Este método es ilustrado utilizando tres conjuntos de datos provenientes del repositorio UCI , Irvin Repository of Machine Learning databases de la Universidad de California y un conjunto de datos proveniente de la Encuesta Nacional de Hogares del Instituto Nacional de Estadística e Informática del Perú, ENAHO – INEI, e implementado con el programa WEKA.
publishDate 2015
dc.date.accessioned.none.fl_str_mv 2015-04-30T17:24:27Z
2015-04-30T17:24:40Z
dc.date.available.none.fl_str_mv 2015-04-30T17:24:27Z
2015-04-30T17:24:40Z
dc.date.issued.fl_str_mv 2015
dc.type.none.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
dc.identifier.citation.none.fl_str_mv Alarcón, C. (2015). Optimización del clasificador "Naive Bayes" usando árbol de decisión C4.5. [Tesis de maestría, Universidad Nacional Mayor de San Marcos, Facultad de Ciencias Matemáticas, Unidad de Posgrado]. Repositorio institucional Cybertesis UNMSM.
dc.identifier.uri.none.fl_str_mv https://hdl.handle.net/20.500.12672/4183
identifier_str_mv Alarcón, C. (2015). Optimización del clasificador "Naive Bayes" usando árbol de decisión C4.5. [Tesis de maestría, Universidad Nacional Mayor de San Marcos, Facultad de Ciencias Matemáticas, Unidad de Posgrado]. Repositorio institucional Cybertesis UNMSM.
url https://hdl.handle.net/20.500.12672/4183
dc.language.iso.none.fl_str_mv spa
language spa
dc.relation.ispartof.fl_str_mv SUNEDU
dc.rights.none.fl_str_mv info:eu-repo/semantics/openAccess
dc.rights.uri.none.fl_str_mv https://creativecommons.org/licenses/by-nc-sa/4.0/
eu_rights_str_mv openAccess
rights_invalid_str_mv https://creativecommons.org/licenses/by-nc-sa/4.0/
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Universidad Nacional Mayor de San Marcos
dc.publisher.country.none.fl_str_mv PE
publisher.none.fl_str_mv Universidad Nacional Mayor de San Marcos
dc.source.none.fl_str_mv Universidad Nacional Mayor de San Marcos
Repositorio de Tesis - UNMSM
reponame:UNMSM-Tesis
instname:Universidad Nacional Mayor de San Marcos
instacron:UNMSM
instname_str Universidad Nacional Mayor de San Marcos
instacron_str UNMSM
institution UNMSM
reponame_str UNMSM-Tesis
collection UNMSM-Tesis
bitstream.url.fl_str_mv https://cybertesis.unmsm.edu.pe/bitstreams/27bd00cc-6513-453d-b2bd-a279927e4170/download
https://cybertesis.unmsm.edu.pe/bitstreams/d4b88d34-dd01-407e-bbe0-02a0e79b3d7b/download
https://cybertesis.unmsm.edu.pe/bitstreams/67cb7526-5c5c-4cb5-9aa0-04c936beb9ff/download
https://cybertesis.unmsm.edu.pe/bitstreams/cb9dfb6b-fa86-4de4-844c-312430fc0e31/download
bitstream.checksum.fl_str_mv 8a4605be74aa9ea9d79846c1fba20a33
77285a9abc6766519d644df4edf64147
0d5b4cee23cb475b6f85518ff6fecbcb
952dfc2680a851c5b383a20c9fb677d4
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
MD5
repository.name.fl_str_mv Cybertesis UNMSM
repository.mail.fl_str_mv cybertesis@unmsm.edu.pe
_version_ 1847252400152248320
spelling Cambillo Moyano, Emma NormaAlarcón Jaimes, Carlos2015-04-30T17:24:27Z2015-04-30T17:24:40Z2015-04-30T17:24:27Z2015-04-30T17:24:40Z2015Alarcón, C. (2015). Optimización del clasificador "Naive Bayes" usando árbol de decisión C4.5. [Tesis de maestría, Universidad Nacional Mayor de San Marcos, Facultad de Ciencias Matemáticas, Unidad de Posgrado]. Repositorio institucional Cybertesis UNMSM.https://hdl.handle.net/20.500.12672/4183El clasificador Naive Bayes es uno de los modelos de clasificación más efectivos, debido a su simplicidad, resistencia al ruido, poco tiempo de procesamiento y alto poder predictivo. El clasificador Naive Bayes asume una fuerte suposición de independencia entre las variables predictoras dada la clase, lo que generalmente no se cumple. Muchas investigaciones buscan mejorar el poder predictivo del clasificador relajando esta suposición de independencia, como el escoger un subconjunto de variables que sean independientes o aproximadamente independientes. En este trabajo, se presenta un método que busca optimizar el clasificador Naive Bayes usando el árbol de decisión C4.5. Este método, selecciona un subconjunto de variables del conjunto de datos usando el árbol de decisión C4.5 inducido y luego aplica el clasificador Naive Bayes a estas variables seleccionadas. Con el uso previo del árbol de decisión C4.5 se consigue remover las variables redundantes y/o irrelevantes del conjunto de datos y escoger las que son más informativas en tareas de clasificación, y de esta forma mejorar el poder predictivo del clasificador. Este método es ilustrado utilizando tres conjuntos de datos provenientes del repositorio UCI , Irvin Repository of Machine Learning databases de la Universidad de California y un conjunto de datos proveniente de la Encuesta Nacional de Hogares del Instituto Nacional de Estadística e Informática del Perú, ENAHO – INEI, e implementado con el programa WEKA.Tesisapplication/pdfspaUniversidad Nacional Mayor de San MarcosPEinfo:eu-repo/semantics/openAccesshttps://creativecommons.org/licenses/by-nc-sa/4.0/Universidad Nacional Mayor de San MarcosRepositorio de Tesis - UNMSMreponame:UNMSM-Tesisinstname:Universidad Nacional Mayor de San Marcosinstacron:UNMSMRedes bayesianasClasificador bayesianoNaive BayesÁrbol de decisión C4.5https://purl.org/pe-repo/ocde/ford#1.01.00Optimización del clasificador “Naive Bayes” usando árbol de decisión C4.5info:eu-repo/semantics/masterThesisSUNEDUMagíster en EstadísticaUniversidad Nacional Mayor de San Marcos. Facultad de Ciencias Matemáticas. Unidad de PosgradoEstadística15377390https://orcid.org/0000-0003-3173-942509786431542067Kraenau Espinal, ErwinDomínguez Cirilo, Wilfredo EugenioBullón Cuadrado, Rosario ZorinaSolano Dávila, Olga Lidiahttps://purl.org/pe-repo/renati/level#maestrohttps://purl.org/pe-repo/renati/type#tesis07772101083894290675503209118212LICENSElicense.txtlicense.txttext/plain; charset=utf-81748https://cybertesis.unmsm.edu.pe/bitstreams/27bd00cc-6513-453d-b2bd-a279927e4170/download8a4605be74aa9ea9d79846c1fba20a33MD52ORIGINALAlarcón_jc.pdfAlarcón_jc.pdfapplication/pdf2318474https://cybertesis.unmsm.edu.pe/bitstreams/d4b88d34-dd01-407e-bbe0-02a0e79b3d7b/download77285a9abc6766519d644df4edf64147MD53TEXTAlarcón_jc.pdf.txtAlarcón_jc.pdf.txtExtracted texttext/plain101356https://cybertesis.unmsm.edu.pe/bitstreams/67cb7526-5c5c-4cb5-9aa0-04c936beb9ff/download0d5b4cee23cb475b6f85518ff6fecbcbMD56THUMBNAILAlarcón_jc.pdf.jpgAlarcón_jc.pdf.jpgGenerated Thumbnailimage/jpeg13452https://cybertesis.unmsm.edu.pe/bitstreams/cb9dfb6b-fa86-4de4-844c-312430fc0e31/download952dfc2680a851c5b383a20c9fb677d4MD5720.500.12672/4183oai:cybertesis.unmsm.edu.pe:20.500.12672/41832025-02-20 14:57:43.277https://creativecommons.org/licenses/by-nc-sa/4.0/info:eu-repo/semantics/openAccessopen.accesshttps://cybertesis.unmsm.edu.peCybertesis UNMSMcybertesis@unmsm.edu.peTk9URTogUExBQ0UgWU9VUiBPV04gTElDRU5TRSBIRVJFClRoaXMgc2FtcGxlIGxpY2Vuc2UgaXMgcHJvdmlkZWQgZm9yIGluZm9ybWF0aW9uYWwgcHVycG9zZXMgb25seS4KCk5PTi1FWENMVVNJVkUgRElTVFJJQlVUSU9OIExJQ0VOU0UKCkJ5IHNpZ25pbmcgYW5kIHN1Ym1pdHRpbmcgdGhpcyBsaWNlbnNlLCB5b3UgKHRoZSBhdXRob3Iocykgb3IgY29weXJpZ2h0Cm93bmVyKSBncmFudHMgdG8gRFNwYWNlIFVuaXZlcnNpdHkgKERTVSkgdGhlIG5vbi1leGNsdXNpdmUgcmlnaHQgdG8gcmVwcm9kdWNlLAp0cmFuc2xhdGUgKGFzIGRlZmluZWQgYmVsb3cpLCBhbmQvb3IgZGlzdHJpYnV0ZSB5b3VyIHN1Ym1pc3Npb24gKGluY2x1ZGluZwp0aGUgYWJzdHJhY3QpIHdvcmxkd2lkZSBpbiBwcmludCBhbmQgZWxlY3Ryb25pYyBmb3JtYXQgYW5kIGluIGFueSBtZWRpdW0sCmluY2x1ZGluZyBidXQgbm90IGxpbWl0ZWQgdG8gYXVkaW8gb3IgdmlkZW8uCgpZb3UgYWdyZWUgdGhhdCBEU1UgbWF5LCB3aXRob3V0IGNoYW5naW5nIHRoZSBjb250ZW50LCB0cmFuc2xhdGUgdGhlCnN1Ym1pc3Npb24gdG8gYW55IG1lZGl1bSBvciBmb3JtYXQgZm9yIHRoZSBwdXJwb3NlIG9mIHByZXNlcnZhdGlvbi4KCllvdSBhbHNvIGFncmVlIHRoYXQgRFNVIG1heSBrZWVwIG1vcmUgdGhhbiBvbmUgY29weSBvZiB0aGlzIHN1Ym1pc3Npb24gZm9yCnB1cnBvc2VzIG9mIHNlY3VyaXR5LCBiYWNrLXVwIGFuZCBwcmVzZXJ2YXRpb24uCgpZb3UgcmVwcmVzZW50IHRoYXQgdGhlIHN1Ym1pc3Npb24gaXMgeW91ciBvcmlnaW5hbCB3b3JrLCBhbmQgdGhhdCB5b3UgaGF2ZQp0aGUgcmlnaHQgdG8gZ3JhbnQgdGhlIHJpZ2h0cyBjb250YWluZWQgaW4gdGhpcyBsaWNlbnNlLiBZb3UgYWxzbyByZXByZXNlbnQKdGhhdCB5b3VyIHN1Ym1pc3Npb24gZG9lcyBub3QsIHRvIHRoZSBiZXN0IG9mIHlvdXIga25vd2xlZGdlLCBpbmZyaW5nZSB1cG9uCmFueW9uZSdzIGNvcHlyaWdodC4KCklmIHRoZSBzdWJtaXNzaW9uIGNvbnRhaW5zIG1hdGVyaWFsIGZvciB3aGljaCB5b3UgZG8gbm90IGhvbGQgY29weXJpZ2h0LAp5b3UgcmVwcmVzZW50IHRoYXQgeW91IGhhdmUgb2J0YWluZWQgdGhlIHVucmVzdHJpY3RlZCBwZXJtaXNzaW9uIG9mIHRoZQpjb3B5cmlnaHQgb3duZXIgdG8gZ3JhbnQgRFNVIHRoZSByaWdodHMgcmVxdWlyZWQgYnkgdGhpcyBsaWNlbnNlLCBhbmQgdGhhdApzdWNoIHRoaXJkLXBhcnR5IG93bmVkIG1hdGVyaWFsIGlzIGNsZWFybHkgaWRlbnRpZmllZCBhbmQgYWNrbm93bGVkZ2VkCndpdGhpbiB0aGUgdGV4dCBvciBjb250ZW50IG9mIHRoZSBzdWJtaXNzaW9uLgoKSUYgVEhFIFNVQk1JU1NJT04gSVMgQkFTRUQgVVBPTiBXT1JLIFRIQVQgSEFTIEJFRU4gU1BPTlNPUkVEIE9SIFNVUFBPUlRFRApCWSBBTiBBR0VOQ1kgT1IgT1JHQU5JWkFUSU9OIE9USEVSIFRIQU4gRFNVLCBZT1UgUkVQUkVTRU5UIFRIQVQgWU9VIEhBVkUKRlVMRklMTEVEIEFOWSBSSUdIVCBPRiBSRVZJRVcgT1IgT1RIRVIgT0JMSUdBVElPTlMgUkVRVUlSRUQgQlkgU1VDSApDT05UUkFDVCBPUiBBR1JFRU1FTlQuCgpEU1Ugd2lsbCBjbGVhcmx5IGlkZW50aWZ5IHlvdXIgbmFtZShzKSBhcyB0aGUgYXV0aG9yKHMpIG9yIG93bmVyKHMpIG9mIHRoZQpzdWJtaXNzaW9uLCBhbmQgd2lsbCBub3QgbWFrZSBhbnkgYWx0ZXJhdGlvbiwgb3RoZXIgdGhhbiBhcyBhbGxvd2VkIGJ5IHRoaXMKbGljZW5zZSwgdG8geW91ciBzdWJtaXNzaW9uLgo=
score 13.108393
Nota importante:
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).