Optimización del clasificador “Naive Bayes” usando árbol de decisión C4.5
Descripción del Articulo
El clasificador Naive Bayes es uno de los modelos de clasificación más efectivos, debido a su simplicidad, resistencia al ruido, poco tiempo de procesamiento y alto poder predictivo. El clasificador Naive Bayes asume una fuerte suposición de independencia entre las variables predictoras dada la clas...
| Autor: | |
|---|---|
| Formato: | tesis de maestría |
| Fecha de Publicación: | 2015 |
| Institución: | Universidad Nacional Mayor de San Marcos |
| Repositorio: | UNMSM-Tesis |
| Lenguaje: | español |
| OAI Identifier: | oai:cybertesis.unmsm.edu.pe:20.500.12672/4183 |
| Enlace del recurso: | https://hdl.handle.net/20.500.12672/4183 |
| Nivel de acceso: | acceso abierto |
| Materia: | Redes bayesianas Clasificador bayesiano Naive Bayes Árbol de decisión C4.5 https://purl.org/pe-repo/ocde/ford#1.01.00 |
| id |
UNMS_5dc65d4804b1d9d80715797cd80da6a6 |
|---|---|
| oai_identifier_str |
oai:cybertesis.unmsm.edu.pe:20.500.12672/4183 |
| network_acronym_str |
UNMS |
| network_name_str |
UNMSM-Tesis |
| repository_id_str |
410 |
| dc.title.none.fl_str_mv |
Optimización del clasificador “Naive Bayes” usando árbol de decisión C4.5 |
| title |
Optimización del clasificador “Naive Bayes” usando árbol de decisión C4.5 |
| spellingShingle |
Optimización del clasificador “Naive Bayes” usando árbol de decisión C4.5 Alarcón Jaimes, Carlos Redes bayesianas Clasificador bayesiano Naive Bayes Árbol de decisión C4.5 https://purl.org/pe-repo/ocde/ford#1.01.00 |
| title_short |
Optimización del clasificador “Naive Bayes” usando árbol de decisión C4.5 |
| title_full |
Optimización del clasificador “Naive Bayes” usando árbol de decisión C4.5 |
| title_fullStr |
Optimización del clasificador “Naive Bayes” usando árbol de decisión C4.5 |
| title_full_unstemmed |
Optimización del clasificador “Naive Bayes” usando árbol de decisión C4.5 |
| title_sort |
Optimización del clasificador “Naive Bayes” usando árbol de decisión C4.5 |
| author |
Alarcón Jaimes, Carlos |
| author_facet |
Alarcón Jaimes, Carlos |
| author_role |
author |
| dc.contributor.advisor.fl_str_mv |
Cambillo Moyano, Emma Norma |
| dc.contributor.author.fl_str_mv |
Alarcón Jaimes, Carlos |
| dc.subject.none.fl_str_mv |
Redes bayesianas Clasificador bayesiano Naive Bayes Árbol de decisión C4.5 |
| topic |
Redes bayesianas Clasificador bayesiano Naive Bayes Árbol de decisión C4.5 https://purl.org/pe-repo/ocde/ford#1.01.00 |
| dc.subject.ocde.none.fl_str_mv |
https://purl.org/pe-repo/ocde/ford#1.01.00 |
| description |
El clasificador Naive Bayes es uno de los modelos de clasificación más efectivos, debido a su simplicidad, resistencia al ruido, poco tiempo de procesamiento y alto poder predictivo. El clasificador Naive Bayes asume una fuerte suposición de independencia entre las variables predictoras dada la clase, lo que generalmente no se cumple. Muchas investigaciones buscan mejorar el poder predictivo del clasificador relajando esta suposición de independencia, como el escoger un subconjunto de variables que sean independientes o aproximadamente independientes. En este trabajo, se presenta un método que busca optimizar el clasificador Naive Bayes usando el árbol de decisión C4.5. Este método, selecciona un subconjunto de variables del conjunto de datos usando el árbol de decisión C4.5 inducido y luego aplica el clasificador Naive Bayes a estas variables seleccionadas. Con el uso previo del árbol de decisión C4.5 se consigue remover las variables redundantes y/o irrelevantes del conjunto de datos y escoger las que son más informativas en tareas de clasificación, y de esta forma mejorar el poder predictivo del clasificador. Este método es ilustrado utilizando tres conjuntos de datos provenientes del repositorio UCI , Irvin Repository of Machine Learning databases de la Universidad de California y un conjunto de datos proveniente de la Encuesta Nacional de Hogares del Instituto Nacional de Estadística e Informática del Perú, ENAHO – INEI, e implementado con el programa WEKA. |
| publishDate |
2015 |
| dc.date.accessioned.none.fl_str_mv |
2015-04-30T17:24:27Z 2015-04-30T17:24:40Z |
| dc.date.available.none.fl_str_mv |
2015-04-30T17:24:27Z 2015-04-30T17:24:40Z |
| dc.date.issued.fl_str_mv |
2015 |
| dc.type.none.fl_str_mv |
info:eu-repo/semantics/masterThesis |
| format |
masterThesis |
| dc.identifier.citation.none.fl_str_mv |
Alarcón, C. (2015). Optimización del clasificador "Naive Bayes" usando árbol de decisión C4.5. [Tesis de maestría, Universidad Nacional Mayor de San Marcos, Facultad de Ciencias Matemáticas, Unidad de Posgrado]. Repositorio institucional Cybertesis UNMSM. |
| dc.identifier.uri.none.fl_str_mv |
https://hdl.handle.net/20.500.12672/4183 |
| identifier_str_mv |
Alarcón, C. (2015). Optimización del clasificador "Naive Bayes" usando árbol de decisión C4.5. [Tesis de maestría, Universidad Nacional Mayor de San Marcos, Facultad de Ciencias Matemáticas, Unidad de Posgrado]. Repositorio institucional Cybertesis UNMSM. |
| url |
https://hdl.handle.net/20.500.12672/4183 |
| dc.language.iso.none.fl_str_mv |
spa |
| language |
spa |
| dc.relation.ispartof.fl_str_mv |
SUNEDU |
| dc.rights.none.fl_str_mv |
info:eu-repo/semantics/openAccess |
| dc.rights.uri.none.fl_str_mv |
https://creativecommons.org/licenses/by-nc-sa/4.0/ |
| eu_rights_str_mv |
openAccess |
| rights_invalid_str_mv |
https://creativecommons.org/licenses/by-nc-sa/4.0/ |
| dc.format.none.fl_str_mv |
application/pdf |
| dc.publisher.none.fl_str_mv |
Universidad Nacional Mayor de San Marcos |
| dc.publisher.country.none.fl_str_mv |
PE |
| publisher.none.fl_str_mv |
Universidad Nacional Mayor de San Marcos |
| dc.source.none.fl_str_mv |
Universidad Nacional Mayor de San Marcos Repositorio de Tesis - UNMSM reponame:UNMSM-Tesis instname:Universidad Nacional Mayor de San Marcos instacron:UNMSM |
| instname_str |
Universidad Nacional Mayor de San Marcos |
| instacron_str |
UNMSM |
| institution |
UNMSM |
| reponame_str |
UNMSM-Tesis |
| collection |
UNMSM-Tesis |
| bitstream.url.fl_str_mv |
https://cybertesis.unmsm.edu.pe/bitstreams/27bd00cc-6513-453d-b2bd-a279927e4170/download https://cybertesis.unmsm.edu.pe/bitstreams/d4b88d34-dd01-407e-bbe0-02a0e79b3d7b/download https://cybertesis.unmsm.edu.pe/bitstreams/67cb7526-5c5c-4cb5-9aa0-04c936beb9ff/download https://cybertesis.unmsm.edu.pe/bitstreams/cb9dfb6b-fa86-4de4-844c-312430fc0e31/download |
| bitstream.checksum.fl_str_mv |
8a4605be74aa9ea9d79846c1fba20a33 77285a9abc6766519d644df4edf64147 0d5b4cee23cb475b6f85518ff6fecbcb 952dfc2680a851c5b383a20c9fb677d4 |
| bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 MD5 |
| repository.name.fl_str_mv |
Cybertesis UNMSM |
| repository.mail.fl_str_mv |
cybertesis@unmsm.edu.pe |
| _version_ |
1847252400152248320 |
| spelling |
Cambillo Moyano, Emma NormaAlarcón Jaimes, Carlos2015-04-30T17:24:27Z2015-04-30T17:24:40Z2015-04-30T17:24:27Z2015-04-30T17:24:40Z2015Alarcón, C. (2015). Optimización del clasificador "Naive Bayes" usando árbol de decisión C4.5. [Tesis de maestría, Universidad Nacional Mayor de San Marcos, Facultad de Ciencias Matemáticas, Unidad de Posgrado]. Repositorio institucional Cybertesis UNMSM.https://hdl.handle.net/20.500.12672/4183El clasificador Naive Bayes es uno de los modelos de clasificación más efectivos, debido a su simplicidad, resistencia al ruido, poco tiempo de procesamiento y alto poder predictivo. El clasificador Naive Bayes asume una fuerte suposición de independencia entre las variables predictoras dada la clase, lo que generalmente no se cumple. Muchas investigaciones buscan mejorar el poder predictivo del clasificador relajando esta suposición de independencia, como el escoger un subconjunto de variables que sean independientes o aproximadamente independientes. En este trabajo, se presenta un método que busca optimizar el clasificador Naive Bayes usando el árbol de decisión C4.5. Este método, selecciona un subconjunto de variables del conjunto de datos usando el árbol de decisión C4.5 inducido y luego aplica el clasificador Naive Bayes a estas variables seleccionadas. Con el uso previo del árbol de decisión C4.5 se consigue remover las variables redundantes y/o irrelevantes del conjunto de datos y escoger las que son más informativas en tareas de clasificación, y de esta forma mejorar el poder predictivo del clasificador. Este método es ilustrado utilizando tres conjuntos de datos provenientes del repositorio UCI , Irvin Repository of Machine Learning databases de la Universidad de California y un conjunto de datos proveniente de la Encuesta Nacional de Hogares del Instituto Nacional de Estadística e Informática del Perú, ENAHO – INEI, e implementado con el programa WEKA.Tesisapplication/pdfspaUniversidad Nacional Mayor de San MarcosPEinfo:eu-repo/semantics/openAccesshttps://creativecommons.org/licenses/by-nc-sa/4.0/Universidad Nacional Mayor de San MarcosRepositorio de Tesis - UNMSMreponame:UNMSM-Tesisinstname:Universidad Nacional Mayor de San Marcosinstacron:UNMSMRedes bayesianasClasificador bayesianoNaive BayesÁrbol de decisión C4.5https://purl.org/pe-repo/ocde/ford#1.01.00Optimización del clasificador “Naive Bayes” usando árbol de decisión C4.5info:eu-repo/semantics/masterThesisSUNEDUMagíster en EstadísticaUniversidad Nacional Mayor de San Marcos. Facultad de Ciencias Matemáticas. Unidad de PosgradoEstadística15377390https://orcid.org/0000-0003-3173-942509786431542067Kraenau Espinal, ErwinDomínguez Cirilo, Wilfredo EugenioBullón Cuadrado, Rosario ZorinaSolano Dávila, Olga Lidiahttps://purl.org/pe-repo/renati/level#maestrohttps://purl.org/pe-repo/renati/type#tesis07772101083894290675503209118212LICENSElicense.txtlicense.txttext/plain; charset=utf-81748https://cybertesis.unmsm.edu.pe/bitstreams/27bd00cc-6513-453d-b2bd-a279927e4170/download8a4605be74aa9ea9d79846c1fba20a33MD52ORIGINALAlarcón_jc.pdfAlarcón_jc.pdfapplication/pdf2318474https://cybertesis.unmsm.edu.pe/bitstreams/d4b88d34-dd01-407e-bbe0-02a0e79b3d7b/download77285a9abc6766519d644df4edf64147MD53TEXTAlarcón_jc.pdf.txtAlarcón_jc.pdf.txtExtracted texttext/plain101356https://cybertesis.unmsm.edu.pe/bitstreams/67cb7526-5c5c-4cb5-9aa0-04c936beb9ff/download0d5b4cee23cb475b6f85518ff6fecbcbMD56THUMBNAILAlarcón_jc.pdf.jpgAlarcón_jc.pdf.jpgGenerated Thumbnailimage/jpeg13452https://cybertesis.unmsm.edu.pe/bitstreams/cb9dfb6b-fa86-4de4-844c-312430fc0e31/download952dfc2680a851c5b383a20c9fb677d4MD5720.500.12672/4183oai:cybertesis.unmsm.edu.pe:20.500.12672/41832025-02-20 14:57:43.277https://creativecommons.org/licenses/by-nc-sa/4.0/info:eu-repo/semantics/openAccessopen.accesshttps://cybertesis.unmsm.edu.peCybertesis UNMSMcybertesis@unmsm.edu.peTk9URTogUExBQ0UgWU9VUiBPV04gTElDRU5TRSBIRVJFClRoaXMgc2FtcGxlIGxpY2Vuc2UgaXMgcHJvdmlkZWQgZm9yIGluZm9ybWF0aW9uYWwgcHVycG9zZXMgb25seS4KCk5PTi1FWENMVVNJVkUgRElTVFJJQlVUSU9OIExJQ0VOU0UKCkJ5IHNpZ25pbmcgYW5kIHN1Ym1pdHRpbmcgdGhpcyBsaWNlbnNlLCB5b3UgKHRoZSBhdXRob3Iocykgb3IgY29weXJpZ2h0Cm93bmVyKSBncmFudHMgdG8gRFNwYWNlIFVuaXZlcnNpdHkgKERTVSkgdGhlIG5vbi1leGNsdXNpdmUgcmlnaHQgdG8gcmVwcm9kdWNlLAp0cmFuc2xhdGUgKGFzIGRlZmluZWQgYmVsb3cpLCBhbmQvb3IgZGlzdHJpYnV0ZSB5b3VyIHN1Ym1pc3Npb24gKGluY2x1ZGluZwp0aGUgYWJzdHJhY3QpIHdvcmxkd2lkZSBpbiBwcmludCBhbmQgZWxlY3Ryb25pYyBmb3JtYXQgYW5kIGluIGFueSBtZWRpdW0sCmluY2x1ZGluZyBidXQgbm90IGxpbWl0ZWQgdG8gYXVkaW8gb3IgdmlkZW8uCgpZb3UgYWdyZWUgdGhhdCBEU1UgbWF5LCB3aXRob3V0IGNoYW5naW5nIHRoZSBjb250ZW50LCB0cmFuc2xhdGUgdGhlCnN1Ym1pc3Npb24gdG8gYW55IG1lZGl1bSBvciBmb3JtYXQgZm9yIHRoZSBwdXJwb3NlIG9mIHByZXNlcnZhdGlvbi4KCllvdSBhbHNvIGFncmVlIHRoYXQgRFNVIG1heSBrZWVwIG1vcmUgdGhhbiBvbmUgY29weSBvZiB0aGlzIHN1Ym1pc3Npb24gZm9yCnB1cnBvc2VzIG9mIHNlY3VyaXR5LCBiYWNrLXVwIGFuZCBwcmVzZXJ2YXRpb24uCgpZb3UgcmVwcmVzZW50IHRoYXQgdGhlIHN1Ym1pc3Npb24gaXMgeW91ciBvcmlnaW5hbCB3b3JrLCBhbmQgdGhhdCB5b3UgaGF2ZQp0aGUgcmlnaHQgdG8gZ3JhbnQgdGhlIHJpZ2h0cyBjb250YWluZWQgaW4gdGhpcyBsaWNlbnNlLiBZb3UgYWxzbyByZXByZXNlbnQKdGhhdCB5b3VyIHN1Ym1pc3Npb24gZG9lcyBub3QsIHRvIHRoZSBiZXN0IG9mIHlvdXIga25vd2xlZGdlLCBpbmZyaW5nZSB1cG9uCmFueW9uZSdzIGNvcHlyaWdodC4KCklmIHRoZSBzdWJtaXNzaW9uIGNvbnRhaW5zIG1hdGVyaWFsIGZvciB3aGljaCB5b3UgZG8gbm90IGhvbGQgY29weXJpZ2h0LAp5b3UgcmVwcmVzZW50IHRoYXQgeW91IGhhdmUgb2J0YWluZWQgdGhlIHVucmVzdHJpY3RlZCBwZXJtaXNzaW9uIG9mIHRoZQpjb3B5cmlnaHQgb3duZXIgdG8gZ3JhbnQgRFNVIHRoZSByaWdodHMgcmVxdWlyZWQgYnkgdGhpcyBsaWNlbnNlLCBhbmQgdGhhdApzdWNoIHRoaXJkLXBhcnR5IG93bmVkIG1hdGVyaWFsIGlzIGNsZWFybHkgaWRlbnRpZmllZCBhbmQgYWNrbm93bGVkZ2VkCndpdGhpbiB0aGUgdGV4dCBvciBjb250ZW50IG9mIHRoZSBzdWJtaXNzaW9uLgoKSUYgVEhFIFNVQk1JU1NJT04gSVMgQkFTRUQgVVBPTiBXT1JLIFRIQVQgSEFTIEJFRU4gU1BPTlNPUkVEIE9SIFNVUFBPUlRFRApCWSBBTiBBR0VOQ1kgT1IgT1JHQU5JWkFUSU9OIE9USEVSIFRIQU4gRFNVLCBZT1UgUkVQUkVTRU5UIFRIQVQgWU9VIEhBVkUKRlVMRklMTEVEIEFOWSBSSUdIVCBPRiBSRVZJRVcgT1IgT1RIRVIgT0JMSUdBVElPTlMgUkVRVUlSRUQgQlkgU1VDSApDT05UUkFDVCBPUiBBR1JFRU1FTlQuCgpEU1Ugd2lsbCBjbGVhcmx5IGlkZW50aWZ5IHlvdXIgbmFtZShzKSBhcyB0aGUgYXV0aG9yKHMpIG9yIG93bmVyKHMpIG9mIHRoZQpzdWJtaXNzaW9uLCBhbmQgd2lsbCBub3QgbWFrZSBhbnkgYWx0ZXJhdGlvbiwgb3RoZXIgdGhhbiBhcyBhbGxvd2VkIGJ5IHRoaXMKbGljZW5zZSwgdG8geW91ciBzdWJtaXNzaW9uLgo= |
| score |
13.108393 |
Nota importante:
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).