Aprendizaje estadístico supervisado con máquina de soporte vectorial

Descripción del Articulo

Actualmente las organizaciones recolectan datos en grandes volúmenes y de fuentes muy variadas. Para dar sentido y convertir los datos en información útil es necesario utilizar técnicas que permitan encontrar y entender las relaciones ocultas en los datos. Generalmente, la relación que nos interesa...

Descripción completa

Detalles Bibliográficos
Autor: Falcón Cisneros, Sergio Daniel
Formato: tesis de maestría
Fecha de Publicación:2024
Institución:Pontificia Universidad Católica del Perú
Repositorio:PUCP-Tesis
Lenguaje:español
OAI Identifier:oai:tesis.pucp.edu.pe:20.500.12404/27176
Enlace del recurso:http://hdl.handle.net/20.500.12404/27176
Nivel de acceso:acceso abierto
Materia:Variables (Estadística)
Procesamiento de datos
Algoritmos--Aplicaciones
https://purl.org/pe-repo/ocde/ford#1.01.03
id PUCP_d445c8187b3fc98868f7c7199d0c38cd
oai_identifier_str oai:tesis.pucp.edu.pe:20.500.12404/27176
network_acronym_str PUCP
network_name_str PUCP-Tesis
repository_id_str .
dc.title.es_ES.fl_str_mv Aprendizaje estadístico supervisado con máquina de soporte vectorial
title Aprendizaje estadístico supervisado con máquina de soporte vectorial
spellingShingle Aprendizaje estadístico supervisado con máquina de soporte vectorial
Falcón Cisneros, Sergio Daniel
Variables (Estadística)
Procesamiento de datos
Algoritmos--Aplicaciones
https://purl.org/pe-repo/ocde/ford#1.01.03
title_short Aprendizaje estadístico supervisado con máquina de soporte vectorial
title_full Aprendizaje estadístico supervisado con máquina de soporte vectorial
title_fullStr Aprendizaje estadístico supervisado con máquina de soporte vectorial
title_full_unstemmed Aprendizaje estadístico supervisado con máquina de soporte vectorial
title_sort Aprendizaje estadístico supervisado con máquina de soporte vectorial
author Falcón Cisneros, Sergio Daniel
author_facet Falcón Cisneros, Sergio Daniel
author_role author
dc.contributor.advisor.fl_str_mv Véliz Capuñay, Carlos Nilberto
dc.contributor.author.fl_str_mv Falcón Cisneros, Sergio Daniel
dc.subject.es_ES.fl_str_mv Variables (Estadística)
Procesamiento de datos
Algoritmos--Aplicaciones
topic Variables (Estadística)
Procesamiento de datos
Algoritmos--Aplicaciones
https://purl.org/pe-repo/ocde/ford#1.01.03
dc.subject.ocde.es_ES.fl_str_mv https://purl.org/pe-repo/ocde/ford#1.01.03
description Actualmente las organizaciones recolectan datos en grandes volúmenes y de fuentes muy variadas. Para dar sentido y convertir los datos en información útil es necesario utilizar técnicas que permitan encontrar y entender las relaciones ocultas en los datos. Generalmente, la relación que nos interesa estudiar es cómo predecir un evento utilizando un conjunto de variables. Sin embargo, muchas veces la relación entre los datos es muy compleja y no puede ser analizada adecuadamente usando las técnicas más conocidas, dado que éstas suelen tener supuestos que no necesariamente se cumplen. Por ello, es importante conocer técnicas de análisis más complejas y flexibles. Esta tesis busca ser un instrumento de ayuda en el aprendizaje y uso de nuevas técnicas para estudiar los datos, lo cual es relevante sobre todo en el medio local en el que este tema es poco conocido. Con este objetivo, presenta una revisión introductoria de la teoría del aprendizaje estadístico, la cual provee del marco teórico para que distintos métodos utilicen los datos para aprender, y usando este conocimiento puedan hacer predicciones sobre datos nuevos o diferentes. Luego se centra en un estudio exhaustivo del método de aprendizaje de Máquinas de Soporte Vectorial (SVM por sus siglas en inglés), introduciendo y aplicando las funciones Kernel. Este método se puede entender como una representación de los datos como puntos en el espacio, asignados de tal forma que exista una brecha grande que separe a los elementos diferentes. Finalmente se pone en práctica la teoría estudiada aplicando el método SVM a datos de clientes de una entidad financiera. Esta entidad financiera usa predominantemente técnicas de aprendizaje estadístico simples y con varios supuestos; particularmente usa una de estas técnicas en un modelo que predice la propensión a la compra y persistencia del producto Seguro de Protección de Tarjetas. Por ello, la presente tesis se centra en aplicar el método SVM para construir una alternativa a este modelo.
publishDate 2024
dc.date.accessioned.none.fl_str_mv 2024-02-26T14:41:45Z
dc.date.available.none.fl_str_mv 2024-02-26T14:41:45Z
dc.date.created.none.fl_str_mv 2024
dc.date.issued.fl_str_mv 2024-02-26
dc.type.es_ES.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
dc.identifier.uri.none.fl_str_mv http://hdl.handle.net/20.500.12404/27176
url http://hdl.handle.net/20.500.12404/27176
dc.language.iso.es_ES.fl_str_mv spa
language spa
dc.relation.ispartof.fl_str_mv SUNEDU
dc.rights.es_ES.fl_str_mv info:eu-repo/semantics/openAccess
dc.rights.uri.*.fl_str_mv http://creativecommons.org/licenses/by/2.5/pe/
eu_rights_str_mv openAccess
rights_invalid_str_mv http://creativecommons.org/licenses/by/2.5/pe/
dc.publisher.es_ES.fl_str_mv Pontificia Universidad Católica del Perú
dc.publisher.country.es_ES.fl_str_mv PE
dc.source.none.fl_str_mv reponame:PUCP-Tesis
instname:Pontificia Universidad Católica del Perú
instacron:PUCP
instname_str Pontificia Universidad Católica del Perú
instacron_str PUCP
institution PUCP
reponame_str PUCP-Tesis
collection PUCP-Tesis
bitstream.url.fl_str_mv https://tesis.pucp.edu.pe/bitstreams/81b97ba0-c66e-4184-b464-4c30cb25c1ab/download
https://tesis.pucp.edu.pe/bitstreams/ca9ac1d1-da1f-4939-99db-cb2ebf6b9eaa/download
https://tesis.pucp.edu.pe/bitstreams/5391a790-87a5-4346-a762-5b12778f7eb5/download
https://tesis.pucp.edu.pe/bitstreams/02f5531f-97c2-47ca-a5b2-2a8cf600d4f8/download
https://tesis.pucp.edu.pe/bitstreams/aeac29b2-7928-4807-beef-1f2e46ca1f42/download
https://tesis.pucp.edu.pe/bitstreams/d328167e-ebce-4814-94d0-56b9ac63b4a6/download
bitstream.checksum.fl_str_mv f57b6ec4a7364f44805aad4de7953653
4b6838df0cdcf8c40e0f568f6a2ae419
5a4ffbc01f1b5eb70a835dac0d501661
8a4605be74aa9ea9d79846c1fba20a33
0f17bc08a2aefc149d2b77ad79be52e1
15be1911fa96bb24629dcd77fcac6638
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
MD5
MD5
MD5
repository.name.fl_str_mv Repositorio de Tesis PUCP
repository.mail.fl_str_mv raul.sifuentes@pucp.pe
_version_ 1834737044372324352
spelling Véliz Capuñay, Carlos NilbertoFalcón Cisneros, Sergio Daniel2024-02-26T14:41:45Z2024-02-26T14:41:45Z20242024-02-26http://hdl.handle.net/20.500.12404/27176Actualmente las organizaciones recolectan datos en grandes volúmenes y de fuentes muy variadas. Para dar sentido y convertir los datos en información útil es necesario utilizar técnicas que permitan encontrar y entender las relaciones ocultas en los datos. Generalmente, la relación que nos interesa estudiar es cómo predecir un evento utilizando un conjunto de variables. Sin embargo, muchas veces la relación entre los datos es muy compleja y no puede ser analizada adecuadamente usando las técnicas más conocidas, dado que éstas suelen tener supuestos que no necesariamente se cumplen. Por ello, es importante conocer técnicas de análisis más complejas y flexibles. Esta tesis busca ser un instrumento de ayuda en el aprendizaje y uso de nuevas técnicas para estudiar los datos, lo cual es relevante sobre todo en el medio local en el que este tema es poco conocido. Con este objetivo, presenta una revisión introductoria de la teoría del aprendizaje estadístico, la cual provee del marco teórico para que distintos métodos utilicen los datos para aprender, y usando este conocimiento puedan hacer predicciones sobre datos nuevos o diferentes. Luego se centra en un estudio exhaustivo del método de aprendizaje de Máquinas de Soporte Vectorial (SVM por sus siglas en inglés), introduciendo y aplicando las funciones Kernel. Este método se puede entender como una representación de los datos como puntos en el espacio, asignados de tal forma que exista una brecha grande que separe a los elementos diferentes. Finalmente se pone en práctica la teoría estudiada aplicando el método SVM a datos de clientes de una entidad financiera. Esta entidad financiera usa predominantemente técnicas de aprendizaje estadístico simples y con varios supuestos; particularmente usa una de estas técnicas en un modelo que predice la propensión a la compra y persistencia del producto Seguro de Protección de Tarjetas. Por ello, la presente tesis se centra en aplicar el método SVM para construir una alternativa a este modelo.spaPontificia Universidad Católica del PerúPEinfo:eu-repo/semantics/openAccesshttp://creativecommons.org/licenses/by/2.5/pe/Variables (Estadística)Procesamiento de datosAlgoritmos--Aplicacioneshttps://purl.org/pe-repo/ocde/ford#1.01.03Aprendizaje estadístico supervisado con máquina de soporte vectorialinfo:eu-repo/semantics/masterThesisreponame:PUCP-Tesisinstname:Pontificia Universidad Católica del Perúinstacron:PUCPSUNEDUMaestro en EstadísticaMaestríaPontificia Universidad Católica del Perú. Escuela de Posgrado.Estadística07911208https://orcid.org/0009-0005-1529-080X41685404542037Valdivieso Serrano, Luis HilmarVeliz Capuñay, Carlos NilbertoJoo Arakawa, Rocio De Abrilhttps://purl.org/pe-repo/renati/level#maestrohttps://purl.org/pe-repo/renati/type#tesisORIGINALFALCON_CISNEROS_SERGIO_APRENDIZAJE_ESTADISTICO_SUPERVISADO.pdfFALCON_CISNEROS_SERGIO_APRENDIZAJE_ESTADISTICO_SUPERVISADO.pdfTexto completoapplication/pdf1248036https://tesis.pucp.edu.pe/bitstreams/81b97ba0-c66e-4184-b464-4c30cb25c1ab/downloadf57b6ec4a7364f44805aad4de7953653MD51trueAnonymousREADFALCÓN_CISNEROS_SERGIO_DANIEL_T.pdfFALCÓN_CISNEROS_SERGIO_DANIEL_T.pdfReporte de originalidadapplication/pdf16663917https://tesis.pucp.edu.pe/bitstreams/ca9ac1d1-da1f-4939-99db-cb2ebf6b9eaa/download4b6838df0cdcf8c40e0f568f6a2ae419MD52falseAnonymousREAD2500-01-01CC-LICENSElicense_rdflicense_rdfapplication/rdf+xml; charset=utf-8914https://tesis.pucp.edu.pe/bitstreams/5391a790-87a5-4346-a762-5b12778f7eb5/download5a4ffbc01f1b5eb70a835dac0d501661MD53falseAnonymousREADLICENSElicense.txtlicense.txttext/plain; charset=utf-81748https://tesis.pucp.edu.pe/bitstreams/02f5531f-97c2-47ca-a5b2-2a8cf600d4f8/download8a4605be74aa9ea9d79846c1fba20a33MD54falseAnonymousREADTHUMBNAILFALCON_CISNEROS_SERGIO_APRENDIZAJE_ESTADISTICO_SUPERVISADO.pdf.jpgFALCON_CISNEROS_SERGIO_APRENDIZAJE_ESTADISTICO_SUPERVISADO.pdf.jpgIM Thumbnailimage/jpeg10535https://tesis.pucp.edu.pe/bitstreams/aeac29b2-7928-4807-beef-1f2e46ca1f42/download0f17bc08a2aefc149d2b77ad79be52e1MD55falseAnonymousREADFALCÓN_CISNEROS_SERGIO_DANIEL_T.pdf.jpgFALCÓN_CISNEROS_SERGIO_DANIEL_T.pdf.jpgIM Thumbnailimage/jpeg5436https://tesis.pucp.edu.pe/bitstreams/d328167e-ebce-4814-94d0-56b9ac63b4a6/download15be1911fa96bb24629dcd77fcac6638MD56falseAnonymousREAD2500-01-0120.500.12404/27176oai:tesis.pucp.edu.pe:20.500.12404/271762024-05-29 10:29:33.826http://creativecommons.org/licenses/by/2.5/pe/info:eu-repo/semantics/openAccessopen.accesshttps://tesis.pucp.edu.peRepositorio de Tesis PUCPraul.sifuentes@pucp.peTk9URTogUExBQ0UgWU9VUiBPV04gTElDRU5TRSBIRVJFClRoaXMgc2FtcGxlIGxpY2Vuc2UgaXMgcHJvdmlkZWQgZm9yIGluZm9ybWF0aW9uYWwgcHVycG9zZXMgb25seS4KCk5PTi1FWENMVVNJVkUgRElTVFJJQlVUSU9OIExJQ0VOU0UKCkJ5IHNpZ25pbmcgYW5kIHN1Ym1pdHRpbmcgdGhpcyBsaWNlbnNlLCB5b3UgKHRoZSBhdXRob3Iocykgb3IgY29weXJpZ2h0Cm93bmVyKSBncmFudHMgdG8gRFNwYWNlIFVuaXZlcnNpdHkgKERTVSkgdGhlIG5vbi1leGNsdXNpdmUgcmlnaHQgdG8gcmVwcm9kdWNlLAp0cmFuc2xhdGUgKGFzIGRlZmluZWQgYmVsb3cpLCBhbmQvb3IgZGlzdHJpYnV0ZSB5b3VyIHN1Ym1pc3Npb24gKGluY2x1ZGluZwp0aGUgYWJzdHJhY3QpIHdvcmxkd2lkZSBpbiBwcmludCBhbmQgZWxlY3Ryb25pYyBmb3JtYXQgYW5kIGluIGFueSBtZWRpdW0sCmluY2x1ZGluZyBidXQgbm90IGxpbWl0ZWQgdG8gYXVkaW8gb3IgdmlkZW8uCgpZb3UgYWdyZWUgdGhhdCBEU1UgbWF5LCB3aXRob3V0IGNoYW5naW5nIHRoZSBjb250ZW50LCB0cmFuc2xhdGUgdGhlCnN1Ym1pc3Npb24gdG8gYW55IG1lZGl1bSBvciBmb3JtYXQgZm9yIHRoZSBwdXJwb3NlIG9mIHByZXNlcnZhdGlvbi4KCllvdSBhbHNvIGFncmVlIHRoYXQgRFNVIG1heSBrZWVwIG1vcmUgdGhhbiBvbmUgY29weSBvZiB0aGlzIHN1Ym1pc3Npb24gZm9yCnB1cnBvc2VzIG9mIHNlY3VyaXR5LCBiYWNrLXVwIGFuZCBwcmVzZXJ2YXRpb24uCgpZb3UgcmVwcmVzZW50IHRoYXQgdGhlIHN1Ym1pc3Npb24gaXMgeW91ciBvcmlnaW5hbCB3b3JrLCBhbmQgdGhhdCB5b3UgaGF2ZQp0aGUgcmlnaHQgdG8gZ3JhbnQgdGhlIHJpZ2h0cyBjb250YWluZWQgaW4gdGhpcyBsaWNlbnNlLiBZb3UgYWxzbyByZXByZXNlbnQKdGhhdCB5b3VyIHN1Ym1pc3Npb24gZG9lcyBub3QsIHRvIHRoZSBiZXN0IG9mIHlvdXIga25vd2xlZGdlLCBpbmZyaW5nZSB1cG9uCmFueW9uZSdzIGNvcHlyaWdodC4KCklmIHRoZSBzdWJtaXNzaW9uIGNvbnRhaW5zIG1hdGVyaWFsIGZvciB3aGljaCB5b3UgZG8gbm90IGhvbGQgY29weXJpZ2h0LAp5b3UgcmVwcmVzZW50IHRoYXQgeW91IGhhdmUgb2J0YWluZWQgdGhlIHVucmVzdHJpY3RlZCBwZXJtaXNzaW9uIG9mIHRoZQpjb3B5cmlnaHQgb3duZXIgdG8gZ3JhbnQgRFNVIHRoZSByaWdodHMgcmVxdWlyZWQgYnkgdGhpcyBsaWNlbnNlLCBhbmQgdGhhdApzdWNoIHRoaXJkLXBhcnR5IG93bmVkIG1hdGVyaWFsIGlzIGNsZWFybHkgaWRlbnRpZmllZCBhbmQgYWNrbm93bGVkZ2VkCndpdGhpbiB0aGUgdGV4dCBvciBjb250ZW50IG9mIHRoZSBzdWJtaXNzaW9uLgoKSUYgVEhFIFNVQk1JU1NJT04gSVMgQkFTRUQgVVBPTiBXT1JLIFRIQVQgSEFTIEJFRU4gU1BPTlNPUkVEIE9SIFNVUFBPUlRFRApCWSBBTiBBR0VOQ1kgT1IgT1JHQU5JWkFUSU9OIE9USEVSIFRIQU4gRFNVLCBZT1UgUkVQUkVTRU5UIFRIQVQgWU9VIEhBVkUKRlVMRklMTEVEIEFOWSBSSUdIVCBPRiBSRVZJRVcgT1IgT1RIRVIgT0JMSUdBVElPTlMgUkVRVUlSRUQgQlkgU1VDSApDT05UUkFDVCBPUiBBR1JFRU1FTlQuCgpEU1Ugd2lsbCBjbGVhcmx5IGlkZW50aWZ5IHlvdXIgbmFtZShzKSBhcyB0aGUgYXV0aG9yKHMpIG9yIG93bmVyKHMpIG9mIHRoZQpzdWJtaXNzaW9uLCBhbmQgd2lsbCBub3QgbWFrZSBhbnkgYWx0ZXJhdGlvbiwgb3RoZXIgdGhhbiBhcyBhbGxvd2VkIGJ5IHRoaXMKbGljZW5zZSwgdG8geW91ciBzdWJtaXNzaW9uLgo=
score 13.968331
Nota importante:
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).