Análisis de sentimiento en la industria del lujo aplicando procesamiento de lenguaje natural (NLP) y machine learning
Descripción del Articulo
        Esta tesis se enfoca en el análisis avanzado de sentimiento aplicando técnicas de procesamiento de lenguaje natural (NLP) para examinar las evaluaciones y comentarios de clientes en el ámbito del lujo. A través de un proceso que incluye la recopilación y preparación de los datos, modelado de NLP y m...
              
            
    
                        | Autor: | |
|---|---|
| Formato: | tesis de grado | 
| Fecha de Publicación: | 2025 | 
| Institución: | Pontificia Universidad Católica del Perú | 
| Repositorio: | PUCP-Tesis | 
| Lenguaje: | español | 
| OAI Identifier: | oai:tesis.pucp.edu.pe:20.500.12404/30478 | 
| Enlace del recurso: | http://hdl.handle.net/20.500.12404/30478 | 
| Nivel de acceso: | acceso abierto | 
| Materia: | Procesamiento en lenguaje natural (Computación) Aprendizaje automático (Inteligencia artificial) Análisis de datos Emociones Satisfacción del cliente https://purl.org/pe-repo/ocde/ford#2.03.01  | 
| id | 
                  PUCP_90a65a09712e038c67ffa1471aca3a3a | 
    
|---|---|
| oai_identifier_str | 
                  oai:tesis.pucp.edu.pe:20.500.12404/30478 | 
    
| network_acronym_str | 
                  PUCP | 
    
| network_name_str | 
                  PUCP-Tesis | 
    
| repository_id_str | 
                  . | 
    
| dc.title.none.fl_str_mv | 
                  Análisis de sentimiento en la industria del lujo aplicando procesamiento de lenguaje natural (NLP) y machine learning | 
    
| title | 
                  Análisis de sentimiento en la industria del lujo aplicando procesamiento de lenguaje natural (NLP) y machine learning | 
    
| spellingShingle | 
                  Análisis de sentimiento en la industria del lujo aplicando procesamiento de lenguaje natural (NLP) y machine learning Osorio Espinoza, Jefferson Erick Procesamiento en lenguaje natural (Computación) Aprendizaje automático (Inteligencia artificial) Análisis de datos Emociones Satisfacción del cliente https://purl.org/pe-repo/ocde/ford#2.03.01  | 
    
| title_short | 
                  Análisis de sentimiento en la industria del lujo aplicando procesamiento de lenguaje natural (NLP) y machine learning | 
    
| title_full | 
                  Análisis de sentimiento en la industria del lujo aplicando procesamiento de lenguaje natural (NLP) y machine learning | 
    
| title_fullStr | 
                  Análisis de sentimiento en la industria del lujo aplicando procesamiento de lenguaje natural (NLP) y machine learning | 
    
| title_full_unstemmed | 
                  Análisis de sentimiento en la industria del lujo aplicando procesamiento de lenguaje natural (NLP) y machine learning | 
    
| title_sort | 
                  Análisis de sentimiento en la industria del lujo aplicando procesamiento de lenguaje natural (NLP) y machine learning | 
    
| author | 
                  Osorio Espinoza, Jefferson Erick | 
    
| author_facet | 
                  Osorio Espinoza, Jefferson Erick | 
    
| author_role | 
                  author | 
    
| dc.contributor.advisor.fl_str_mv | 
                  Villota Cerna, Elizabeth Roxana | 
    
| dc.contributor.author.fl_str_mv | 
                  Osorio Espinoza, Jefferson Erick | 
    
| dc.subject.none.fl_str_mv | 
                  Procesamiento en lenguaje natural (Computación) Aprendizaje automático (Inteligencia artificial) Análisis de datos Emociones Satisfacción del cliente  | 
    
| topic | 
                  Procesamiento en lenguaje natural (Computación) Aprendizaje automático (Inteligencia artificial) Análisis de datos Emociones Satisfacción del cliente https://purl.org/pe-repo/ocde/ford#2.03.01  | 
    
| dc.subject.ocde.none.fl_str_mv | 
                  https://purl.org/pe-repo/ocde/ford#2.03.01 | 
    
| description | 
                  Esta tesis se enfoca en el análisis avanzado de sentimiento aplicando técnicas de procesamiento de lenguaje natural (NLP) para examinar las evaluaciones y comentarios de clientes en el ámbito del lujo. A través de un proceso que incluye la recopilación y preparación de los datos, modelado de NLP y machine learning, así como la implementación y análisis de resultados, se busca mejorar la comprensión de la percepción de la marca y la satisfacción del cliente. El objetivo de esta tesis es brindar a las empresas de lujo conocimientos prácticos para mejorar sus productos con la finalidad de optimizar la experiencia del cliente y, de esta manera, fortalecer su posición en el ámbito del lujo. En el primer capítulo se presenta la introducción al análisis de datos, abordando técnicas generales de análisis y describiendo modelos de machine learning y deep learning, enfatizando su importancia en la extracción de información a partir de conjuntos de datos que incluyen reseñas de productos por parte de los consumidores. Así mismo, se detalla la problemática a resolver y los objetivos planteados para el desarrollo de la presente tesis En el segundo capítulo se desarrolla el marco teórico y estado del arte. En el marco teórico se da una breve explicación de las métricas que ayudan a seleccionar al algoritmo más adecuado para realizar un análisis de sentimiento, así como también la explicación de su proceso de implementación. Por otro lado, en el estado del arte se detallan hitos asociados al NLP que han contribuido a que este tipo de análisis cada vez sea más preciso. La estrategia para realizar un preprocesado de datos e implementar un análisis exploratorio se desarrolla en el tercer capítulo. Aquí se describe el conjunto de datos a emplear, se describen las librerías más usadas para realizar un análisis exploratorio en el marco de desarrollar un análisis de sentimiento lo que permite que el conjunto de datos este preparado para implementar los algoritmos o modelos de NLP. En el cuarto capítulo y, considerando el análisis exploratorio previo, se desarrolla la función que se encarga de procesar las reseñas o comentarios de los consumidores hacia los productos adquiridos. Se estudian además los N-gramas para entender a detalle el conjunto de datos y, de la misma manera, conocer qué tan bien la función implementada cumple su función de procesar estos textos para realizar el modelado posterior. En el capítulo quinto se desarrollan los modelos de machine learning y deep learning para implementar el análisis de sentimiento. Así mismo, se selecciona el mejor modelo, haciendo una comparativa de métricas, para ser implementado como el modelo que da mejores resultados al momento de predecir cuándo una reseña es positiva o negativa. En el capítulo sexto se pone a prueba el modelo seleccionado a través de un nuevo conjunto de datos para ver cuán preciso es este modelo frente a nuevas reseñas de los consumidores. Esto se desarrolla a través de métricas para evaluar al modelo y concluir que es la mejor opción en este contexto en particular. Por último, el análisis de costo de un proyecto de análisis de sentimiento y las conclusiones de la tesis se desarrolla en el séptimo y octavo capítulo respectivamente. Además, se enfatizan las lecciones aprendidas y se ofrecen recomendaciones para futuras investigaciones o aplicaciones prácticas de las técnicas de NLP en el análisis de opiniones o reseñas. | 
    
| publishDate | 
                  2025 | 
    
| dc.date.accessioned.none.fl_str_mv | 
                  2025-04-08T14:11:24Z | 
    
| dc.date.created.none.fl_str_mv | 
                  2025 | 
    
| dc.date.issued.fl_str_mv | 
                  2025-04-08 | 
    
| dc.type.none.fl_str_mv | 
                  info:eu-repo/semantics/bachelorThesis | 
    
| format | 
                  bachelorThesis | 
    
| dc.identifier.uri.none.fl_str_mv | 
                  http://hdl.handle.net/20.500.12404/30478 | 
    
| url | 
                  http://hdl.handle.net/20.500.12404/30478 | 
    
| dc.language.iso.none.fl_str_mv | 
                  spa | 
    
| language | 
                  spa | 
    
| dc.relation.ispartof.fl_str_mv | 
                  SUNEDU | 
    
| dc.rights.none.fl_str_mv | 
                  info:eu-repo/semantics/openAccess | 
    
| dc.rights.uri.none.fl_str_mv | 
                  http://creativecommons.org/licenses/by-sa/2.5/pe/ | 
    
| eu_rights_str_mv | 
                  openAccess | 
    
| rights_invalid_str_mv | 
                  http://creativecommons.org/licenses/by-sa/2.5/pe/ | 
    
| dc.publisher.es_ES.fl_str_mv | 
                  Pontificia Universidad Católica del Perú | 
    
| dc.publisher.country.none.fl_str_mv | 
                  PE | 
    
| dc.source.none.fl_str_mv | 
                  reponame:PUCP-Tesis instname:Pontificia Universidad Católica del Perú instacron:PUCP  | 
    
| instname_str | 
                  Pontificia Universidad Católica del Perú | 
    
| instacron_str | 
                  PUCP | 
    
| institution | 
                  PUCP | 
    
| reponame_str | 
                  PUCP-Tesis | 
    
| collection | 
                  PUCP-Tesis | 
    
| bitstream.url.fl_str_mv | 
                  https://tesis.pucp.edu.pe/bitstreams/eb933468-cf86-46ca-a229-5439cdead644/download https://tesis.pucp.edu.pe/bitstreams/adbf7977-6a3c-42e9-bfd0-2b52a73614d7/download https://tesis.pucp.edu.pe/bitstreams/359cdabc-1561-4dd8-960b-023b8f6ea392/download https://tesis.pucp.edu.pe/bitstreams/88771f4d-cc7d-4bc4-b2e8-c0cf423839b5/download https://tesis.pucp.edu.pe/bitstreams/ee3c09d0-16de-44b0-afcc-000936f4a824/download https://tesis.pucp.edu.pe/bitstreams/4801e805-910d-4dcc-93ff-a4e67d77e382/download https://tesis.pucp.edu.pe/bitstreams/276ea534-8c8c-4e32-b219-21306557e7b8/download https://tesis.pucp.edu.pe/bitstreams/8da008ba-facb-4022-a488-1f52270e8dbb/download  | 
    
| bitstream.checksum.fl_str_mv | 
                  bfdf56c30ff5d2fbbaf5fa9aedb15748 4436f54ed39bf50341c31c3e33df24ef 85e50b88013d0c13f136d8bfc3dd4616 bb9bdc0b3349e4284e09149f943790b4 4519655f2343bb6faba2b4972b73c6b2 47012be211b9c430776d06648560bea3 d9fe3ea07511dff0d538f3ead7b994a1 db724b3f920b3cefffa65309c5670acd  | 
    
| bitstream.checksumAlgorithm.fl_str_mv | 
                  MD5 MD5 MD5 MD5 MD5 MD5 MD5 MD5  | 
    
| repository.name.fl_str_mv | 
                  Repositorio de Tesis PUCP | 
    
| repository.mail.fl_str_mv | 
                  raul.sifuentes@pucp.pe | 
    
| _version_ | 
                  1839176220332261376 | 
    
| spelling | 
                  Villota Cerna, Elizabeth RoxanaOsorio Espinoza, Jefferson Erick2025-04-08T14:11:24Z20252025-04-08http://hdl.handle.net/20.500.12404/30478Esta tesis se enfoca en el análisis avanzado de sentimiento aplicando técnicas de procesamiento de lenguaje natural (NLP) para examinar las evaluaciones y comentarios de clientes en el ámbito del lujo. A través de un proceso que incluye la recopilación y preparación de los datos, modelado de NLP y machine learning, así como la implementación y análisis de resultados, se busca mejorar la comprensión de la percepción de la marca y la satisfacción del cliente. El objetivo de esta tesis es brindar a las empresas de lujo conocimientos prácticos para mejorar sus productos con la finalidad de optimizar la experiencia del cliente y, de esta manera, fortalecer su posición en el ámbito del lujo. En el primer capítulo se presenta la introducción al análisis de datos, abordando técnicas generales de análisis y describiendo modelos de machine learning y deep learning, enfatizando su importancia en la extracción de información a partir de conjuntos de datos que incluyen reseñas de productos por parte de los consumidores. Así mismo, se detalla la problemática a resolver y los objetivos planteados para el desarrollo de la presente tesis En el segundo capítulo se desarrolla el marco teórico y estado del arte. En el marco teórico se da una breve explicación de las métricas que ayudan a seleccionar al algoritmo más adecuado para realizar un análisis de sentimiento, así como también la explicación de su proceso de implementación. Por otro lado, en el estado del arte se detallan hitos asociados al NLP que han contribuido a que este tipo de análisis cada vez sea más preciso. La estrategia para realizar un preprocesado de datos e implementar un análisis exploratorio se desarrolla en el tercer capítulo. Aquí se describe el conjunto de datos a emplear, se describen las librerías más usadas para realizar un análisis exploratorio en el marco de desarrollar un análisis de sentimiento lo que permite que el conjunto de datos este preparado para implementar los algoritmos o modelos de NLP. En el cuarto capítulo y, considerando el análisis exploratorio previo, se desarrolla la función que se encarga de procesar las reseñas o comentarios de los consumidores hacia los productos adquiridos. Se estudian además los N-gramas para entender a detalle el conjunto de datos y, de la misma manera, conocer qué tan bien la función implementada cumple su función de procesar estos textos para realizar el modelado posterior. En el capítulo quinto se desarrollan los modelos de machine learning y deep learning para implementar el análisis de sentimiento. Así mismo, se selecciona el mejor modelo, haciendo una comparativa de métricas, para ser implementado como el modelo que da mejores resultados al momento de predecir cuándo una reseña es positiva o negativa. En el capítulo sexto se pone a prueba el modelo seleccionado a través de un nuevo conjunto de datos para ver cuán preciso es este modelo frente a nuevas reseñas de los consumidores. Esto se desarrolla a través de métricas para evaluar al modelo y concluir que es la mejor opción en este contexto en particular. Por último, el análisis de costo de un proyecto de análisis de sentimiento y las conclusiones de la tesis se desarrolla en el séptimo y octavo capítulo respectivamente. Además, se enfatizan las lecciones aprendidas y se ofrecen recomendaciones para futuras investigaciones o aplicaciones prácticas de las técnicas de NLP en el análisis de opiniones o reseñas.spaPontificia Universidad Católica del PerúPEinfo:eu-repo/semantics/openAccesshttp://creativecommons.org/licenses/by-sa/2.5/pe/Procesamiento en lenguaje natural (Computación)Aprendizaje automático (Inteligencia artificial)Análisis de datosEmocionesSatisfacción del clientehttps://purl.org/pe-repo/ocde/ford#2.03.01Análisis de sentimiento en la industria del lujo aplicando procesamiento de lenguaje natural (NLP) y machine learninginfo:eu-repo/semantics/bachelorThesisreponame:PUCP-Tesisinstname:Pontificia Universidad Católica del Perúinstacron:PUCPSUNEDUIngeniero MecatrónicoTítulo ProfesionalPontificia Universidad Católica del Perú. Facultad de Ciencias e IngenieríaIngeniería Mecatrónica10686413https://orcid.org/0000-0002-6431-147945780836713096Balbuena Galván, José GuillermoVillota Cerna, Elizabeth RoxanaMeneses Carnero, Alexis Joséhttps://purl.org/pe-repo/renati/level#tituloProfesionalhttps://purl.org/pe-repo/renati/type#tesisORIGINALOSORIO_ESPINOZA_JEFFERSON_ERICK.pdfOSORIO_ESPINOZA_JEFFERSON_ERICK.pdfTexto completoapplication/pdf3856713https://tesis.pucp.edu.pe/bitstreams/eb933468-cf86-46ca-a229-5439cdead644/downloadbfdf56c30ff5d2fbbaf5fa9aedb15748MD51trueAnonymousREADOSORIO_ESPINOZA_JEFFERSON_ERICK_T.pdfOSORIO_ESPINOZA_JEFFERSON_ERICK_T.pdfReporte de originalidadapplication/pdf17520121https://tesis.pucp.edu.pe/bitstreams/adbf7977-6a3c-42e9-bfd0-2b52a73614d7/download4436f54ed39bf50341c31c3e33df24efMD52falseAdministratorREADCC-LICENSElicense_rdflicense_rdfapplication/rdf+xml; charset=utf-81160https://tesis.pucp.edu.pe/bitstreams/359cdabc-1561-4dd8-960b-023b8f6ea392/download85e50b88013d0c13f136d8bfc3dd4616MD53falseAnonymousREADLICENSElicense.txtlicense.txttext/plain; charset=utf-81748https://tesis.pucp.edu.pe/bitstreams/88771f4d-cc7d-4bc4-b2e8-c0cf423839b5/downloadbb9bdc0b3349e4284e09149f943790b4MD54falseAnonymousREADTEXTOSORIO_ESPINOZA_JEFFERSON_ERICK.pdf.txtOSORIO_ESPINOZA_JEFFERSON_ERICK.pdf.txtExtracted texttext/plain172109https://tesis.pucp.edu.pe/bitstreams/ee3c09d0-16de-44b0-afcc-000936f4a824/download4519655f2343bb6faba2b4972b73c6b2MD55falseAnonymousREADOSORIO_ESPINOZA_JEFFERSON_ERICK_T.pdf.txtOSORIO_ESPINOZA_JEFFERSON_ERICK_T.pdf.txtExtracted texttext/plain8525https://tesis.pucp.edu.pe/bitstreams/4801e805-910d-4dcc-93ff-a4e67d77e382/download47012be211b9c430776d06648560bea3MD57falseAdministratorREADTHUMBNAILOSORIO_ESPINOZA_JEFFERSON_ERICK.pdf.jpgOSORIO_ESPINOZA_JEFFERSON_ERICK.pdf.jpgGenerated Thumbnailimage/jpeg13485https://tesis.pucp.edu.pe/bitstreams/276ea534-8c8c-4e32-b219-21306557e7b8/downloadd9fe3ea07511dff0d538f3ead7b994a1MD56falseAnonymousREADOSORIO_ESPINOZA_JEFFERSON_ERICK_T.pdf.jpgOSORIO_ESPINOZA_JEFFERSON_ERICK_T.pdf.jpgGenerated Thumbnailimage/jpeg7093https://tesis.pucp.edu.pe/bitstreams/8da008ba-facb-4022-a488-1f52270e8dbb/downloaddb724b3f920b3cefffa65309c5670acdMD58falseAdministratorREAD20.500.12404/30478oai:tesis.pucp.edu.pe:20.500.12404/304782025-07-18 15:29:58.236http://creativecommons.org/licenses/by-sa/2.5/pe/info:eu-repo/semantics/openAccessopen.accesshttps://tesis.pucp.edu.peRepositorio de Tesis PUCPraul.sifuentes@pucp.peTk9URTogUExBQ0UgWU9VUiBPV04gTElDRU5TRSBIRVJFClRoaXMgc2FtcGxlIGxpY2Vuc2UgaXMgcHJvdmlkZWQgZm9yIGluZm9ybWF0aW9uYWwgcHVycG9zZXMgb25seS4KCk5PTi1FWENMVVNJVkUgRElTVFJJQlVUSU9OIExJQ0VOU0UKCkJ5IHNpZ25pbmcgYW5kIHN1Ym1pdHRpbmcgdGhpcyBsaWNlbnNlLCB5b3UgKHRoZSBhdXRob3Iocykgb3IgY29weXJpZ2h0IG93bmVyKSBncmFudHMgdG8gRFNwYWNlIFVuaXZlcnNpdHkgKERTVSkgdGhlIG5vbi1leGNsdXNpdmUgcmlnaHQgdG8gcmVwcm9kdWNlLCB0cmFuc2xhdGUgKGFzIGRlZmluZWQgYmVsb3cpLCBhbmQvb3IgZGlzdHJpYnV0ZSB5b3VyIHN1Ym1pc3Npb24gKGluY2x1ZGluZyB0aGUgYWJzdHJhY3QpIHdvcmxkd2lkZSBpbiBwcmludCBhbmQgZWxlY3Ryb25pYyBmb3JtYXQgYW5kIGluIGFueSBtZWRpdW0sIGluY2x1ZGluZyBidXQgbm90IGxpbWl0ZWQgdG8gYXVkaW8gb3IgdmlkZW8uCgpZb3UgYWdyZWUgdGhhdCBEU1UgbWF5LCB3aXRob3V0IGNoYW5naW5nIHRoZSBjb250ZW50LCB0cmFuc2xhdGUgdGhlIHN1Ym1pc3Npb24gdG8gYW55IG1lZGl1bSBvciBmb3JtYXQgZm9yIHRoZSBwdXJwb3NlIG9mIHByZXNlcnZhdGlvbi4KCllvdSBhbHNvIGFncmVlIHRoYXQgRFNVIG1heSBrZWVwIG1vcmUgdGhhbiBvbmUgY29weSBvZiB0aGlzIHN1Ym1pc3Npb24gZm9yIHB1cnBvc2VzIG9mIHNlY3VyaXR5LCBiYWNrLXVwIGFuZCBwcmVzZXJ2YXRpb24uCgpZb3UgcmVwcmVzZW50IHRoYXQgdGhlIHN1Ym1pc3Npb24gaXMgeW91ciBvcmlnaW5hbCB3b3JrLCBhbmQgdGhhdCB5b3UgaGF2ZSB0aGUgcmlnaHQgdG8gZ3JhbnQgdGhlIHJpZ2h0cyBjb250YWluZWQgaW4gdGhpcyBsaWNlbnNlLiBZb3UgYWxzbyByZXByZXNlbnQgdGhhdCB5b3VyIHN1Ym1pc3Npb24gZG9lcyBub3QsIHRvIHRoZSBiZXN0IG9mIHlvdXIga25vd2xlZGdlLCBpbmZyaW5nZSB1cG9uIGFueW9uZSdzIGNvcHlyaWdodC4KCklmIHRoZSBzdWJtaXNzaW9uIGNvbnRhaW5zIG1hdGVyaWFsIGZvciB3aGljaCB5b3UgZG8gbm90IGhvbGQgY29weXJpZ2h0LCB5b3UgcmVwcmVzZW50IHRoYXQgeW91IGhhdmUgb2J0YWluZWQgdGhlIHVucmVzdHJpY3RlZCBwZXJtaXNzaW9uIG9mIHRoZSBjb3B5cmlnaHQgb3duZXIgdG8gZ3JhbnQgRFNVIHRoZSByaWdodHMgcmVxdWlyZWQgYnkgdGhpcyBsaWNlbnNlLCBhbmQgdGhhdCBzdWNoIHRoaXJkLXBhcnR5IG93bmVkIG1hdGVyaWFsIGlzIGNsZWFybHkgaWRlbnRpZmllZCBhbmQgYWNrbm93bGVkZ2VkIHdpdGhpbiB0aGUgdGV4dCBvciBjb250ZW50IG9mIHRoZSBzdWJtaXNzaW9uLgoKSUYgVEhFIFNVQk1JU1NJT04gSVMgQkFTRUQgVVBPTiBXT1JLIFRIQVQgSEFTIEJFRU4gU1BPTlNPUkVEIE9SIFNVUFBPUlRFRCBCWSBBTiBBR0VOQ1kgT1IgT1JHQU5JWkFUSU9OIE9USEVSIFRIQU4gRFNVLCBZT1UgUkVQUkVTRU5UIFRIQVQgWU9VIEhBVkUgRlVMRklMTEVEIEFOWSBSSUdIVCBPRiBSRVZJRVcgT1IgT1RIRVIgT0JMSUdBVElPTlMgUkVRVUlSRUQgQlkgU1VDSCBDT05UUkFDVCBPUiBBR1JFRU1FTlQuCgpEU1Ugd2lsbCBjbGVhcmx5IGlkZW50aWZ5IHlvdXIgbmFtZShzKSBhcyB0aGUgYXV0aG9yKHMpIG9yIG93bmVyKHMpIG9mIHRoZSBzdWJtaXNzaW9uLCBhbmQgd2lsbCBub3QgbWFrZSBhbnkgYWx0ZXJhdGlvbiwgb3RoZXIgdGhhbiBhcyBhbGxvd2VkIGJ5IHRoaXMgbGljZW5zZSwgdG8geW91ciBzdWJtaXNzaW9uLgo= | 
    
| score | 
                  13.466479 | 
    
 Nota importante:
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).
    La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).