Marco de trabajo para el desarrollo de proyectos de analítica de datos
Descripción del Articulo
        El desarrollo de proyectos de analítica de datos en las organizaciones requiere de procesos bien definidos para su éxito. Existen procesos estándar de analítica de datos, como CRISP-DM, que han tenido una amplia adopción en las últimas décadas. Sin embargo, mediante una búsqueda sistemática de la li...
              
            
    
                        | Autor: | |
|---|---|
| Formato: | tesis de maestría | 
| Fecha de Publicación: | 2024 | 
| Institución: | Pontificia Universidad Católica del Perú | 
| Repositorio: | PUCP-Tesis | 
| Lenguaje: | español | 
| OAI Identifier: | oai:tesis.pucp.edu.pe:20.500.12404/28564 | 
| Enlace del recurso: | http://hdl.handle.net/20.500.12404/28564 | 
| Nivel de acceso: | acceso abierto | 
| Materia: | Minería de datos--Investigación--Metodología Administración de proyectos Ciencia del diseño https://purl.org/pe-repo/ocde/ford#1.02.00 | 
| id | PUCP_574f8104c401e904516828674ddf3cbb | 
|---|---|
| oai_identifier_str | oai:tesis.pucp.edu.pe:20.500.12404/28564 | 
| network_acronym_str | PUCP | 
| network_name_str | PUCP-Tesis | 
| repository_id_str | . | 
| dc.title.es_ES.fl_str_mv | Marco de trabajo para el desarrollo de proyectos de analítica de datos | 
| title | Marco de trabajo para el desarrollo de proyectos de analítica de datos | 
| spellingShingle | Marco de trabajo para el desarrollo de proyectos de analítica de datos Olivera Cokan, César Alberto Minería de datos--Investigación--Metodología Administración de proyectos Ciencia del diseño https://purl.org/pe-repo/ocde/ford#1.02.00 | 
| title_short | Marco de trabajo para el desarrollo de proyectos de analítica de datos | 
| title_full | Marco de trabajo para el desarrollo de proyectos de analítica de datos | 
| title_fullStr | Marco de trabajo para el desarrollo de proyectos de analítica de datos | 
| title_full_unstemmed | Marco de trabajo para el desarrollo de proyectos de analítica de datos | 
| title_sort | Marco de trabajo para el desarrollo de proyectos de analítica de datos | 
| author | Olivera Cokan, César Alberto | 
| author_facet | Olivera Cokan, César Alberto | 
| author_role | author | 
| dc.contributor.advisor.fl_str_mv | Bello Ruiz, Alejandro Toribio Pow Sang Portillo, José Antonio | 
| dc.contributor.author.fl_str_mv | Olivera Cokan, César Alberto | 
| dc.subject.es_ES.fl_str_mv | Minería de datos--Investigación--Metodología Administración de proyectos Ciencia del diseño | 
| topic | Minería de datos--Investigación--Metodología Administración de proyectos Ciencia del diseño https://purl.org/pe-repo/ocde/ford#1.02.00 | 
| dc.subject.ocde.es_ES.fl_str_mv | https://purl.org/pe-repo/ocde/ford#1.02.00 | 
| description | El desarrollo de proyectos de analítica de datos en las organizaciones requiere de procesos bien definidos para su éxito. Existen procesos estándar de analítica de datos, como CRISP-DM, que han tenido una amplia adopción en las últimas décadas. Sin embargo, mediante una búsqueda sistemática de la literatura se ha podido evidenciar que muchas de las organizaciones a menudo no aplican CRISP-DM o procesos similares, como SEMMA y KDD, tal como están, sino que muchos de ellas adaptan estos marcos de trabajo para abordar requerimientos específicos en diversos contextos de la industria. Además, según estos estudios se evidencia que un grupo considerable de empresas emplea Scrum u otros marcos de trabajo para el desarrollo de software con el fin de llevar a cabo sus proyectos de analítica de datos, lo cual no es correcto pues estos marcos de trabajo no abordan las particularidades de un ciclo de vida de una solución analítica. Si bien CRISPDM es el marco de trabajo para analítica de datos más empleado, este mismo posee un conjunto de falencias enfocadas en diversos casos de uso o procesos de negocio que ha llevado a muchas organizaciones a adaptar este marco a sus necesidades. Hasta ahora no se ha sugerido ninguna adaptación que permita abordar las falencias que los diferentes dominios en la industria poseen. Este artículo aborda la propuesta del diseño de un marco de trabajo para proyectos de analítica de datos general denominado GEN-DA (Generic Data Analytics framework por sus siglas en inglés). GEN-DA extiende y modifica CRISP-DM para solucionar las diferentes falencias encontradas en la literatura y lograr un ciclo de vida del proyecto de analítica de datos que pueda ser empleado en todos los contextos de la industria. Este marco de trabajo ha sido diseñado y evaluado de forma iterativa empleando una metodología en ciencias del diseño gracias a la participación de expertos en analítica de datos mediante el método de validación por Juicio Experto. Los resultados obtenidos son alentadores y habilita la factibilidad de emplear este marco propuesto en un entorno real, cuyos resultados, se presume, que serán satisfactorios. | 
| publishDate | 2024 | 
| dc.date.accessioned.none.fl_str_mv | 2024-08-09T22:02:04Z | 
| dc.date.available.none.fl_str_mv | 2024-08-09T22:02:04Z | 
| dc.date.created.none.fl_str_mv | 2024 | 
| dc.date.issued.fl_str_mv | 2024-08-09 | 
| dc.type.es_ES.fl_str_mv | info:eu-repo/semantics/masterThesis | 
| format | masterThesis | 
| dc.identifier.uri.none.fl_str_mv | http://hdl.handle.net/20.500.12404/28564 | 
| url | http://hdl.handle.net/20.500.12404/28564 | 
| dc.language.iso.es_ES.fl_str_mv | spa | 
| language | spa | 
| dc.relation.ispartof.fl_str_mv | SUNEDU | 
| dc.rights.es_ES.fl_str_mv | info:eu-repo/semantics/openAccess | 
| dc.rights.uri.*.fl_str_mv | http://creativecommons.org/licenses/by-nc-sa/2.5/pe/ | 
| eu_rights_str_mv | openAccess | 
| rights_invalid_str_mv | http://creativecommons.org/licenses/by-nc-sa/2.5/pe/ | 
| dc.publisher.es_ES.fl_str_mv | Pontificia Universidad Católica del Perú | 
| dc.publisher.country.es_ES.fl_str_mv | PE | 
| dc.source.none.fl_str_mv | reponame:PUCP-Tesis instname:Pontificia Universidad Católica del Perú instacron:PUCP | 
| instname_str | Pontificia Universidad Católica del Perú | 
| instacron_str | PUCP | 
| institution | PUCP | 
| reponame_str | PUCP-Tesis | 
| collection | PUCP-Tesis | 
| bitstream.url.fl_str_mv | https://tesis.pucp.edu.pe/bitstreams/bb1d219a-4612-43ac-b8bd-bd47e1c74438/download https://tesis.pucp.edu.pe/bitstreams/a83ad583-f18a-4c82-843b-bfaffdae9fb6/download https://tesis.pucp.edu.pe/bitstreams/89c26091-ebcf-4def-9d03-68912ed6e7c6/download https://tesis.pucp.edu.pe/bitstreams/1f7b56db-86d0-4652-9fee-bc93f5e48e87/download https://tesis.pucp.edu.pe/bitstreams/07f31dc9-ce79-4f9b-8653-b7f48a8288d0/download https://tesis.pucp.edu.pe/bitstreams/5db12a8f-6733-494d-bdea-9c67affd9774/download https://tesis.pucp.edu.pe/bitstreams/91b3956a-73c4-4571-82bb-9900038a9a58/download https://tesis.pucp.edu.pe/bitstreams/b3828f93-2275-423f-8288-9273acd71b67/download | 
| bitstream.checksum.fl_str_mv | 281e691fe6580314c5efa2ed462df951 1b457ace398d8f642f428c49c0342803 8fc46f5e71650fd7adee84a69b9163c2 8a4605be74aa9ea9d79846c1fba20a33 9b962b916751f4d93c048e5b32454843 2ee47d5edb160a39c3d6bd56f2e5028b 618a0900947c8d89609b3bb16457dc33 a09a97ded85e7aebafed36c3f499e372 | 
| bitstream.checksumAlgorithm.fl_str_mv | MD5 MD5 MD5 MD5 MD5 MD5 MD5 MD5 | 
| repository.name.fl_str_mv | Repositorio de Tesis PUCP | 
| repository.mail.fl_str_mv | raul.sifuentes@pucp.pe | 
| _version_ | 1834736802617884672 | 
| spelling | Bello Ruiz, Alejandro ToribioPow Sang Portillo, José AntonioOlivera Cokan, César Alberto2024-08-09T22:02:04Z2024-08-09T22:02:04Z20242024-08-09http://hdl.handle.net/20.500.12404/28564El desarrollo de proyectos de analítica de datos en las organizaciones requiere de procesos bien definidos para su éxito. Existen procesos estándar de analítica de datos, como CRISP-DM, que han tenido una amplia adopción en las últimas décadas. Sin embargo, mediante una búsqueda sistemática de la literatura se ha podido evidenciar que muchas de las organizaciones a menudo no aplican CRISP-DM o procesos similares, como SEMMA y KDD, tal como están, sino que muchos de ellas adaptan estos marcos de trabajo para abordar requerimientos específicos en diversos contextos de la industria. Además, según estos estudios se evidencia que un grupo considerable de empresas emplea Scrum u otros marcos de trabajo para el desarrollo de software con el fin de llevar a cabo sus proyectos de analítica de datos, lo cual no es correcto pues estos marcos de trabajo no abordan las particularidades de un ciclo de vida de una solución analítica. Si bien CRISPDM es el marco de trabajo para analítica de datos más empleado, este mismo posee un conjunto de falencias enfocadas en diversos casos de uso o procesos de negocio que ha llevado a muchas organizaciones a adaptar este marco a sus necesidades. Hasta ahora no se ha sugerido ninguna adaptación que permita abordar las falencias que los diferentes dominios en la industria poseen. Este artículo aborda la propuesta del diseño de un marco de trabajo para proyectos de analítica de datos general denominado GEN-DA (Generic Data Analytics framework por sus siglas en inglés). GEN-DA extiende y modifica CRISP-DM para solucionar las diferentes falencias encontradas en la literatura y lograr un ciclo de vida del proyecto de analítica de datos que pueda ser empleado en todos los contextos de la industria. Este marco de trabajo ha sido diseñado y evaluado de forma iterativa empleando una metodología en ciencias del diseño gracias a la participación de expertos en analítica de datos mediante el método de validación por Juicio Experto. Los resultados obtenidos son alentadores y habilita la factibilidad de emplear este marco propuesto en un entorno real, cuyos resultados, se presume, que serán satisfactorios.spaPontificia Universidad Católica del PerúPEinfo:eu-repo/semantics/openAccesshttp://creativecommons.org/licenses/by-nc-sa/2.5/pe/Minería de datos--Investigación--MetodologíaAdministración de proyectosCiencia del diseñohttps://purl.org/pe-repo/ocde/ford#1.02.00Marco de trabajo para el desarrollo de proyectos de analítica de datosinfo:eu-repo/semantics/masterThesisreponame:PUCP-Tesisinstname:Pontificia Universidad Católica del Perúinstacron:PUCPSUNEDUMaestro en Informática con mención en Ciencias de la ComputaciónMaestríaPontificia Universidad Católica del Perú. Escuela de Posgrado.Informática con mención en Ciencias de la Computación1665662421520576https://orcid.org/0000-0002-8608-6364https://orcid.org/0000-0003-4001-807247803790611087Villanueva Talavera, Edwin RafaelBello Ruiz, Alejandro ToribioFlores Lafosse, Natalíhttps://purl.org/pe-repo/renati/level#maestrohttps://purl.org/pe-repo/renati/type#trabajoDeInvestigacionORIGINALOLIVERA_COKAN_CÉSAR_ALBERTO_MARCO_TRABAJO.pdfOLIVERA_COKAN_CÉSAR_ALBERTO_MARCO_TRABAJO.pdfTexto completoapplication/pdf655929https://tesis.pucp.edu.pe/bitstreams/bb1d219a-4612-43ac-b8bd-bd47e1c74438/download281e691fe6580314c5efa2ed462df951MD51trueAnonymousREADOLIVERA_COKAN_CÉSAR_ALBERTO_T.pdfOLIVERA_COKAN_CÉSAR_ALBERTO_T.pdfReporte de originalidadapplication/pdf4387819https://tesis.pucp.edu.pe/bitstreams/a83ad583-f18a-4c82-843b-bfaffdae9fb6/download1b457ace398d8f642f428c49c0342803MD52falseAnonymousREAD2500-01-01CC-LICENSElicense_rdflicense_rdfapplication/rdf+xml; charset=utf-81037https://tesis.pucp.edu.pe/bitstreams/89c26091-ebcf-4def-9d03-68912ed6e7c6/download8fc46f5e71650fd7adee84a69b9163c2MD53falseAnonymousREADLICENSElicense.txtlicense.txttext/plain; charset=utf-81748https://tesis.pucp.edu.pe/bitstreams/1f7b56db-86d0-4652-9fee-bc93f5e48e87/download8a4605be74aa9ea9d79846c1fba20a33MD54falseAnonymousREADTHUMBNAILOLIVERA_COKAN_CÉSAR_ALBERTO_MARCO_TRABAJO.pdf.jpgOLIVERA_COKAN_CÉSAR_ALBERTO_MARCO_TRABAJO.pdf.jpgIM Thumbnailimage/jpeg25484https://tesis.pucp.edu.pe/bitstreams/07f31dc9-ce79-4f9b-8653-b7f48a8288d0/download9b962b916751f4d93c048e5b32454843MD55falseAnonymousREADOLIVERA_COKAN_CÉSAR_ALBERTO_T.pdf.jpgOLIVERA_COKAN_CÉSAR_ALBERTO_T.pdf.jpgIM Thumbnailimage/jpeg7078https://tesis.pucp.edu.pe/bitstreams/5db12a8f-6733-494d-bdea-9c67affd9774/download2ee47d5edb160a39c3d6bd56f2e5028bMD56falseAnonymousREAD2500-01-01TEXTOLIVERA_COKAN_CÉSAR_ALBERTO_MARCO_TRABAJO.pdf.txtOLIVERA_COKAN_CÉSAR_ALBERTO_MARCO_TRABAJO.pdf.txtExtracted texttext/plain72631https://tesis.pucp.edu.pe/bitstreams/91b3956a-73c4-4571-82bb-9900038a9a58/download618a0900947c8d89609b3bb16457dc33MD57falseAnonymousREADOLIVERA_COKAN_CÉSAR_ALBERTO_T.pdf.txtOLIVERA_COKAN_CÉSAR_ALBERTO_T.pdf.txtExtracted texttext/plain4901https://tesis.pucp.edu.pe/bitstreams/b3828f93-2275-423f-8288-9273acd71b67/downloada09a97ded85e7aebafed36c3f499e372MD58falseAnonymousREAD2500-01-0120.500.12404/28564oai:tesis.pucp.edu.pe:20.500.12404/285642025-03-04 17:56:47.501http://creativecommons.org/licenses/by-nc-sa/2.5/pe/info:eu-repo/semantics/openAccessopen.accesshttps://tesis.pucp.edu.peRepositorio de Tesis PUCPraul.sifuentes@pucp.peTk9URTogUExBQ0UgWU9VUiBPV04gTElDRU5TRSBIRVJFClRoaXMgc2FtcGxlIGxpY2Vuc2UgaXMgcHJvdmlkZWQgZm9yIGluZm9ybWF0aW9uYWwgcHVycG9zZXMgb25seS4KCk5PTi1FWENMVVNJVkUgRElTVFJJQlVUSU9OIExJQ0VOU0UKCkJ5IHNpZ25pbmcgYW5kIHN1Ym1pdHRpbmcgdGhpcyBsaWNlbnNlLCB5b3UgKHRoZSBhdXRob3Iocykgb3IgY29weXJpZ2h0Cm93bmVyKSBncmFudHMgdG8gRFNwYWNlIFVuaXZlcnNpdHkgKERTVSkgdGhlIG5vbi1leGNsdXNpdmUgcmlnaHQgdG8gcmVwcm9kdWNlLAp0cmFuc2xhdGUgKGFzIGRlZmluZWQgYmVsb3cpLCBhbmQvb3IgZGlzdHJpYnV0ZSB5b3VyIHN1Ym1pc3Npb24gKGluY2x1ZGluZwp0aGUgYWJzdHJhY3QpIHdvcmxkd2lkZSBpbiBwcmludCBhbmQgZWxlY3Ryb25pYyBmb3JtYXQgYW5kIGluIGFueSBtZWRpdW0sCmluY2x1ZGluZyBidXQgbm90IGxpbWl0ZWQgdG8gYXVkaW8gb3IgdmlkZW8uCgpZb3UgYWdyZWUgdGhhdCBEU1UgbWF5LCB3aXRob3V0IGNoYW5naW5nIHRoZSBjb250ZW50LCB0cmFuc2xhdGUgdGhlCnN1Ym1pc3Npb24gdG8gYW55IG1lZGl1bSBvciBmb3JtYXQgZm9yIHRoZSBwdXJwb3NlIG9mIHByZXNlcnZhdGlvbi4KCllvdSBhbHNvIGFncmVlIHRoYXQgRFNVIG1heSBrZWVwIG1vcmUgdGhhbiBvbmUgY29weSBvZiB0aGlzIHN1Ym1pc3Npb24gZm9yCnB1cnBvc2VzIG9mIHNlY3VyaXR5LCBiYWNrLXVwIGFuZCBwcmVzZXJ2YXRpb24uCgpZb3UgcmVwcmVzZW50IHRoYXQgdGhlIHN1Ym1pc3Npb24gaXMgeW91ciBvcmlnaW5hbCB3b3JrLCBhbmQgdGhhdCB5b3UgaGF2ZQp0aGUgcmlnaHQgdG8gZ3JhbnQgdGhlIHJpZ2h0cyBjb250YWluZWQgaW4gdGhpcyBsaWNlbnNlLiBZb3UgYWxzbyByZXByZXNlbnQKdGhhdCB5b3VyIHN1Ym1pc3Npb24gZG9lcyBub3QsIHRvIHRoZSBiZXN0IG9mIHlvdXIga25vd2xlZGdlLCBpbmZyaW5nZSB1cG9uCmFueW9uZSdzIGNvcHlyaWdodC4KCklmIHRoZSBzdWJtaXNzaW9uIGNvbnRhaW5zIG1hdGVyaWFsIGZvciB3aGljaCB5b3UgZG8gbm90IGhvbGQgY29weXJpZ2h0LAp5b3UgcmVwcmVzZW50IHRoYXQgeW91IGhhdmUgb2J0YWluZWQgdGhlIHVucmVzdHJpY3RlZCBwZXJtaXNzaW9uIG9mIHRoZQpjb3B5cmlnaHQgb3duZXIgdG8gZ3JhbnQgRFNVIHRoZSByaWdodHMgcmVxdWlyZWQgYnkgdGhpcyBsaWNlbnNlLCBhbmQgdGhhdApzdWNoIHRoaXJkLXBhcnR5IG93bmVkIG1hdGVyaWFsIGlzIGNsZWFybHkgaWRlbnRpZmllZCBhbmQgYWNrbm93bGVkZ2VkCndpdGhpbiB0aGUgdGV4dCBvciBjb250ZW50IG9mIHRoZSBzdWJtaXNzaW9uLgoKSUYgVEhFIFNVQk1JU1NJT04gSVMgQkFTRUQgVVBPTiBXT1JLIFRIQVQgSEFTIEJFRU4gU1BPTlNPUkVEIE9SIFNVUFBPUlRFRApCWSBBTiBBR0VOQ1kgT1IgT1JHQU5JWkFUSU9OIE9USEVSIFRIQU4gRFNVLCBZT1UgUkVQUkVTRU5UIFRIQVQgWU9VIEhBVkUKRlVMRklMTEVEIEFOWSBSSUdIVCBPRiBSRVZJRVcgT1IgT1RIRVIgT0JMSUdBVElPTlMgUkVRVUlSRUQgQlkgU1VDSApDT05UUkFDVCBPUiBBR1JFRU1FTlQuCgpEU1Ugd2lsbCBjbGVhcmx5IGlkZW50aWZ5IHlvdXIgbmFtZShzKSBhcyB0aGUgYXV0aG9yKHMpIG9yIG93bmVyKHMpIG9mIHRoZQpzdWJtaXNzaW9uLCBhbmQgd2lsbCBub3QgbWFrZSBhbnkgYWx0ZXJhdGlvbiwgb3RoZXIgdGhhbiBhcyBhbGxvd2VkIGJ5IHRoaXMKbGljZW5zZSwgdG8geW91ciBzdWJtaXNzaW9uLgo= | 
| score | 13.932078 | 
 Nota importante:
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).
    La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).
 
   
   
             
            