Marco de trabajo para el desarrollo de proyectos de analítica de datos
Descripción del Articulo
El desarrollo de proyectos de analítica de datos en las organizaciones requiere de procesos bien definidos para su éxito. Existen procesos estándar de analítica de datos, como CRISP-DM, que han tenido una amplia adopción en las últimas décadas. Sin embargo, mediante una búsqueda sistemática de la li...
| Autor: | |
|---|---|
| Formato: | tesis de maestría |
| Fecha de Publicación: | 2024 |
| Institución: | Pontificia Universidad Católica del Perú |
| Repositorio: | PUCP-Institucional |
| Lenguaje: | español |
| OAI Identifier: | oai:repositorio.pucp.edu.pe:20.500.14657/201019 |
| Enlace del recurso: | http://hdl.handle.net/20.500.12404/28564 |
| Nivel de acceso: | acceso abierto |
| Materia: | Minería de datos--Investigación--Metodología Administración de proyectos Ciencia del diseño https://purl.org/pe-repo/ocde/ford#1.02.00 |
| id |
RPUC_254d736de43e233c4a9e24c90a8af143 |
|---|---|
| oai_identifier_str |
oai:repositorio.pucp.edu.pe:20.500.14657/201019 |
| network_acronym_str |
RPUC |
| network_name_str |
PUCP-Institucional |
| repository_id_str |
2905 |
| spelling |
Bello Ruiz, Alejandro ToribioPow Sang Portillo, José AntonioOlivera Cokan, César Alberto2024-08-09T22:02:04Z2024-08-09T22:02:04Z20242024-08-09http://hdl.handle.net/20.500.12404/28564El desarrollo de proyectos de analítica de datos en las organizaciones requiere de procesos bien definidos para su éxito. Existen procesos estándar de analítica de datos, como CRISP-DM, que han tenido una amplia adopción en las últimas décadas. Sin embargo, mediante una búsqueda sistemática de la literatura se ha podido evidenciar que muchas de las organizaciones a menudo no aplican CRISP-DM o procesos similares, como SEMMA y KDD, tal como están, sino que muchos de ellas adaptan estos marcos de trabajo para abordar requerimientos específicos en diversos contextos de la industria. Además, según estos estudios se evidencia que un grupo considerable de empresas emplea Scrum u otros marcos de trabajo para el desarrollo de software con el fin de llevar a cabo sus proyectos de analítica de datos, lo cual no es correcto pues estos marcos de trabajo no abordan las particularidades de un ciclo de vida de una solución analítica. Si bien CRISPDM es el marco de trabajo para analítica de datos más empleado, este mismo posee un conjunto de falencias enfocadas en diversos casos de uso o procesos de negocio que ha llevado a muchas organizaciones a adaptar este marco a sus necesidades. Hasta ahora no se ha sugerido ninguna adaptación que permita abordar las falencias que los diferentes dominios en la industria poseen. Este artículo aborda la propuesta del diseño de un marco de trabajo para proyectos de analítica de datos general denominado GEN-DA (Generic Data Analytics framework por sus siglas en inglés). GEN-DA extiende y modifica CRISP-DM para solucionar las diferentes falencias encontradas en la literatura y lograr un ciclo de vida del proyecto de analítica de datos que pueda ser empleado en todos los contextos de la industria. Este marco de trabajo ha sido diseñado y evaluado de forma iterativa empleando una metodología en ciencias del diseño gracias a la participación de expertos en analítica de datos mediante el método de validación por Juicio Experto. Los resultados obtenidos son alentadores y habilita la factibilidad de emplear este marco propuesto en un entorno real, cuyos resultados, se presume, que serán satisfactorios.spaPontificia Universidad Católica del PerúPEinfo:eu-repo/semantics/openAccesshttp://creativecommons.org/licenses/by-nc-sa/2.5/pe/Minería de datos--Investigación--MetodologíaAdministración de proyectosCiencia del diseñohttps://purl.org/pe-repo/ocde/ford#1.02.00Marco de trabajo para el desarrollo de proyectos de analítica de datosinfo:eu-repo/semantics/masterThesisreponame:PUCP-Institucionalinstname:Pontificia Universidad Católica del Perúinstacron:PUCPMaestro en Informática con mención en Ciencias de la ComputaciónMaestríaPontificia Universidad Católica del Perú. Escuela de Posgrado.Informática con mención en Ciencias de la Computación1665662421520576https://orcid.org/0000-0002-8608-6364https://orcid.org/0000-0003-4001-807247803790611087Villanueva Talavera, Edwin RafaelBello Ruiz, Alejandro ToribioFlores Lafosse, Natalíhttps://purl.org/pe-repo/renati/level#maestrohttps://purl.org/pe-repo/renati/type#trabajoDeInvestigacion20.500.14657/201019oai:repositorio.pucp.edu.pe:20.500.14657/2010192025-03-11 11:07:29.69http://creativecommons.org/licenses/by-nc-sa/2.5/pe/info:eu-repo/semantics/openAccessmetadata.onlyhttps://repositorio.pucp.edu.peRepositorio Institucional de la PUCPrepositorio@pucp.pe |
| dc.title.es_ES.fl_str_mv |
Marco de trabajo para el desarrollo de proyectos de analítica de datos |
| title |
Marco de trabajo para el desarrollo de proyectos de analítica de datos |
| spellingShingle |
Marco de trabajo para el desarrollo de proyectos de analítica de datos Olivera Cokan, César Alberto Minería de datos--Investigación--Metodología Administración de proyectos Ciencia del diseño https://purl.org/pe-repo/ocde/ford#1.02.00 |
| title_short |
Marco de trabajo para el desarrollo de proyectos de analítica de datos |
| title_full |
Marco de trabajo para el desarrollo de proyectos de analítica de datos |
| title_fullStr |
Marco de trabajo para el desarrollo de proyectos de analítica de datos |
| title_full_unstemmed |
Marco de trabajo para el desarrollo de proyectos de analítica de datos |
| title_sort |
Marco de trabajo para el desarrollo de proyectos de analítica de datos |
| author |
Olivera Cokan, César Alberto |
| author_facet |
Olivera Cokan, César Alberto |
| author_role |
author |
| dc.contributor.advisor.fl_str_mv |
Bello Ruiz, Alejandro Toribio Pow Sang Portillo, José Antonio |
| dc.contributor.author.fl_str_mv |
Olivera Cokan, César Alberto |
| dc.subject.es_ES.fl_str_mv |
Minería de datos--Investigación--Metodología Administración de proyectos Ciencia del diseño |
| topic |
Minería de datos--Investigación--Metodología Administración de proyectos Ciencia del diseño https://purl.org/pe-repo/ocde/ford#1.02.00 |
| dc.subject.ocde.es_ES.fl_str_mv |
https://purl.org/pe-repo/ocde/ford#1.02.00 |
| description |
El desarrollo de proyectos de analítica de datos en las organizaciones requiere de procesos bien definidos para su éxito. Existen procesos estándar de analítica de datos, como CRISP-DM, que han tenido una amplia adopción en las últimas décadas. Sin embargo, mediante una búsqueda sistemática de la literatura se ha podido evidenciar que muchas de las organizaciones a menudo no aplican CRISP-DM o procesos similares, como SEMMA y KDD, tal como están, sino que muchos de ellas adaptan estos marcos de trabajo para abordar requerimientos específicos en diversos contextos de la industria. Además, según estos estudios se evidencia que un grupo considerable de empresas emplea Scrum u otros marcos de trabajo para el desarrollo de software con el fin de llevar a cabo sus proyectos de analítica de datos, lo cual no es correcto pues estos marcos de trabajo no abordan las particularidades de un ciclo de vida de una solución analítica. Si bien CRISPDM es el marco de trabajo para analítica de datos más empleado, este mismo posee un conjunto de falencias enfocadas en diversos casos de uso o procesos de negocio que ha llevado a muchas organizaciones a adaptar este marco a sus necesidades. Hasta ahora no se ha sugerido ninguna adaptación que permita abordar las falencias que los diferentes dominios en la industria poseen. Este artículo aborda la propuesta del diseño de un marco de trabajo para proyectos de analítica de datos general denominado GEN-DA (Generic Data Analytics framework por sus siglas en inglés). GEN-DA extiende y modifica CRISP-DM para solucionar las diferentes falencias encontradas en la literatura y lograr un ciclo de vida del proyecto de analítica de datos que pueda ser empleado en todos los contextos de la industria. Este marco de trabajo ha sido diseñado y evaluado de forma iterativa empleando una metodología en ciencias del diseño gracias a la participación de expertos en analítica de datos mediante el método de validación por Juicio Experto. Los resultados obtenidos son alentadores y habilita la factibilidad de emplear este marco propuesto en un entorno real, cuyos resultados, se presume, que serán satisfactorios. |
| publishDate |
2024 |
| dc.date.accessioned.none.fl_str_mv |
2024-08-09T22:02:04Z |
| dc.date.available.none.fl_str_mv |
2024-08-09T22:02:04Z |
| dc.date.created.none.fl_str_mv |
2024 |
| dc.date.issued.fl_str_mv |
2024-08-09 |
| dc.type.es_ES.fl_str_mv |
info:eu-repo/semantics/masterThesis |
| format |
masterThesis |
| dc.identifier.uri.none.fl_str_mv |
http://hdl.handle.net/20.500.12404/28564 |
| url |
http://hdl.handle.net/20.500.12404/28564 |
| dc.language.iso.es_ES.fl_str_mv |
spa |
| language |
spa |
| dc.rights.es_ES.fl_str_mv |
info:eu-repo/semantics/openAccess |
| dc.rights.uri.none.fl_str_mv |
http://creativecommons.org/licenses/by-nc-sa/2.5/pe/ |
| eu_rights_str_mv |
openAccess |
| rights_invalid_str_mv |
http://creativecommons.org/licenses/by-nc-sa/2.5/pe/ |
| dc.publisher.es_ES.fl_str_mv |
Pontificia Universidad Católica del Perú |
| dc.publisher.country.es_ES.fl_str_mv |
PE |
| dc.source.none.fl_str_mv |
reponame:PUCP-Institucional instname:Pontificia Universidad Católica del Perú instacron:PUCP |
| instname_str |
Pontificia Universidad Católica del Perú |
| instacron_str |
PUCP |
| institution |
PUCP |
| reponame_str |
PUCP-Institucional |
| collection |
PUCP-Institucional |
| repository.name.fl_str_mv |
Repositorio Institucional de la PUCP |
| repository.mail.fl_str_mv |
repositorio@pucp.pe |
| _version_ |
1835638439952777216 |
| score |
13.987529 |
Nota importante:
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).