Marco de trabajo para el desarrollo de proyectos de analítica de datos

Descripción del Articulo

El desarrollo de proyectos de analítica de datos en las organizaciones requiere de procesos bien definidos para su éxito. Existen procesos estándar de analítica de datos, como CRISP-DM, que han tenido una amplia adopción en las últimas décadas. Sin embargo, mediante una búsqueda sistemática de la li...

Descripción completa

Detalles Bibliográficos
Autor: Olivera Cokan, César Alberto
Formato: tesis de maestría
Fecha de Publicación:2024
Institución:Pontificia Universidad Católica del Perú
Repositorio:PUCP-Institucional
Lenguaje:español
OAI Identifier:oai:repositorio.pucp.edu.pe:20.500.14657/201019
Enlace del recurso:http://hdl.handle.net/20.500.12404/28564
Nivel de acceso:acceso abierto
Materia:Minería de datos--Investigación--Metodología
Administración de proyectos
Ciencia del diseño
https://purl.org/pe-repo/ocde/ford#1.02.00
id RPUC_254d736de43e233c4a9e24c90a8af143
oai_identifier_str oai:repositorio.pucp.edu.pe:20.500.14657/201019
network_acronym_str RPUC
network_name_str PUCP-Institucional
repository_id_str 2905
spelling Bello Ruiz, Alejandro ToribioPow Sang Portillo, José AntonioOlivera Cokan, César Alberto2024-08-09T22:02:04Z2024-08-09T22:02:04Z20242024-08-09http://hdl.handle.net/20.500.12404/28564El desarrollo de proyectos de analítica de datos en las organizaciones requiere de procesos bien definidos para su éxito. Existen procesos estándar de analítica de datos, como CRISP-DM, que han tenido una amplia adopción en las últimas décadas. Sin embargo, mediante una búsqueda sistemática de la literatura se ha podido evidenciar que muchas de las organizaciones a menudo no aplican CRISP-DM o procesos similares, como SEMMA y KDD, tal como están, sino que muchos de ellas adaptan estos marcos de trabajo para abordar requerimientos específicos en diversos contextos de la industria. Además, según estos estudios se evidencia que un grupo considerable de empresas emplea Scrum u otros marcos de trabajo para el desarrollo de software con el fin de llevar a cabo sus proyectos de analítica de datos, lo cual no es correcto pues estos marcos de trabajo no abordan las particularidades de un ciclo de vida de una solución analítica. Si bien CRISPDM es el marco de trabajo para analítica de datos más empleado, este mismo posee un conjunto de falencias enfocadas en diversos casos de uso o procesos de negocio que ha llevado a muchas organizaciones a adaptar este marco a sus necesidades. Hasta ahora no se ha sugerido ninguna adaptación que permita abordar las falencias que los diferentes dominios en la industria poseen. Este artículo aborda la propuesta del diseño de un marco de trabajo para proyectos de analítica de datos general denominado GEN-DA (Generic Data Analytics framework por sus siglas en inglés). GEN-DA extiende y modifica CRISP-DM para solucionar las diferentes falencias encontradas en la literatura y lograr un ciclo de vida del proyecto de analítica de datos que pueda ser empleado en todos los contextos de la industria. Este marco de trabajo ha sido diseñado y evaluado de forma iterativa empleando una metodología en ciencias del diseño gracias a la participación de expertos en analítica de datos mediante el método de validación por Juicio Experto. Los resultados obtenidos son alentadores y habilita la factibilidad de emplear este marco propuesto en un entorno real, cuyos resultados, se presume, que serán satisfactorios.spaPontificia Universidad Católica del PerúPEinfo:eu-repo/semantics/openAccesshttp://creativecommons.org/licenses/by-nc-sa/2.5/pe/Minería de datos--Investigación--MetodologíaAdministración de proyectosCiencia del diseñohttps://purl.org/pe-repo/ocde/ford#1.02.00Marco de trabajo para el desarrollo de proyectos de analítica de datosinfo:eu-repo/semantics/masterThesisreponame:PUCP-Institucionalinstname:Pontificia Universidad Católica del Perúinstacron:PUCPMaestro en Informática con mención en Ciencias de la ComputaciónMaestríaPontificia Universidad Católica del Perú. Escuela de Posgrado.Informática con mención en Ciencias de la Computación1665662421520576https://orcid.org/0000-0002-8608-6364https://orcid.org/0000-0003-4001-807247803790611087Villanueva Talavera, Edwin RafaelBello Ruiz, Alejandro ToribioFlores Lafosse, Natalíhttps://purl.org/pe-repo/renati/level#maestrohttps://purl.org/pe-repo/renati/type#trabajoDeInvestigacion20.500.14657/201019oai:repositorio.pucp.edu.pe:20.500.14657/2010192025-03-11 11:07:29.69http://creativecommons.org/licenses/by-nc-sa/2.5/pe/info:eu-repo/semantics/openAccessmetadata.onlyhttps://repositorio.pucp.edu.peRepositorio Institucional de la PUCPrepositorio@pucp.pe
dc.title.es_ES.fl_str_mv Marco de trabajo para el desarrollo de proyectos de analítica de datos
title Marco de trabajo para el desarrollo de proyectos de analítica de datos
spellingShingle Marco de trabajo para el desarrollo de proyectos de analítica de datos
Olivera Cokan, César Alberto
Minería de datos--Investigación--Metodología
Administración de proyectos
Ciencia del diseño
https://purl.org/pe-repo/ocde/ford#1.02.00
title_short Marco de trabajo para el desarrollo de proyectos de analítica de datos
title_full Marco de trabajo para el desarrollo de proyectos de analítica de datos
title_fullStr Marco de trabajo para el desarrollo de proyectos de analítica de datos
title_full_unstemmed Marco de trabajo para el desarrollo de proyectos de analítica de datos
title_sort Marco de trabajo para el desarrollo de proyectos de analítica de datos
author Olivera Cokan, César Alberto
author_facet Olivera Cokan, César Alberto
author_role author
dc.contributor.advisor.fl_str_mv Bello Ruiz, Alejandro Toribio
Pow Sang Portillo, José Antonio
dc.contributor.author.fl_str_mv Olivera Cokan, César Alberto
dc.subject.es_ES.fl_str_mv Minería de datos--Investigación--Metodología
Administración de proyectos
Ciencia del diseño
topic Minería de datos--Investigación--Metodología
Administración de proyectos
Ciencia del diseño
https://purl.org/pe-repo/ocde/ford#1.02.00
dc.subject.ocde.es_ES.fl_str_mv https://purl.org/pe-repo/ocde/ford#1.02.00
description El desarrollo de proyectos de analítica de datos en las organizaciones requiere de procesos bien definidos para su éxito. Existen procesos estándar de analítica de datos, como CRISP-DM, que han tenido una amplia adopción en las últimas décadas. Sin embargo, mediante una búsqueda sistemática de la literatura se ha podido evidenciar que muchas de las organizaciones a menudo no aplican CRISP-DM o procesos similares, como SEMMA y KDD, tal como están, sino que muchos de ellas adaptan estos marcos de trabajo para abordar requerimientos específicos en diversos contextos de la industria. Además, según estos estudios se evidencia que un grupo considerable de empresas emplea Scrum u otros marcos de trabajo para el desarrollo de software con el fin de llevar a cabo sus proyectos de analítica de datos, lo cual no es correcto pues estos marcos de trabajo no abordan las particularidades de un ciclo de vida de una solución analítica. Si bien CRISPDM es el marco de trabajo para analítica de datos más empleado, este mismo posee un conjunto de falencias enfocadas en diversos casos de uso o procesos de negocio que ha llevado a muchas organizaciones a adaptar este marco a sus necesidades. Hasta ahora no se ha sugerido ninguna adaptación que permita abordar las falencias que los diferentes dominios en la industria poseen. Este artículo aborda la propuesta del diseño de un marco de trabajo para proyectos de analítica de datos general denominado GEN-DA (Generic Data Analytics framework por sus siglas en inglés). GEN-DA extiende y modifica CRISP-DM para solucionar las diferentes falencias encontradas en la literatura y lograr un ciclo de vida del proyecto de analítica de datos que pueda ser empleado en todos los contextos de la industria. Este marco de trabajo ha sido diseñado y evaluado de forma iterativa empleando una metodología en ciencias del diseño gracias a la participación de expertos en analítica de datos mediante el método de validación por Juicio Experto. Los resultados obtenidos son alentadores y habilita la factibilidad de emplear este marco propuesto en un entorno real, cuyos resultados, se presume, que serán satisfactorios.
publishDate 2024
dc.date.accessioned.none.fl_str_mv 2024-08-09T22:02:04Z
dc.date.available.none.fl_str_mv 2024-08-09T22:02:04Z
dc.date.created.none.fl_str_mv 2024
dc.date.issued.fl_str_mv 2024-08-09
dc.type.es_ES.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
dc.identifier.uri.none.fl_str_mv http://hdl.handle.net/20.500.12404/28564
url http://hdl.handle.net/20.500.12404/28564
dc.language.iso.es_ES.fl_str_mv spa
language spa
dc.rights.es_ES.fl_str_mv info:eu-repo/semantics/openAccess
dc.rights.uri.none.fl_str_mv http://creativecommons.org/licenses/by-nc-sa/2.5/pe/
eu_rights_str_mv openAccess
rights_invalid_str_mv http://creativecommons.org/licenses/by-nc-sa/2.5/pe/
dc.publisher.es_ES.fl_str_mv Pontificia Universidad Católica del Perú
dc.publisher.country.es_ES.fl_str_mv PE
dc.source.none.fl_str_mv reponame:PUCP-Institucional
instname:Pontificia Universidad Católica del Perú
instacron:PUCP
instname_str Pontificia Universidad Católica del Perú
instacron_str PUCP
institution PUCP
reponame_str PUCP-Institucional
collection PUCP-Institucional
repository.name.fl_str_mv Repositorio Institucional de la PUCP
repository.mail.fl_str_mv repositorio@pucp.pe
_version_ 1835638439952777216
score 13.987529
Nota importante:
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).