1
tesis de maestría
Publicado 2022
Enlace

La presente tesis muestra la aplicación de la Metodología Fundamental de Ciencia de Datos de IBM en conjunto con el marco de trabajo SCRUM para poder Analizar, modelar e implementar un modelo predictivo que permita asignar probabilidades a las transacciones bancarias y establecer cuáles son probablemente fraudulentas. Con tal objeto, se identificará al mejor modelo luego de ejecutar la validación cruzada con Kfold igual a 10 y calcular los indicadores de Área bajo la curva de la Precisión y Exhaustividad (AUC-PR) y Lift ya que nos encontramos ante un problema de datos desbalanceados donde las transacciones fraudulentas representan el 0.13% y las no fraudulentas el 99.87%. Como resultado se obtiene el mejor modelo a Gradient Boosting Classifier del que se obtuvieron los resultados con un Área bajo la curva de la Precisión y Exhaustividad (AUC-PR) de 0.036 y Lift de 3.629%; estos ...
2
Publicado 2024
Enlace

El presente informe detalla la metodología empleada para desarrollar los modelos analíticos basados en técnicas de Aprendizaje Automático (Machine Learning, ML), los cuales fueron ajustados para proyectar, con un horizonte temporal de un año, la «matrícula escolar, las secciones y docentes» para cada grado escolar de los servicios educativos de la «Educación Básica Regular» (EBR) en el Perú. La elaboración de los modelos se fundamentó principalmente de los datos administrativos proporcionados por el Ministerio de Educación (Minedu), los cuales revelaron su idoneidad para la implementación de modelos de ML. Las proyecciones generadas por los modelos de ML fueron sometidas a una evaluación, comparándolas con las proyecciones realizadas por la Unidad de Estadística (UE) de la Oficina de Seguimiento y Evaluación Estratégica (OSEE) del Minedu para el año 2021. La métri...