Tópicos Sugeridos dentro de su búsqueda.
Tópicos Sugeridos dentro de su búsqueda.
1
tesis de grado
Publicado 2024
Enlace
Enlace
El presente trabajo de investigación muestra la estrategia de ventas cruzada de una empresa peruana especializada en medios de pagos, mediante la aplicación de machine learning basado en el enfoque de minería de datos, se intenta impulsar las ventas identificando patrones dentro de su portafolio de comercios. Actualmente la empresa procesadora de medios de pagos cuenta con comercios con un solo sistema de pago del total de su portafolio, esto conlleva a una pérdida de captación de venta, haciendo uso de la estrategia de Cross Selling aplicando el algoritmo k-vecinos más cercanos se puede lograr vender más productos o canales de pagos relevantes para cada comercio.
2
artículo
Publicado 2018
Enlace
Enlace
Este artículo resume las contribuciones principales de la tesis con el título “K-vecino más próximos en una aplicación de clasificación y predicción en el Poder Judicial del Perú". En esta tesis se construye un modelo utilizando el método de los k-vecinos más próximos que permite clasificar y predecir las Cortes Superiores de Justicia del Perú. Mediante un análisis descriptivo de datos se excluye la Corte de Lima del estudio. Con las restantes 30 Cortes Superiores, se genera un modelo de tres grupos fundado en clasificación no supervisada, para ello se deduce la matriz de distancia euclidiana que origina el árbol de clasificación. Se construye el modelo de clasificación de tres vecinos más próximos, con partición y pliegues de validación cruzada aleatoria, que indica; el modelo de espacio de predictores, el error cuadrático o índice de error que valida el valor ...
3
tesis de maestría
Publicado 2017
Enlace
Enlace
Busca encontrar modelos utilizando el método de los k−vecinos más próximos con el propósito de clasificar las 31 Cortes Superiores de Justicia del País y poder realizar predicciones para futuras Cortes Superiores de Justicia. Verifica la validez del modelo de clasificación y predicción de las Cortes Superiores de Justicia basado en el método de los k-vecinos más próximos. Verifica la precisión del modelo de k-vecinos más próximo cuando se tiene muestras pequeñas de entrenamiento y reserva. Experimenta los modelos que identifica y evalúa las 31 Cortes Superiores de Justicia, respecto de los predictores en forma a priori. Encuentra un modelo de agrupamiento jerárquico basado en encadenamiento simple para asociar las Cortes Superiores de Justicia del País en conglomerados.
4
tesis de grado
Publicado 2021
Enlace
Enlace
Universidad Nacional Agraria La Molina. Facultad de Economía y Planificación. Departamento Académico de Estadística e Informática
5
tesis de grado
Publicado 2020
Enlace
Enlace
El presente proyecto de investigación denominado “COMPARACIÓN DE KVECINOS MÁS CERCANOS Y SUAVIZAMIENTO EXPONENCIAL EN LA PREDICCION DE MOROSIDAD DE CUOTAS SOCIALES DEL COLEGUIO DE INGENIEROS DEL PERÚ CONSEJO DEPARTAMENTAL LAMBAYEQUE” se propone utilizar dos técnicas de predicción, donde se utiliza una computacional K-Vecinos más Cercanos, una estadística Suavizamiento Exponencial donde lo que se espera es saber que algoritmo es el más eficaz para predecir la morosidad, donde se utilizaran los datos de los Colegiados del Colegio de Ingenieros CDL. Donde se toma como guía estudios realizados en otros campos ya que en morosidad no hay hasta el momento un estudio que determine cualquier tipo de medición en el campo de morosidad. El objetivo principal es saber que algoritmo es el mejor para predecir la morosidad, donde se evaluara la precisión, especificidad y tiempo y así sa...
6
tesis de grado
Publicado 2024
Enlace
Enlace
La investigación realizada tuvo como objetivo principal determinar el impacto de la implementación de un Algoritmo basado en una red siamesa, pérdida del triplete, kvecinos más cercanos y en el aprendizaje de una sesión para el reconocimiento facial. Las teorías que se platearon respecto a la investigación son que la implementación de un algoritmo basado en una red siamesa, pérdida del triplete, k-vecinos más cercanos y en el aprendizaje de una sesión, reducirá el tiempo de entrenamiento de reconocimiento facial y además de ello aumentará la precisión del mismo. La investigación se realizó mediante un enfoque cuantitativo, con un diseño de tipo preexperimental. Para el presente estudio se tomó como población los datos digitales del dataset ORL, que incluyo 400 imágenes de representaciones faciales y como muestra se utilizó 40 imágenes de representaciones faciales. ...
7
tesis de grado
Publicado 2025
Enlace
Enlace
La calidad del agua en la cuenca del río Huarmey enfrenta desafíos significativos debido a la contaminación por metales pesados y parámetros fisicoquímicos que superan los estándares de calidad ambiental del agua en Perú. Tradicionalmente, la evaluación del Índice de Calidad de Agua (ICA) se realiza mediante fórmulas y macros de Excel, lo que implica largos tiempos de procesamiento, alta propensión a errores y limitaciones frente a grandes volúmenes de datos. La presente investigación propone la implementación de un modelo de clasificación basado en el algoritmo K-vecinos más cercanos (KNN) para optimizar la categorización de muestras de agua en las categorías de Consumo Humano (1-A2) y Bebida Animal (3-D2), conforme al ICA Perú. Además, se comparó su desempeño con los algoritmos Support Vector Machine (SVM) y Random Forest (RF), aplicando normalización Min-Max, va...
8
tesis de grado
Publicado 2024
Enlace
Enlace
La presente investigación titulada “Estudio comparativo de modelos de clasificación de Minería de Datos para la predicción del rendimiento académico de los estudiantes de la Escuela Profesional de Ingeniería de Sistemas e Informática-UTEA”, tuvo como objetivo principal comparar los modelos de clasificación de minería de datos: Árboles de decisión y K-Vecinos Más Cercanos para predecir el rendimiento académico de los estudiantes en la Escuela Profesional de Ingeniería de Sistemas e Informática – UTEA. Con una metodología de investigación aplicada, de nivel descriptivo y diseño no experimental de corte transversal. La muestra consistió en 112 estudiantes inscritos en la asignatura de Minería de datos, seleccionados mediante el método no probabilístico e intencional. Se registraron los resultados del desempeño de cada modelo aplicando la técnica de la observaci...
9
artículo
Publicado 2018
Enlace
Enlace
Abstract: This article summarizes the main contributions of the thesis with the title “K-Nearest neighbor in a classification and prediction application in the Judicial Power of Peru". In this thesis a model is constructed using the method of the nearest k-neighbors that allows classifying and predicting the Superior Courts of Justice of Peru. Through a descriptive data analysis, the Lima Court is excluded from the study. With the remaining 30 Superior Courts, a three-group model based on unsupervised classification is generated, for which the Euclidean distance matrix that originates the classification tree is deduced. The classification model of three nearest neighbors is constructed, with partition and random cross-validation folds, which indicates; the predictor space model, the quadratic error or error index that validates the op-timal value of k = 3 neighbors, the model error and...
10
tesis de grado
Publicado 2024
Enlace
Enlace
La presente investigación tiene como objetivo determinar un modelo de aprendizaje automático para la predicción del rendimiento académico de los estudiantes ingresantes de la Facultad de Ingeniería en Industrias Alimentarias de la UNAS. Se planteó la hipótesis: La predicción del rendimiento académico de los estudiantes ingresantes de la Facultad de Ingeniería en Industrias Alimentarias de la UNAS con un modelo de aprendizaje automático es significativa. La técnica que se usó para recolectar los datos es una ficha de análisis documental, se obtuvo una población 204 datos. Con el software WEKA 3.9.5 y el análisis de cinco modelos Vote, k Vecinos más Cercanos (IBK), Random Forest, Naive Bayes, y Bagging. En conclusión, El rendimiento académico de los alumnos ingresantes es un tema muy complejo, usando la metodología CRISP-DM y técnicas de minería de datos se logró det...
11
tesis de grado
Publicado 2024
Enlace
Enlace
La osmosis inversa es un proceso ampliamente utilizado en la purificación del agua por medio de una membrana semi permeable encargada de retener todas las partículas da niñas para el hombre. Sin embrago, el desgaste de esta puede comprometer tanto la calidad del producto como el rendimiento del equipo, lo que eventualmente podría requerir de un mantenimiento mayor. Esto reduciría la disponibilidad del activo y generaría retraso en la prestación del servicio a los clientes. Esta investigación se centro inicialmente en hacer un estudio comparativo entre diferentes algoritmos de aprendizaje máquina capaces de poder clasificar y monitorizar el estado en tiempo real del proceso de ´osmosis inversa de la empresa DILO y con ello evitar en lo posible un desmontaje del activo. Se utilizaron algoritmos de clasificación tales como el Perceptrón Multicapa (MLP) y K-Nearest Neighbors (KNN...
12
tesis de grado
Publicado 2019
Enlace
Enlace
La producción de mangos en el Per ú constituye una fuente muy impor tante en la economía. El uso de sistemas de clasificación automática todavía no se aplica ampliamente para apoyar la producción y distr ibución la cual es realizada por una persona considerada exper ta. Así que el objetivo de este trabajo es implementar una técnica no destr uctiva para automatizar el procedimiento de la clasificación de los mangos según su estado de madurez utilizando el sensor de color RGB TCS3200 para la extracción de las caracter ísticas de color. El conjunto de datos se recolectó en fases verde, semi maduro y maduro. A continuación, se realiza el preprocesamiento de los datos el cual consiste en conver tir las muestras RGB al modelo de color CIE L*a*b* para trabajar con datos semejantes a como el ser humano percibe el color. La extracción de caracter ísticas de color cor responde a ...
13
tesis de grado
Publicado 2019
Enlace
Enlace
Este estudio resalta la importancia de llevar un control para detectar fraudes en tarjetas de crédito para prevenir diferentes riesgos hacia nuestros bienes. Las técnicas de Aprendizaje Automático han demostrado ser la solución para el aprendizaje supervisado. Este trabajo identifica técnicas como Máquinas de Vectores de Soporte, Clasificador Bayesiano Ingenuo, Bosques Aleatorios, Red Neuronal y Extreme Gradiente Boost como las mejores técnicas según los trabajos relacionados. Este trabajo se enfocó en realizar todo el proceso que aborda un proyecto como este, es decir ingeniería de características, preparar los datos, lidiar con el desbalance de datos, entre otros. Se usó como herramienta de evaluación de rendimiento la validación cruzada k-fold para encontrar la mejor parametrización de cada una de estas técnicas, que son evaluadas con métricas de desempeño como exact...
14
tesis de grado
Publicado 2022
Enlace
Enlace
Los ensayos de desgaste según la norma ASTM G-65 son realizados para determinar la resistencia al desgaste abrasivo de bajo esfuerzo de un material mediante su exposición al contacto con arena seca. Estos ensayos permiten la evaluación de recargues duros o hardfacing con la finalidad de encontrar los efectos de los elementos aleantes sobre la microestructura y la resistencia al desgaste. Por su parte, el aprendizaje automático, conocido como Machine Learning, es una técnica del campo de la inteligencia artificial que busca desarrollar modelos computacionales con la capacidad de realizar tareas de clasificación y regresión. La metodología utilizada para realizar el entrenamiento, y posterior evaluación de los modelos obtenidos, consiste en la digitalización de los registros de ensayos de desgaste ejecutados por la American Welding Society, el análisis del comportamiento de la p...
15
tesis de grado
Publicado 2019
Enlace
Enlace
Desde que el Ministerio de Educación oficializó el alfabeto shipibo-konibo, existe la necesidad de generar una gran cantidad de documentos educativos y oficiales para los hablantes de esta lengua, los cuales solo se realizan actualmente mediante el apoyo de traductores o personas bilingües. Sin embargo, en el campo de la lingüística computacional existen herramientas que permiten facilitar estas labores, como es el caso de un lematizador, el cual se encarga de obtener el lema o forma base de una palabra a partir de su forma flexionada. Su realización se da comúnmente mediante dos métodos: el uso de reglas morfológicas y el uso de diccionarios. Debido a esto, este proyecto tiene como objetivo principal desarrollar una herramienta de lematización para el shipibo-konibo usando un corpus de palabras, la cual se base en los estándares de anotación utilizados en otras lenguas, y qu...
16
tesis de grado
Publicado 2018
Enlace
Enlace
Desde que el Ministerio de Educación oficializó el alfabeto shipibo-konibo, existe la necesidad de generar una gran cantidad de documentos educativos y oficiales para los hablantes de esta lengua, los cuales solo se realizan actualmente mediante el apoyo de traductores o personas bilingües. Sin embargo, en el campo de la lingüística computacional existen herramientas que permiten facilitar estas labores, como es el caso de un lematizador, el cual se encarga de obtener el lema o forma base de una palabra a partir de su forma flexionada. Su realización se da comúnmente mediante dos métodos: el uso de reglas morfológicas y el uso de diccionarios. Debido a esto, este proyecto tiene como objetivo principal desarrollar una herramienta de lematización para el shipibo-konibo usando un corpus de palabras, la cual se base en los estándares de anotación utilizados en otras lenguas, y qu...
17
tesis de grado
Publicado 2023
Enlace
Enlace
La presente investigación es básica descriptiva, con un enfoque cuantitativo con diseño no experimental donde la unidad de análisis son los pacientes infantes del Hospital Regional del Cusco, el propósito de la presente investigación fue el de determinar cuál es la técnica de imputación de datos que mejor desempeño presenta la muestra estuvo conformado por 656 registros de historias de los pacientes infantes del Hospital Regional del Cusco-2021, donde la técnica de recolección de datos e información fue la revisión documental, en específico revisión de historias clínicas. Para el análisis se utilizó metodologías de completar datos, como completar con la mediana, completar con regresión utilizando predictores y ruidos aleatorios gaussianos, además de la metodología de KNN k vecinos más cercanos, todos ellos implementados en el software libre R y Restudio; así mism...
18
tesis de grado
Publicado 2024
Enlace
Enlace
Actualmente el porcentaje de accidentes de tránsito se ha incrementado y según las estadísticas este porcentaje seguirá aumentando cada año, por tal motivo se deben desarrollar nuevas tecnologías para prevenir accidentes de este tipo. Este documento presenta un sistema de detección de somnolencia basado en señales de electroencefalograma (EEG) mediante un par de canales (Fp1 y Fp2), aplicado a los conductores antes de subir a sus vehículos. Primero, este modelo detecta la relación entre el área bajo la curva (AUC) de las ondas cerebrales alfa, este es un parámetro principal para detectar la somnolencia. Posteriormente, la información extraída se pasa a un sistema experto difuso (FES) que clasifica el estado del sujeto como “alerta” o “somnolencia”, el criterio utilizado fue un umbral y entrenamiento con niveles subjetivos. El sistema propuesto se comparó con modelo...
19
tesis doctoral
Publicado 2018
Enlace
Enlace
La creciente disponibilidad de datos en diferente dominio de aplicación ha motivado el desarrollo de técnicas de recuperación y descubrimiento de conocimiento en grandes volúmenes de datos. Recientes trabajos muestran que tanto las técnicas de aprendizaje profundo como nuevos métodos de búsqueda aproximada en dominio de datos complejos son campos de investigación importantes, donde tanto la eficiencia como la escalabilidad de los algoritmos son factores críticos. Para resolver el problema de escalabilidad se han propuesto muchos enfoques. En problemas de gran escala con datos en altas dimensiones, una solución de búsqueda aproximada con un análisis teórico solido se muestra más adecuado que una solución exacta con un modelo teórico débil. Algoritmos de búsqueda aproximada basados en hashing son propuestos para consultar en conjuntos de datos alta dimensiones debido a su...
20
tesis de grado
Publicado 2019
Enlace
Enlace
Los últimos avances sobre visión artificial permiten una variedad de aplicaciones en diferentes campos cotidianos de la vida, una de estas disciplinas es la clasificación de frutas experimentando un gran porcentaje de acierto dependiendo de las variables a controlar, si bien es cierto se avanzado de manera constante todavía sigue siendo un campo de investigación abierto ya que está demostrado que garantizar la calidad de este procedimiento supone un problema complejo y necesita ser desarrollado. La clasificación de frutas presenta retos significativos debido a las similitudes entre clases y las características irregulares que existe en cada una de estas; es por ello que la selección de los componentes para la extracción de los datos apropiados y el debido enfoque de representación de las características es considerado decisivo en éxito o fracaso del método planteado. Se han...