“Modelo Tuco” – Algoritmo para diagnóstico de melanomas aplicando un modelo híbrido entre una red neuronal convolucional y random forest

Descripción del Articulo

El propósito de esta investigación es crear un modelo combinado que integre una CNN con Random Forest con el fin de clasificar adecuadamente lunares como benignos o malignos. Dicha combinación de metodologías se desarrolla con el fin de aumentar la eficiencia si se compara el trabajo de los algoritm...

Descripción completa

Detalles Bibliográficos
Autor: Calderon Ortiz, Jose Dario
Formato: tesis de grado
Fecha de Publicación:2023
Institución:Universidad de Piura
Repositorio:UDEP-Institucional
Lenguaje:español
OAI Identifier:oai:pirhua.udep.edu.pe:11042/6318
Enlace del recurso:https://hdl.handle.net/11042/6318
Nivel de acceso:acceso abierto
Materia:Melanoma -- Diagnóstico
Inteligencia artificial -- Aplicación -- Uso Diagnóstico
Redes neuronales (Computadores) -- Uso diagnóstico -- Investigaciones
006.3
https://purl.org/pe-repo/ocde/ford#2.02.03
id UDEP_1b9a306c61dbcc1a14334bfc9824a252
oai_identifier_str oai:pirhua.udep.edu.pe:11042/6318
network_acronym_str UDEP
network_name_str UDEP-Institucional
repository_id_str 2644
dc.title.es.fl_str_mv “Modelo Tuco” – Algoritmo para diagnóstico de melanomas aplicando un modelo híbrido entre una red neuronal convolucional y random forest
title “Modelo Tuco” – Algoritmo para diagnóstico de melanomas aplicando un modelo híbrido entre una red neuronal convolucional y random forest
spellingShingle “Modelo Tuco” – Algoritmo para diagnóstico de melanomas aplicando un modelo híbrido entre una red neuronal convolucional y random forest
Calderon Ortiz, Jose Dario
Melanoma -- Diagnóstico
Inteligencia artificial -- Aplicación -- Uso Diagnóstico
Redes neuronales (Computadores) -- Uso diagnóstico -- Investigaciones
006.3
https://purl.org/pe-repo/ocde/ford#2.02.03
title_short “Modelo Tuco” – Algoritmo para diagnóstico de melanomas aplicando un modelo híbrido entre una red neuronal convolucional y random forest
title_full “Modelo Tuco” – Algoritmo para diagnóstico de melanomas aplicando un modelo híbrido entre una red neuronal convolucional y random forest
title_fullStr “Modelo Tuco” – Algoritmo para diagnóstico de melanomas aplicando un modelo híbrido entre una red neuronal convolucional y random forest
title_full_unstemmed “Modelo Tuco” – Algoritmo para diagnóstico de melanomas aplicando un modelo híbrido entre una red neuronal convolucional y random forest
title_sort “Modelo Tuco” – Algoritmo para diagnóstico de melanomas aplicando un modelo híbrido entre una red neuronal convolucional y random forest
author Calderon Ortiz, Jose Dario
author_facet Calderon Ortiz, Jose Dario
author_role author
dc.contributor.advisor.fl_str_mv Ipanaqué Alama, William
dc.contributor.author.fl_str_mv Calderon Ortiz, Jose Dario
dc.subject.es.fl_str_mv Melanoma -- Diagnóstico
Inteligencia artificial -- Aplicación -- Uso Diagnóstico
Redes neuronales (Computadores) -- Uso diagnóstico -- Investigaciones
topic Melanoma -- Diagnóstico
Inteligencia artificial -- Aplicación -- Uso Diagnóstico
Redes neuronales (Computadores) -- Uso diagnóstico -- Investigaciones
006.3
https://purl.org/pe-repo/ocde/ford#2.02.03
dc.subject.ddc.es.fl_str_mv 006.3
dc.subject.ocde.es.fl_str_mv https://purl.org/pe-repo/ocde/ford#2.02.03
description El propósito de esta investigación es crear un modelo combinado que integre una CNN con Random Forest con el fin de clasificar adecuadamente lunares como benignos o malignos. Dicha combinación de metodologías se desarrolla con el fin de aumentar la eficiencia si se compara el trabajo de los algoritmos por separado. Esta metodología de desarrollo se llevó a cabo con el lenguaje de programación Python, escrito en el entorno de ejecución de Google Colaboratory. Se empezó importando las librerías que se van a utilizar para la escritura y ejecución del código de programación, una vez hecho eso, se desarrollaron funciones con el fin de ahorrar escrituras de líneas de código más adelante, y minimizar el uso de los recursos computacionales. Estas funciones son: Función de entrenamiento, Función de varianza y Función de matriz de confusión. Finalizado esto, se empezó con el procesamiento y tratamiento de las imágenes. Se cargaron las imágenes separándolas en dos variables: Benigno y Maligno (las imágenes de lunares benignos son 2,645 y las imágenes de lunares malignos son 733, teniendo un desequilibro en la data). A todas estas variables se les implementó la técnica de data augmentation con el objetivo de evitar el sobreajuste durante la fase de entrenamiento y potenciar la eficacia del modelo. Culminando esto se procedió con la creación del modelo híbrido. La creación del modelo híbrido se empezó cargando la red neuronal convolucional pre-entrenada ResNet50, pero sin su última capa de clasificación, después se cargó una capa llamada GlobalAveragePooling2D añadiéndola a la CNN previamente cargada, esta capa ayuda a que las características que se extraerán de las imágenes se conviertan en un vector de una dimensión, facilitando su entrada para la clasificación con Random Forest. Teniendo el modelo compilado se procedió a la extracción de características de las imágenes con dicho modelo, para después concatenarlas en una variable llamada “X” y, creando etiquetas (benignas = 0 y malignas = 1) y concatenarlas en una variable llamada “y”. Con estas variables se realizó un equilibrio de datos con la metodología de RandomOverSampler debido al desbalance existente en la data. Y para finalizar con la creación del modelo híbrido se procedió con la estandarización y PCA (Principal Component Analysis) de los datos, obteniendo como resultado que con 700 componentes o características se puede tener el 99.9% de la varianza explicada acumulada (este procedimiento se desarrolló con la función de varianza anteriormente definida), esto es necesario para trabajar únicamente con las características de mayor peso y relevancia minimizando el uso de los recursos computacionales. Finalmente se procedió con el entrenamiento aplicando la metodología de Random Forest que se encuentra en la función de entrenamiento previamente definida. Con este entrenamiento se crearon modelos de acuerdo con la cantidad y variación de sus hiperparámetros. Con la ayuda de la función de matriz de confusión se realizó el análisis de las métricas de todos los modelos obteniendo uno con las mejores métricas el cual se denominó Modelo Tuco.
publishDate 2023
dc.date.accessioned.none.fl_str_mv 2023-12-15T14:57:30Z
dc.date.available.none.fl_str_mv 2023-12-15T14:57:30Z
dc.date.issued.fl_str_mv 2023-11
dc.type.es.fl_str_mv info:eu-repo/semantics/bachelorThesis
format bachelorThesis
dc.identifier.citation.es.fl_str_mv Calderon, J. (2023). “Modelo Tuco” – Algoritmo para diagnóstico de melanomas aplicando un modelo híbrido entre una red neuronal convolucional y random forest (Tesis para optar el título de Ingeniero Mecánico-Eléctrico). Universidad de Piura. Facultad de Ingeniería. Programa Académico de Ingeniería Mecánico-Eléctrica. Piura, Perú.
dc.identifier.uri.none.fl_str_mv https://hdl.handle.net/11042/6318
identifier_str_mv Calderon, J. (2023). “Modelo Tuco” – Algoritmo para diagnóstico de melanomas aplicando un modelo híbrido entre una red neuronal convolucional y random forest (Tesis para optar el título de Ingeniero Mecánico-Eléctrico). Universidad de Piura. Facultad de Ingeniería. Programa Académico de Ingeniería Mecánico-Eléctrica. Piura, Perú.
url https://hdl.handle.net/11042/6318
dc.language.es.fl_str_mv Español
dc.language.iso.es.fl_str_mv spa
language_invalid_str_mv Español
language spa
dc.relation.ispartof.fl_str_mv SUNEDU
dc.relation.requires.es.fl_str_mv Adobe Reader
dc.rights.es.fl_str_mv info:eu-repo/semantics/openAccess
dc.rights.uri.es.fl_str_mv http://creativecommons.org/licenses/by-nc-nd/4.0/
dc.rights.holder.es.fl_str_mv Jose Calderon-Ortiz
dc.rights.license.es.fl_str_mv Creative Commons Attibution-NonComercial-NoDerivatives 4.0 Internacional
eu_rights_str_mv openAccess
rights_invalid_str_mv http://creativecommons.org/licenses/by-nc-nd/4.0/
Jose Calderon-Ortiz
Creative Commons Attibution-NonComercial-NoDerivatives 4.0 Internacional
dc.format.extent.es.fl_str_mv 2,93 MB
dc.format.mimetype.es.fl_str_mv application/pdf
dc.coverage.spatial.es.fl_str_mv Perú
dc.publisher.es.fl_str_mv Universidad de Piura
dc.publisher.country.es.fl_str_mv PE
dc.source.es.fl_str_mv Universidad de Piura
Repositorio Institucional Pirhua - UDEP
dc.source.none.fl_str_mv reponame:UDEP-Institucional
instname:Universidad de Piura
instacron:UDEP
instname_str Universidad de Piura
instacron_str UDEP
institution UDEP
reponame_str UDEP-Institucional
collection UDEP-Institucional
bitstream.url.fl_str_mv https://pirhua.udep.edu.pe/backend/api/core/bitstreams/577d133e-51ff-43d5-9391-7e1d828a042f/download
https://pirhua.udep.edu.pe/backend/api/core/bitstreams/92e519cb-393e-4969-b32a-a56922098614/download
https://pirhua.udep.edu.pe/backend/api/core/bitstreams/16277877-c019-40c5-956a-726f450ee1f1/download
https://pirhua.udep.edu.pe/backend/api/core/bitstreams/28157182-04bf-497d-bec7-5589bf013530/download
https://pirhua.udep.edu.pe/backend/api/core/bitstreams/2935b072-d7b6-483b-a021-ac6718218b2d/download
https://pirhua.udep.edu.pe/backend/api/core/bitstreams/5060ebfd-0f12-4bc8-9883-13f0ebec4287/download
https://pirhua.udep.edu.pe/backend/api/core/bitstreams/a7635c24-af49-4c99-86d7-dbb97a2c4374/download
https://pirhua.udep.edu.pe/backend/api/core/bitstreams/d1ec1ed5-b4a4-4fb9-b261-5e45e876a53f/download
https://pirhua.udep.edu.pe/backend/api/core/bitstreams/2126c677-f62b-4f2e-b6ea-915da91fdc69/download
https://pirhua.udep.edu.pe/backend/api/core/bitstreams/5c644ad9-3842-4e52-8dca-2b059f413406/download
bitstream.checksum.fl_str_mv c126c204f2b37ef30b5db40deda6f50c
e5da46a90da0da70440afe95494f2fd0
cbb613b08fd870ee560ecd7cb0a5f583
cbb613b08fd870ee560ecd7cb0a5f583
517ade9ce763e417f71ca141c8fcd6ff
326cd00ab10f9acbb64870221594ff77
603e0860cd19a93bd151a01274747fc5
ceb358ecbaea613fcea4a4b98411fd1d
ad8e039202cd5adc595e0653a6b81b00
94267cdc66e2e02994aa3586b0894355
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
MD5
MD5
MD5
MD5
MD5
MD5
MD5
repository.name.fl_str_mv Repositorio Institucional Pirhua
repository.mail.fl_str_mv no-reply3@udep.edu.pe
_version_ 1839818543888072704
spelling Ipanaqué Alama, WilliamCalderon Ortiz, Jose DarioPerú2023-12-15T14:57:30Z2023-12-15T14:57:30Z2023-11Calderon, J. (2023). “Modelo Tuco” – Algoritmo para diagnóstico de melanomas aplicando un modelo híbrido entre una red neuronal convolucional y random forest (Tesis para optar el título de Ingeniero Mecánico-Eléctrico). Universidad de Piura. Facultad de Ingeniería. Programa Académico de Ingeniería Mecánico-Eléctrica. Piura, Perú.https://hdl.handle.net/11042/6318El propósito de esta investigación es crear un modelo combinado que integre una CNN con Random Forest con el fin de clasificar adecuadamente lunares como benignos o malignos. Dicha combinación de metodologías se desarrolla con el fin de aumentar la eficiencia si se compara el trabajo de los algoritmos por separado. Esta metodología de desarrollo se llevó a cabo con el lenguaje de programación Python, escrito en el entorno de ejecución de Google Colaboratory. Se empezó importando las librerías que se van a utilizar para la escritura y ejecución del código de programación, una vez hecho eso, se desarrollaron funciones con el fin de ahorrar escrituras de líneas de código más adelante, y minimizar el uso de los recursos computacionales. Estas funciones son: Función de entrenamiento, Función de varianza y Función de matriz de confusión. Finalizado esto, se empezó con el procesamiento y tratamiento de las imágenes. Se cargaron las imágenes separándolas en dos variables: Benigno y Maligno (las imágenes de lunares benignos son 2,645 y las imágenes de lunares malignos son 733, teniendo un desequilibro en la data). A todas estas variables se les implementó la técnica de data augmentation con el objetivo de evitar el sobreajuste durante la fase de entrenamiento y potenciar la eficacia del modelo. Culminando esto se procedió con la creación del modelo híbrido. La creación del modelo híbrido se empezó cargando la red neuronal convolucional pre-entrenada ResNet50, pero sin su última capa de clasificación, después se cargó una capa llamada GlobalAveragePooling2D añadiéndola a la CNN previamente cargada, esta capa ayuda a que las características que se extraerán de las imágenes se conviertan en un vector de una dimensión, facilitando su entrada para la clasificación con Random Forest. Teniendo el modelo compilado se procedió a la extracción de características de las imágenes con dicho modelo, para después concatenarlas en una variable llamada “X” y, creando etiquetas (benignas = 0 y malignas = 1) y concatenarlas en una variable llamada “y”. Con estas variables se realizó un equilibrio de datos con la metodología de RandomOverSampler debido al desbalance existente en la data. Y para finalizar con la creación del modelo híbrido se procedió con la estandarización y PCA (Principal Component Analysis) de los datos, obteniendo como resultado que con 700 componentes o características se puede tener el 99.9% de la varianza explicada acumulada (este procedimiento se desarrolló con la función de varianza anteriormente definida), esto es necesario para trabajar únicamente con las características de mayor peso y relevancia minimizando el uso de los recursos computacionales. Finalmente se procedió con el entrenamiento aplicando la metodología de Random Forest que se encuentra en la función de entrenamiento previamente definida. Con este entrenamiento se crearon modelos de acuerdo con la cantidad y variación de sus hiperparámetros. Con la ayuda de la función de matriz de confusión se realizó el análisis de las métricas de todos los modelos obteniendo uno con las mejores métricas el cual se denominó Modelo Tuco.2,93 MBapplication/pdfEspañolspaUniversidad de PiuraPEAdobe ReaderSUNEDUinfo:eu-repo/semantics/openAccesshttp://creativecommons.org/licenses/by-nc-nd/4.0/Jose Calderon-OrtizCreative Commons Attibution-NonComercial-NoDerivatives 4.0 InternacionalUniversidad de PiuraRepositorio Institucional Pirhua - UDEPreponame:UDEP-Institucionalinstname:Universidad de Piurainstacron:UDEPMelanoma -- DiagnósticoInteligencia artificial -- Aplicación -- Uso DiagnósticoRedes neuronales (Computadores) -- Uso diagnóstico -- Investigaciones006.3https://purl.org/pe-repo/ocde/ford#2.02.03“Modelo Tuco” – Algoritmo para diagnóstico de melanomas aplicando un modelo híbrido entre una red neuronal convolucional y random forestinfo:eu-repo/semantics/bachelorThesisIngeniero Mecánico-EléctricoUniversidad de Piura. Facultad de IngenieríaIngeniería Mecánico-Eléctrica72943511https://orcid.org/0000-0003-4039-442206422494https://purl.org/pe-repo/renati/type#tesishttps://purl.org/pe-repo/renati/level#tituloProfesional713076Alvarado Tabacchi, IreneManrique Silupú, José JoséIpanaqué Alama, WilliamORIGINALIME_2361.pdfIME_2361.pdfArchivo%20principalapplication/pdf3074968https://pirhua.udep.edu.pe/backend/api/core/bitstreams/577d133e-51ff-43d5-9391-7e1d828a042f/downloadc126c204f2b37ef30b5db40deda6f50cMD51Autorización_Calderón-Ortiz.pdfAutorización de publicaciónapplication/pdf370602https://pirhua.udep.edu.pe/backend/api/core/bitstreams/92e519cb-393e-4969-b32a-a56922098614/downloade5da46a90da0da70440afe95494f2fd0MD52Reporte_Calderón-Ortiz.pdfReporte Turnitinapplication/pdf3086495https://pirhua.udep.edu.pe/backend/api/core/bitstreams/16277877-c019-40c5-956a-726f450ee1f1/downloadcbb613b08fd870ee560ecd7cb0a5f583MD53Reporte_Calderón-Ortiz.pdfReporte Turnitinapplication/pdf3086495https://pirhua.udep.edu.pe/backend/api/core/bitstreams/28157182-04bf-497d-bec7-5589bf013530/downloadcbb613b08fd870ee560ecd7cb0a5f583MD53TEXTIME_2361.pdf.txtIME_2361.pdf.txtExtracted texttext/plain102247https://pirhua.udep.edu.pe/backend/api/core/bitstreams/2935b072-d7b6-483b-a021-ac6718218b2d/download517ade9ce763e417f71ca141c8fcd6ffMD510Autorización_Calderón-Ortiz.pdf.txtAutorización_Calderón-Ortiz.pdf.txtExtracted texttext/plain2913https://pirhua.udep.edu.pe/backend/api/core/bitstreams/5060ebfd-0f12-4bc8-9883-13f0ebec4287/download326cd00ab10f9acbb64870221594ff77MD512Reporte_Calderón-Ortiz.pdf.txtReporte_Calderón-Ortiz.pdf.txtExtracted texttext/plain102155https://pirhua.udep.edu.pe/backend/api/core/bitstreams/a7635c24-af49-4c99-86d7-dbb97a2c4374/download603e0860cd19a93bd151a01274747fc5MD516THUMBNAILIME_2361.pdf.jpgIME_2361.pdf.jpgGenerated Thumbnailimage/jpeg17896https://pirhua.udep.edu.pe/backend/api/core/bitstreams/d1ec1ed5-b4a4-4fb9-b261-5e45e876a53f/downloadceb358ecbaea613fcea4a4b98411fd1dMD511Autorización_Calderón-Ortiz.pdf.jpgAutorización_Calderón-Ortiz.pdf.jpgGenerated Thumbnailimage/jpeg35825https://pirhua.udep.edu.pe/backend/api/core/bitstreams/2126c677-f62b-4f2e-b6ea-915da91fdc69/downloadad8e039202cd5adc595e0653a6b81b00MD513Reporte_Calderón-Ortiz.pdf.jpgReporte_Calderón-Ortiz.pdf.jpgGenerated Thumbnailimage/jpeg22118https://pirhua.udep.edu.pe/backend/api/core/bitstreams/5c644ad9-3842-4e52-8dca-2b059f413406/download94267cdc66e2e02994aa3586b0894355MD51711042/6318oai:pirhua.udep.edu.pe:11042/63182025-03-15 19:15:06.936http://creativecommons.org/licenses/by-nc-nd/4.0/info:eu-repo/semantics/openAccessopen.accesshttps://pirhua.udep.edu.peRepositorio Institucional Pirhuano-reply3@udep.edu.pe
score 13.44655
Nota importante:
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).