“Modelo Tuco” – Algoritmo para diagnóstico de melanomas aplicando un modelo híbrido entre una red neuronal convolucional y random forest
Descripción del Articulo
El propósito de esta investigación es crear un modelo combinado que integre una CNN con Random Forest con el fin de clasificar adecuadamente lunares como benignos o malignos. Dicha combinación de metodologías se desarrolla con el fin de aumentar la eficiencia si se compara el trabajo de los algoritm...
| Autor: | |
|---|---|
| Formato: | tesis de grado |
| Fecha de Publicación: | 2023 |
| Institución: | Universidad de Piura |
| Repositorio: | UDEP-Institucional |
| Lenguaje: | español |
| OAI Identifier: | oai:pirhua.udep.edu.pe:11042/6318 |
| Enlace del recurso: | https://hdl.handle.net/11042/6318 |
| Nivel de acceso: | acceso abierto |
| Materia: | Melanoma -- Diagnóstico Inteligencia artificial -- Aplicación -- Uso Diagnóstico Redes neuronales (Computadores) -- Uso diagnóstico -- Investigaciones 006.3 https://purl.org/pe-repo/ocde/ford#2.02.03 |
| id |
UDEP_1b9a306c61dbcc1a14334bfc9824a252 |
|---|---|
| oai_identifier_str |
oai:pirhua.udep.edu.pe:11042/6318 |
| network_acronym_str |
UDEP |
| network_name_str |
UDEP-Institucional |
| repository_id_str |
2644 |
| dc.title.es.fl_str_mv |
“Modelo Tuco” – Algoritmo para diagnóstico de melanomas aplicando un modelo híbrido entre una red neuronal convolucional y random forest |
| title |
“Modelo Tuco” – Algoritmo para diagnóstico de melanomas aplicando un modelo híbrido entre una red neuronal convolucional y random forest |
| spellingShingle |
“Modelo Tuco” – Algoritmo para diagnóstico de melanomas aplicando un modelo híbrido entre una red neuronal convolucional y random forest Calderon Ortiz, Jose Dario Melanoma -- Diagnóstico Inteligencia artificial -- Aplicación -- Uso Diagnóstico Redes neuronales (Computadores) -- Uso diagnóstico -- Investigaciones 006.3 https://purl.org/pe-repo/ocde/ford#2.02.03 |
| title_short |
“Modelo Tuco” – Algoritmo para diagnóstico de melanomas aplicando un modelo híbrido entre una red neuronal convolucional y random forest |
| title_full |
“Modelo Tuco” – Algoritmo para diagnóstico de melanomas aplicando un modelo híbrido entre una red neuronal convolucional y random forest |
| title_fullStr |
“Modelo Tuco” – Algoritmo para diagnóstico de melanomas aplicando un modelo híbrido entre una red neuronal convolucional y random forest |
| title_full_unstemmed |
“Modelo Tuco” – Algoritmo para diagnóstico de melanomas aplicando un modelo híbrido entre una red neuronal convolucional y random forest |
| title_sort |
“Modelo Tuco” – Algoritmo para diagnóstico de melanomas aplicando un modelo híbrido entre una red neuronal convolucional y random forest |
| author |
Calderon Ortiz, Jose Dario |
| author_facet |
Calderon Ortiz, Jose Dario |
| author_role |
author |
| dc.contributor.advisor.fl_str_mv |
Ipanaqué Alama, William |
| dc.contributor.author.fl_str_mv |
Calderon Ortiz, Jose Dario |
| dc.subject.es.fl_str_mv |
Melanoma -- Diagnóstico Inteligencia artificial -- Aplicación -- Uso Diagnóstico Redes neuronales (Computadores) -- Uso diagnóstico -- Investigaciones |
| topic |
Melanoma -- Diagnóstico Inteligencia artificial -- Aplicación -- Uso Diagnóstico Redes neuronales (Computadores) -- Uso diagnóstico -- Investigaciones 006.3 https://purl.org/pe-repo/ocde/ford#2.02.03 |
| dc.subject.ddc.es.fl_str_mv |
006.3 |
| dc.subject.ocde.es.fl_str_mv |
https://purl.org/pe-repo/ocde/ford#2.02.03 |
| description |
El propósito de esta investigación es crear un modelo combinado que integre una CNN con Random Forest con el fin de clasificar adecuadamente lunares como benignos o malignos. Dicha combinación de metodologías se desarrolla con el fin de aumentar la eficiencia si se compara el trabajo de los algoritmos por separado. Esta metodología de desarrollo se llevó a cabo con el lenguaje de programación Python, escrito en el entorno de ejecución de Google Colaboratory. Se empezó importando las librerías que se van a utilizar para la escritura y ejecución del código de programación, una vez hecho eso, se desarrollaron funciones con el fin de ahorrar escrituras de líneas de código más adelante, y minimizar el uso de los recursos computacionales. Estas funciones son: Función de entrenamiento, Función de varianza y Función de matriz de confusión. Finalizado esto, se empezó con el procesamiento y tratamiento de las imágenes. Se cargaron las imágenes separándolas en dos variables: Benigno y Maligno (las imágenes de lunares benignos son 2,645 y las imágenes de lunares malignos son 733, teniendo un desequilibro en la data). A todas estas variables se les implementó la técnica de data augmentation con el objetivo de evitar el sobreajuste durante la fase de entrenamiento y potenciar la eficacia del modelo. Culminando esto se procedió con la creación del modelo híbrido. La creación del modelo híbrido se empezó cargando la red neuronal convolucional pre-entrenada ResNet50, pero sin su última capa de clasificación, después se cargó una capa llamada GlobalAveragePooling2D añadiéndola a la CNN previamente cargada, esta capa ayuda a que las características que se extraerán de las imágenes se conviertan en un vector de una dimensión, facilitando su entrada para la clasificación con Random Forest. Teniendo el modelo compilado se procedió a la extracción de características de las imágenes con dicho modelo, para después concatenarlas en una variable llamada “X” y, creando etiquetas (benignas = 0 y malignas = 1) y concatenarlas en una variable llamada “y”. Con estas variables se realizó un equilibrio de datos con la metodología de RandomOverSampler debido al desbalance existente en la data. Y para finalizar con la creación del modelo híbrido se procedió con la estandarización y PCA (Principal Component Analysis) de los datos, obteniendo como resultado que con 700 componentes o características se puede tener el 99.9% de la varianza explicada acumulada (este procedimiento se desarrolló con la función de varianza anteriormente definida), esto es necesario para trabajar únicamente con las características de mayor peso y relevancia minimizando el uso de los recursos computacionales. Finalmente se procedió con el entrenamiento aplicando la metodología de Random Forest que se encuentra en la función de entrenamiento previamente definida. Con este entrenamiento se crearon modelos de acuerdo con la cantidad y variación de sus hiperparámetros. Con la ayuda de la función de matriz de confusión se realizó el análisis de las métricas de todos los modelos obteniendo uno con las mejores métricas el cual se denominó Modelo Tuco. |
| publishDate |
2023 |
| dc.date.accessioned.none.fl_str_mv |
2023-12-15T14:57:30Z |
| dc.date.available.none.fl_str_mv |
2023-12-15T14:57:30Z |
| dc.date.issued.fl_str_mv |
2023-11 |
| dc.type.es.fl_str_mv |
info:eu-repo/semantics/bachelorThesis |
| format |
bachelorThesis |
| dc.identifier.citation.es.fl_str_mv |
Calderon, J. (2023). “Modelo Tuco” – Algoritmo para diagnóstico de melanomas aplicando un modelo híbrido entre una red neuronal convolucional y random forest (Tesis para optar el título de Ingeniero Mecánico-Eléctrico). Universidad de Piura. Facultad de Ingeniería. Programa Académico de Ingeniería Mecánico-Eléctrica. Piura, Perú. |
| dc.identifier.uri.none.fl_str_mv |
https://hdl.handle.net/11042/6318 |
| identifier_str_mv |
Calderon, J. (2023). “Modelo Tuco” – Algoritmo para diagnóstico de melanomas aplicando un modelo híbrido entre una red neuronal convolucional y random forest (Tesis para optar el título de Ingeniero Mecánico-Eléctrico). Universidad de Piura. Facultad de Ingeniería. Programa Académico de Ingeniería Mecánico-Eléctrica. Piura, Perú. |
| url |
https://hdl.handle.net/11042/6318 |
| dc.language.es.fl_str_mv |
Español |
| dc.language.iso.es.fl_str_mv |
spa |
| language_invalid_str_mv |
Español |
| language |
spa |
| dc.relation.ispartof.fl_str_mv |
SUNEDU |
| dc.relation.requires.es.fl_str_mv |
Adobe Reader |
| dc.rights.es.fl_str_mv |
info:eu-repo/semantics/openAccess |
| dc.rights.uri.es.fl_str_mv |
http://creativecommons.org/licenses/by-nc-nd/4.0/ |
| dc.rights.holder.es.fl_str_mv |
Jose Calderon-Ortiz |
| dc.rights.license.es.fl_str_mv |
Creative Commons Attibution-NonComercial-NoDerivatives 4.0 Internacional |
| eu_rights_str_mv |
openAccess |
| rights_invalid_str_mv |
http://creativecommons.org/licenses/by-nc-nd/4.0/ Jose Calderon-Ortiz Creative Commons Attibution-NonComercial-NoDerivatives 4.0 Internacional |
| dc.format.extent.es.fl_str_mv |
2,93 MB |
| dc.format.mimetype.es.fl_str_mv |
application/pdf |
| dc.coverage.spatial.es.fl_str_mv |
Perú |
| dc.publisher.es.fl_str_mv |
Universidad de Piura |
| dc.publisher.country.es.fl_str_mv |
PE |
| dc.source.es.fl_str_mv |
Universidad de Piura Repositorio Institucional Pirhua - UDEP |
| dc.source.none.fl_str_mv |
reponame:UDEP-Institucional instname:Universidad de Piura instacron:UDEP |
| instname_str |
Universidad de Piura |
| instacron_str |
UDEP |
| institution |
UDEP |
| reponame_str |
UDEP-Institucional |
| collection |
UDEP-Institucional |
| bitstream.url.fl_str_mv |
https://pirhua.udep.edu.pe/backend/api/core/bitstreams/577d133e-51ff-43d5-9391-7e1d828a042f/download https://pirhua.udep.edu.pe/backend/api/core/bitstreams/92e519cb-393e-4969-b32a-a56922098614/download https://pirhua.udep.edu.pe/backend/api/core/bitstreams/16277877-c019-40c5-956a-726f450ee1f1/download https://pirhua.udep.edu.pe/backend/api/core/bitstreams/28157182-04bf-497d-bec7-5589bf013530/download https://pirhua.udep.edu.pe/backend/api/core/bitstreams/2935b072-d7b6-483b-a021-ac6718218b2d/download https://pirhua.udep.edu.pe/backend/api/core/bitstreams/5060ebfd-0f12-4bc8-9883-13f0ebec4287/download https://pirhua.udep.edu.pe/backend/api/core/bitstreams/a7635c24-af49-4c99-86d7-dbb97a2c4374/download https://pirhua.udep.edu.pe/backend/api/core/bitstreams/d1ec1ed5-b4a4-4fb9-b261-5e45e876a53f/download https://pirhua.udep.edu.pe/backend/api/core/bitstreams/2126c677-f62b-4f2e-b6ea-915da91fdc69/download https://pirhua.udep.edu.pe/backend/api/core/bitstreams/5c644ad9-3842-4e52-8dca-2b059f413406/download |
| bitstream.checksum.fl_str_mv |
c126c204f2b37ef30b5db40deda6f50c e5da46a90da0da70440afe95494f2fd0 cbb613b08fd870ee560ecd7cb0a5f583 cbb613b08fd870ee560ecd7cb0a5f583 517ade9ce763e417f71ca141c8fcd6ff 326cd00ab10f9acbb64870221594ff77 603e0860cd19a93bd151a01274747fc5 ceb358ecbaea613fcea4a4b98411fd1d ad8e039202cd5adc595e0653a6b81b00 94267cdc66e2e02994aa3586b0894355 |
| bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 MD5 MD5 MD5 MD5 MD5 MD5 MD5 |
| repository.name.fl_str_mv |
Repositorio Institucional Pirhua |
| repository.mail.fl_str_mv |
no-reply3@udep.edu.pe |
| _version_ |
1839818543888072704 |
| spelling |
Ipanaqué Alama, WilliamCalderon Ortiz, Jose DarioPerú2023-12-15T14:57:30Z2023-12-15T14:57:30Z2023-11Calderon, J. (2023). “Modelo Tuco” – Algoritmo para diagnóstico de melanomas aplicando un modelo híbrido entre una red neuronal convolucional y random forest (Tesis para optar el título de Ingeniero Mecánico-Eléctrico). Universidad de Piura. Facultad de Ingeniería. Programa Académico de Ingeniería Mecánico-Eléctrica. Piura, Perú.https://hdl.handle.net/11042/6318El propósito de esta investigación es crear un modelo combinado que integre una CNN con Random Forest con el fin de clasificar adecuadamente lunares como benignos o malignos. Dicha combinación de metodologías se desarrolla con el fin de aumentar la eficiencia si se compara el trabajo de los algoritmos por separado. Esta metodología de desarrollo se llevó a cabo con el lenguaje de programación Python, escrito en el entorno de ejecución de Google Colaboratory. Se empezó importando las librerías que se van a utilizar para la escritura y ejecución del código de programación, una vez hecho eso, se desarrollaron funciones con el fin de ahorrar escrituras de líneas de código más adelante, y minimizar el uso de los recursos computacionales. Estas funciones son: Función de entrenamiento, Función de varianza y Función de matriz de confusión. Finalizado esto, se empezó con el procesamiento y tratamiento de las imágenes. Se cargaron las imágenes separándolas en dos variables: Benigno y Maligno (las imágenes de lunares benignos son 2,645 y las imágenes de lunares malignos son 733, teniendo un desequilibro en la data). A todas estas variables se les implementó la técnica de data augmentation con el objetivo de evitar el sobreajuste durante la fase de entrenamiento y potenciar la eficacia del modelo. Culminando esto se procedió con la creación del modelo híbrido. La creación del modelo híbrido se empezó cargando la red neuronal convolucional pre-entrenada ResNet50, pero sin su última capa de clasificación, después se cargó una capa llamada GlobalAveragePooling2D añadiéndola a la CNN previamente cargada, esta capa ayuda a que las características que se extraerán de las imágenes se conviertan en un vector de una dimensión, facilitando su entrada para la clasificación con Random Forest. Teniendo el modelo compilado se procedió a la extracción de características de las imágenes con dicho modelo, para después concatenarlas en una variable llamada “X” y, creando etiquetas (benignas = 0 y malignas = 1) y concatenarlas en una variable llamada “y”. Con estas variables se realizó un equilibrio de datos con la metodología de RandomOverSampler debido al desbalance existente en la data. Y para finalizar con la creación del modelo híbrido se procedió con la estandarización y PCA (Principal Component Analysis) de los datos, obteniendo como resultado que con 700 componentes o características se puede tener el 99.9% de la varianza explicada acumulada (este procedimiento se desarrolló con la función de varianza anteriormente definida), esto es necesario para trabajar únicamente con las características de mayor peso y relevancia minimizando el uso de los recursos computacionales. Finalmente se procedió con el entrenamiento aplicando la metodología de Random Forest que se encuentra en la función de entrenamiento previamente definida. Con este entrenamiento se crearon modelos de acuerdo con la cantidad y variación de sus hiperparámetros. Con la ayuda de la función de matriz de confusión se realizó el análisis de las métricas de todos los modelos obteniendo uno con las mejores métricas el cual se denominó Modelo Tuco.2,93 MBapplication/pdfEspañolspaUniversidad de PiuraPEAdobe ReaderSUNEDUinfo:eu-repo/semantics/openAccesshttp://creativecommons.org/licenses/by-nc-nd/4.0/Jose Calderon-OrtizCreative Commons Attibution-NonComercial-NoDerivatives 4.0 InternacionalUniversidad de PiuraRepositorio Institucional Pirhua - UDEPreponame:UDEP-Institucionalinstname:Universidad de Piurainstacron:UDEPMelanoma -- DiagnósticoInteligencia artificial -- Aplicación -- Uso DiagnósticoRedes neuronales (Computadores) -- Uso diagnóstico -- Investigaciones006.3https://purl.org/pe-repo/ocde/ford#2.02.03“Modelo Tuco” – Algoritmo para diagnóstico de melanomas aplicando un modelo híbrido entre una red neuronal convolucional y random forestinfo:eu-repo/semantics/bachelorThesisIngeniero Mecánico-EléctricoUniversidad de Piura. Facultad de IngenieríaIngeniería Mecánico-Eléctrica72943511https://orcid.org/0000-0003-4039-442206422494https://purl.org/pe-repo/renati/type#tesishttps://purl.org/pe-repo/renati/level#tituloProfesional713076Alvarado Tabacchi, IreneManrique Silupú, José JoséIpanaqué Alama, WilliamORIGINALIME_2361.pdfIME_2361.pdfArchivo%20principalapplication/pdf3074968https://pirhua.udep.edu.pe/backend/api/core/bitstreams/577d133e-51ff-43d5-9391-7e1d828a042f/downloadc126c204f2b37ef30b5db40deda6f50cMD51Autorización_Calderón-Ortiz.pdfAutorización de publicaciónapplication/pdf370602https://pirhua.udep.edu.pe/backend/api/core/bitstreams/92e519cb-393e-4969-b32a-a56922098614/downloade5da46a90da0da70440afe95494f2fd0MD52Reporte_Calderón-Ortiz.pdfReporte Turnitinapplication/pdf3086495https://pirhua.udep.edu.pe/backend/api/core/bitstreams/16277877-c019-40c5-956a-726f450ee1f1/downloadcbb613b08fd870ee560ecd7cb0a5f583MD53Reporte_Calderón-Ortiz.pdfReporte Turnitinapplication/pdf3086495https://pirhua.udep.edu.pe/backend/api/core/bitstreams/28157182-04bf-497d-bec7-5589bf013530/downloadcbb613b08fd870ee560ecd7cb0a5f583MD53TEXTIME_2361.pdf.txtIME_2361.pdf.txtExtracted texttext/plain102247https://pirhua.udep.edu.pe/backend/api/core/bitstreams/2935b072-d7b6-483b-a021-ac6718218b2d/download517ade9ce763e417f71ca141c8fcd6ffMD510Autorización_Calderón-Ortiz.pdf.txtAutorización_Calderón-Ortiz.pdf.txtExtracted texttext/plain2913https://pirhua.udep.edu.pe/backend/api/core/bitstreams/5060ebfd-0f12-4bc8-9883-13f0ebec4287/download326cd00ab10f9acbb64870221594ff77MD512Reporte_Calderón-Ortiz.pdf.txtReporte_Calderón-Ortiz.pdf.txtExtracted texttext/plain102155https://pirhua.udep.edu.pe/backend/api/core/bitstreams/a7635c24-af49-4c99-86d7-dbb97a2c4374/download603e0860cd19a93bd151a01274747fc5MD516THUMBNAILIME_2361.pdf.jpgIME_2361.pdf.jpgGenerated Thumbnailimage/jpeg17896https://pirhua.udep.edu.pe/backend/api/core/bitstreams/d1ec1ed5-b4a4-4fb9-b261-5e45e876a53f/downloadceb358ecbaea613fcea4a4b98411fd1dMD511Autorización_Calderón-Ortiz.pdf.jpgAutorización_Calderón-Ortiz.pdf.jpgGenerated Thumbnailimage/jpeg35825https://pirhua.udep.edu.pe/backend/api/core/bitstreams/2126c677-f62b-4f2e-b6ea-915da91fdc69/downloadad8e039202cd5adc595e0653a6b81b00MD513Reporte_Calderón-Ortiz.pdf.jpgReporte_Calderón-Ortiz.pdf.jpgGenerated Thumbnailimage/jpeg22118https://pirhua.udep.edu.pe/backend/api/core/bitstreams/5c644ad9-3842-4e52-8dca-2b059f413406/download94267cdc66e2e02994aa3586b0894355MD51711042/6318oai:pirhua.udep.edu.pe:11042/63182025-03-15 19:15:06.936http://creativecommons.org/licenses/by-nc-nd/4.0/info:eu-repo/semantics/openAccessopen.accesshttps://pirhua.udep.edu.peRepositorio Institucional Pirhuano-reply3@udep.edu.pe |
| score |
13.44655 |
Nota importante:
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).