Estudio comparativo de la eficiencia diagnóstica del cáncer de mama con los algoritmos CNN, NB y RF

Descripción del Articulo

El objetivo de la investigación fue comparar la eficiencia diagnóstica del cáncer de mama en mujeres con los algoritmos CNN (Convolutional Neural Networks - Redes Neuronales Convolucionales), RF (Random Forest - Bosque Aleatorio) y NB (Naive Bayes - Bayesiana Ingenua). Se usó la matriz de confusión...

Descripción completa

Detalles Bibliográficos
Autores: Araujo Rodriguez, Jhon Alexander, Medina Paquiyuari, Fernando Jose
Formato: tesis de grado
Fecha de Publicación:2023
Institución:Universidad Cesar Vallejo
Repositorio:UCV-Institucional
Lenguaje:español
OAI Identifier:oai:repositorio.ucv.edu.pe:20.500.12692/153103
Enlace del recurso:https://hdl.handle.net/20.500.12692/153103
Nivel de acceso:acceso abierto
Materia:Redes neuronales convolucionales
Bayesiana ingenua
Random forest
Tiempo de identificación
Exactitud
https://purl.org/pe-repo/ocde/ford#2.01.01
id UCVV_c8c69784da532437873c57dbbc60699d
oai_identifier_str oai:repositorio.ucv.edu.pe:20.500.12692/153103
network_acronym_str UCVV
network_name_str UCV-Institucional
repository_id_str 3741
dc.title.es_PE.fl_str_mv Estudio comparativo de la eficiencia diagnóstica del cáncer de mama con los algoritmos CNN, NB y RF
title Estudio comparativo de la eficiencia diagnóstica del cáncer de mama con los algoritmos CNN, NB y RF
spellingShingle Estudio comparativo de la eficiencia diagnóstica del cáncer de mama con los algoritmos CNN, NB y RF
Araujo Rodriguez, Jhon Alexander
Redes neuronales convolucionales
Bayesiana ingenua
Random forest
Tiempo de identificación
Exactitud
https://purl.org/pe-repo/ocde/ford#2.01.01
title_short Estudio comparativo de la eficiencia diagnóstica del cáncer de mama con los algoritmos CNN, NB y RF
title_full Estudio comparativo de la eficiencia diagnóstica del cáncer de mama con los algoritmos CNN, NB y RF
title_fullStr Estudio comparativo de la eficiencia diagnóstica del cáncer de mama con los algoritmos CNN, NB y RF
title_full_unstemmed Estudio comparativo de la eficiencia diagnóstica del cáncer de mama con los algoritmos CNN, NB y RF
title_sort Estudio comparativo de la eficiencia diagnóstica del cáncer de mama con los algoritmos CNN, NB y RF
author Araujo Rodriguez, Jhon Alexander
author_facet Araujo Rodriguez, Jhon Alexander
Medina Paquiyuari, Fernando Jose
author_role author
author2 Medina Paquiyuari, Fernando Jose
author2_role author
dc.contributor.advisor.fl_str_mv Alfaro Paredes, Emigdio Antonio
dc.contributor.author.fl_str_mv Araujo Rodriguez, Jhon Alexander
Medina Paquiyuari, Fernando Jose
dc.subject.es_PE.fl_str_mv Redes neuronales convolucionales
Bayesiana ingenua
Random forest
Tiempo de identificación
Exactitud
topic Redes neuronales convolucionales
Bayesiana ingenua
Random forest
Tiempo de identificación
Exactitud
https://purl.org/pe-repo/ocde/ford#2.01.01
dc.subject.ocde.es_PE.fl_str_mv https://purl.org/pe-repo/ocde/ford#2.01.01
description El objetivo de la investigación fue comparar la eficiencia diagnóstica del cáncer de mama en mujeres con los algoritmos CNN (Convolutional Neural Networks - Redes Neuronales Convolucionales), RF (Random Forest - Bosque Aleatorio) y NB (Naive Bayes - Bayesiana Ingenua). Se usó la matriz de confusión del sistema para comparar y plasmar los resultados de la sensibilidad, la especificidad, la precisión, la exactitud, el tiempo de entrenamiento y el tiempo de diagnóstico de cáncer de mama de los algoritmos mencionados. Se consideró un total de 7632 imágenes mamográficas entre benignos (2520) y malignos (5112) para el diagnóstico de la enfermedad. La investigación fue de tipo aplicada, con un enfoque cuantitativo y diseño no experimental y tipo de diseño transversal descriptivo. Se usaron librerías gratuitas tales como Django, Keras, Tensorflow, OpenCV-Python, entre otras, para el desarrollo de lenguaje de programación Python. Además, se usó los criterios de inclusión y exclusión en la investigación para diferenciar qué imágenes no están incluidas y cuáles sí están incluidas para la población. Se utilizó el tipo y la cantidad de imágenes mamográficas para precisar la fuente (Data Science Kaggle) tipo (benigno y maligno), muestreo, el tiempo de identificación y tiempo de entrenamiento. Los resultados de la comparación indicaron que NB tuvo una repercusión positiva en la sensibilidad y precisión, debido a que estos indicadores fueron mayores a los obtenidos por los algoritmos CNN y RF; asimismo, NB tuvo menor tiempo de entrenamiento e identificación. La especificidad y la exactitudno fueron mayores a los resultados obtenidos por el algoritmo RF, pero fueron mayores a lo obtenido por el algoritmo CNN. Se recomendó emplear el algoritmo regresión logística, con la finalidad de manejar datos de alta dimensionalidad, lo cual permite identificar características relevantes, manejar datos no lineales y capturar relaciones complejas en los datos para una investigación a futuro.
publishDate 2023
dc.date.accessioned.none.fl_str_mv 2024-11-07T15:55:06Z
dc.date.available.none.fl_str_mv 2024-11-07T15:55:06Z
dc.date.issued.fl_str_mv 2023
dc.type.es_PE.fl_str_mv info:eu-repo/semantics/bachelorThesis
format bachelorThesis
dc.identifier.uri.none.fl_str_mv https://hdl.handle.net/20.500.12692/153103
url https://hdl.handle.net/20.500.12692/153103
dc.language.iso.es_PE.fl_str_mv spa
language spa
dc.relation.ispartof.fl_str_mv SUNEDU
dc.rights.es_PE.fl_str_mv info:eu-repo/semantics/openAccess
dc.rights.uri.es_PE.fl_str_mv https://creativecommons.org/licenses/by/4.0/
eu_rights_str_mv openAccess
rights_invalid_str_mv https://creativecommons.org/licenses/by/4.0/
dc.format.es_PE.fl_str_mv application/pdf
dc.publisher.es_PE.fl_str_mv Universidad César Vallejo
dc.publisher.country.es_PE.fl_str_mv PE
dc.source.es_PE.fl_str_mv Repositorio Institucional - UCV
Universidad César Vallejo
dc.source.none.fl_str_mv reponame:UCV-Institucional
instname:Universidad Cesar Vallejo
instacron:UCV
instname_str Universidad Cesar Vallejo
instacron_str UCV
institution UCV
reponame_str UCV-Institucional
collection UCV-Institucional
bitstream.url.fl_str_mv https://repositorio.ucv.edu.pe/bitstream/20.500.12692/153103/1/Araujo_RJA-Medina_PFJ-SD.pdf
https://repositorio.ucv.edu.pe/bitstream/20.500.12692/153103/2/Araujo_RJA-Medina_PFJ-IT.pdf
https://repositorio.ucv.edu.pe/bitstream/20.500.12692/153103/3/Araujo_RJA-Medina_PFJ.pdf
https://repositorio.ucv.edu.pe/bitstream/20.500.12692/153103/4/license.txt
https://repositorio.ucv.edu.pe/bitstream/20.500.12692/153103/5/Araujo_RJA-Medina_PFJ-SD.pdf.txt
https://repositorio.ucv.edu.pe/bitstream/20.500.12692/153103/7/Araujo_RJA-Medina_PFJ-IT.pdf.txt
https://repositorio.ucv.edu.pe/bitstream/20.500.12692/153103/9/Araujo_RJA-Medina_PFJ.pdf.txt
https://repositorio.ucv.edu.pe/bitstream/20.500.12692/153103/6/Araujo_RJA-Medina_PFJ-SD.pdf.jpg
https://repositorio.ucv.edu.pe/bitstream/20.500.12692/153103/8/Araujo_RJA-Medina_PFJ-IT.pdf.jpg
https://repositorio.ucv.edu.pe/bitstream/20.500.12692/153103/10/Araujo_RJA-Medina_PFJ.pdf.jpg
bitstream.checksum.fl_str_mv 79d8c17982ac3518a248dacb46c691f0
e4a82265f03e8421b271533553f1389e
132bf1c9d25c7612f269208f66b81757
8a4605be74aa9ea9d79846c1fba20a33
e1ae9ebf8465eb20e68d00e2dbff5b5f
f301fd9a67dc5a909ea9ca4b2dd6f663
f8047750fee47373287c64f6746910f6
c26fea2c6b42af75f977444961d867ed
c4e8a258a0648dcc024ee368d7a5f21c
c26fea2c6b42af75f977444961d867ed
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
MD5
MD5
MD5
MD5
MD5
MD5
MD5
repository.name.fl_str_mv Repositorio de la Universidad César Vallejo
repository.mail.fl_str_mv repositorio@ucv.edu.pe
_version_ 1816165273846153216
spelling Alfaro Paredes, Emigdio AntonioAraujo Rodriguez, Jhon AlexanderMedina Paquiyuari, Fernando Jose2024-11-07T15:55:06Z2024-11-07T15:55:06Z2023https://hdl.handle.net/20.500.12692/153103El objetivo de la investigación fue comparar la eficiencia diagnóstica del cáncer de mama en mujeres con los algoritmos CNN (Convolutional Neural Networks - Redes Neuronales Convolucionales), RF (Random Forest - Bosque Aleatorio) y NB (Naive Bayes - Bayesiana Ingenua). Se usó la matriz de confusión del sistema para comparar y plasmar los resultados de la sensibilidad, la especificidad, la precisión, la exactitud, el tiempo de entrenamiento y el tiempo de diagnóstico de cáncer de mama de los algoritmos mencionados. Se consideró un total de 7632 imágenes mamográficas entre benignos (2520) y malignos (5112) para el diagnóstico de la enfermedad. La investigación fue de tipo aplicada, con un enfoque cuantitativo y diseño no experimental y tipo de diseño transversal descriptivo. Se usaron librerías gratuitas tales como Django, Keras, Tensorflow, OpenCV-Python, entre otras, para el desarrollo de lenguaje de programación Python. Además, se usó los criterios de inclusión y exclusión en la investigación para diferenciar qué imágenes no están incluidas y cuáles sí están incluidas para la población. Se utilizó el tipo y la cantidad de imágenes mamográficas para precisar la fuente (Data Science Kaggle) tipo (benigno y maligno), muestreo, el tiempo de identificación y tiempo de entrenamiento. Los resultados de la comparación indicaron que NB tuvo una repercusión positiva en la sensibilidad y precisión, debido a que estos indicadores fueron mayores a los obtenidos por los algoritmos CNN y RF; asimismo, NB tuvo menor tiempo de entrenamiento e identificación. La especificidad y la exactitudno fueron mayores a los resultados obtenidos por el algoritmo RF, pero fueron mayores a lo obtenido por el algoritmo CNN. Se recomendó emplear el algoritmo regresión logística, con la finalidad de manejar datos de alta dimensionalidad, lo cual permite identificar características relevantes, manejar datos no lineales y capturar relaciones complejas en los datos para una investigación a futuro.Lima EsteEscuela de Ingeniería CivilSistema de Información y ComunicacionesDesarrollo sostenible, emprendimientos y responsabilidad social.Apoyo a la reducción de brechas y carencias en la educación en todos sus nivelesSalud y bienestarPRESENCIALapplication/pdfspaUniversidad César VallejoPEinfo:eu-repo/semantics/openAccesshttps://creativecommons.org/licenses/by/4.0/Repositorio Institucional - UCVUniversidad César Vallejoreponame:UCV-Institucionalinstname:Universidad Cesar Vallejoinstacron:UCVRedes neuronales convolucionalesBayesiana ingenuaRandom forestTiempo de identificaciónExactitudhttps://purl.org/pe-repo/ocde/ford#2.01.01Estudio comparativo de la eficiencia diagnóstica del cáncer de mama con los algoritmos CNN, NB y RFinfo:eu-repo/semantics/bachelorThesisSUNEDUIngeniería CivilUniversidad César Vallejo. Facultad de Ingeniería y ArquitecturaIngeniero de Sistemas10288238https://orcid.org/0000-0002-0309-91957565644370415187612076Pérez Rojas, Even DeyserBurga Vasquez, Nestor GiankeilerAlfaro Paredes, Emigdio Antoniohttps://purl.org/pe-repo/renati/level#tituloProfesionalhttps://purl.org/pe-repo/renati/type#tesisORIGINALAraujo_RJA-Medina_PFJ-SD.pdfAraujo_RJA-Medina_PFJ-SD.pdfapplication/pdf1575139https://repositorio.ucv.edu.pe/bitstream/20.500.12692/153103/1/Araujo_RJA-Medina_PFJ-SD.pdf79d8c17982ac3518a248dacb46c691f0MD51Araujo_RJA-Medina_PFJ-IT.pdfAraujo_RJA-Medina_PFJ-IT.pdfapplication/pdf6054185https://repositorio.ucv.edu.pe/bitstream/20.500.12692/153103/2/Araujo_RJA-Medina_PFJ-IT.pdfe4a82265f03e8421b271533553f1389eMD52Araujo_RJA-Medina_PFJ.pdfAraujo_RJA-Medina_PFJ.pdfapplication/pdf1555883https://repositorio.ucv.edu.pe/bitstream/20.500.12692/153103/3/Araujo_RJA-Medina_PFJ.pdf132bf1c9d25c7612f269208f66b81757MD53LICENSElicense.txtlicense.txttext/plain; charset=utf-81748https://repositorio.ucv.edu.pe/bitstream/20.500.12692/153103/4/license.txt8a4605be74aa9ea9d79846c1fba20a33MD54TEXTAraujo_RJA-Medina_PFJ-SD.pdf.txtAraujo_RJA-Medina_PFJ-SD.pdf.txtExtracted texttext/plain138233https://repositorio.ucv.edu.pe/bitstream/20.500.12692/153103/5/Araujo_RJA-Medina_PFJ-SD.pdf.txte1ae9ebf8465eb20e68d00e2dbff5b5fMD55Araujo_RJA-Medina_PFJ-IT.pdf.txtAraujo_RJA-Medina_PFJ-IT.pdf.txtExtracted texttext/plain3285https://repositorio.ucv.edu.pe/bitstream/20.500.12692/153103/7/Araujo_RJA-Medina_PFJ-IT.pdf.txtf301fd9a67dc5a909ea9ca4b2dd6f663MD57Araujo_RJA-Medina_PFJ.pdf.txtAraujo_RJA-Medina_PFJ.pdf.txtExtracted texttext/plain140952https://repositorio.ucv.edu.pe/bitstream/20.500.12692/153103/9/Araujo_RJA-Medina_PFJ.pdf.txtf8047750fee47373287c64f6746910f6MD59THUMBNAILAraujo_RJA-Medina_PFJ-SD.pdf.jpgAraujo_RJA-Medina_PFJ-SD.pdf.jpgGenerated Thumbnailimage/jpeg4671https://repositorio.ucv.edu.pe/bitstream/20.500.12692/153103/6/Araujo_RJA-Medina_PFJ-SD.pdf.jpgc26fea2c6b42af75f977444961d867edMD56Araujo_RJA-Medina_PFJ-IT.pdf.jpgAraujo_RJA-Medina_PFJ-IT.pdf.jpgGenerated Thumbnailimage/jpeg5244https://repositorio.ucv.edu.pe/bitstream/20.500.12692/153103/8/Araujo_RJA-Medina_PFJ-IT.pdf.jpgc4e8a258a0648dcc024ee368d7a5f21cMD58Araujo_RJA-Medina_PFJ.pdf.jpgAraujo_RJA-Medina_PFJ.pdf.jpgGenerated Thumbnailimage/jpeg4671https://repositorio.ucv.edu.pe/bitstream/20.500.12692/153103/10/Araujo_RJA-Medina_PFJ.pdf.jpgc26fea2c6b42af75f977444961d867edMD51020.500.12692/153103oai:repositorio.ucv.edu.pe:20.500.12692/1531032024-11-09 22:50:22.307Repositorio de la Universidad César Vallejorepositorio@ucv.edu.peTk9URTogUExBQ0UgWU9VUiBPV04gTElDRU5TRSBIRVJFClRoaXMgc2FtcGxlIGxpY2Vuc2UgaXMgcHJvdmlkZWQgZm9yIGluZm9ybWF0aW9uYWwgcHVycG9zZXMgb25seS4KCk5PTi1FWENMVVNJVkUgRElTVFJJQlVUSU9OIExJQ0VOU0UKCkJ5IHNpZ25pbmcgYW5kIHN1Ym1pdHRpbmcgdGhpcyBsaWNlbnNlLCB5b3UgKHRoZSBhdXRob3Iocykgb3IgY29weXJpZ2h0Cm93bmVyKSBncmFudHMgdG8gRFNwYWNlIFVuaXZlcnNpdHkgKERTVSkgdGhlIG5vbi1leGNsdXNpdmUgcmlnaHQgdG8gcmVwcm9kdWNlLAp0cmFuc2xhdGUgKGFzIGRlZmluZWQgYmVsb3cpLCBhbmQvb3IgZGlzdHJpYnV0ZSB5b3VyIHN1Ym1pc3Npb24gKGluY2x1ZGluZwp0aGUgYWJzdHJhY3QpIHdvcmxkd2lkZSBpbiBwcmludCBhbmQgZWxlY3Ryb25pYyBmb3JtYXQgYW5kIGluIGFueSBtZWRpdW0sCmluY2x1ZGluZyBidXQgbm90IGxpbWl0ZWQgdG8gYXVkaW8gb3IgdmlkZW8uCgpZb3UgYWdyZWUgdGhhdCBEU1UgbWF5LCB3aXRob3V0IGNoYW5naW5nIHRoZSBjb250ZW50LCB0cmFuc2xhdGUgdGhlCnN1Ym1pc3Npb24gdG8gYW55IG1lZGl1bSBvciBmb3JtYXQgZm9yIHRoZSBwdXJwb3NlIG9mIHByZXNlcnZhdGlvbi4KCllvdSBhbHNvIGFncmVlIHRoYXQgRFNVIG1heSBrZWVwIG1vcmUgdGhhbiBvbmUgY29weSBvZiB0aGlzIHN1Ym1pc3Npb24gZm9yCnB1cnBvc2VzIG9mIHNlY3VyaXR5LCBiYWNrLXVwIGFuZCBwcmVzZXJ2YXRpb24uCgpZb3UgcmVwcmVzZW50IHRoYXQgdGhlIHN1Ym1pc3Npb24gaXMgeW91ciBvcmlnaW5hbCB3b3JrLCBhbmQgdGhhdCB5b3UgaGF2ZQp0aGUgcmlnaHQgdG8gZ3JhbnQgdGhlIHJpZ2h0cyBjb250YWluZWQgaW4gdGhpcyBsaWNlbnNlLiBZb3UgYWxzbyByZXByZXNlbnQKdGhhdCB5b3VyIHN1Ym1pc3Npb24gZG9lcyBub3QsIHRvIHRoZSBiZXN0IG9mIHlvdXIga25vd2xlZGdlLCBpbmZyaW5nZSB1cG9uCmFueW9uZSdzIGNvcHlyaWdodC4KCklmIHRoZSBzdWJtaXNzaW9uIGNvbnRhaW5zIG1hdGVyaWFsIGZvciB3aGljaCB5b3UgZG8gbm90IGhvbGQgY29weXJpZ2h0LAp5b3UgcmVwcmVzZW50IHRoYXQgeW91IGhhdmUgb2J0YWluZWQgdGhlIHVucmVzdHJpY3RlZCBwZXJtaXNzaW9uIG9mIHRoZQpjb3B5cmlnaHQgb3duZXIgdG8gZ3JhbnQgRFNVIHRoZSByaWdodHMgcmVxdWlyZWQgYnkgdGhpcyBsaWNlbnNlLCBhbmQgdGhhdApzdWNoIHRoaXJkLXBhcnR5IG93bmVkIG1hdGVyaWFsIGlzIGNsZWFybHkgaWRlbnRpZmllZCBhbmQgYWNrbm93bGVkZ2VkCndpdGhpbiB0aGUgdGV4dCBvciBjb250ZW50IG9mIHRoZSBzdWJtaXNzaW9uLgoKSUYgVEhFIFNVQk1JU1NJT04gSVMgQkFTRUQgVVBPTiBXT1JLIFRIQVQgSEFTIEJFRU4gU1BPTlNPUkVEIE9SIFNVUFBPUlRFRApCWSBBTiBBR0VOQ1kgT1IgT1JHQU5JWkFUSU9OIE9USEVSIFRIQU4gRFNVLCBZT1UgUkVQUkVTRU5UIFRIQVQgWU9VIEhBVkUKRlVMRklMTEVEIEFOWSBSSUdIVCBPRiBSRVZJRVcgT1IgT1RIRVIgT0JMSUdBVElPTlMgUkVRVUlSRUQgQlkgU1VDSApDT05UUkFDVCBPUiBBR1JFRU1FTlQuCgpEU1Ugd2lsbCBjbGVhcmx5IGlkZW50aWZ5IHlvdXIgbmFtZShzKSBhcyB0aGUgYXV0aG9yKHMpIG9yIG93bmVyKHMpIG9mIHRoZQpzdWJtaXNzaW9uLCBhbmQgd2lsbCBub3QgbWFrZSBhbnkgYWx0ZXJhdGlvbiwgb3RoZXIgdGhhbiBhcyBhbGxvd2VkIGJ5IHRoaXMKbGljZW5zZSwgdG8geW91ciBzdWJtaXNzaW9uLgo=
score 13.968699
Nota importante:
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).