Rendimiento de los Modelos de Lenguaje Grandes ante preguntas acerca de las técnicas radiológicas

Descripción del Articulo

Evalúa el rendimiento de los Modelos de Lenguaje Grandes ante preguntas acerca de las técnicas radiológicas. La investigación es de enfoque cuantitativo, de diseño observacional de tipo descriptivo comparativo y transversal. Se consideraron 15 preguntas adaptadas del banco del Colegio Americano de R...

Descripción completa

Detalles Bibliográficos
Autor: Cardenas Cordova, Mitzy D’yhana
Formato: tesis de grado
Fecha de Publicación:2024
Institución:Universidad Nacional Mayor de San Marcos
Repositorio:UNMSM-Tesis
Lenguaje:español
OAI Identifier:oai:cybertesis.unmsm.edu.pe:20.500.12672/22852
Enlace del recurso:https://hdl.handle.net/20.500.12672/22852
Nivel de acceso:acceso abierto
Materia:Inteligencia artificial
Radiología médica
https://purl.org/pe-repo/ocde/ford#3.00.00
https://purl.org/pe-repo/ocde/ford#1.02.00
https://purl.org/pe-repo/ocde/ford#3.02.12
id UNMS_a4c86f44d18c14a542deb29fb027cbc4
oai_identifier_str oai:cybertesis.unmsm.edu.pe:20.500.12672/22852
network_acronym_str UNMS
network_name_str UNMSM-Tesis
repository_id_str 410
dc.title.none.fl_str_mv Rendimiento de los Modelos de Lenguaje Grandes ante preguntas acerca de las técnicas radiológicas
title Rendimiento de los Modelos de Lenguaje Grandes ante preguntas acerca de las técnicas radiológicas
spellingShingle Rendimiento de los Modelos de Lenguaje Grandes ante preguntas acerca de las técnicas radiológicas
Cardenas Cordova, Mitzy D’yhana
Inteligencia artificial
Radiología médica
https://purl.org/pe-repo/ocde/ford#3.00.00
https://purl.org/pe-repo/ocde/ford#1.02.00
https://purl.org/pe-repo/ocde/ford#3.02.12
title_short Rendimiento de los Modelos de Lenguaje Grandes ante preguntas acerca de las técnicas radiológicas
title_full Rendimiento de los Modelos de Lenguaje Grandes ante preguntas acerca de las técnicas radiológicas
title_fullStr Rendimiento de los Modelos de Lenguaje Grandes ante preguntas acerca de las técnicas radiológicas
title_full_unstemmed Rendimiento de los Modelos de Lenguaje Grandes ante preguntas acerca de las técnicas radiológicas
title_sort Rendimiento de los Modelos de Lenguaje Grandes ante preguntas acerca de las técnicas radiológicas
author Cardenas Cordova, Mitzy D’yhana
author_facet Cardenas Cordova, Mitzy D’yhana
author_role author
dc.contributor.advisor.fl_str_mv Muñoz Barabino, Carmen Cecilia
dc.contributor.author.fl_str_mv Cardenas Cordova, Mitzy D’yhana
dc.subject.none.fl_str_mv Inteligencia artificial
Radiología médica
topic Inteligencia artificial
Radiología médica
https://purl.org/pe-repo/ocde/ford#3.00.00
https://purl.org/pe-repo/ocde/ford#1.02.00
https://purl.org/pe-repo/ocde/ford#3.02.12
dc.subject.ocde.none.fl_str_mv https://purl.org/pe-repo/ocde/ford#3.00.00
https://purl.org/pe-repo/ocde/ford#1.02.00
https://purl.org/pe-repo/ocde/ford#3.02.12
description Evalúa el rendimiento de los Modelos de Lenguaje Grandes ante preguntas acerca de las técnicas radiológicas. La investigación es de enfoque cuantitativo, de diseño observacional de tipo descriptivo comparativo y transversal. Se consideraron 15 preguntas adaptadas del banco del Colegio Americano de Radiología (ACR), que se clasificaron en tres dominios: radiodiagnóstico, tomografía computada y medicina nuclear. Cada pregunta se ingresó de manera independiente a cada modelo y las respuestas fueron evaluadas por tres expertos, que utilizaron la Escala de tres puntos. Se aplicó la prueba de Shapiro-Wilk para evaluar la normalidad de los datos. Los análisis estadísticos se realizaron con Microsoft Excel y SPSS v.25, incluyendo la prueba de Kruskal-Wallis para comparar las puntuaciones entre modelos y el Coeficiente de Correlación Intraclase (CCI) para determinar la coherencia entre los evaluadores. Se obtuvo que Google Bard ofreció las respuestas más extensas con 3239 palabras y 17113 caracteres, seguido por Microsoft Bing (2065 palabras, 10866 caracteres) y ChatGPT-3.5 (1635 palabras, 9008 caracteres). En cuanto a la precisión, Google Bard tuvo la puntuación más alta en precisión total (37 ± 3.6), seguido por Microsoft Bing (28 ± 4) y ChatGPT-3.5 (26 ± 4.4). Bard también lideró en precisión en dominios específicos como radiodiagnóstico (10.67 ± 1.5), tomografía computada (12.67 ± 2.5) y medicina nuclear (13.67 ± 1.5). En la precisión por consenso, el 60% de las respuestas de Bard fueron calificadas como "Bueno", en comparación con el 13.3% para ChatGPT-3.5 y Microsoft Bing. La correlación entre las evaluaciones de los jueces mostró coherencia significativa y sustancial para ChatGPT-3.5 (r=0.007; CI: 0.618), Google Bard (r=0.008; CI: 0.632), y Microsoft Bing (r=0.007; CI: 0.703). Se concluye que Google Bard tuvo mayor precisión en comparación con Microsoft Bing y ChatGPT-3.5 al responder preguntas sobre las técnicas radiológicas, sin embargo, no se encontraron diferencias significativas entre ellos.
publishDate 2024
dc.date.accessioned.none.fl_str_mv 2024-07-11T17:01:10Z
dc.date.available.none.fl_str_mv 2024-07-11T17:01:10Z
dc.date.issued.fl_str_mv 2024
dc.type.none.fl_str_mv info:eu-repo/semantics/bachelorThesis
format bachelorThesis
dc.identifier.citation.none.fl_str_mv Cardenas M. Rendimiento de los Modelos de Lenguaje Grandes ante preguntas acerca de las técnicas radiológicas [Tesis de pregrado]. Lima: Universidad Nacional Mayor de San Marcos, Facultad de Medicina, Escuela Profesional de Tecnología Médica; 2024.
dc.identifier.uri.none.fl_str_mv https://hdl.handle.net/20.500.12672/22852
identifier_str_mv Cardenas M. Rendimiento de los Modelos de Lenguaje Grandes ante preguntas acerca de las técnicas radiológicas [Tesis de pregrado]. Lima: Universidad Nacional Mayor de San Marcos, Facultad de Medicina, Escuela Profesional de Tecnología Médica; 2024.
url https://hdl.handle.net/20.500.12672/22852
dc.language.iso.none.fl_str_mv spa
language spa
dc.relation.ispartof.fl_str_mv SUNEDU
dc.rights.none.fl_str_mv info:eu-repo/semantics/openAccess
dc.rights.uri.none.fl_str_mv http://creativecommons.org/licenses/by-nc-nd/2.5/pe/
eu_rights_str_mv openAccess
rights_invalid_str_mv http://creativecommons.org/licenses/by-nc-nd/2.5/pe/
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Universidad Nacional Mayor de San Marcos
dc.publisher.country.none.fl_str_mv PE
publisher.none.fl_str_mv Universidad Nacional Mayor de San Marcos
dc.source.none.fl_str_mv reponame:UNMSM-Tesis
instname:Universidad Nacional Mayor de San Marcos
instacron:UNMSM
instname_str Universidad Nacional Mayor de San Marcos
instacron_str UNMSM
institution UNMSM
reponame_str UNMSM-Tesis
collection UNMSM-Tesis
bitstream.url.fl_str_mv https://cybertesis.unmsm.edu.pe/bitstreams/728b8046-d619-4b4d-a35d-47eef7f219f0/download
https://cybertesis.unmsm.edu.pe/bitstreams/dff8ebfc-c1cb-4a7b-a6aa-a4588a375eff/download
https://cybertesis.unmsm.edu.pe/bitstreams/7635a704-053e-4820-be59-84ea1351858b/download
https://cybertesis.unmsm.edu.pe/bitstreams/c3c84498-69c8-44db-a76b-8eb5ea9436c3/download
https://cybertesis.unmsm.edu.pe/bitstreams/befa1e9a-dec4-40b4-be52-1bc1e84501e0/download
https://cybertesis.unmsm.edu.pe/bitstreams/bcf6c27c-7cbb-448a-b67d-62981369fe59/download
https://cybertesis.unmsm.edu.pe/bitstreams/64ce28f5-1c8d-4bd4-8eae-df2999ec2128/download
https://cybertesis.unmsm.edu.pe/bitstreams/e8155431-c409-474f-b498-69d463768c21/download
https://cybertesis.unmsm.edu.pe/bitstreams/2a4c682b-a52c-4930-9edf-387467290f33/download
https://cybertesis.unmsm.edu.pe/bitstreams/2517718b-5f85-46d5-98c0-06bca7b21754/download
https://cybertesis.unmsm.edu.pe/bitstreams/01d71527-e2f3-48c2-a82d-1e3216ab879d/download
bitstream.checksum.fl_str_mv bb9bdc0b3349e4284e09149f943790b4
1f14487299a8a795dc379bc1df9968a0
a28bcf99c28619c2a68fbb880ec49906
36138a7224ac21341da176be1dda2e2b
439cb0155244a6985d94232140992539
9e9e2b01495ce485e39cd45f356601c5
804b6d6cccc45c847a04205c3a5005ef
ae8a6e538be0549ef818a748ed9eb08f
bfad2fcf135c8d2d793fd0ce98932ab4
8dc60abab2cf82530915a8842efa6a98
889f2ce64c32b259a0c908d5a2a98e72
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
MD5
MD5
MD5
MD5
MD5
MD5
MD5
MD5
repository.name.fl_str_mv Cybertesis UNMSM
repository.mail.fl_str_mv cybertesis@unmsm.edu.pe
_version_ 1865014220948504576
spelling Muñoz Barabino, Carmen CeciliaCardenas Cordova, Mitzy D’yhana2024-07-11T17:01:10Z2024-07-11T17:01:10Z2024Cardenas M. Rendimiento de los Modelos de Lenguaje Grandes ante preguntas acerca de las técnicas radiológicas [Tesis de pregrado]. Lima: Universidad Nacional Mayor de San Marcos, Facultad de Medicina, Escuela Profesional de Tecnología Médica; 2024.https://hdl.handle.net/20.500.12672/22852Evalúa el rendimiento de los Modelos de Lenguaje Grandes ante preguntas acerca de las técnicas radiológicas. La investigación es de enfoque cuantitativo, de diseño observacional de tipo descriptivo comparativo y transversal. Se consideraron 15 preguntas adaptadas del banco del Colegio Americano de Radiología (ACR), que se clasificaron en tres dominios: radiodiagnóstico, tomografía computada y medicina nuclear. Cada pregunta se ingresó de manera independiente a cada modelo y las respuestas fueron evaluadas por tres expertos, que utilizaron la Escala de tres puntos. Se aplicó la prueba de Shapiro-Wilk para evaluar la normalidad de los datos. Los análisis estadísticos se realizaron con Microsoft Excel y SPSS v.25, incluyendo la prueba de Kruskal-Wallis para comparar las puntuaciones entre modelos y el Coeficiente de Correlación Intraclase (CCI) para determinar la coherencia entre los evaluadores. Se obtuvo que Google Bard ofreció las respuestas más extensas con 3239 palabras y 17113 caracteres, seguido por Microsoft Bing (2065 palabras, 10866 caracteres) y ChatGPT-3.5 (1635 palabras, 9008 caracteres). En cuanto a la precisión, Google Bard tuvo la puntuación más alta en precisión total (37 ± 3.6), seguido por Microsoft Bing (28 ± 4) y ChatGPT-3.5 (26 ± 4.4). Bard también lideró en precisión en dominios específicos como radiodiagnóstico (10.67 ± 1.5), tomografía computada (12.67 ± 2.5) y medicina nuclear (13.67 ± 1.5). En la precisión por consenso, el 60% de las respuestas de Bard fueron calificadas como "Bueno", en comparación con el 13.3% para ChatGPT-3.5 y Microsoft Bing. La correlación entre las evaluaciones de los jueces mostró coherencia significativa y sustancial para ChatGPT-3.5 (r=0.007; CI: 0.618), Google Bard (r=0.008; CI: 0.632), y Microsoft Bing (r=0.007; CI: 0.703). Se concluye que Google Bard tuvo mayor precisión en comparación con Microsoft Bing y ChatGPT-3.5 al responder preguntas sobre las técnicas radiológicas, sin embargo, no se encontraron diferencias significativas entre ellos.application/pdfspaUniversidad Nacional Mayor de San MarcosPEinfo:eu-repo/semantics/openAccesshttp://creativecommons.org/licenses/by-nc-nd/2.5/pe/Inteligencia artificialRadiología médicahttps://purl.org/pe-repo/ocde/ford#3.00.00https://purl.org/pe-repo/ocde/ford#1.02.00https://purl.org/pe-repo/ocde/ford#3.02.12Rendimiento de los Modelos de Lenguaje Grandes ante preguntas acerca de las técnicas radiológicasinfo:eu-repo/semantics/bachelorThesisreponame:UNMSM-Tesisinstname:Universidad Nacional Mayor de San Marcosinstacron:UNMSMSUNEDULicenciada en Tecnología Médica en el área de RadiologíaUniversidad Nacional Mayor de San Marcos. Facultad de Medicina. Escuela Profesional de Tecnología MédicaTecnología Médica en el área de Radiología07194769https://orcid.org/0000-0002-3168-821072263069915076Carbonel Arribasplata, José AntonioVásquez Herrera, José FernandoSánchez García, Waynnerhttps://purl.org/pe-repo/renati/level#tituloProfesionalhttps://purl.org/pe-repo/renati/type#tesisLICENSElicense.txtlicense.txttext/plain; charset=utf-81748https://cybertesis.unmsm.edu.pe/bitstreams/728b8046-d619-4b4d-a35d-47eef7f219f0/downloadbb9bdc0b3349e4284e09149f943790b4MD51CC-LICENSElicense_rdflicense_rdfapplication/rdf+xml; charset=utf-8905https://cybertesis.unmsm.edu.pe/bitstreams/dff8ebfc-c1cb-4a7b-a6aa-a4588a375eff/download1f14487299a8a795dc379bc1df9968a0MD52ORIGINALCardenas_cm.pdfCardenas_cm.pdfapplication/pdf2704022https://cybertesis.unmsm.edu.pe/bitstreams/7635a704-053e-4820-be59-84ea1351858b/downloada28bcf99c28619c2a68fbb880ec49906MD53C1817_2024_Cardenas_cm_autorización.pdfapplication/pdf188576https://cybertesis.unmsm.edu.pe/bitstreams/c3c84498-69c8-44db-a76b-8eb5ea9436c3/download36138a7224ac21341da176be1dda2e2bMD54C1817_2024_Cardenas_cm_reporte.pdfapplication/pdf12845134https://cybertesis.unmsm.edu.pe/bitstreams/befa1e9a-dec4-40b4-be52-1bc1e84501e0/download439cb0155244a6985d94232140992539MD55TEXTCardenas_cm.pdf.txtCardenas_cm.pdf.txtExtracted texttext/plain101870https://cybertesis.unmsm.edu.pe/bitstreams/bcf6c27c-7cbb-448a-b67d-62981369fe59/download9e9e2b01495ce485e39cd45f356601c5MD56C1817_2024_Cardenas_cm_autorización.pdf.txtC1817_2024_Cardenas_cm_autorización.pdf.txtExtracted texttext/plain3875https://cybertesis.unmsm.edu.pe/bitstreams/64ce28f5-1c8d-4bd4-8eae-df2999ec2128/download804b6d6cccc45c847a04205c3a5005efMD58C1817_2024_Cardenas_cm_reporte.pdf.txtC1817_2024_Cardenas_cm_reporte.pdf.txtExtracted texttext/plain3548https://cybertesis.unmsm.edu.pe/bitstreams/e8155431-c409-474f-b498-69d463768c21/downloadae8a6e538be0549ef818a748ed9eb08fMD510THUMBNAILCardenas_cm.pdf.jpgCardenas_cm.pdf.jpgGenerated Thumbnailimage/jpeg15015https://cybertesis.unmsm.edu.pe/bitstreams/2a4c682b-a52c-4930-9edf-387467290f33/downloadbfad2fcf135c8d2d793fd0ce98932ab4MD57C1817_2024_Cardenas_cm_autorización.pdf.jpgC1817_2024_Cardenas_cm_autorización.pdf.jpgGenerated Thumbnailimage/jpeg20930https://cybertesis.unmsm.edu.pe/bitstreams/2517718b-5f85-46d5-98c0-06bca7b21754/download8dc60abab2cf82530915a8842efa6a98MD59C1817_2024_Cardenas_cm_reporte.pdf.jpgC1817_2024_Cardenas_cm_reporte.pdf.jpgGenerated Thumbnailimage/jpeg16099https://cybertesis.unmsm.edu.pe/bitstreams/01d71527-e2f3-48c2-a82d-1e3216ab879d/download889f2ce64c32b259a0c908d5a2a98e72MD51120.500.12672/22852oai:cybertesis.unmsm.edu.pe:20.500.12672/228522024-08-16 02:03:47.046http://creativecommons.org/licenses/by-nc-nd/2.5/pe/info:eu-repo/semantics/openAccessopen.accesshttps://cybertesis.unmsm.edu.peCybertesis UNMSMcybertesis@unmsm.edu.peTk9URTogUExBQ0UgWU9VUiBPV04gTElDRU5TRSBIRVJFClRoaXMgc2FtcGxlIGxpY2Vuc2UgaXMgcHJvdmlkZWQgZm9yIGluZm9ybWF0aW9uYWwgcHVycG9zZXMgb25seS4KCk5PTi1FWENMVVNJVkUgRElTVFJJQlVUSU9OIExJQ0VOU0UKCkJ5IHNpZ25pbmcgYW5kIHN1Ym1pdHRpbmcgdGhpcyBsaWNlbnNlLCB5b3UgKHRoZSBhdXRob3Iocykgb3IgY29weXJpZ2h0IG93bmVyKSBncmFudHMgdG8gRFNwYWNlIFVuaXZlcnNpdHkgKERTVSkgdGhlIG5vbi1leGNsdXNpdmUgcmlnaHQgdG8gcmVwcm9kdWNlLCB0cmFuc2xhdGUgKGFzIGRlZmluZWQgYmVsb3cpLCBhbmQvb3IgZGlzdHJpYnV0ZSB5b3VyIHN1Ym1pc3Npb24gKGluY2x1ZGluZyB0aGUgYWJzdHJhY3QpIHdvcmxkd2lkZSBpbiBwcmludCBhbmQgZWxlY3Ryb25pYyBmb3JtYXQgYW5kIGluIGFueSBtZWRpdW0sIGluY2x1ZGluZyBidXQgbm90IGxpbWl0ZWQgdG8gYXVkaW8gb3IgdmlkZW8uCgpZb3UgYWdyZWUgdGhhdCBEU1UgbWF5LCB3aXRob3V0IGNoYW5naW5nIHRoZSBjb250ZW50LCB0cmFuc2xhdGUgdGhlIHN1Ym1pc3Npb24gdG8gYW55IG1lZGl1bSBvciBmb3JtYXQgZm9yIHRoZSBwdXJwb3NlIG9mIHByZXNlcnZhdGlvbi4KCllvdSBhbHNvIGFncmVlIHRoYXQgRFNVIG1heSBrZWVwIG1vcmUgdGhhbiBvbmUgY29weSBvZiB0aGlzIHN1Ym1pc3Npb24gZm9yIHB1cnBvc2VzIG9mIHNlY3VyaXR5LCBiYWNrLXVwIGFuZCBwcmVzZXJ2YXRpb24uCgpZb3UgcmVwcmVzZW50IHRoYXQgdGhlIHN1Ym1pc3Npb24gaXMgeW91ciBvcmlnaW5hbCB3b3JrLCBhbmQgdGhhdCB5b3UgaGF2ZSB0aGUgcmlnaHQgdG8gZ3JhbnQgdGhlIHJpZ2h0cyBjb250YWluZWQgaW4gdGhpcyBsaWNlbnNlLiBZb3UgYWxzbyByZXByZXNlbnQgdGhhdCB5b3VyIHN1Ym1pc3Npb24gZG9lcyBub3QsIHRvIHRoZSBiZXN0IG9mIHlvdXIga25vd2xlZGdlLCBpbmZyaW5nZSB1cG9uIGFueW9uZSdzIGNvcHlyaWdodC4KCklmIHRoZSBzdWJtaXNzaW9uIGNvbnRhaW5zIG1hdGVyaWFsIGZvciB3aGljaCB5b3UgZG8gbm90IGhvbGQgY29weXJpZ2h0LCB5b3UgcmVwcmVzZW50IHRoYXQgeW91IGhhdmUgb2J0YWluZWQgdGhlIHVucmVzdHJpY3RlZCBwZXJtaXNzaW9uIG9mIHRoZSBjb3B5cmlnaHQgb3duZXIgdG8gZ3JhbnQgRFNVIHRoZSByaWdodHMgcmVxdWlyZWQgYnkgdGhpcyBsaWNlbnNlLCBhbmQgdGhhdCBzdWNoIHRoaXJkLXBhcnR5IG93bmVkIG1hdGVyaWFsIGlzIGNsZWFybHkgaWRlbnRpZmllZCBhbmQgYWNrbm93bGVkZ2VkIHdpdGhpbiB0aGUgdGV4dCBvciBjb250ZW50IG9mIHRoZSBzdWJtaXNzaW9uLgoKSUYgVEhFIFNVQk1JU1NJT04gSVMgQkFTRUQgVVBPTiBXT1JLIFRIQVQgSEFTIEJFRU4gU1BPTlNPUkVEIE9SIFNVUFBPUlRFRCBCWSBBTiBBR0VOQ1kgT1IgT1JHQU5JWkFUSU9OIE9USEVSIFRIQU4gRFNVLCBZT1UgUkVQUkVTRU5UIFRIQVQgWU9VIEhBVkUgRlVMRklMTEVEIEFOWSBSSUdIVCBPRiBSRVZJRVcgT1IgT1RIRVIgT0JMSUdBVElPTlMgUkVRVUlSRUQgQlkgU1VDSCBDT05UUkFDVCBPUiBBR1JFRU1FTlQuCgpEU1Ugd2lsbCBjbGVhcmx5IGlkZW50aWZ5IHlvdXIgbmFtZShzKSBhcyB0aGUgYXV0aG9yKHMpIG9yIG93bmVyKHMpIG9mIHRoZSBzdWJtaXNzaW9uLCBhbmQgd2lsbCBub3QgbWFrZSBhbnkgYWx0ZXJhdGlvbiwgb3RoZXIgdGhhbiBhcyBhbGxvd2VkIGJ5IHRoaXMgbGljZW5zZSwgdG8geW91ciBzdWJtaXNzaW9uLgo=
score 12.8181
Nota importante:
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).