Rendimiento de los Modelos de Lenguaje Grandes ante preguntas acerca de las técnicas radiológicas

Cardenas Cordova, Mitzy D’yhana

Rendimiento de los Modelos de Lenguaje Grandes ante preguntas acerca de las técnicas radiológicas

Descripción del Articulo

Evalúa el rendimiento de los Modelos de Lenguaje Grandes ante preguntas acerca de las técnicas radiológicas. La investigación es de enfoque cuantitativo, de diseño observacional de tipo descriptivo comparativo y transversal. Se consideraron 15 preguntas adaptadas del banco del Colegio Americano de R...

Descripción completa

Detalles Bibliográficos
Autor:	Cardenas Cordova, Mitzy D’yhana
Formato:	tesis de grado
Fecha de Publicación:	2024
Institución:	Universidad Nacional Mayor de San Marcos
Repositorio:	UNMSM-Tesis
Lenguaje:	español
OAI Identifier:	oai:cybertesis.unmsm.edu.pe:20.500.12672/22852
Enlace del recurso:	https://hdl.handle.net/20.500.12672/22852
Nivel de acceso:	acceso abierto
Materia:	Inteligencia artificial Radiología médica https://purl.org/pe-repo/ocde/ford#3.00.00 https://purl.org/pe-repo/ocde/ford#1.02.00 https://purl.org/pe-repo/ocde/ford#3.02.12

id	UNMS_a4c86f44d18c14a542deb29fb027cbc4
oai_identifier_str	oai:cybertesis.unmsm.edu.pe:20.500.12672/22852
network_acronym_str	UNMS
network_name_str	UNMSM-Tesis
repository_id_str	410
dc.title.none.fl_str_mv	Rendimiento de los Modelos de Lenguaje Grandes ante preguntas acerca de las técnicas radiológicas
title	Rendimiento de los Modelos de Lenguaje Grandes ante preguntas acerca de las técnicas radiológicas
spellingShingle	Rendimiento de los Modelos de Lenguaje Grandes ante preguntas acerca de las técnicas radiológicas Cardenas Cordova, Mitzy D’yhana Inteligencia artificial Radiología médica https://purl.org/pe-repo/ocde/ford#3.00.00 https://purl.org/pe-repo/ocde/ford#1.02.00 https://purl.org/pe-repo/ocde/ford#3.02.12
title_short	Rendimiento de los Modelos de Lenguaje Grandes ante preguntas acerca de las técnicas radiológicas
title_full	Rendimiento de los Modelos de Lenguaje Grandes ante preguntas acerca de las técnicas radiológicas
title_fullStr	Rendimiento de los Modelos de Lenguaje Grandes ante preguntas acerca de las técnicas radiológicas
title_full_unstemmed	Rendimiento de los Modelos de Lenguaje Grandes ante preguntas acerca de las técnicas radiológicas
title_sort	Rendimiento de los Modelos de Lenguaje Grandes ante preguntas acerca de las técnicas radiológicas
author	Cardenas Cordova, Mitzy D’yhana
author_facet	Cardenas Cordova, Mitzy D’yhana
author_role	author
dc.contributor.advisor.fl_str_mv	Muñoz Barabino, Carmen Cecilia
dc.contributor.author.fl_str_mv	Cardenas Cordova, Mitzy D’yhana
dc.subject.none.fl_str_mv	Inteligencia artificial Radiología médica
topic	Inteligencia artificial Radiología médica https://purl.org/pe-repo/ocde/ford#3.00.00 https://purl.org/pe-repo/ocde/ford#1.02.00 https://purl.org/pe-repo/ocde/ford#3.02.12
dc.subject.ocde.none.fl_str_mv	https://purl.org/pe-repo/ocde/ford#3.00.00 https://purl.org/pe-repo/ocde/ford#1.02.00 https://purl.org/pe-repo/ocde/ford#3.02.12
description	Evalúa el rendimiento de los Modelos de Lenguaje Grandes ante preguntas acerca de las técnicas radiológicas. La investigación es de enfoque cuantitativo, de diseño observacional de tipo descriptivo comparativo y transversal. Se consideraron 15 preguntas adaptadas del banco del Colegio Americano de Radiología (ACR), que se clasificaron en tres dominios: radiodiagnóstico, tomografía computada y medicina nuclear. Cada pregunta se ingresó de manera independiente a cada modelo y las respuestas fueron evaluadas por tres expertos, que utilizaron la Escala de tres puntos. Se aplicó la prueba de Shapiro-Wilk para evaluar la normalidad de los datos. Los análisis estadísticos se realizaron con Microsoft Excel y SPSS v.25, incluyendo la prueba de Kruskal-Wallis para comparar las puntuaciones entre modelos y el Coeficiente de Correlación Intraclase (CCI) para determinar la coherencia entre los evaluadores. Se obtuvo que Google Bard ofreció las respuestas más extensas con 3239 palabras y 17113 caracteres, seguido por Microsoft Bing (2065 palabras, 10866 caracteres) y ChatGPT-3.5 (1635 palabras, 9008 caracteres). En cuanto a la precisión, Google Bard tuvo la puntuación más alta en precisión total (37 ± 3.6), seguido por Microsoft Bing (28 ± 4) y ChatGPT-3.5 (26 ± 4.4). Bard también lideró en precisión en dominios específicos como radiodiagnóstico (10.67 ± 1.5), tomografía computada (12.67 ± 2.5) y medicina nuclear (13.67 ± 1.5). En la precisión por consenso, el 60% de las respuestas de Bard fueron calificadas como "Bueno", en comparación con el 13.3% para ChatGPT-3.5 y Microsoft Bing. La correlación entre las evaluaciones de los jueces mostró coherencia significativa y sustancial para ChatGPT-3.5 (r=0.007; CI: 0.618), Google Bard (r=0.008; CI: 0.632), y Microsoft Bing (r=0.007; CI: 0.703). Se concluye que Google Bard tuvo mayor precisión en comparación con Microsoft Bing y ChatGPT-3.5 al responder preguntas sobre las técnicas radiológicas, sin embargo, no se encontraron diferencias significativas entre ellos.
publishDate	2024
dc.date.accessioned.none.fl_str_mv	2024-07-11T17:01:10Z
dc.date.available.none.fl_str_mv	2024-07-11T17:01:10Z
dc.date.issued.fl_str_mv	2024
dc.type.none.fl_str_mv	info:eu-repo/semantics/bachelorThesis
format	bachelorThesis
dc.identifier.citation.none.fl_str_mv	Cardenas M. Rendimiento de los Modelos de Lenguaje Grandes ante preguntas acerca de las técnicas radiológicas [Tesis de pregrado]. Lima: Universidad Nacional Mayor de San Marcos, Facultad de Medicina, Escuela Profesional de Tecnología Médica; 2024.
dc.identifier.uri.none.fl_str_mv	https://hdl.handle.net/20.500.12672/22852
identifier_str_mv	Cardenas M. Rendimiento de los Modelos de Lenguaje Grandes ante preguntas acerca de las técnicas radiológicas [Tesis de pregrado]. Lima: Universidad Nacional Mayor de San Marcos, Facultad de Medicina, Escuela Profesional de Tecnología Médica; 2024.
url	https://hdl.handle.net/20.500.12672/22852
dc.language.iso.none.fl_str_mv	spa
language	spa
dc.relation.ispartof.fl_str_mv	SUNEDU
dc.rights.none.fl_str_mv	info:eu-repo/semantics/openAccess
dc.rights.uri.none.fl_str_mv	http://creativecommons.org/licenses/by-nc-nd/2.5/pe/
eu_rights_str_mv	openAccess
rights_invalid_str_mv	http://creativecommons.org/licenses/by-nc-nd/2.5/pe/
dc.format.none.fl_str_mv	application/pdf
dc.publisher.none.fl_str_mv	Universidad Nacional Mayor de San Marcos
dc.publisher.country.none.fl_str_mv	PE
publisher.none.fl_str_mv	Universidad Nacional Mayor de San Marcos
dc.source.none.fl_str_mv	reponame:UNMSM-Tesis instname:Universidad Nacional Mayor de San Marcos instacron:UNMSM
instname_str	Universidad Nacional Mayor de San Marcos
instacron_str	UNMSM
institution	UNMSM
reponame_str	UNMSM-Tesis
collection	UNMSM-Tesis
bitstream.url.fl_str_mv	https://cybertesis.unmsm.edu.pe/bitstreams/728b8046-d619-4b4d-a35d-47eef7f219f0/download https://cybertesis.unmsm.edu.pe/bitstreams/dff8ebfc-c1cb-4a7b-a6aa-a4588a375eff/download https://cybertesis.unmsm.edu.pe/bitstreams/7635a704-053e-4820-be59-84ea1351858b/download https://cybertesis.unmsm.edu.pe/bitstreams/c3c84498-69c8-44db-a76b-8eb5ea9436c3/download https://cybertesis.unmsm.edu.pe/bitstreams/befa1e9a-dec4-40b4-be52-1bc1e84501e0/download https://cybertesis.unmsm.edu.pe/bitstreams/bcf6c27c-7cbb-448a-b67d-62981369fe59/download https://cybertesis.unmsm.edu.pe/bitstreams/64ce28f5-1c8d-4bd4-8eae-df2999ec2128/download https://cybertesis.unmsm.edu.pe/bitstreams/e8155431-c409-474f-b498-69d463768c21/download https://cybertesis.unmsm.edu.pe/bitstreams/2a4c682b-a52c-4930-9edf-387467290f33/download https://cybertesis.unmsm.edu.pe/bitstreams/2517718b-5f85-46d5-98c0-06bca7b21754/download https://cybertesis.unmsm.edu.pe/bitstreams/01d71527-e2f3-48c2-a82d-1e3216ab879d/download
bitstream.checksum.fl_str_mv	bb9bdc0b3349e4284e09149f943790b4 1f14487299a8a795dc379bc1df9968a0 a28bcf99c28619c2a68fbb880ec49906 36138a7224ac21341da176be1dda2e2b 439cb0155244a6985d94232140992539 9e9e2b01495ce485e39cd45f356601c5 804b6d6cccc45c847a04205c3a5005ef ae8a6e538be0549ef818a748ed9eb08f bfad2fcf135c8d2d793fd0ce98932ab4 8dc60abab2cf82530915a8842efa6a98 889f2ce64c32b259a0c908d5a2a98e72
bitstream.checksumAlgorithm.fl_str_mv	MD5 MD5 MD5 MD5 MD5 MD5 MD5 MD5 MD5 MD5 MD5
repository.name.fl_str_mv	Cybertesis UNMSM
repository.mail.fl_str_mv	cybertesis@unmsm.edu.pe
_version_	1868179425570324480
spelling	Muñoz Barabino, Carmen CeciliaCardenas Cordova, Mitzy D’yhana2024-07-11T17:01:10Z2024-07-11T17:01:10Z2024Cardenas M. Rendimiento de los Modelos de Lenguaje Grandes ante preguntas acerca de las técnicas radiológicas [Tesis de pregrado]. Lima: Universidad Nacional Mayor de San Marcos, Facultad de Medicina, Escuela Profesional de Tecnología Médica; 2024.https://hdl.handle.net/20.500.12672/22852Evalúa el rendimiento de los Modelos de Lenguaje Grandes ante preguntas acerca de las técnicas radiológicas. La investigación es de enfoque cuantitativo, de diseño observacional de tipo descriptivo comparativo y transversal. Se consideraron 15 preguntas adaptadas del banco del Colegio Americano de Radiología (ACR), que se clasificaron en tres dominios: radiodiagnóstico, tomografía computada y medicina nuclear. Cada pregunta se ingresó de manera independiente a cada modelo y las respuestas fueron evaluadas por tres expertos, que utilizaron la Escala de tres puntos. Se aplicó la prueba de Shapiro-Wilk para evaluar la normalidad de los datos. Los análisis estadísticos se realizaron con Microsoft Excel y SPSS v.25, incluyendo la prueba de Kruskal-Wallis para comparar las puntuaciones entre modelos y el Coeficiente de Correlación Intraclase (CCI) para determinar la coherencia entre los evaluadores. Se obtuvo que Google Bard ofreció las respuestas más extensas con 3239 palabras y 17113 caracteres, seguido por Microsoft Bing (2065 palabras, 10866 caracteres) y ChatGPT-3.5 (1635 palabras, 9008 caracteres). En cuanto a la precisión, Google Bard tuvo la puntuación más alta en precisión total (37 ± 3.6), seguido por Microsoft Bing (28 ± 4) y ChatGPT-3.5 (26 ± 4.4). Bard también lideró en precisión en dominios específicos como radiodiagnóstico (10.67 ± 1.5), tomografía computada (12.67 ± 2.5) y medicina nuclear (13.67 ± 1.5). En la precisión por consenso, el 60% de las respuestas de Bard fueron calificadas como "Bueno", en comparación con el 13.3% para ChatGPT-3.5 y Microsoft Bing. La correlación entre las evaluaciones de los jueces mostró coherencia significativa y sustancial para ChatGPT-3.5 (r=0.007; CI: 0.618), Google Bard (r=0.008; CI: 0.632), y Microsoft Bing (r=0.007; CI: 0.703). Se concluye que Google Bard tuvo mayor precisión en comparación con Microsoft Bing y ChatGPT-3.5 al responder preguntas sobre las técnicas radiológicas, sin embargo, no se encontraron diferencias significativas entre ellos.application/pdfspaUniversidad Nacional Mayor de San MarcosPEinfo:eu-repo/semantics/openAccesshttp://creativecommons.org/licenses/by-nc-nd/2.5/pe/Inteligencia artificialRadiología médicahttps://purl.org/pe-repo/ocde/ford#3.00.00https://purl.org/pe-repo/ocde/ford#1.02.00https://purl.org/pe-repo/ocde/ford#3.02.12Rendimiento de los Modelos de Lenguaje Grandes ante preguntas acerca de las técnicas radiológicasinfo:eu-repo/semantics/bachelorThesisreponame:UNMSM-Tesisinstname:Universidad Nacional Mayor de San Marcosinstacron:UNMSMSUNEDULicenciada en Tecnología Médica en el área de RadiologíaUniversidad Nacional Mayor de San Marcos. Facultad de Medicina. Escuela Profesional de Tecnología MédicaTecnología Médica en el área de Radiología07194769https://orcid.org/0000-0002-3168-821072263069915076Carbonel Arribasplata, José AntonioVásquez Herrera, José FernandoSánchez García, Waynnerhttps://purl.org/pe-repo/renati/level#tituloProfesionalhttps://purl.org/pe-repo/renati/type#tesisLICENSElicense.txtlicense.txttext/plain; charset=utf-81748https://cybertesis.unmsm.edu.pe/bitstreams/728b8046-d619-4b4d-a35d-47eef7f219f0/downloadbb9bdc0b3349e4284e09149f943790b4MD51CC-LICENSElicense_rdflicense_rdfapplication/rdf+xml; charset=utf-8905https://cybertesis.unmsm.edu.pe/bitstreams/dff8ebfc-c1cb-4a7b-a6aa-a4588a375eff/download1f14487299a8a795dc379bc1df9968a0MD52ORIGINALCardenas_cm.pdfCardenas_cm.pdfapplication/pdf2704022https://cybertesis.unmsm.edu.pe/bitstreams/7635a704-053e-4820-be59-84ea1351858b/downloada28bcf99c28619c2a68fbb880ec49906MD53C1817_2024_Cardenas_cm_autorización.pdfapplication/pdf188576https://cybertesis.unmsm.edu.pe/bitstreams/c3c84498-69c8-44db-a76b-8eb5ea9436c3/download36138a7224ac21341da176be1dda2e2bMD54C1817_2024_Cardenas_cm_reporte.pdfapplication/pdf12845134https://cybertesis.unmsm.edu.pe/bitstreams/befa1e9a-dec4-40b4-be52-1bc1e84501e0/download439cb0155244a6985d94232140992539MD55TEXTCardenas_cm.pdf.txtCardenas_cm.pdf.txtExtracted texttext/plain101870https://cybertesis.unmsm.edu.pe/bitstreams/bcf6c27c-7cbb-448a-b67d-62981369fe59/download9e9e2b01495ce485e39cd45f356601c5MD56C1817_2024_Cardenas_cm_autorización.pdf.txtC1817_2024_Cardenas_cm_autorización.pdf.txtExtracted texttext/plain3875https://cybertesis.unmsm.edu.pe/bitstreams/64ce28f5-1c8d-4bd4-8eae-df2999ec2128/download804b6d6cccc45c847a04205c3a5005efMD58C1817_2024_Cardenas_cm_reporte.pdf.txtC1817_2024_Cardenas_cm_reporte.pdf.txtExtracted texttext/plain3548https://cybertesis.unmsm.edu.pe/bitstreams/e8155431-c409-474f-b498-69d463768c21/downloadae8a6e538be0549ef818a748ed9eb08fMD510THUMBNAILCardenas_cm.pdf.jpgCardenas_cm.pdf.jpgGenerated Thumbnailimage/jpeg15015https://cybertesis.unmsm.edu.pe/bitstreams/2a4c682b-a52c-4930-9edf-387467290f33/downloadbfad2fcf135c8d2d793fd0ce98932ab4MD57C1817_2024_Cardenas_cm_autorización.pdf.jpgC1817_2024_Cardenas_cm_autorización.pdf.jpgGenerated Thumbnailimage/jpeg20930https://cybertesis.unmsm.edu.pe/bitstreams/2517718b-5f85-46d5-98c0-06bca7b21754/download8dc60abab2cf82530915a8842efa6a98MD59C1817_2024_Cardenas_cm_reporte.pdf.jpgC1817_2024_Cardenas_cm_reporte.pdf.jpgGenerated Thumbnailimage/jpeg16099https://cybertesis.unmsm.edu.pe/bitstreams/01d71527-e2f3-48c2-a82d-1e3216ab879d/download889f2ce64c32b259a0c908d5a2a98e72MD51120.500.12672/22852oai:cybertesis.unmsm.edu.pe:20.500.12672/228522024-08-16 02:03:47.046http://creativecommons.org/licenses/by-nc-nd/2.5/pe/info:eu-repo/semantics/openAccessopen.accesshttps://cybertesis.unmsm.edu.peCybertesis UNMSMcybertesis@unmsm.edu.peTk9URTogUExBQ0UgWU9VUiBPV04gTElDRU5TRSBIRVJFClRoaXMgc2FtcGxlIGxpY2Vuc2UgaXMgcHJvdmlkZWQgZm9yIGluZm9ybWF0aW9uYWwgcHVycG9zZXMgb25seS4KCk5PTi1FWENMVVNJVkUgRElTVFJJQlVUSU9OIExJQ0VOU0UKCkJ5IHNpZ25pbmcgYW5kIHN1Ym1pdHRpbmcgdGhpcyBsaWNlbnNlLCB5b3UgKHRoZSBhdXRob3Iocykgb3IgY29weXJpZ2h0IG93bmVyKSBncmFudHMgdG8gRFNwYWNlIFVuaXZlcnNpdHkgKERTVSkgdGhlIG5vbi1leGNsdXNpdmUgcmlnaHQgdG8gcmVwcm9kdWNlLCB0cmFuc2xhdGUgKGFzIGRlZmluZWQgYmVsb3cpLCBhbmQvb3IgZGlzdHJpYnV0ZSB5b3VyIHN1Ym1pc3Npb24gKGluY2x1ZGluZyB0aGUgYWJzdHJhY3QpIHdvcmxkd2lkZSBpbiBwcmludCBhbmQgZWxlY3Ryb25pYyBmb3JtYXQgYW5kIGluIGFueSBtZWRpdW0sIGluY2x1ZGluZyBidXQgbm90IGxpbWl0ZWQgdG8gYXVkaW8gb3IgdmlkZW8uCgpZb3UgYWdyZWUgdGhhdCBEU1UgbWF5LCB3aXRob3V0IGNoYW5naW5nIHRoZSBjb250ZW50LCB0cmFuc2xhdGUgdGhlIHN1Ym1pc3Npb24gdG8gYW55IG1lZGl1bSBvciBmb3JtYXQgZm9yIHRoZSBwdXJwb3NlIG9mIHByZXNlcnZhdGlvbi4KCllvdSBhbHNvIGFncmVlIHRoYXQgRFNVIG1heSBrZWVwIG1vcmUgdGhhbiBvbmUgY29weSBvZiB0aGlzIHN1Ym1pc3Npb24gZm9yIHB1cnBvc2VzIG9mIHNlY3VyaXR5LCBiYWNrLXVwIGFuZCBwcmVzZXJ2YXRpb24uCgpZb3UgcmVwcmVzZW50IHRoYXQgdGhlIHN1Ym1pc3Npb24gaXMgeW91ciBvcmlnaW5hbCB3b3JrLCBhbmQgdGhhdCB5b3UgaGF2ZSB0aGUgcmlnaHQgdG8gZ3JhbnQgdGhlIHJpZ2h0cyBjb250YWluZWQgaW4gdGhpcyBsaWNlbnNlLiBZb3UgYWxzbyByZXByZXNlbnQgdGhhdCB5b3VyIHN1Ym1pc3Npb24gZG9lcyBub3QsIHRvIHRoZSBiZXN0IG9mIHlvdXIga25vd2xlZGdlLCBpbmZyaW5nZSB1cG9uIGFueW9uZSdzIGNvcHlyaWdodC4KCklmIHRoZSBzdWJtaXNzaW9uIGNvbnRhaW5zIG1hdGVyaWFsIGZvciB3aGljaCB5b3UgZG8gbm90IGhvbGQgY29weXJpZ2h0LCB5b3UgcmVwcmVzZW50IHRoYXQgeW91IGhhdmUgb2J0YWluZWQgdGhlIHVucmVzdHJpY3RlZCBwZXJtaXNzaW9uIG9mIHRoZSBjb3B5cmlnaHQgb3duZXIgdG8gZ3JhbnQgRFNVIHRoZSByaWdodHMgcmVxdWlyZWQgYnkgdGhpcyBsaWNlbnNlLCBhbmQgdGhhdCBzdWNoIHRoaXJkLXBhcnR5IG93bmVkIG1hdGVyaWFsIGlzIGNsZWFybHkgaWRlbnRpZmllZCBhbmQgYWNrbm93bGVkZ2VkIHdpdGhpbiB0aGUgdGV4dCBvciBjb250ZW50IG9mIHRoZSBzdWJtaXNzaW9uLgoKSUYgVEhFIFNVQk1JU1NJT04gSVMgQkFTRUQgVVBPTiBXT1JLIFRIQVQgSEFTIEJFRU4gU1BPTlNPUkVEIE9SIFNVUFBPUlRFRCBCWSBBTiBBR0VOQ1kgT1IgT1JHQU5JWkFUSU9OIE9USEVSIFRIQU4gRFNVLCBZT1UgUkVQUkVTRU5UIFRIQVQgWU9VIEhBVkUgRlVMRklMTEVEIEFOWSBSSUdIVCBPRiBSRVZJRVcgT1IgT1RIRVIgT0JMSUdBVElPTlMgUkVRVUlSRUQgQlkgU1VDSCBDT05UUkFDVCBPUiBBR1JFRU1FTlQuCgpEU1Ugd2lsbCBjbGVhcmx5IGlkZW50aWZ5IHlvdXIgbmFtZShzKSBhcyB0aGUgYXV0aG9yKHMpIG9yIG93bmVyKHMpIG9mIHRoZSBzdWJtaXNzaW9uLCBhbmQgd2lsbCBub3QgbWFrZSBhbnkgYWx0ZXJhdGlvbiwgb3RoZXIgdGhhbiBhcyBhbGxvd2VkIGJ5IHRoaXMgbGljZW5zZSwgdG8geW91ciBzdWJtaXNzaW9uLgo=
score	12.824051

Rendimiento de los Modelos de Lenguaje Grandes ante preguntas acerca de las técnicas radiológicas

Nota importante:
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).

Rendimiento de los Modelos de Lenguaje Grandes ante preguntas acerca de las técnicas radiológicas

Descripción del Articulo

Ejemplares Similares