Análisis de LLMS Open Source para la generación de casos de prueba unitarios

Descripción del Articulo

La generación de casos de prueba unitarios es una tarea importante en las pruebas de software, ya que permite detectar errores de manera temprana; sin embargo, es un proceso que demanda mucho tiempo y esfuerzo. Las primeras propuestas para abordar este problema aplican enfoques tradicionales que se...

Descripción completa

Detalles Bibliográficos
Autor: Rojas Barraza, Cluny Judiht
Formato: tesis de maestría
Fecha de Publicación:2024
Institución:Universidad de Ingeniería y tecnología
Repositorio:UTEC-Institucional
Lenguaje:español
OAI Identifier:oai:repositorio.utec.edu.pe:20.500.12815/444
Enlace del recurso:https://hdl.handle.net/20.500.12815/444
Nivel de acceso:acceso abierto
Materia:Pruebas unitarias
Fine-Tuning
Prompt engineering
LLM
TDD
https://purl.org/pe-repo/ocde/ford#1.02.02
https://purl.org/pe-repo/ocde/ford#1.02.01
id UTEC_79250301398ee374615a1e68b717ffd8
oai_identifier_str oai:repositorio.utec.edu.pe:20.500.12815/444
network_acronym_str UTEC
network_name_str UTEC-Institucional
repository_id_str 4822
dc.title.es_PE.fl_str_mv Análisis de LLMS Open Source para la generación de casos de prueba unitarios
title Análisis de LLMS Open Source para la generación de casos de prueba unitarios
spellingShingle Análisis de LLMS Open Source para la generación de casos de prueba unitarios
Rojas Barraza, Cluny Judiht
Pruebas unitarias
Fine-Tuning
Prompt engineering
LLM
TDD
https://purl.org/pe-repo/ocde/ford#1.02.02
https://purl.org/pe-repo/ocde/ford#1.02.01
title_short Análisis de LLMS Open Source para la generación de casos de prueba unitarios
title_full Análisis de LLMS Open Source para la generación de casos de prueba unitarios
title_fullStr Análisis de LLMS Open Source para la generación de casos de prueba unitarios
title_full_unstemmed Análisis de LLMS Open Source para la generación de casos de prueba unitarios
title_sort Análisis de LLMS Open Source para la generación de casos de prueba unitarios
author Rojas Barraza, Cluny Judiht
author_facet Rojas Barraza, Cluny Judiht
author_role author
dc.contributor.advisor.fl_str_mv López del Alamo, Cristian José
dc.contributor.author.fl_str_mv Rojas Barraza, Cluny Judiht
dc.subject.es_PE.fl_str_mv Pruebas unitarias
Fine-Tuning
Prompt engineering
LLM
TDD
topic Pruebas unitarias
Fine-Tuning
Prompt engineering
LLM
TDD
https://purl.org/pe-repo/ocde/ford#1.02.02
https://purl.org/pe-repo/ocde/ford#1.02.01
dc.subject.ocde.es_PE.fl_str_mv https://purl.org/pe-repo/ocde/ford#1.02.02
https://purl.org/pe-repo/ocde/ford#1.02.01
description La generación de casos de prueba unitarios es una tarea importante en las pruebas de software, ya que permite detectar errores de manera temprana; sin embargo, es un proceso que demanda mucho tiempo y esfuerzo. Las primeras propuestas para abordar este problema aplican enfoques tradicionales que se basan en aleatoriedad, [1] y búsquedas [2]. Recientemente, ha surgido una nueva línea de investigación que explora el uso de Modelos de Lenguaje Grande (LLM por sus siglas en inglés) para la generación de pruebas unitarias, como ChatUniTest [3] y LLMforTDD [4]. Estas soluciones mejoran la cobertura de casos de prueba, pero se limitan a LLMs de licencia cerrada y generalmente requieren código fuente previo. Solo LLMforTDD se alinea con el enfoque de desarrollo guiado por pruebas (Test-Driven Development, TDD) [5], que prioriza crear casos de prueba antes del código. Este trabajo propone un análisis de LLMs open source para generación de casos de prueba unitarios en Java, siguiendo TDD. Mediante técnicas de fine-tuning y diseño de prompts, se busca comparar el rendimiento de estos modelos, identificando sus fortalezas y limitaciones, con el propósito de desarrollar una alternativa accesible y adaptable para la generación automática de pruebas unitarias.
publishDate 2024
dc.date.accessioned.none.fl_str_mv 2025-06-30T19:53:23Z
dc.date.available.none.fl_str_mv 2025-06-30T19:53:23Z
dc.date.issued.fl_str_mv 2024
dc.type.es_PE.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
dc.identifier.citation.es_PE.fl_str_mv Rojas Barraza, C. J. (2024). Análisis de LLMS Open Source para la generación de casos de prueba unitarios. [Tesis de Maestría, Universidad de Ingeniería y Tecnología]. Repositorio Institucional UTEC. https://hdl.handle.net/20.500.12815/444
dc.identifier.uri.none.fl_str_mv https://hdl.handle.net/20.500.12815/444
identifier_str_mv Rojas Barraza, C. J. (2024). Análisis de LLMS Open Source para la generación de casos de prueba unitarios. [Tesis de Maestría, Universidad de Ingeniería y Tecnología]. Repositorio Institucional UTEC. https://hdl.handle.net/20.500.12815/444
url https://hdl.handle.net/20.500.12815/444
dc.language.iso.es_PE.fl_str_mv spa
language spa
dc.relation.ispartof.fl_str_mv SUNEDU
dc.rights.es_PE.fl_str_mv info:eu-repo/semantics/openAccess
dc.rights.uri.none.fl_str_mv http://creativecommons.org/licenses/by-nc-nd/4.0/
eu_rights_str_mv openAccess
rights_invalid_str_mv http://creativecommons.org/licenses/by-nc-nd/4.0/
dc.format.es_PE.fl_str_mv application/pdf
dc.publisher.es_PE.fl_str_mv Universidad de Ingeniería y Tecnología
dc.publisher.country.es_PE.fl_str_mv PE
dc.source.es_PE.fl_str_mv Repositorio Institucional UTEC
Universidad de Ingeniería y Tecnología - UTEC
dc.source.none.fl_str_mv reponame:UTEC-Institucional
instname:Universidad de Ingeniería y tecnología
instacron:UTEC
instname_str Universidad de Ingeniería y tecnología
instacron_str UTEC
institution UTEC
reponame_str UTEC-Institucional
collection UTEC-Institucional
bitstream.url.fl_str_mv http://repositorio.utec.edu.pe/bitstream/20.500.12815/444/8/Tesis_Rojas.pdf
http://repositorio.utec.edu.pe/bitstream/20.500.12815/444/4/Acta_Rojas%20Barraza.pdf
http://repositorio.utec.edu.pe/bitstream/20.500.12815/444/5/Autorizacion_Rojas%20Barraza.pdf
http://repositorio.utec.edu.pe/bitstream/20.500.12815/444/7/Reporte%20de%20similitud_Rojas%20Barraza.pdf
http://repositorio.utec.edu.pe/bitstream/20.500.12815/444/3/license.txt
http://repositorio.utec.edu.pe/bitstream/20.500.12815/444/9/Tesis_Rojas.pdf.txt
http://repositorio.utec.edu.pe/bitstream/20.500.12815/444/11/Acta_Rojas%20Barraza.pdf.txt
http://repositorio.utec.edu.pe/bitstream/20.500.12815/444/13/Autorizacion_Rojas%20Barraza.pdf.txt
http://repositorio.utec.edu.pe/bitstream/20.500.12815/444/15/Reporte%20de%20similitud_Rojas%20Barraza.pdf.txt
http://repositorio.utec.edu.pe/bitstream/20.500.12815/444/10/Tesis_Rojas.pdf.jpg
http://repositorio.utec.edu.pe/bitstream/20.500.12815/444/12/Acta_Rojas%20Barraza.pdf.jpg
http://repositorio.utec.edu.pe/bitstream/20.500.12815/444/14/Autorizacion_Rojas%20Barraza.pdf.jpg
http://repositorio.utec.edu.pe/bitstream/20.500.12815/444/16/Reporte%20de%20similitud_Rojas%20Barraza.pdf.jpg
bitstream.checksum.fl_str_mv edac8e9bc014e8efc295f44659121356
34cb32ff7946566b388a3ea7352fa00b
f2c7efc913db55d60aef0d9fb7b894b5
f3da6c31adc7892f28b04e0a42cc83ba
8a4605be74aa9ea9d79846c1fba20a33
eab7459a06f72f26b8590eaf8fa9550e
16a9a58b1ce878bf9367a922bd6161f4
8baf49dfe8e85ffc08decbd26891d048
1c08b45b08f9a940e29cdb14b39a4200
a0e26e7acf43ddab5a354a5fd42ca303
52a76d4749a7a1c56fe0639f190b42ef
6876422789fab503226a5cf60d6b4e52
d342b3b4a2766d2f25fa75c7c0846d6c
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
MD5
MD5
MD5
MD5
MD5
MD5
MD5
MD5
MD5
MD5
repository.name.fl_str_mv Repositorio Institucional UTEC
repository.mail.fl_str_mv repositorio@utec.edu.pe
_version_ 1848239809131184128
spelling López del Alamo, Cristian JoséRojas Barraza, Cluny Judiht2025-06-30T19:53:23Z2025-06-30T19:53:23Z2024Rojas Barraza, C. J. (2024). Análisis de LLMS Open Source para la generación de casos de prueba unitarios. [Tesis de Maestría, Universidad de Ingeniería y Tecnología]. Repositorio Institucional UTEC. https://hdl.handle.net/20.500.12815/444https://hdl.handle.net/20.500.12815/444La generación de casos de prueba unitarios es una tarea importante en las pruebas de software, ya que permite detectar errores de manera temprana; sin embargo, es un proceso que demanda mucho tiempo y esfuerzo. Las primeras propuestas para abordar este problema aplican enfoques tradicionales que se basan en aleatoriedad, [1] y búsquedas [2]. Recientemente, ha surgido una nueva línea de investigación que explora el uso de Modelos de Lenguaje Grande (LLM por sus siglas en inglés) para la generación de pruebas unitarias, como ChatUniTest [3] y LLMforTDD [4]. Estas soluciones mejoran la cobertura de casos de prueba, pero se limitan a LLMs de licencia cerrada y generalmente requieren código fuente previo. Solo LLMforTDD se alinea con el enfoque de desarrollo guiado por pruebas (Test-Driven Development, TDD) [5], que prioriza crear casos de prueba antes del código. Este trabajo propone un análisis de LLMs open source para generación de casos de prueba unitarios en Java, siguiendo TDD. Mediante técnicas de fine-tuning y diseño de prompts, se busca comparar el rendimiento de estos modelos, identificando sus fortalezas y limitaciones, con el propósito de desarrollar una alternativa accesible y adaptable para la generación automática de pruebas unitarias.Unit test case generation is an important task in software testing, as it allows early error detection; however, it is a process that requires significant time and effort. The first proposals to address this problem apply traditional approaches based on randomness and searches. Recently, a new line of research has emerged exploring the use of Large Language Models (LLMs) for unit test generation, such as ChatUniTest and LLMforTDD. These solutions improve test case coverage but are limited to closed-license LLMs and generally require prior source code. Only LLMforTDD aligns with the Test-Driven Development (TDD) approach, which prioritizes creating test cases before code. This work proposes an analysis of open-source LLMs for the generation of unit test cases in Java, following TDD. Through fine-tuning techniques and prompt design, the objective is to compare the performance of these models, identifying their strengths and limitations, with the purpose of developing an accessible and adaptable alternative for automatic test generation.Tesisapplication/pdfspaUniversidad de Ingeniería y TecnologíaPEinfo:eu-repo/semantics/openAccesshttp://creativecommons.org/licenses/by-nc-nd/4.0/Repositorio Institucional UTECUniversidad de Ingeniería y Tecnología - UTECreponame:UTEC-Institucionalinstname:Universidad de Ingeniería y tecnologíainstacron:UTECPruebas unitariasFine-TuningPrompt engineeringLLMTDDhttps://purl.org/pe-repo/ocde/ford#1.02.02https://purl.org/pe-repo/ocde/ford#1.02.01Análisis de LLMS Open Source para la generación de casos de prueba unitariosinfo:eu-repo/semantics/masterThesisSUNEDUMaestría en Computer ScienceUniversidad de Ingeniería y Tecnología. Escuela de PosgradoMaestríaMaestro en Computer Sciencehttps://orcid.org/0000-0002-2568-650X70434410https://orcid.org/0000-0002-2993-5104611016https://purl.org/pe-repo/renati/level#tituloProfesionalhttps://purl.org/pe-repo/renati/type#tesisORIGINALTesis_Rojas.pdfTesis_Rojas.pdfapplication/pdf2119725http://repositorio.utec.edu.pe/bitstream/20.500.12815/444/8/Tesis_Rojas.pdfedac8e9bc014e8efc295f44659121356MD58open accessActa_Rojas Barraza.pdfActa_Rojas Barraza.pdfapplication/pdf696546http://repositorio.utec.edu.pe/bitstream/20.500.12815/444/4/Acta_Rojas%20Barraza.pdf34cb32ff7946566b388a3ea7352fa00bMD54metadata only accessAutorizacion_Rojas Barraza.pdfAutorizacion_Rojas Barraza.pdfapplication/pdf67042http://repositorio.utec.edu.pe/bitstream/20.500.12815/444/5/Autorizacion_Rojas%20Barraza.pdff2c7efc913db55d60aef0d9fb7b894b5MD55metadata only accessReporte de similitud_Rojas Barraza.pdfReporte de similitud_Rojas Barraza.pdfapplication/pdf2079377http://repositorio.utec.edu.pe/bitstream/20.500.12815/444/7/Reporte%20de%20similitud_Rojas%20Barraza.pdff3da6c31adc7892f28b04e0a42cc83baMD57metadata only accessLICENSElicense.txtlicense.txttext/plain; charset=utf-81748http://repositorio.utec.edu.pe/bitstream/20.500.12815/444/3/license.txt8a4605be74aa9ea9d79846c1fba20a33MD53open accessTEXTTesis_Rojas.pdf.txtTesis_Rojas.pdf.txtExtracted texttext/plain111814http://repositorio.utec.edu.pe/bitstream/20.500.12815/444/9/Tesis_Rojas.pdf.txteab7459a06f72f26b8590eaf8fa9550eMD59open accessActa_Rojas Barraza.pdf.txtActa_Rojas Barraza.pdf.txtExtracted texttext/plain179http://repositorio.utec.edu.pe/bitstream/20.500.12815/444/11/Acta_Rojas%20Barraza.pdf.txt16a9a58b1ce878bf9367a922bd6161f4MD511metadata only accessAutorizacion_Rojas Barraza.pdf.txtAutorizacion_Rojas Barraza.pdf.txtExtracted texttext/plain3655http://repositorio.utec.edu.pe/bitstream/20.500.12815/444/13/Autorizacion_Rojas%20Barraza.pdf.txt8baf49dfe8e85ffc08decbd26891d048MD513metadata only accessReporte de similitud_Rojas Barraza.pdf.txtReporte de similitud_Rojas Barraza.pdf.txtExtracted texttext/plain117205http://repositorio.utec.edu.pe/bitstream/20.500.12815/444/15/Reporte%20de%20similitud_Rojas%20Barraza.pdf.txt1c08b45b08f9a940e29cdb14b39a4200MD515metadata only accessTHUMBNAILTesis_Rojas.pdf.jpgTesis_Rojas.pdf.jpgGenerated Thumbnailimage/jpeg7785http://repositorio.utec.edu.pe/bitstream/20.500.12815/444/10/Tesis_Rojas.pdf.jpga0e26e7acf43ddab5a354a5fd42ca303MD510open accessActa_Rojas Barraza.pdf.jpgActa_Rojas Barraza.pdf.jpgGenerated Thumbnailimage/jpeg8729http://repositorio.utec.edu.pe/bitstream/20.500.12815/444/12/Acta_Rojas%20Barraza.pdf.jpg52a76d4749a7a1c56fe0639f190b42efMD512metadata only accessAutorizacion_Rojas Barraza.pdf.jpgAutorizacion_Rojas Barraza.pdf.jpgGenerated Thumbnailimage/jpeg8462http://repositorio.utec.edu.pe/bitstream/20.500.12815/444/14/Autorizacion_Rojas%20Barraza.pdf.jpg6876422789fab503226a5cf60d6b4e52MD514metadata only accessReporte de similitud_Rojas Barraza.pdf.jpgReporte de similitud_Rojas Barraza.pdf.jpgGenerated Thumbnailimage/jpeg5633http://repositorio.utec.edu.pe/bitstream/20.500.12815/444/16/Reporte%20de%20similitud_Rojas%20Barraza.pdf.jpgd342b3b4a2766d2f25fa75c7c0846d6cMD516metadata only access20.500.12815/444oai:repositorio.utec.edu.pe:20.500.12815/4442025-10-30 18:09:38.062open accessRepositorio Institucional UTECrepositorio@utec.edu.peTk9URTogUExBQ0UgWU9VUiBPV04gTElDRU5TRSBIRVJFClRoaXMgc2FtcGxlIGxpY2Vuc2UgaXMgcHJvdmlkZWQgZm9yIGluZm9ybWF0aW9uYWwgcHVycG9zZXMgb25seS4KCk5PTi1FWENMVVNJVkUgRElTVFJJQlVUSU9OIExJQ0VOU0UKCkJ5IHNpZ25pbmcgYW5kIHN1Ym1pdHRpbmcgdGhpcyBsaWNlbnNlLCB5b3UgKHRoZSBhdXRob3Iocykgb3IgY29weXJpZ2h0Cm93bmVyKSBncmFudHMgdG8gRFNwYWNlIFVuaXZlcnNpdHkgKERTVSkgdGhlIG5vbi1leGNsdXNpdmUgcmlnaHQgdG8gcmVwcm9kdWNlLAp0cmFuc2xhdGUgKGFzIGRlZmluZWQgYmVsb3cpLCBhbmQvb3IgZGlzdHJpYnV0ZSB5b3VyIHN1Ym1pc3Npb24gKGluY2x1ZGluZwp0aGUgYWJzdHJhY3QpIHdvcmxkd2lkZSBpbiBwcmludCBhbmQgZWxlY3Ryb25pYyBmb3JtYXQgYW5kIGluIGFueSBtZWRpdW0sCmluY2x1ZGluZyBidXQgbm90IGxpbWl0ZWQgdG8gYXVkaW8gb3IgdmlkZW8uCgpZb3UgYWdyZWUgdGhhdCBEU1UgbWF5LCB3aXRob3V0IGNoYW5naW5nIHRoZSBjb250ZW50LCB0cmFuc2xhdGUgdGhlCnN1Ym1pc3Npb24gdG8gYW55IG1lZGl1bSBvciBmb3JtYXQgZm9yIHRoZSBwdXJwb3NlIG9mIHByZXNlcnZhdGlvbi4KCllvdSBhbHNvIGFncmVlIHRoYXQgRFNVIG1heSBrZWVwIG1vcmUgdGhhbiBvbmUgY29weSBvZiB0aGlzIHN1Ym1pc3Npb24gZm9yCnB1cnBvc2VzIG9mIHNlY3VyaXR5LCBiYWNrLXVwIGFuZCBwcmVzZXJ2YXRpb24uCgpZb3UgcmVwcmVzZW50IHRoYXQgdGhlIHN1Ym1pc3Npb24gaXMgeW91ciBvcmlnaW5hbCB3b3JrLCBhbmQgdGhhdCB5b3UgaGF2ZQp0aGUgcmlnaHQgdG8gZ3JhbnQgdGhlIHJpZ2h0cyBjb250YWluZWQgaW4gdGhpcyBsaWNlbnNlLiBZb3UgYWxzbyByZXByZXNlbnQKdGhhdCB5b3VyIHN1Ym1pc3Npb24gZG9lcyBub3QsIHRvIHRoZSBiZXN0IG9mIHlvdXIga25vd2xlZGdlLCBpbmZyaW5nZSB1cG9uCmFueW9uZSdzIGNvcHlyaWdodC4KCklmIHRoZSBzdWJtaXNzaW9uIGNvbnRhaW5zIG1hdGVyaWFsIGZvciB3aGljaCB5b3UgZG8gbm90IGhvbGQgY29weXJpZ2h0LAp5b3UgcmVwcmVzZW50IHRoYXQgeW91IGhhdmUgb2J0YWluZWQgdGhlIHVucmVzdHJpY3RlZCBwZXJtaXNzaW9uIG9mIHRoZQpjb3B5cmlnaHQgb3duZXIgdG8gZ3JhbnQgRFNVIHRoZSByaWdodHMgcmVxdWlyZWQgYnkgdGhpcyBsaWNlbnNlLCBhbmQgdGhhdApzdWNoIHRoaXJkLXBhcnR5IG93bmVkIG1hdGVyaWFsIGlzIGNsZWFybHkgaWRlbnRpZmllZCBhbmQgYWNrbm93bGVkZ2VkCndpdGhpbiB0aGUgdGV4dCBvciBjb250ZW50IG9mIHRoZSBzdWJtaXNzaW9uLgoKSUYgVEhFIFNVQk1JU1NJT04gSVMgQkFTRUQgVVBPTiBXT1JLIFRIQVQgSEFTIEJFRU4gU1BPTlNPUkVEIE9SIFNVUFBPUlRFRApCWSBBTiBBR0VOQ1kgT1IgT1JHQU5JWkFUSU9OIE9USEVSIFRIQU4gRFNVLCBZT1UgUkVQUkVTRU5UIFRIQVQgWU9VIEhBVkUKRlVMRklMTEVEIEFOWSBSSUdIVCBPRiBSRVZJRVcgT1IgT1RIRVIgT0JMSUdBVElPTlMgUkVRVUlSRUQgQlkgU1VDSApDT05UUkFDVCBPUiBBR1JFRU1FTlQuCgpEU1Ugd2lsbCBjbGVhcmx5IGlkZW50aWZ5IHlvdXIgbmFtZShzKSBhcyB0aGUgYXV0aG9yKHMpIG9yIG93bmVyKHMpIG9mIHRoZQpzdWJtaXNzaW9uLCBhbmQgd2lsbCBub3QgbWFrZSBhbnkgYWx0ZXJhdGlvbiwgb3RoZXIgdGhhbiBhcyBhbGxvd2VkIGJ5IHRoaXMKbGljZW5zZSwgdG8geW91ciBzdWJtaXNzaW9uLgo=
score 13.457588
Nota importante:
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).