Análisis de LLMS Open Source para la generación de casos de prueba unitarios
Descripción del Articulo
La generación de casos de prueba unitarios es una tarea importante en las pruebas de software, ya que permite detectar errores de manera temprana; sin embargo, es un proceso que demanda mucho tiempo y esfuerzo. Las primeras propuestas para abordar este problema aplican enfoques tradicionales que se...
| Autor: | |
|---|---|
| Formato: | tesis de maestría |
| Fecha de Publicación: | 2024 |
| Institución: | Universidad de Ingeniería y tecnología |
| Repositorio: | UTEC-Institucional |
| Lenguaje: | español |
| OAI Identifier: | oai:repositorio.utec.edu.pe:20.500.12815/444 |
| Enlace del recurso: | https://hdl.handle.net/20.500.12815/444 |
| Nivel de acceso: | acceso abierto |
| Materia: | Pruebas unitarias Fine-Tuning Prompt engineering LLM TDD https://purl.org/pe-repo/ocde/ford#1.02.02 https://purl.org/pe-repo/ocde/ford#1.02.01 |
| id |
UTEC_79250301398ee374615a1e68b717ffd8 |
|---|---|
| oai_identifier_str |
oai:repositorio.utec.edu.pe:20.500.12815/444 |
| network_acronym_str |
UTEC |
| network_name_str |
UTEC-Institucional |
| repository_id_str |
4822 |
| dc.title.es_PE.fl_str_mv |
Análisis de LLMS Open Source para la generación de casos de prueba unitarios |
| title |
Análisis de LLMS Open Source para la generación de casos de prueba unitarios |
| spellingShingle |
Análisis de LLMS Open Source para la generación de casos de prueba unitarios Rojas Barraza, Cluny Judiht Pruebas unitarias Fine-Tuning Prompt engineering LLM TDD https://purl.org/pe-repo/ocde/ford#1.02.02 https://purl.org/pe-repo/ocde/ford#1.02.01 |
| title_short |
Análisis de LLMS Open Source para la generación de casos de prueba unitarios |
| title_full |
Análisis de LLMS Open Source para la generación de casos de prueba unitarios |
| title_fullStr |
Análisis de LLMS Open Source para la generación de casos de prueba unitarios |
| title_full_unstemmed |
Análisis de LLMS Open Source para la generación de casos de prueba unitarios |
| title_sort |
Análisis de LLMS Open Source para la generación de casos de prueba unitarios |
| author |
Rojas Barraza, Cluny Judiht |
| author_facet |
Rojas Barraza, Cluny Judiht |
| author_role |
author |
| dc.contributor.advisor.fl_str_mv |
López del Alamo, Cristian José |
| dc.contributor.author.fl_str_mv |
Rojas Barraza, Cluny Judiht |
| dc.subject.es_PE.fl_str_mv |
Pruebas unitarias Fine-Tuning Prompt engineering LLM TDD |
| topic |
Pruebas unitarias Fine-Tuning Prompt engineering LLM TDD https://purl.org/pe-repo/ocde/ford#1.02.02 https://purl.org/pe-repo/ocde/ford#1.02.01 |
| dc.subject.ocde.es_PE.fl_str_mv |
https://purl.org/pe-repo/ocde/ford#1.02.02 https://purl.org/pe-repo/ocde/ford#1.02.01 |
| description |
La generación de casos de prueba unitarios es una tarea importante en las pruebas de software, ya que permite detectar errores de manera temprana; sin embargo, es un proceso que demanda mucho tiempo y esfuerzo. Las primeras propuestas para abordar este problema aplican enfoques tradicionales que se basan en aleatoriedad, [1] y búsquedas [2]. Recientemente, ha surgido una nueva línea de investigación que explora el uso de Modelos de Lenguaje Grande (LLM por sus siglas en inglés) para la generación de pruebas unitarias, como ChatUniTest [3] y LLMforTDD [4]. Estas soluciones mejoran la cobertura de casos de prueba, pero se limitan a LLMs de licencia cerrada y generalmente requieren código fuente previo. Solo LLMforTDD se alinea con el enfoque de desarrollo guiado por pruebas (Test-Driven Development, TDD) [5], que prioriza crear casos de prueba antes del código. Este trabajo propone un análisis de LLMs open source para generación de casos de prueba unitarios en Java, siguiendo TDD. Mediante técnicas de fine-tuning y diseño de prompts, se busca comparar el rendimiento de estos modelos, identificando sus fortalezas y limitaciones, con el propósito de desarrollar una alternativa accesible y adaptable para la generación automática de pruebas unitarias. |
| publishDate |
2024 |
| dc.date.accessioned.none.fl_str_mv |
2025-06-30T19:53:23Z |
| dc.date.available.none.fl_str_mv |
2025-06-30T19:53:23Z |
| dc.date.issued.fl_str_mv |
2024 |
| dc.type.es_PE.fl_str_mv |
info:eu-repo/semantics/masterThesis |
| format |
masterThesis |
| dc.identifier.citation.es_PE.fl_str_mv |
Rojas Barraza, C. J. (2024). Análisis de LLMS Open Source para la generación de casos de prueba unitarios. [Tesis de Maestría, Universidad de Ingeniería y Tecnología]. Repositorio Institucional UTEC. https://hdl.handle.net/20.500.12815/444 |
| dc.identifier.uri.none.fl_str_mv |
https://hdl.handle.net/20.500.12815/444 |
| identifier_str_mv |
Rojas Barraza, C. J. (2024). Análisis de LLMS Open Source para la generación de casos de prueba unitarios. [Tesis de Maestría, Universidad de Ingeniería y Tecnología]. Repositorio Institucional UTEC. https://hdl.handle.net/20.500.12815/444 |
| url |
https://hdl.handle.net/20.500.12815/444 |
| dc.language.iso.es_PE.fl_str_mv |
spa |
| language |
spa |
| dc.relation.ispartof.fl_str_mv |
SUNEDU |
| dc.rights.es_PE.fl_str_mv |
info:eu-repo/semantics/openAccess |
| dc.rights.uri.none.fl_str_mv |
http://creativecommons.org/licenses/by-nc-nd/4.0/ |
| eu_rights_str_mv |
openAccess |
| rights_invalid_str_mv |
http://creativecommons.org/licenses/by-nc-nd/4.0/ |
| dc.format.es_PE.fl_str_mv |
application/pdf |
| dc.publisher.es_PE.fl_str_mv |
Universidad de Ingeniería y Tecnología |
| dc.publisher.country.es_PE.fl_str_mv |
PE |
| dc.source.es_PE.fl_str_mv |
Repositorio Institucional UTEC Universidad de Ingeniería y Tecnología - UTEC |
| dc.source.none.fl_str_mv |
reponame:UTEC-Institucional instname:Universidad de Ingeniería y tecnología instacron:UTEC |
| instname_str |
Universidad de Ingeniería y tecnología |
| instacron_str |
UTEC |
| institution |
UTEC |
| reponame_str |
UTEC-Institucional |
| collection |
UTEC-Institucional |
| bitstream.url.fl_str_mv |
http://repositorio.utec.edu.pe/bitstream/20.500.12815/444/8/Tesis_Rojas.pdf http://repositorio.utec.edu.pe/bitstream/20.500.12815/444/4/Acta_Rojas%20Barraza.pdf http://repositorio.utec.edu.pe/bitstream/20.500.12815/444/5/Autorizacion_Rojas%20Barraza.pdf http://repositorio.utec.edu.pe/bitstream/20.500.12815/444/7/Reporte%20de%20similitud_Rojas%20Barraza.pdf http://repositorio.utec.edu.pe/bitstream/20.500.12815/444/3/license.txt http://repositorio.utec.edu.pe/bitstream/20.500.12815/444/9/Tesis_Rojas.pdf.txt http://repositorio.utec.edu.pe/bitstream/20.500.12815/444/11/Acta_Rojas%20Barraza.pdf.txt http://repositorio.utec.edu.pe/bitstream/20.500.12815/444/13/Autorizacion_Rojas%20Barraza.pdf.txt http://repositorio.utec.edu.pe/bitstream/20.500.12815/444/15/Reporte%20de%20similitud_Rojas%20Barraza.pdf.txt http://repositorio.utec.edu.pe/bitstream/20.500.12815/444/10/Tesis_Rojas.pdf.jpg http://repositorio.utec.edu.pe/bitstream/20.500.12815/444/12/Acta_Rojas%20Barraza.pdf.jpg http://repositorio.utec.edu.pe/bitstream/20.500.12815/444/14/Autorizacion_Rojas%20Barraza.pdf.jpg http://repositorio.utec.edu.pe/bitstream/20.500.12815/444/16/Reporte%20de%20similitud_Rojas%20Barraza.pdf.jpg |
| bitstream.checksum.fl_str_mv |
edac8e9bc014e8efc295f44659121356 34cb32ff7946566b388a3ea7352fa00b f2c7efc913db55d60aef0d9fb7b894b5 f3da6c31adc7892f28b04e0a42cc83ba 8a4605be74aa9ea9d79846c1fba20a33 eab7459a06f72f26b8590eaf8fa9550e 16a9a58b1ce878bf9367a922bd6161f4 8baf49dfe8e85ffc08decbd26891d048 1c08b45b08f9a940e29cdb14b39a4200 a0e26e7acf43ddab5a354a5fd42ca303 52a76d4749a7a1c56fe0639f190b42ef 6876422789fab503226a5cf60d6b4e52 d342b3b4a2766d2f25fa75c7c0846d6c |
| bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 MD5 MD5 MD5 MD5 MD5 MD5 MD5 MD5 MD5 MD5 |
| repository.name.fl_str_mv |
Repositorio Institucional UTEC |
| repository.mail.fl_str_mv |
repositorio@utec.edu.pe |
| _version_ |
1848239809131184128 |
| spelling |
López del Alamo, Cristian JoséRojas Barraza, Cluny Judiht2025-06-30T19:53:23Z2025-06-30T19:53:23Z2024Rojas Barraza, C. J. (2024). Análisis de LLMS Open Source para la generación de casos de prueba unitarios. [Tesis de Maestría, Universidad de Ingeniería y Tecnología]. Repositorio Institucional UTEC. https://hdl.handle.net/20.500.12815/444https://hdl.handle.net/20.500.12815/444La generación de casos de prueba unitarios es una tarea importante en las pruebas de software, ya que permite detectar errores de manera temprana; sin embargo, es un proceso que demanda mucho tiempo y esfuerzo. Las primeras propuestas para abordar este problema aplican enfoques tradicionales que se basan en aleatoriedad, [1] y búsquedas [2]. Recientemente, ha surgido una nueva línea de investigación que explora el uso de Modelos de Lenguaje Grande (LLM por sus siglas en inglés) para la generación de pruebas unitarias, como ChatUniTest [3] y LLMforTDD [4]. Estas soluciones mejoran la cobertura de casos de prueba, pero se limitan a LLMs de licencia cerrada y generalmente requieren código fuente previo. Solo LLMforTDD se alinea con el enfoque de desarrollo guiado por pruebas (Test-Driven Development, TDD) [5], que prioriza crear casos de prueba antes del código. Este trabajo propone un análisis de LLMs open source para generación de casos de prueba unitarios en Java, siguiendo TDD. Mediante técnicas de fine-tuning y diseño de prompts, se busca comparar el rendimiento de estos modelos, identificando sus fortalezas y limitaciones, con el propósito de desarrollar una alternativa accesible y adaptable para la generación automática de pruebas unitarias.Unit test case generation is an important task in software testing, as it allows early error detection; however, it is a process that requires significant time and effort. The first proposals to address this problem apply traditional approaches based on randomness and searches. Recently, a new line of research has emerged exploring the use of Large Language Models (LLMs) for unit test generation, such as ChatUniTest and LLMforTDD. These solutions improve test case coverage but are limited to closed-license LLMs and generally require prior source code. Only LLMforTDD aligns with the Test-Driven Development (TDD) approach, which prioritizes creating test cases before code. This work proposes an analysis of open-source LLMs for the generation of unit test cases in Java, following TDD. Through fine-tuning techniques and prompt design, the objective is to compare the performance of these models, identifying their strengths and limitations, with the purpose of developing an accessible and adaptable alternative for automatic test generation.Tesisapplication/pdfspaUniversidad de Ingeniería y TecnologíaPEinfo:eu-repo/semantics/openAccesshttp://creativecommons.org/licenses/by-nc-nd/4.0/Repositorio Institucional UTECUniversidad de Ingeniería y Tecnología - UTECreponame:UTEC-Institucionalinstname:Universidad de Ingeniería y tecnologíainstacron:UTECPruebas unitariasFine-TuningPrompt engineeringLLMTDDhttps://purl.org/pe-repo/ocde/ford#1.02.02https://purl.org/pe-repo/ocde/ford#1.02.01Análisis de LLMS Open Source para la generación de casos de prueba unitariosinfo:eu-repo/semantics/masterThesisSUNEDUMaestría en Computer ScienceUniversidad de Ingeniería y Tecnología. Escuela de PosgradoMaestríaMaestro en Computer Sciencehttps://orcid.org/0000-0002-2568-650X70434410https://orcid.org/0000-0002-2993-5104611016https://purl.org/pe-repo/renati/level#tituloProfesionalhttps://purl.org/pe-repo/renati/type#tesisORIGINALTesis_Rojas.pdfTesis_Rojas.pdfapplication/pdf2119725http://repositorio.utec.edu.pe/bitstream/20.500.12815/444/8/Tesis_Rojas.pdfedac8e9bc014e8efc295f44659121356MD58open accessActa_Rojas Barraza.pdfActa_Rojas Barraza.pdfapplication/pdf696546http://repositorio.utec.edu.pe/bitstream/20.500.12815/444/4/Acta_Rojas%20Barraza.pdf34cb32ff7946566b388a3ea7352fa00bMD54metadata only accessAutorizacion_Rojas Barraza.pdfAutorizacion_Rojas Barraza.pdfapplication/pdf67042http://repositorio.utec.edu.pe/bitstream/20.500.12815/444/5/Autorizacion_Rojas%20Barraza.pdff2c7efc913db55d60aef0d9fb7b894b5MD55metadata only accessReporte de similitud_Rojas Barraza.pdfReporte de similitud_Rojas Barraza.pdfapplication/pdf2079377http://repositorio.utec.edu.pe/bitstream/20.500.12815/444/7/Reporte%20de%20similitud_Rojas%20Barraza.pdff3da6c31adc7892f28b04e0a42cc83baMD57metadata only accessLICENSElicense.txtlicense.txttext/plain; charset=utf-81748http://repositorio.utec.edu.pe/bitstream/20.500.12815/444/3/license.txt8a4605be74aa9ea9d79846c1fba20a33MD53open accessTEXTTesis_Rojas.pdf.txtTesis_Rojas.pdf.txtExtracted texttext/plain111814http://repositorio.utec.edu.pe/bitstream/20.500.12815/444/9/Tesis_Rojas.pdf.txteab7459a06f72f26b8590eaf8fa9550eMD59open accessActa_Rojas Barraza.pdf.txtActa_Rojas Barraza.pdf.txtExtracted texttext/plain179http://repositorio.utec.edu.pe/bitstream/20.500.12815/444/11/Acta_Rojas%20Barraza.pdf.txt16a9a58b1ce878bf9367a922bd6161f4MD511metadata only accessAutorizacion_Rojas Barraza.pdf.txtAutorizacion_Rojas Barraza.pdf.txtExtracted texttext/plain3655http://repositorio.utec.edu.pe/bitstream/20.500.12815/444/13/Autorizacion_Rojas%20Barraza.pdf.txt8baf49dfe8e85ffc08decbd26891d048MD513metadata only accessReporte de similitud_Rojas Barraza.pdf.txtReporte de similitud_Rojas Barraza.pdf.txtExtracted texttext/plain117205http://repositorio.utec.edu.pe/bitstream/20.500.12815/444/15/Reporte%20de%20similitud_Rojas%20Barraza.pdf.txt1c08b45b08f9a940e29cdb14b39a4200MD515metadata only accessTHUMBNAILTesis_Rojas.pdf.jpgTesis_Rojas.pdf.jpgGenerated Thumbnailimage/jpeg7785http://repositorio.utec.edu.pe/bitstream/20.500.12815/444/10/Tesis_Rojas.pdf.jpga0e26e7acf43ddab5a354a5fd42ca303MD510open accessActa_Rojas Barraza.pdf.jpgActa_Rojas Barraza.pdf.jpgGenerated Thumbnailimage/jpeg8729http://repositorio.utec.edu.pe/bitstream/20.500.12815/444/12/Acta_Rojas%20Barraza.pdf.jpg52a76d4749a7a1c56fe0639f190b42efMD512metadata only accessAutorizacion_Rojas Barraza.pdf.jpgAutorizacion_Rojas Barraza.pdf.jpgGenerated Thumbnailimage/jpeg8462http://repositorio.utec.edu.pe/bitstream/20.500.12815/444/14/Autorizacion_Rojas%20Barraza.pdf.jpg6876422789fab503226a5cf60d6b4e52MD514metadata only accessReporte de similitud_Rojas Barraza.pdf.jpgReporte de similitud_Rojas Barraza.pdf.jpgGenerated Thumbnailimage/jpeg5633http://repositorio.utec.edu.pe/bitstream/20.500.12815/444/16/Reporte%20de%20similitud_Rojas%20Barraza.pdf.jpgd342b3b4a2766d2f25fa75c7c0846d6cMD516metadata only access20.500.12815/444oai:repositorio.utec.edu.pe:20.500.12815/4442025-10-30 18:09:38.062open accessRepositorio Institucional UTECrepositorio@utec.edu.peTk9URTogUExBQ0UgWU9VUiBPV04gTElDRU5TRSBIRVJFClRoaXMgc2FtcGxlIGxpY2Vuc2UgaXMgcHJvdmlkZWQgZm9yIGluZm9ybWF0aW9uYWwgcHVycG9zZXMgb25seS4KCk5PTi1FWENMVVNJVkUgRElTVFJJQlVUSU9OIExJQ0VOU0UKCkJ5IHNpZ25pbmcgYW5kIHN1Ym1pdHRpbmcgdGhpcyBsaWNlbnNlLCB5b3UgKHRoZSBhdXRob3Iocykgb3IgY29weXJpZ2h0Cm93bmVyKSBncmFudHMgdG8gRFNwYWNlIFVuaXZlcnNpdHkgKERTVSkgdGhlIG5vbi1leGNsdXNpdmUgcmlnaHQgdG8gcmVwcm9kdWNlLAp0cmFuc2xhdGUgKGFzIGRlZmluZWQgYmVsb3cpLCBhbmQvb3IgZGlzdHJpYnV0ZSB5b3VyIHN1Ym1pc3Npb24gKGluY2x1ZGluZwp0aGUgYWJzdHJhY3QpIHdvcmxkd2lkZSBpbiBwcmludCBhbmQgZWxlY3Ryb25pYyBmb3JtYXQgYW5kIGluIGFueSBtZWRpdW0sCmluY2x1ZGluZyBidXQgbm90IGxpbWl0ZWQgdG8gYXVkaW8gb3IgdmlkZW8uCgpZb3UgYWdyZWUgdGhhdCBEU1UgbWF5LCB3aXRob3V0IGNoYW5naW5nIHRoZSBjb250ZW50LCB0cmFuc2xhdGUgdGhlCnN1Ym1pc3Npb24gdG8gYW55IG1lZGl1bSBvciBmb3JtYXQgZm9yIHRoZSBwdXJwb3NlIG9mIHByZXNlcnZhdGlvbi4KCllvdSBhbHNvIGFncmVlIHRoYXQgRFNVIG1heSBrZWVwIG1vcmUgdGhhbiBvbmUgY29weSBvZiB0aGlzIHN1Ym1pc3Npb24gZm9yCnB1cnBvc2VzIG9mIHNlY3VyaXR5LCBiYWNrLXVwIGFuZCBwcmVzZXJ2YXRpb24uCgpZb3UgcmVwcmVzZW50IHRoYXQgdGhlIHN1Ym1pc3Npb24gaXMgeW91ciBvcmlnaW5hbCB3b3JrLCBhbmQgdGhhdCB5b3UgaGF2ZQp0aGUgcmlnaHQgdG8gZ3JhbnQgdGhlIHJpZ2h0cyBjb250YWluZWQgaW4gdGhpcyBsaWNlbnNlLiBZb3UgYWxzbyByZXByZXNlbnQKdGhhdCB5b3VyIHN1Ym1pc3Npb24gZG9lcyBub3QsIHRvIHRoZSBiZXN0IG9mIHlvdXIga25vd2xlZGdlLCBpbmZyaW5nZSB1cG9uCmFueW9uZSdzIGNvcHlyaWdodC4KCklmIHRoZSBzdWJtaXNzaW9uIGNvbnRhaW5zIG1hdGVyaWFsIGZvciB3aGljaCB5b3UgZG8gbm90IGhvbGQgY29weXJpZ2h0LAp5b3UgcmVwcmVzZW50IHRoYXQgeW91IGhhdmUgb2J0YWluZWQgdGhlIHVucmVzdHJpY3RlZCBwZXJtaXNzaW9uIG9mIHRoZQpjb3B5cmlnaHQgb3duZXIgdG8gZ3JhbnQgRFNVIHRoZSByaWdodHMgcmVxdWlyZWQgYnkgdGhpcyBsaWNlbnNlLCBhbmQgdGhhdApzdWNoIHRoaXJkLXBhcnR5IG93bmVkIG1hdGVyaWFsIGlzIGNsZWFybHkgaWRlbnRpZmllZCBhbmQgYWNrbm93bGVkZ2VkCndpdGhpbiB0aGUgdGV4dCBvciBjb250ZW50IG9mIHRoZSBzdWJtaXNzaW9uLgoKSUYgVEhFIFNVQk1JU1NJT04gSVMgQkFTRUQgVVBPTiBXT1JLIFRIQVQgSEFTIEJFRU4gU1BPTlNPUkVEIE9SIFNVUFBPUlRFRApCWSBBTiBBR0VOQ1kgT1IgT1JHQU5JWkFUSU9OIE9USEVSIFRIQU4gRFNVLCBZT1UgUkVQUkVTRU5UIFRIQVQgWU9VIEhBVkUKRlVMRklMTEVEIEFOWSBSSUdIVCBPRiBSRVZJRVcgT1IgT1RIRVIgT0JMSUdBVElPTlMgUkVRVUlSRUQgQlkgU1VDSApDT05UUkFDVCBPUiBBR1JFRU1FTlQuCgpEU1Ugd2lsbCBjbGVhcmx5IGlkZW50aWZ5IHlvdXIgbmFtZShzKSBhcyB0aGUgYXV0aG9yKHMpIG9yIG93bmVyKHMpIG9mIHRoZQpzdWJtaXNzaW9uLCBhbmQgd2lsbCBub3QgbWFrZSBhbnkgYWx0ZXJhdGlvbiwgb3RoZXIgdGhhbiBhcyBhbGxvd2VkIGJ5IHRoaXMKbGljZW5zZSwgdG8geW91ciBzdWJtaXNzaW9uLgo= |
| score |
13.457588 |
Nota importante:
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).