Análisis de LLMS Open Source para la generación de casos de prueba unitarios

Descripción del Articulo

La generación de casos de prueba unitarios es una tarea importante en las pruebas de software, ya que permite detectar errores de manera temprana; sin embargo, es un proceso que demanda mucho tiempo y esfuerzo. Las primeras propuestas para abordar este problema aplican enfoques tradicionales que se...

Descripción completa

Detalles Bibliográficos
Autor: Rojas Barraza, Cluny Judiht
Formato: tesis de maestría
Fecha de Publicación:2024
Institución:Universidad de Ingeniería y tecnología
Repositorio:UTEC-Institucional
Lenguaje:español
OAI Identifier:oai:repositorio.utec.edu.pe:20.500.12815/444
Enlace del recurso:https://hdl.handle.net/20.500.12815/444
Nivel de acceso:acceso abierto
Materia:Pruebas unitarias
Fine-Tuning
Prompt engineering
LLM
TDD
https://purl.org/pe-repo/ocde/ford#1.02.02
https://purl.org/pe-repo/ocde/ford#1.02.01
Descripción
Sumario:La generación de casos de prueba unitarios es una tarea importante en las pruebas de software, ya que permite detectar errores de manera temprana; sin embargo, es un proceso que demanda mucho tiempo y esfuerzo. Las primeras propuestas para abordar este problema aplican enfoques tradicionales que se basan en aleatoriedad, [1] y búsquedas [2]. Recientemente, ha surgido una nueva línea de investigación que explora el uso de Modelos de Lenguaje Grande (LLM por sus siglas en inglés) para la generación de pruebas unitarias, como ChatUniTest [3] y LLMforTDD [4]. Estas soluciones mejoran la cobertura de casos de prueba, pero se limitan a LLMs de licencia cerrada y generalmente requieren código fuente previo. Solo LLMforTDD se alinea con el enfoque de desarrollo guiado por pruebas (Test-Driven Development, TDD) [5], que prioriza crear casos de prueba antes del código. Este trabajo propone un análisis de LLMs open source para generación de casos de prueba unitarios en Java, siguiendo TDD. Mediante técnicas de fine-tuning y diseño de prompts, se busca comparar el rendimiento de estos modelos, identificando sus fortalezas y limitaciones, con el propósito de desarrollar una alternativa accesible y adaptable para la generación automática de pruebas unitarias.
Nota importante:
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).