Diseño de una plataforma tecnológica de alto rendimiento con procesamiento por gráfica y basada en tecnología de hiperconvergencia para la aplicación de la inteligencia generativa en el desarrollo de sistemas predictivos de información con el entrenamiento de modelos de Inteligencia Artificial (IA)

Descripción del Articulo

Con los avances logrados actualmente en el campo del Aprendizaje Profundo (Deep Learning), se busca formular el diseño conceptual de una plataforma tecnológica basada en tecnología hiperconvergente, que incorpore infraestructura de procesamiento por gráfica o GPU (Graphics Processing Unit o Unidad d...

Descripción completa

Detalles Bibliográficos
Autor: Salgado Paraguay, Julio Cesar
Formato: tesis de grado
Fecha de Publicación:2024
Institución:Universidad Peruana de Ciencias Aplicadas
Repositorio:UPC-Institucional
Lenguaje:español
OAI Identifier:oai:repositorioacademico.upc.edu.pe:10757/674703
Enlace del recurso:http://hdl.handle.net/10757/674703
Nivel de acceso:acceso abierto
Materia:Inteligencia artificial
Modelos de lenguaje
Aprendizaje profundo
Cuantización
Embedding
Entrenamiento
Inferencia
Dataset
Fine-tuning
RAG
Inteligencia generativa
LLM
Paralelización
Token
Ventana de contexto
Sparsity
GPU
Benchmark
Artificial intelligence
Language models
Deep learning
Quantization
Training
Inference
DataFine-tuning
Generative intelligence
Parallelization
Context window
https://purl.org/pe-repo/ocde/ford#2.02.05
https://purl.org/pe-repo/ocde/ford#2.00.00
id UUPC_cc331a91b1ca5a1e0de4e1a2fa83019f
oai_identifier_str oai:repositorioacademico.upc.edu.pe:10757/674703
network_acronym_str UUPC
network_name_str UPC-Institucional
repository_id_str 2670
dc.title.es_PE.fl_str_mv Diseño de una plataforma tecnológica de alto rendimiento con procesamiento por gráfica y basada en tecnología de hiperconvergencia para la aplicación de la inteligencia generativa en el desarrollo de sistemas predictivos de información con el entrenamiento de modelos de Inteligencia Artificial (IA)
dc.title.alternative.none.fl_str_mv Design of a high-performance technological platform with graph processing and based on hyperconvergence technology for the application of generative intelligence in the development of predictive information systems with the training of Artificial Intelligence (AI) models
title Diseño de una plataforma tecnológica de alto rendimiento con procesamiento por gráfica y basada en tecnología de hiperconvergencia para la aplicación de la inteligencia generativa en el desarrollo de sistemas predictivos de información con el entrenamiento de modelos de Inteligencia Artificial (IA)
spellingShingle Diseño de una plataforma tecnológica de alto rendimiento con procesamiento por gráfica y basada en tecnología de hiperconvergencia para la aplicación de la inteligencia generativa en el desarrollo de sistemas predictivos de información con el entrenamiento de modelos de Inteligencia Artificial (IA)
Salgado Paraguay, Julio Cesar
Inteligencia artificial
Modelos de lenguaje
Aprendizaje profundo
Cuantización
Embedding
Entrenamiento
Inferencia
Dataset
Fine-tuning
RAG
Inteligencia generativa
LLM
Paralelización
Token
Ventana de contexto
Sparsity
GPU
Benchmark
Artificial intelligence
Language models
Deep learning
Quantization
Training
Inference
DataFine-tuning
Generative intelligence
Parallelization
Context window
https://purl.org/pe-repo/ocde/ford#2.02.05
https://purl.org/pe-repo/ocde/ford#2.00.00
title_short Diseño de una plataforma tecnológica de alto rendimiento con procesamiento por gráfica y basada en tecnología de hiperconvergencia para la aplicación de la inteligencia generativa en el desarrollo de sistemas predictivos de información con el entrenamiento de modelos de Inteligencia Artificial (IA)
title_full Diseño de una plataforma tecnológica de alto rendimiento con procesamiento por gráfica y basada en tecnología de hiperconvergencia para la aplicación de la inteligencia generativa en el desarrollo de sistemas predictivos de información con el entrenamiento de modelos de Inteligencia Artificial (IA)
title_fullStr Diseño de una plataforma tecnológica de alto rendimiento con procesamiento por gráfica y basada en tecnología de hiperconvergencia para la aplicación de la inteligencia generativa en el desarrollo de sistemas predictivos de información con el entrenamiento de modelos de Inteligencia Artificial (IA)
title_full_unstemmed Diseño de una plataforma tecnológica de alto rendimiento con procesamiento por gráfica y basada en tecnología de hiperconvergencia para la aplicación de la inteligencia generativa en el desarrollo de sistemas predictivos de información con el entrenamiento de modelos de Inteligencia Artificial (IA)
title_sort Diseño de una plataforma tecnológica de alto rendimiento con procesamiento por gráfica y basada en tecnología de hiperconvergencia para la aplicación de la inteligencia generativa en el desarrollo de sistemas predictivos de información con el entrenamiento de modelos de Inteligencia Artificial (IA)
author Salgado Paraguay, Julio Cesar
author_facet Salgado Paraguay, Julio Cesar
author_role author
dc.contributor.advisor.fl_str_mv Gonzales Figueroa, Renatto Gustavo
dc.contributor.author.fl_str_mv Salgado Paraguay, Julio Cesar
dc.subject.none.fl_str_mv Inteligencia artificial
Modelos de lenguaje
Aprendizaje profundo
Cuantización
Embedding
Entrenamiento
Inferencia
Dataset
Fine-tuning
RAG
Inteligencia generativa
LLM
Paralelización
Token
Ventana de contexto
Sparsity
GPU
Benchmark
Artificial intelligence
Language models
Deep learning
Quantization
Training
Inference
DataFine-tuning
Generative intelligence
Parallelization
Context window
topic Inteligencia artificial
Modelos de lenguaje
Aprendizaje profundo
Cuantización
Embedding
Entrenamiento
Inferencia
Dataset
Fine-tuning
RAG
Inteligencia generativa
LLM
Paralelización
Token
Ventana de contexto
Sparsity
GPU
Benchmark
Artificial intelligence
Language models
Deep learning
Quantization
Training
Inference
DataFine-tuning
Generative intelligence
Parallelization
Context window
https://purl.org/pe-repo/ocde/ford#2.02.05
https://purl.org/pe-repo/ocde/ford#2.00.00
dc.subject.ocde.none.fl_str_mv https://purl.org/pe-repo/ocde/ford#2.02.05
dc.subject.ocde.es_PE.fl_str_mv https://purl.org/pe-repo/ocde/ford#2.00.00
description Con los avances logrados actualmente en el campo del Aprendizaje Profundo (Deep Learning), se busca formular el diseño conceptual de una plataforma tecnológica basada en tecnología hiperconvergente, que incorpore infraestructura de procesamiento por gráfica o GPU (Graphics Processing Unit o Unidad de Procesamiento Gráfico), capaz de soportar el desarrollo de soluciones del tipo RAG (Retrieval Augmented Generation o Generación Mejorada por Recuperación) con la aplicación de los grandes modelos generativos de lenguaje de código abierto, que han sido entrenados previamente con miles de millones de datos, para la codificación de sistemas de información predictivos (SPI) y que cuente, además, con el entrenamiento de datos propietarios generados al interior de la misma institución, provenientes de distintas fuentes de información, para optimizar la precisión de la información, que pueda acompañar los procesos de innovación y emprendimiento a fin de incrementar la productividad de las cadenas productivas del rubro nacional generando con ella beneficios económicos que repercutan en la mejora de la calidad de vida de los peruanos. Así, con el desarrollo del proyecto se incrementará el ancho de banda de la VRAM con tasas de transferencia de la información iguales a 864GB/s y 2TB/s; también, se potenciará la cantidad de operaciones de coma flotante por segundo con índices de procesamiento de 378 TFLOPS en precisión TF32, 756 TFLOPS en formato BFLOAT16, 756 TFLOPS en precisión FP16 y 1513 TFLOPS en formato FP8; además, se elevará la velocidad de reloj de los núcleos de cómputo a 1755MHz aprovechando las capacidades del procesamiento en paralelo incorporando la tecnología NVIDIA NVLink; asimismo, se aumentará el número de tokens de la ventana de contexto para conseguir máximos de 7,993 y 9,193 tokens/s en la inferencia de salida y, finalmente, se elevará la cantidad de parámetros o variables internas con la posibilidad de procesar modelos de lenguaje de 7B, 13B, 70B, 130B, entre otros.
publishDate 2024
dc.date.accessioned.none.fl_str_mv 2024-08-04T15:28:30Z
dc.date.available.none.fl_str_mv 2024-08-04T15:28:30Z
dc.date.issued.fl_str_mv 2024-07-16
dc.type.es_PE.fl_str_mv info:eu-repo/semantics/bachelorThesis
dc.type.other.es_PE.fl_str_mv Trabajo de Suficiencia Profesional
dc.type.coar.none.fl_str_mv http://purl.org/coar/resource_type/c_7a1f
format bachelorThesis
dc.identifier.uri.none.fl_str_mv http://hdl.handle.net/10757/674703
dc.identifier.isni.es_PE.fl_str_mv 000000012196144X
url http://hdl.handle.net/10757/674703
identifier_str_mv 000000012196144X
dc.language.iso.es_PE.fl_str_mv spa
language spa
dc.relation.ispartof.fl_str_mv SUNEDU
dc.rights.es_PE.fl_str_mv info:eu-repo/semantics/openAccess
dc.rights.uri.*.fl_str_mv http://creativecommons.org/licenses/by-nc-sa/4.0/
dc.rights.coar.none.fl_str_mv http://purl.org/coar/access_right/c_abf2
eu_rights_str_mv openAccess
rights_invalid_str_mv http://creativecommons.org/licenses/by-nc-sa/4.0/
http://purl.org/coar/access_right/c_abf2
dc.format.en_US.fl_str_mv application/pdf
application/epub
application/msword
dc.publisher.es_PE.fl_str_mv Universidad Peruana de Ciencias Aplicadas (UPC)
dc.publisher.country.es_PE.fl_str_mv PE
dc.source.es_PE.fl_str_mv Universidad Peruana de Ciencias Aplicadas (UPC)
Repositorio Académico - UPC
dc.source.none.fl_str_mv reponame:UPC-Institucional
instname:Universidad Peruana de Ciencias Aplicadas
instacron:UPC
instname_str Universidad Peruana de Ciencias Aplicadas
instacron_str UPC
institution UPC
reponame_str UPC-Institucional
collection UPC-Institucional
bitstream.url.fl_str_mv https://repositorioacademico.upc.edu.pe/bitstream/10757/674703/8/Salgado_PJ.pdf
https://repositorioacademico.upc.edu.pe/bitstream/10757/674703/7/Salgado_PJ.pdf.jpg
https://repositorioacademico.upc.edu.pe/bitstream/10757/674703/10/Salgado_PJ_Autorizacionpublicaci%c3%b3n.pdf.jpg
https://repositorioacademico.upc.edu.pe/bitstream/10757/674703/12/Salgado_PJ_Reportesimilitud.pdf.jpg
https://repositorioacademico.upc.edu.pe/bitstream/10757/674703/14/Salgado_PJ_Actasimilitud.pdf.jpg
https://repositorioacademico.upc.edu.pe/bitstream/10757/674703/6/Salgado_PJ.pdf.txt
https://repositorioacademico.upc.edu.pe/bitstream/10757/674703/9/Salgado_PJ_Autorizacionpublicaci%c3%b3n.pdf.txt
https://repositorioacademico.upc.edu.pe/bitstream/10757/674703/11/Salgado_PJ_Reportesimilitud.pdf.txt
https://repositorioacademico.upc.edu.pe/bitstream/10757/674703/13/Salgado_PJ_Actasimilitud.pdf.txt
https://repositorioacademico.upc.edu.pe/bitstream/10757/674703/1/Salgado_PJ.pdf
https://repositorioacademico.upc.edu.pe/bitstream/10757/674703/2/Salgado_PJ.docx
https://repositorioacademico.upc.edu.pe/bitstream/10757/674703/3/Salgado_PJ_Autorizacionpublicaci%c3%b3n.pdf
https://repositorioacademico.upc.edu.pe/bitstream/10757/674703/4/Salgado_PJ_Reportesimilitud.pdf
https://repositorioacademico.upc.edu.pe/bitstream/10757/674703/5/Salgado_PJ_Actasimilitud.pdf
bitstream.checksum.fl_str_mv 22dc7ceef342242732e7c80aba88b951
1f3a079ba9e53769a5d55e08c08cf8ee
0124ec22026c68e2e0489af5e7da221c
4ae4a9d210b97d1bd7da9144c8cfde0c
3304229fb77d024c81eb44a85c9b68c6
fd91bbd7e9fbd8db2a09fd331c6e5b8a
8c19ffd6d32614722dfc9846db8596e0
e520ff083b8f8c45e64b068c6a4dd439
310d67ec0bb7367dce6410af5405a587
a543af72a3f9878d49ef0930ed56cbee
f6fc2790a87e32a54b5098498b6f2cc9
fe66a815bee1145fbbf2eb95596b1caf
dab0bad32d01012abf952a512090d6c7
9f33cde6fe10f7557fa8ffa516307666
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
MD5
MD5
MD5
MD5
MD5
MD5
MD5
MD5
MD5
MD5
MD5
repository.name.fl_str_mv Repositorio académico upc
repository.mail.fl_str_mv upc@openrepository.com
_version_ 1837187145879519232
spelling 6cca11525cac8e13f8725934ed72c41cGonzales Figueroa, Renatto Gustavoc111927ff5b6a003b05b5c8f11727892500Salgado Paraguay, Julio Cesar2024-08-04T15:28:30Z2024-08-04T15:28:30Z2024-07-16http://hdl.handle.net/10757/674703000000012196144XCon los avances logrados actualmente en el campo del Aprendizaje Profundo (Deep Learning), se busca formular el diseño conceptual de una plataforma tecnológica basada en tecnología hiperconvergente, que incorpore infraestructura de procesamiento por gráfica o GPU (Graphics Processing Unit o Unidad de Procesamiento Gráfico), capaz de soportar el desarrollo de soluciones del tipo RAG (Retrieval Augmented Generation o Generación Mejorada por Recuperación) con la aplicación de los grandes modelos generativos de lenguaje de código abierto, que han sido entrenados previamente con miles de millones de datos, para la codificación de sistemas de información predictivos (SPI) y que cuente, además, con el entrenamiento de datos propietarios generados al interior de la misma institución, provenientes de distintas fuentes de información, para optimizar la precisión de la información, que pueda acompañar los procesos de innovación y emprendimiento a fin de incrementar la productividad de las cadenas productivas del rubro nacional generando con ella beneficios económicos que repercutan en la mejora de la calidad de vida de los peruanos. Así, con el desarrollo del proyecto se incrementará el ancho de banda de la VRAM con tasas de transferencia de la información iguales a 864GB/s y 2TB/s; también, se potenciará la cantidad de operaciones de coma flotante por segundo con índices de procesamiento de 378 TFLOPS en precisión TF32, 756 TFLOPS en formato BFLOAT16, 756 TFLOPS en precisión FP16 y 1513 TFLOPS en formato FP8; además, se elevará la velocidad de reloj de los núcleos de cómputo a 1755MHz aprovechando las capacidades del procesamiento en paralelo incorporando la tecnología NVIDIA NVLink; asimismo, se aumentará el número de tokens de la ventana de contexto para conseguir máximos de 7,993 y 9,193 tokens/s en la inferencia de salida y, finalmente, se elevará la cantidad de parámetros o variables internas con la posibilidad de procesar modelos de lenguaje de 7B, 13B, 70B, 130B, entre otros.With the advances currently made in the field of Deep Learning, we seek to formulate the conceptual design of a technological platform based on hyperconverged technology, which incorporates graphics processing infrastructure or GPU (Graphics Processing Unit), capable of supporting the development of RAG (Retrieval Augmented Generation) type solutions with the application of large open source language generative models, which have been previously trained with billions of data, for coding of predictive information systems (PIS) and that also has the training of proprietary data generated within the same institution, coming from different sources of information, to optimize the precision of the information, which can accompany the innovation processes and entrepreneurship in order to increase the productivity of the productive chains of the national sector, thereby generating economic benefits that have an impact on the improvement of the quality of life of Peruvians. Thus, with the development of the project, the VRAM bandwidth will increase with information transfer rates equal to 864GB/s and 2TB/s; also, the number of floating point operations per second will be enhanced with processing rates of 378 TFLOPS in TF32 precision, 756 TFLOPS in BFLOAT16 format, 756 TFLOPS in FP16 precision and 1513 TFLOPS in FP8 format; in addition, the clock speed of the computing cores will be raised to 1755MHz, taking advantage of the capabilities of parallel processing by incorporating NVIDIA NVLink technology; likewise, the number of tokens in the context window will be increased to achieve maximums of 7,993 and 9,193 tokens/s in the output inference and, finally, the number of parameters or internal variables will be increased with the possibility of processing language models 7B, 13B, 70B, 130B, among others.Trabajo de Suficiencia ProfesionalODS 9: Industria, Innovación e InfraestructuraODS 8: Trabajo Decente y Crecimiento EconómicoODS 4: Educación de Calidadapplication/pdfapplication/epubapplication/mswordspaUniversidad Peruana de Ciencias Aplicadas (UPC)PEinfo:eu-repo/semantics/openAccesshttp://creativecommons.org/licenses/by-nc-sa/4.0/http://purl.org/coar/access_right/c_abf2Universidad Peruana de Ciencias Aplicadas (UPC)Repositorio Académico - UPCreponame:UPC-Institucionalinstname:Universidad Peruana de Ciencias Aplicadasinstacron:UPCInteligencia artificialModelos de lenguajeAprendizaje profundoCuantizaciónEmbeddingEntrenamientoInferenciaDatasetFine-tuningRAGInteligencia generativaLLMParalelizaciónTokenVentana de contextoSparsityGPUBenchmarkArtificial intelligenceLanguage modelsDeep learningQuantizationTrainingInferenceDataFine-tuningGenerative intelligenceParallelizationContext windowhttps://purl.org/pe-repo/ocde/ford#2.02.05https://purl.org/pe-repo/ocde/ford#2.00.00Diseño de una plataforma tecnológica de alto rendimiento con procesamiento por gráfica y basada en tecnología de hiperconvergencia para la aplicación de la inteligencia generativa en el desarrollo de sistemas predictivos de información con el entrenamiento de modelos de Inteligencia Artificial (IA)Design of a high-performance technological platform with graph processing and based on hyperconvergence technology for the application of generative intelligence in the development of predictive information systems with the training of Artificial Intelligence (AI) modelsinfo:eu-repo/semantics/bachelorThesisTrabajo de Suficiencia Profesionalhttp://purl.org/coar/resource_type/c_7a1fSUNEDUUniversidad Peruana de Ciencias Aplicadas (UPC). División de Estudios Profesionales para Ejecutivos (EPE)LicenciaturaIngeniería de Redes y ComunicacionesIngeniero de Redes y Comunicaciones2024-08-04T18:01:42Zhttps://purl.org/pe-repo/renati/type#trabajoDeSuficienciaProfesional0000-0003-3658-341510340778https://purl.org/pe-repo/renati/level#tituloProfesional613046Seminario García, Hernán AugustoDíaz Cordova Aldo10013915CONVERTED2_3902217Salgado_PJ.pdfSalgado_PJ.pdfapplication/pdf3485196https://repositorioacademico.upc.edu.pe/bitstream/10757/674703/8/Salgado_PJ.pdf22dc7ceef342242732e7c80aba88b951MD58falseTHUMBNAILSalgado_PJ.pdf.jpgSalgado_PJ.pdf.jpgGenerated Thumbnailimage/jpeg36620https://repositorioacademico.upc.edu.pe/bitstream/10757/674703/7/Salgado_PJ.pdf.jpg1f3a079ba9e53769a5d55e08c08cf8eeMD57falseSalgado_PJ_Autorizacionpublicación.pdf.jpgSalgado_PJ_Autorizacionpublicación.pdf.jpgGenerated Thumbnailimage/jpeg70485https://repositorioacademico.upc.edu.pe/bitstream/10757/674703/10/Salgado_PJ_Autorizacionpublicaci%c3%b3n.pdf.jpg0124ec22026c68e2e0489af5e7da221cMD510falseSalgado_PJ_Reportesimilitud.pdf.jpgSalgado_PJ_Reportesimilitud.pdf.jpgGenerated Thumbnailimage/jpeg16092https://repositorioacademico.upc.edu.pe/bitstream/10757/674703/12/Salgado_PJ_Reportesimilitud.pdf.jpg4ae4a9d210b97d1bd7da9144c8cfde0cMD512falseSalgado_PJ_Actasimilitud.pdf.jpgSalgado_PJ_Actasimilitud.pdf.jpgGenerated Thumbnailimage/jpeg35661https://repositorioacademico.upc.edu.pe/bitstream/10757/674703/14/Salgado_PJ_Actasimilitud.pdf.jpg3304229fb77d024c81eb44a85c9b68c6MD514falseTEXTSalgado_PJ.pdf.txtSalgado_PJ.pdf.txtExtracted texttext/plain199890https://repositorioacademico.upc.edu.pe/bitstream/10757/674703/6/Salgado_PJ.pdf.txtfd91bbd7e9fbd8db2a09fd331c6e5b8aMD56falseSalgado_PJ_Autorizacionpublicación.pdf.txtSalgado_PJ_Autorizacionpublicación.pdf.txtExtracted texttext/plain2570https://repositorioacademico.upc.edu.pe/bitstream/10757/674703/9/Salgado_PJ_Autorizacionpublicaci%c3%b3n.pdf.txt8c19ffd6d32614722dfc9846db8596e0MD59falseSalgado_PJ_Reportesimilitud.pdf.txtSalgado_PJ_Reportesimilitud.pdf.txtExtracted texttext/plain2870https://repositorioacademico.upc.edu.pe/bitstream/10757/674703/11/Salgado_PJ_Reportesimilitud.pdf.txte520ff083b8f8c45e64b068c6a4dd439MD511falseSalgado_PJ_Actasimilitud.pdf.txtSalgado_PJ_Actasimilitud.pdf.txtExtracted texttext/plain1111https://repositorioacademico.upc.edu.pe/bitstream/10757/674703/13/Salgado_PJ_Actasimilitud.pdf.txt310d67ec0bb7367dce6410af5405a587MD513falseORIGINALSalgado_PJ.pdfSalgado_PJ.pdfapplication/pdf4241642https://repositorioacademico.upc.edu.pe/bitstream/10757/674703/1/Salgado_PJ.pdfa543af72a3f9878d49ef0930ed56cbeeMD51trueSalgado_PJ.docxSalgado_PJ.docxapplication/vnd.openxmlformats-officedocument.wordprocessingml.document6537663https://repositorioacademico.upc.edu.pe/bitstream/10757/674703/2/Salgado_PJ.docxf6fc2790a87e32a54b5098498b6f2cc9MD52falseSalgado_PJ_Autorizacionpublicación.pdfSalgado_PJ_Autorizacionpublicación.pdfapplication/pdf189429https://repositorioacademico.upc.edu.pe/bitstream/10757/674703/3/Salgado_PJ_Autorizacionpublicaci%c3%b3n.pdffe66a815bee1145fbbf2eb95596b1cafMD53falseSalgado_PJ_Reportesimilitud.pdfSalgado_PJ_Reportesimilitud.pdfapplication/pdf19400895https://repositorioacademico.upc.edu.pe/bitstream/10757/674703/4/Salgado_PJ_Reportesimilitud.pdfdab0bad32d01012abf952a512090d6c7MD54falseSalgado_PJ_Actasimilitud.pdfSalgado_PJ_Actasimilitud.pdfapplication/pdf55281https://repositorioacademico.upc.edu.pe/bitstream/10757/674703/5/Salgado_PJ_Actasimilitud.pdf9f33cde6fe10f7557fa8ffa516307666MD55false10757/674703oai:repositorioacademico.upc.edu.pe:10757/6747032024-08-05 03:59:00.063Repositorio académico upcupc@openrepository.com
score 13.949927
Nota importante:
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).