Herramienta integrada para la curación de proteínas repetidas

Descripción del Articulo

A finales de los años 1990, se identificó un conjunto de proteínas caracterizadas por tener patrones repetidos en su secuencia, lo que produce una estructura tridimensional repetitiva (Marcotte et al., 1999). Se han clasificado al menos 14% de proteínas encontradas en la naturaleza como repetidas, y...

Descripción completa

Detalles Bibliográficos
Autor: Bezerra Brandao Corrales, Manuel Alberto
Formato: tesis de maestría
Fecha de Publicación:2023
Institución:Pontificia Universidad Católica del Perú
Repositorio:PUCP-Tesis
Lenguaje:español
OAI Identifier:oai:tesis.pucp.edu.pe:20.500.12404/25421
Enlace del recurso:http://hdl.handle.net/20.500.12404/25421
Nivel de acceso:acceso abierto
Materia:Proteinas--Clasificación automática
Algoritmos computacionales
Bioinformática
https://purl.org/pe-repo/ocde/ford#1.02.00
id PUCP_2c3e7f420f6b60f42884a9cd2e7b28d2
oai_identifier_str oai:tesis.pucp.edu.pe:20.500.12404/25421
network_acronym_str PUCP
network_name_str PUCP-Tesis
repository_id_str .
dc.title.es_ES.fl_str_mv Herramienta integrada para la curación de proteínas repetidas
title Herramienta integrada para la curación de proteínas repetidas
spellingShingle Herramienta integrada para la curación de proteínas repetidas
Bezerra Brandao Corrales, Manuel Alberto
Proteinas--Clasificación automática
Algoritmos computacionales
Bioinformática
https://purl.org/pe-repo/ocde/ford#1.02.00
title_short Herramienta integrada para la curación de proteínas repetidas
title_full Herramienta integrada para la curación de proteínas repetidas
title_fullStr Herramienta integrada para la curación de proteínas repetidas
title_full_unstemmed Herramienta integrada para la curación de proteínas repetidas
title_sort Herramienta integrada para la curación de proteínas repetidas
author Bezerra Brandao Corrales, Manuel Alberto
author_facet Bezerra Brandao Corrales, Manuel Alberto
author_role author
dc.contributor.advisor.fl_str_mv Hirsh Martinez, Layla
dc.contributor.author.fl_str_mv Bezerra Brandao Corrales, Manuel Alberto
dc.subject.es_ES.fl_str_mv Proteinas--Clasificación automática
Algoritmos computacionales
Bioinformática
topic Proteinas--Clasificación automática
Algoritmos computacionales
Bioinformática
https://purl.org/pe-repo/ocde/ford#1.02.00
dc.subject.ocde.es_ES.fl_str_mv https://purl.org/pe-repo/ocde/ford#1.02.00
description A finales de los años 1990, se identificó un conjunto de proteínas caracterizadas por tener patrones repetidos en su secuencia, lo que produce una estructura tridimensional repetitiva (Marcotte et al., 1999). Se han clasificado al menos 14% de proteínas encontradas en la naturaleza como repetidas, y presentan un rol crítico en procesos biológicos como la comunicación celular y el reconocimiento molecular (Brunette et al., 2015; Marcotte et al., 1999). Existe un creciente interés en el estudio de las proteínas repetidas debido a sus pliegues estructurales estables, una alta conversación evolutiva y un amplio repertorio de funciones biológicas (Chakrabarty & Parekh, 2022). Además, se estima que una de cada tres proteínas humanas son consideradas repetidas (Jorda & Kajava, 2010). La identificación, clasificación y curación de regiones de repetición en proteínas es un proceso complejo que requiere del procesamiento manual de expertos, gran capacidad computacional y tiempo. Existen diversos avances recientes y relevantes que aplican modelos de aprendizaje automático para la predicción de estructura tridimensional de proteínas y la predicción de clasificación de proteínas repetidas. Este tipo de aplicaciones resultan útiles para este proceso de curación. No obstante, a pesar de que este tipo de software son de libre acceso y de código abierto, no se cuenta con un servicio integrado que contemple las herramientas y bases de datos que soporten la investigación en proteínas repetidas. Por estos motivos, en este proyecto de investigación de plantea, diseña y desarrolla un servicio web integrado para la curación de proteínas repetidas. Con este objetivo, se ha considerado la integración con la base de datos de estructuras terciarias del Protein Data Bank (PDB) y la base de datos de predicciones de estructuras tridimensionales AlphaFold. Asimismo, se ha utilizado un modelo de redes neuronales que permite predecir la probabilidad de clasificación en cada clase de proteína repetida. Finalmente, con esta predicción, se implementó una mejora al algoritmo ReUPred para volver más eficiente el proceso de identificación de regiones y unidades de repetición. Este servicio ha sido desplegado utilizando computación en la nube en la página bioinformática.org de la cual es parte el laboratorio de investigación en Bioinformática de la Pontificia Universidad Católica del Perú. Este servicio permite que los investigadores no requieran contar con alta capacidad de procesamiento computacional para el proceso de curación de proteínas repetidas e integra los resultados totales obtenidos.
publishDate 2023
dc.date.accessioned.none.fl_str_mv 2023-07-20T22:01:43Z
dc.date.available.none.fl_str_mv 2023-07-20T22:01:43Z
dc.date.created.none.fl_str_mv 2023
dc.date.EmbargoEnd.none.fl_str_mv 2024-02-05
dc.date.issued.fl_str_mv 2023-07-20
dc.type.es_ES.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
dc.identifier.uri.none.fl_str_mv http://hdl.handle.net/20.500.12404/25421
url http://hdl.handle.net/20.500.12404/25421
dc.language.iso.es_ES.fl_str_mv spa
language spa
dc.relation.ispartof.fl_str_mv SUNEDU
dc.rights.es_ES.fl_str_mv info:eu-repo/semantics/openAccess
dc.rights.uri.*.fl_str_mv http://creativecommons.org/licenses/by-nc/2.5/pe/
eu_rights_str_mv openAccess
rights_invalid_str_mv http://creativecommons.org/licenses/by-nc/2.5/pe/
dc.publisher.es_ES.fl_str_mv Pontificia Universidad Católica del Perú
dc.publisher.country.es_ES.fl_str_mv PE
dc.source.none.fl_str_mv reponame:PUCP-Tesis
instname:Pontificia Universidad Católica del Perú
instacron:PUCP
instname_str Pontificia Universidad Católica del Perú
instacron_str PUCP
institution PUCP
reponame_str PUCP-Tesis
collection PUCP-Tesis
bitstream.url.fl_str_mv https://tesis.pucp.edu.pe/bitstreams/e8f71b40-9d48-4fa8-aa36-84b56c397b71/download
https://tesis.pucp.edu.pe/bitstreams/1dc3f696-1d5f-418e-9073-a3adc5e1a32b/download
https://tesis.pucp.edu.pe/bitstreams/6630381d-9e6f-4caf-aef5-17ebf855ae3e/download
https://tesis.pucp.edu.pe/bitstreams/23f370fd-797f-4786-9ef6-1f8c7b695237/download
https://tesis.pucp.edu.pe/bitstreams/3d47ae67-224d-4a4e-8caf-826fb6d45329/download
https://tesis.pucp.edu.pe/bitstreams/fcbeb526-24a4-4f00-b377-78e404ed7fff/download
bitstream.checksum.fl_str_mv f16f14cbec9e916808c20cd36996f4c5
7bd24badfe2770478bf929134f9bd91a
a9a8238e6043663c064961e6230cfeb3
8a4605be74aa9ea9d79846c1fba20a33
7e991033de047cd26ea9e1ad18699e2c
c3a142072a40617d2bd54ec0c8bb378a
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
MD5
MD5
MD5
repository.name.fl_str_mv Repositorio de Tesis PUCP
repository.mail.fl_str_mv raul.sifuentes@pucp.pe
_version_ 1834737100436537344
spelling Hirsh Martinez, LaylaBezerra Brandao Corrales, Manuel Alberto2023-07-20T22:01:43Z2023-07-20T22:01:43Z20232023-07-202024-02-05http://hdl.handle.net/20.500.12404/25421A finales de los años 1990, se identificó un conjunto de proteínas caracterizadas por tener patrones repetidos en su secuencia, lo que produce una estructura tridimensional repetitiva (Marcotte et al., 1999). Se han clasificado al menos 14% de proteínas encontradas en la naturaleza como repetidas, y presentan un rol crítico en procesos biológicos como la comunicación celular y el reconocimiento molecular (Brunette et al., 2015; Marcotte et al., 1999). Existe un creciente interés en el estudio de las proteínas repetidas debido a sus pliegues estructurales estables, una alta conversación evolutiva y un amplio repertorio de funciones biológicas (Chakrabarty & Parekh, 2022). Además, se estima que una de cada tres proteínas humanas son consideradas repetidas (Jorda & Kajava, 2010). La identificación, clasificación y curación de regiones de repetición en proteínas es un proceso complejo que requiere del procesamiento manual de expertos, gran capacidad computacional y tiempo. Existen diversos avances recientes y relevantes que aplican modelos de aprendizaje automático para la predicción de estructura tridimensional de proteínas y la predicción de clasificación de proteínas repetidas. Este tipo de aplicaciones resultan útiles para este proceso de curación. No obstante, a pesar de que este tipo de software son de libre acceso y de código abierto, no se cuenta con un servicio integrado que contemple las herramientas y bases de datos que soporten la investigación en proteínas repetidas. Por estos motivos, en este proyecto de investigación de plantea, diseña y desarrolla un servicio web integrado para la curación de proteínas repetidas. Con este objetivo, se ha considerado la integración con la base de datos de estructuras terciarias del Protein Data Bank (PDB) y la base de datos de predicciones de estructuras tridimensionales AlphaFold. Asimismo, se ha utilizado un modelo de redes neuronales que permite predecir la probabilidad de clasificación en cada clase de proteína repetida. Finalmente, con esta predicción, se implementó una mejora al algoritmo ReUPred para volver más eficiente el proceso de identificación de regiones y unidades de repetición. Este servicio ha sido desplegado utilizando computación en la nube en la página bioinformática.org de la cual es parte el laboratorio de investigación en Bioinformática de la Pontificia Universidad Católica del Perú. Este servicio permite que los investigadores no requieran contar con alta capacidad de procesamiento computacional para el proceso de curación de proteínas repetidas e integra los resultados totales obtenidos.spaPontificia Universidad Católica del PerúPEinfo:eu-repo/semantics/openAccesshttp://creativecommons.org/licenses/by-nc/2.5/pe/Proteinas--Clasificación automáticaAlgoritmos computacionalesBioinformáticahttps://purl.org/pe-repo/ocde/ford#1.02.00Herramienta integrada para la curación de proteínas repetidasinfo:eu-repo/semantics/masterThesisreponame:PUCP-Tesisinstname:Pontificia Universidad Católica del Perúinstacron:PUCPSUNEDUMaestro en InformáticaMaestríaPontificia Universidad Católica del Perú. Escuela de Posgrado.Informática40329236https://orcid.org/0000-0002-8215-671673222296611077Beltran Castañon, Cesar ArmandoHirsh Martinez, LaylaMelgar Sasieta, Hector Andreshttps://purl.org/pe-repo/renati/level#maestrohttps://purl.org/pe-repo/renati/type#tesisORIGINALBEZERRA_BRANDAO_ CORRALES_MANUEL_HERRAMIENT_INTEGRADA.pdfBEZERRA_BRANDAO_ CORRALES_MANUEL_HERRAMIENT_INTEGRADA.pdfTexto completoapplication/pdf2500106https://tesis.pucp.edu.pe/bitstreams/e8f71b40-9d48-4fa8-aa36-84b56c397b71/downloadf16f14cbec9e916808c20cd36996f4c5MD51trueAnonymousREAD2024-02-05BEZERRA_BRANDAO CORRALES_MANUEL_ALBELTO_T.pdfBEZERRA_BRANDAO CORRALES_MANUEL_ALBELTO_T.pdfReporte de originalidadapplication/pdf16407427https://tesis.pucp.edu.pe/bitstreams/1dc3f696-1d5f-418e-9073-a3adc5e1a32b/download7bd24badfe2770478bf929134f9bd91aMD52falseAnonymousREAD2500-01-01CC-LICENSElicense_rdflicense_rdfapplication/rdf+xml; charset=utf-8920https://tesis.pucp.edu.pe/bitstreams/6630381d-9e6f-4caf-aef5-17ebf855ae3e/downloada9a8238e6043663c064961e6230cfeb3MD53falseAnonymousREADLICENSElicense.txtlicense.txttext/plain; charset=utf-81748https://tesis.pucp.edu.pe/bitstreams/23f370fd-797f-4786-9ef6-1f8c7b695237/download8a4605be74aa9ea9d79846c1fba20a33MD54falseAnonymousREADTHUMBNAILBEZERRA_BRANDAO_ CORRALES_MANUEL_HERRAMIENT_INTEGRADA.pdf.jpgBEZERRA_BRANDAO_ CORRALES_MANUEL_HERRAMIENT_INTEGRADA.pdf.jpgIM Thumbnailimage/jpeg11538https://tesis.pucp.edu.pe/bitstreams/3d47ae67-224d-4a4e-8caf-826fb6d45329/download7e991033de047cd26ea9e1ad18699e2cMD55falseAnonymousREADBEZERRA_BRANDAO CORRALES_MANUEL_ALBELTO_T.pdf.jpgBEZERRA_BRANDAO CORRALES_MANUEL_ALBELTO_T.pdf.jpgIM Thumbnailimage/jpeg8300https://tesis.pucp.edu.pe/bitstreams/fcbeb526-24a4-4f00-b377-78e404ed7fff/downloadc3a142072a40617d2bd54ec0c8bb378aMD56falseAnonymousREAD2500-01-0120.500.12404/25421oai:tesis.pucp.edu.pe:20.500.12404/254212024-05-29 10:10:38.308http://creativecommons.org/licenses/by-nc/2.5/pe/info:eu-repo/semantics/openAccessopen.accesshttps://tesis.pucp.edu.peRepositorio de Tesis PUCPraul.sifuentes@pucp.peTk9URTogUExBQ0UgWU9VUiBPV04gTElDRU5TRSBIRVJFClRoaXMgc2FtcGxlIGxpY2Vuc2UgaXMgcHJvdmlkZWQgZm9yIGluZm9ybWF0aW9uYWwgcHVycG9zZXMgb25seS4KCk5PTi1FWENMVVNJVkUgRElTVFJJQlVUSU9OIExJQ0VOU0UKCkJ5IHNpZ25pbmcgYW5kIHN1Ym1pdHRpbmcgdGhpcyBsaWNlbnNlLCB5b3UgKHRoZSBhdXRob3Iocykgb3IgY29weXJpZ2h0Cm93bmVyKSBncmFudHMgdG8gRFNwYWNlIFVuaXZlcnNpdHkgKERTVSkgdGhlIG5vbi1leGNsdXNpdmUgcmlnaHQgdG8gcmVwcm9kdWNlLAp0cmFuc2xhdGUgKGFzIGRlZmluZWQgYmVsb3cpLCBhbmQvb3IgZGlzdHJpYnV0ZSB5b3VyIHN1Ym1pc3Npb24gKGluY2x1ZGluZwp0aGUgYWJzdHJhY3QpIHdvcmxkd2lkZSBpbiBwcmludCBhbmQgZWxlY3Ryb25pYyBmb3JtYXQgYW5kIGluIGFueSBtZWRpdW0sCmluY2x1ZGluZyBidXQgbm90IGxpbWl0ZWQgdG8gYXVkaW8gb3IgdmlkZW8uCgpZb3UgYWdyZWUgdGhhdCBEU1UgbWF5LCB3aXRob3V0IGNoYW5naW5nIHRoZSBjb250ZW50LCB0cmFuc2xhdGUgdGhlCnN1Ym1pc3Npb24gdG8gYW55IG1lZGl1bSBvciBmb3JtYXQgZm9yIHRoZSBwdXJwb3NlIG9mIHByZXNlcnZhdGlvbi4KCllvdSBhbHNvIGFncmVlIHRoYXQgRFNVIG1heSBrZWVwIG1vcmUgdGhhbiBvbmUgY29weSBvZiB0aGlzIHN1Ym1pc3Npb24gZm9yCnB1cnBvc2VzIG9mIHNlY3VyaXR5LCBiYWNrLXVwIGFuZCBwcmVzZXJ2YXRpb24uCgpZb3UgcmVwcmVzZW50IHRoYXQgdGhlIHN1Ym1pc3Npb24gaXMgeW91ciBvcmlnaW5hbCB3b3JrLCBhbmQgdGhhdCB5b3UgaGF2ZQp0aGUgcmlnaHQgdG8gZ3JhbnQgdGhlIHJpZ2h0cyBjb250YWluZWQgaW4gdGhpcyBsaWNlbnNlLiBZb3UgYWxzbyByZXByZXNlbnQKdGhhdCB5b3VyIHN1Ym1pc3Npb24gZG9lcyBub3QsIHRvIHRoZSBiZXN0IG9mIHlvdXIga25vd2xlZGdlLCBpbmZyaW5nZSB1cG9uCmFueW9uZSdzIGNvcHlyaWdodC4KCklmIHRoZSBzdWJtaXNzaW9uIGNvbnRhaW5zIG1hdGVyaWFsIGZvciB3aGljaCB5b3UgZG8gbm90IGhvbGQgY29weXJpZ2h0LAp5b3UgcmVwcmVzZW50IHRoYXQgeW91IGhhdmUgb2J0YWluZWQgdGhlIHVucmVzdHJpY3RlZCBwZXJtaXNzaW9uIG9mIHRoZQpjb3B5cmlnaHQgb3duZXIgdG8gZ3JhbnQgRFNVIHRoZSByaWdodHMgcmVxdWlyZWQgYnkgdGhpcyBsaWNlbnNlLCBhbmQgdGhhdApzdWNoIHRoaXJkLXBhcnR5IG93bmVkIG1hdGVyaWFsIGlzIGNsZWFybHkgaWRlbnRpZmllZCBhbmQgYWNrbm93bGVkZ2VkCndpdGhpbiB0aGUgdGV4dCBvciBjb250ZW50IG9mIHRoZSBzdWJtaXNzaW9uLgoKSUYgVEhFIFNVQk1JU1NJT04gSVMgQkFTRUQgVVBPTiBXT1JLIFRIQVQgSEFTIEJFRU4gU1BPTlNPUkVEIE9SIFNVUFBPUlRFRApCWSBBTiBBR0VOQ1kgT1IgT1JHQU5JWkFUSU9OIE9USEVSIFRIQU4gRFNVLCBZT1UgUkVQUkVTRU5UIFRIQVQgWU9VIEhBVkUKRlVMRklMTEVEIEFOWSBSSUdIVCBPRiBSRVZJRVcgT1IgT1RIRVIgT0JMSUdBVElPTlMgUkVRVUlSRUQgQlkgU1VDSApDT05UUkFDVCBPUiBBR1JFRU1FTlQuCgpEU1Ugd2lsbCBjbGVhcmx5IGlkZW50aWZ5IHlvdXIgbmFtZShzKSBhcyB0aGUgYXV0aG9yKHMpIG9yIG93bmVyKHMpIG9mIHRoZQpzdWJtaXNzaW9uLCBhbmQgd2lsbCBub3QgbWFrZSBhbnkgYWx0ZXJhdGlvbiwgb3RoZXIgdGhhbiBhcyBhbGxvd2VkIGJ5IHRoaXMKbGljZW5zZSwgdG8geW91ciBzdWJtaXNzaW9uLgo=
score 13.952411
Nota importante:
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).