Herramienta integrada para la curación de proteínas repetidas
Descripción del Articulo
A finales de los años 1990, se identificó un conjunto de proteínas caracterizadas por tener patrones repetidos en su secuencia, lo que produce una estructura tridimensional repetitiva (Marcotte et al., 1999). Se han clasificado al menos 14% de proteínas encontradas en la naturaleza como repetidas, y...
Autor: | |
---|---|
Formato: | tesis de maestría |
Fecha de Publicación: | 2023 |
Institución: | Pontificia Universidad Católica del Perú |
Repositorio: | PUCP-Tesis |
Lenguaje: | español |
OAI Identifier: | oai:tesis.pucp.edu.pe:20.500.12404/25421 |
Enlace del recurso: | http://hdl.handle.net/20.500.12404/25421 |
Nivel de acceso: | acceso abierto |
Materia: | Proteinas--Clasificación automática Algoritmos computacionales Bioinformática https://purl.org/pe-repo/ocde/ford#1.02.00 |
id |
PUCP_2c3e7f420f6b60f42884a9cd2e7b28d2 |
---|---|
oai_identifier_str |
oai:tesis.pucp.edu.pe:20.500.12404/25421 |
network_acronym_str |
PUCP |
network_name_str |
PUCP-Tesis |
repository_id_str |
. |
dc.title.es_ES.fl_str_mv |
Herramienta integrada para la curación de proteínas repetidas |
title |
Herramienta integrada para la curación de proteínas repetidas |
spellingShingle |
Herramienta integrada para la curación de proteínas repetidas Bezerra Brandao Corrales, Manuel Alberto Proteinas--Clasificación automática Algoritmos computacionales Bioinformática https://purl.org/pe-repo/ocde/ford#1.02.00 |
title_short |
Herramienta integrada para la curación de proteínas repetidas |
title_full |
Herramienta integrada para la curación de proteínas repetidas |
title_fullStr |
Herramienta integrada para la curación de proteínas repetidas |
title_full_unstemmed |
Herramienta integrada para la curación de proteínas repetidas |
title_sort |
Herramienta integrada para la curación de proteínas repetidas |
author |
Bezerra Brandao Corrales, Manuel Alberto |
author_facet |
Bezerra Brandao Corrales, Manuel Alberto |
author_role |
author |
dc.contributor.advisor.fl_str_mv |
Hirsh Martinez, Layla |
dc.contributor.author.fl_str_mv |
Bezerra Brandao Corrales, Manuel Alberto |
dc.subject.es_ES.fl_str_mv |
Proteinas--Clasificación automática Algoritmos computacionales Bioinformática |
topic |
Proteinas--Clasificación automática Algoritmos computacionales Bioinformática https://purl.org/pe-repo/ocde/ford#1.02.00 |
dc.subject.ocde.es_ES.fl_str_mv |
https://purl.org/pe-repo/ocde/ford#1.02.00 |
description |
A finales de los años 1990, se identificó un conjunto de proteínas caracterizadas por tener patrones repetidos en su secuencia, lo que produce una estructura tridimensional repetitiva (Marcotte et al., 1999). Se han clasificado al menos 14% de proteínas encontradas en la naturaleza como repetidas, y presentan un rol crítico en procesos biológicos como la comunicación celular y el reconocimiento molecular (Brunette et al., 2015; Marcotte et al., 1999). Existe un creciente interés en el estudio de las proteínas repetidas debido a sus pliegues estructurales estables, una alta conversación evolutiva y un amplio repertorio de funciones biológicas (Chakrabarty & Parekh, 2022). Además, se estima que una de cada tres proteínas humanas son consideradas repetidas (Jorda & Kajava, 2010). La identificación, clasificación y curación de regiones de repetición en proteínas es un proceso complejo que requiere del procesamiento manual de expertos, gran capacidad computacional y tiempo. Existen diversos avances recientes y relevantes que aplican modelos de aprendizaje automático para la predicción de estructura tridimensional de proteínas y la predicción de clasificación de proteínas repetidas. Este tipo de aplicaciones resultan útiles para este proceso de curación. No obstante, a pesar de que este tipo de software son de libre acceso y de código abierto, no se cuenta con un servicio integrado que contemple las herramientas y bases de datos que soporten la investigación en proteínas repetidas. Por estos motivos, en este proyecto de investigación de plantea, diseña y desarrolla un servicio web integrado para la curación de proteínas repetidas. Con este objetivo, se ha considerado la integración con la base de datos de estructuras terciarias del Protein Data Bank (PDB) y la base de datos de predicciones de estructuras tridimensionales AlphaFold. Asimismo, se ha utilizado un modelo de redes neuronales que permite predecir la probabilidad de clasificación en cada clase de proteína repetida. Finalmente, con esta predicción, se implementó una mejora al algoritmo ReUPred para volver más eficiente el proceso de identificación de regiones y unidades de repetición. Este servicio ha sido desplegado utilizando computación en la nube en la página bioinformática.org de la cual es parte el laboratorio de investigación en Bioinformática de la Pontificia Universidad Católica del Perú. Este servicio permite que los investigadores no requieran contar con alta capacidad de procesamiento computacional para el proceso de curación de proteínas repetidas e integra los resultados totales obtenidos. |
publishDate |
2023 |
dc.date.accessioned.none.fl_str_mv |
2023-07-20T22:01:43Z |
dc.date.available.none.fl_str_mv |
2023-07-20T22:01:43Z |
dc.date.created.none.fl_str_mv |
2023 |
dc.date.EmbargoEnd.none.fl_str_mv |
2024-02-05 |
dc.date.issued.fl_str_mv |
2023-07-20 |
dc.type.es_ES.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
dc.identifier.uri.none.fl_str_mv |
http://hdl.handle.net/20.500.12404/25421 |
url |
http://hdl.handle.net/20.500.12404/25421 |
dc.language.iso.es_ES.fl_str_mv |
spa |
language |
spa |
dc.relation.ispartof.fl_str_mv |
SUNEDU |
dc.rights.es_ES.fl_str_mv |
info:eu-repo/semantics/openAccess |
dc.rights.uri.*.fl_str_mv |
http://creativecommons.org/licenses/by-nc/2.5/pe/ |
eu_rights_str_mv |
openAccess |
rights_invalid_str_mv |
http://creativecommons.org/licenses/by-nc/2.5/pe/ |
dc.publisher.es_ES.fl_str_mv |
Pontificia Universidad Católica del Perú |
dc.publisher.country.es_ES.fl_str_mv |
PE |
dc.source.none.fl_str_mv |
reponame:PUCP-Tesis instname:Pontificia Universidad Católica del Perú instacron:PUCP |
instname_str |
Pontificia Universidad Católica del Perú |
instacron_str |
PUCP |
institution |
PUCP |
reponame_str |
PUCP-Tesis |
collection |
PUCP-Tesis |
bitstream.url.fl_str_mv |
https://tesis.pucp.edu.pe/bitstreams/e8f71b40-9d48-4fa8-aa36-84b56c397b71/download https://tesis.pucp.edu.pe/bitstreams/1dc3f696-1d5f-418e-9073-a3adc5e1a32b/download https://tesis.pucp.edu.pe/bitstreams/6630381d-9e6f-4caf-aef5-17ebf855ae3e/download https://tesis.pucp.edu.pe/bitstreams/23f370fd-797f-4786-9ef6-1f8c7b695237/download https://tesis.pucp.edu.pe/bitstreams/3d47ae67-224d-4a4e-8caf-826fb6d45329/download https://tesis.pucp.edu.pe/bitstreams/fcbeb526-24a4-4f00-b377-78e404ed7fff/download |
bitstream.checksum.fl_str_mv |
f16f14cbec9e916808c20cd36996f4c5 7bd24badfe2770478bf929134f9bd91a a9a8238e6043663c064961e6230cfeb3 8a4605be74aa9ea9d79846c1fba20a33 7e991033de047cd26ea9e1ad18699e2c c3a142072a40617d2bd54ec0c8bb378a |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 MD5 MD5 MD5 |
repository.name.fl_str_mv |
Repositorio de Tesis PUCP |
repository.mail.fl_str_mv |
raul.sifuentes@pucp.pe |
_version_ |
1834737100436537344 |
spelling |
Hirsh Martinez, LaylaBezerra Brandao Corrales, Manuel Alberto2023-07-20T22:01:43Z2023-07-20T22:01:43Z20232023-07-202024-02-05http://hdl.handle.net/20.500.12404/25421A finales de los años 1990, se identificó un conjunto de proteínas caracterizadas por tener patrones repetidos en su secuencia, lo que produce una estructura tridimensional repetitiva (Marcotte et al., 1999). Se han clasificado al menos 14% de proteínas encontradas en la naturaleza como repetidas, y presentan un rol crítico en procesos biológicos como la comunicación celular y el reconocimiento molecular (Brunette et al., 2015; Marcotte et al., 1999). Existe un creciente interés en el estudio de las proteínas repetidas debido a sus pliegues estructurales estables, una alta conversación evolutiva y un amplio repertorio de funciones biológicas (Chakrabarty & Parekh, 2022). Además, se estima que una de cada tres proteínas humanas son consideradas repetidas (Jorda & Kajava, 2010). La identificación, clasificación y curación de regiones de repetición en proteínas es un proceso complejo que requiere del procesamiento manual de expertos, gran capacidad computacional y tiempo. Existen diversos avances recientes y relevantes que aplican modelos de aprendizaje automático para la predicción de estructura tridimensional de proteínas y la predicción de clasificación de proteínas repetidas. Este tipo de aplicaciones resultan útiles para este proceso de curación. No obstante, a pesar de que este tipo de software son de libre acceso y de código abierto, no se cuenta con un servicio integrado que contemple las herramientas y bases de datos que soporten la investigación en proteínas repetidas. Por estos motivos, en este proyecto de investigación de plantea, diseña y desarrolla un servicio web integrado para la curación de proteínas repetidas. Con este objetivo, se ha considerado la integración con la base de datos de estructuras terciarias del Protein Data Bank (PDB) y la base de datos de predicciones de estructuras tridimensionales AlphaFold. Asimismo, se ha utilizado un modelo de redes neuronales que permite predecir la probabilidad de clasificación en cada clase de proteína repetida. Finalmente, con esta predicción, se implementó una mejora al algoritmo ReUPred para volver más eficiente el proceso de identificación de regiones y unidades de repetición. Este servicio ha sido desplegado utilizando computación en la nube en la página bioinformática.org de la cual es parte el laboratorio de investigación en Bioinformática de la Pontificia Universidad Católica del Perú. Este servicio permite que los investigadores no requieran contar con alta capacidad de procesamiento computacional para el proceso de curación de proteínas repetidas e integra los resultados totales obtenidos.spaPontificia Universidad Católica del PerúPEinfo:eu-repo/semantics/openAccesshttp://creativecommons.org/licenses/by-nc/2.5/pe/Proteinas--Clasificación automáticaAlgoritmos computacionalesBioinformáticahttps://purl.org/pe-repo/ocde/ford#1.02.00Herramienta integrada para la curación de proteínas repetidasinfo:eu-repo/semantics/masterThesisreponame:PUCP-Tesisinstname:Pontificia Universidad Católica del Perúinstacron:PUCPSUNEDUMaestro en InformáticaMaestríaPontificia Universidad Católica del Perú. Escuela de Posgrado.Informática40329236https://orcid.org/0000-0002-8215-671673222296611077Beltran Castañon, Cesar ArmandoHirsh Martinez, LaylaMelgar Sasieta, Hector Andreshttps://purl.org/pe-repo/renati/level#maestrohttps://purl.org/pe-repo/renati/type#tesisORIGINALBEZERRA_BRANDAO_ CORRALES_MANUEL_HERRAMIENT_INTEGRADA.pdfBEZERRA_BRANDAO_ CORRALES_MANUEL_HERRAMIENT_INTEGRADA.pdfTexto completoapplication/pdf2500106https://tesis.pucp.edu.pe/bitstreams/e8f71b40-9d48-4fa8-aa36-84b56c397b71/downloadf16f14cbec9e916808c20cd36996f4c5MD51trueAnonymousREAD2024-02-05BEZERRA_BRANDAO CORRALES_MANUEL_ALBELTO_T.pdfBEZERRA_BRANDAO CORRALES_MANUEL_ALBELTO_T.pdfReporte de originalidadapplication/pdf16407427https://tesis.pucp.edu.pe/bitstreams/1dc3f696-1d5f-418e-9073-a3adc5e1a32b/download7bd24badfe2770478bf929134f9bd91aMD52falseAnonymousREAD2500-01-01CC-LICENSElicense_rdflicense_rdfapplication/rdf+xml; charset=utf-8920https://tesis.pucp.edu.pe/bitstreams/6630381d-9e6f-4caf-aef5-17ebf855ae3e/downloada9a8238e6043663c064961e6230cfeb3MD53falseAnonymousREADLICENSElicense.txtlicense.txttext/plain; charset=utf-81748https://tesis.pucp.edu.pe/bitstreams/23f370fd-797f-4786-9ef6-1f8c7b695237/download8a4605be74aa9ea9d79846c1fba20a33MD54falseAnonymousREADTHUMBNAILBEZERRA_BRANDAO_ CORRALES_MANUEL_HERRAMIENT_INTEGRADA.pdf.jpgBEZERRA_BRANDAO_ CORRALES_MANUEL_HERRAMIENT_INTEGRADA.pdf.jpgIM Thumbnailimage/jpeg11538https://tesis.pucp.edu.pe/bitstreams/3d47ae67-224d-4a4e-8caf-826fb6d45329/download7e991033de047cd26ea9e1ad18699e2cMD55falseAnonymousREADBEZERRA_BRANDAO CORRALES_MANUEL_ALBELTO_T.pdf.jpgBEZERRA_BRANDAO CORRALES_MANUEL_ALBELTO_T.pdf.jpgIM Thumbnailimage/jpeg8300https://tesis.pucp.edu.pe/bitstreams/fcbeb526-24a4-4f00-b377-78e404ed7fff/downloadc3a142072a40617d2bd54ec0c8bb378aMD56falseAnonymousREAD2500-01-0120.500.12404/25421oai:tesis.pucp.edu.pe:20.500.12404/254212024-05-29 10:10:38.308http://creativecommons.org/licenses/by-nc/2.5/pe/info:eu-repo/semantics/openAccessopen.accesshttps://tesis.pucp.edu.peRepositorio de Tesis PUCPraul.sifuentes@pucp.peTk9URTogUExBQ0UgWU9VUiBPV04gTElDRU5TRSBIRVJFClRoaXMgc2FtcGxlIGxpY2Vuc2UgaXMgcHJvdmlkZWQgZm9yIGluZm9ybWF0aW9uYWwgcHVycG9zZXMgb25seS4KCk5PTi1FWENMVVNJVkUgRElTVFJJQlVUSU9OIExJQ0VOU0UKCkJ5IHNpZ25pbmcgYW5kIHN1Ym1pdHRpbmcgdGhpcyBsaWNlbnNlLCB5b3UgKHRoZSBhdXRob3Iocykgb3IgY29weXJpZ2h0Cm93bmVyKSBncmFudHMgdG8gRFNwYWNlIFVuaXZlcnNpdHkgKERTVSkgdGhlIG5vbi1leGNsdXNpdmUgcmlnaHQgdG8gcmVwcm9kdWNlLAp0cmFuc2xhdGUgKGFzIGRlZmluZWQgYmVsb3cpLCBhbmQvb3IgZGlzdHJpYnV0ZSB5b3VyIHN1Ym1pc3Npb24gKGluY2x1ZGluZwp0aGUgYWJzdHJhY3QpIHdvcmxkd2lkZSBpbiBwcmludCBhbmQgZWxlY3Ryb25pYyBmb3JtYXQgYW5kIGluIGFueSBtZWRpdW0sCmluY2x1ZGluZyBidXQgbm90IGxpbWl0ZWQgdG8gYXVkaW8gb3IgdmlkZW8uCgpZb3UgYWdyZWUgdGhhdCBEU1UgbWF5LCB3aXRob3V0IGNoYW5naW5nIHRoZSBjb250ZW50LCB0cmFuc2xhdGUgdGhlCnN1Ym1pc3Npb24gdG8gYW55IG1lZGl1bSBvciBmb3JtYXQgZm9yIHRoZSBwdXJwb3NlIG9mIHByZXNlcnZhdGlvbi4KCllvdSBhbHNvIGFncmVlIHRoYXQgRFNVIG1heSBrZWVwIG1vcmUgdGhhbiBvbmUgY29weSBvZiB0aGlzIHN1Ym1pc3Npb24gZm9yCnB1cnBvc2VzIG9mIHNlY3VyaXR5LCBiYWNrLXVwIGFuZCBwcmVzZXJ2YXRpb24uCgpZb3UgcmVwcmVzZW50IHRoYXQgdGhlIHN1Ym1pc3Npb24gaXMgeW91ciBvcmlnaW5hbCB3b3JrLCBhbmQgdGhhdCB5b3UgaGF2ZQp0aGUgcmlnaHQgdG8gZ3JhbnQgdGhlIHJpZ2h0cyBjb250YWluZWQgaW4gdGhpcyBsaWNlbnNlLiBZb3UgYWxzbyByZXByZXNlbnQKdGhhdCB5b3VyIHN1Ym1pc3Npb24gZG9lcyBub3QsIHRvIHRoZSBiZXN0IG9mIHlvdXIga25vd2xlZGdlLCBpbmZyaW5nZSB1cG9uCmFueW9uZSdzIGNvcHlyaWdodC4KCklmIHRoZSBzdWJtaXNzaW9uIGNvbnRhaW5zIG1hdGVyaWFsIGZvciB3aGljaCB5b3UgZG8gbm90IGhvbGQgY29weXJpZ2h0LAp5b3UgcmVwcmVzZW50IHRoYXQgeW91IGhhdmUgb2J0YWluZWQgdGhlIHVucmVzdHJpY3RlZCBwZXJtaXNzaW9uIG9mIHRoZQpjb3B5cmlnaHQgb3duZXIgdG8gZ3JhbnQgRFNVIHRoZSByaWdodHMgcmVxdWlyZWQgYnkgdGhpcyBsaWNlbnNlLCBhbmQgdGhhdApzdWNoIHRoaXJkLXBhcnR5IG93bmVkIG1hdGVyaWFsIGlzIGNsZWFybHkgaWRlbnRpZmllZCBhbmQgYWNrbm93bGVkZ2VkCndpdGhpbiB0aGUgdGV4dCBvciBjb250ZW50IG9mIHRoZSBzdWJtaXNzaW9uLgoKSUYgVEhFIFNVQk1JU1NJT04gSVMgQkFTRUQgVVBPTiBXT1JLIFRIQVQgSEFTIEJFRU4gU1BPTlNPUkVEIE9SIFNVUFBPUlRFRApCWSBBTiBBR0VOQ1kgT1IgT1JHQU5JWkFUSU9OIE9USEVSIFRIQU4gRFNVLCBZT1UgUkVQUkVTRU5UIFRIQVQgWU9VIEhBVkUKRlVMRklMTEVEIEFOWSBSSUdIVCBPRiBSRVZJRVcgT1IgT1RIRVIgT0JMSUdBVElPTlMgUkVRVUlSRUQgQlkgU1VDSApDT05UUkFDVCBPUiBBR1JFRU1FTlQuCgpEU1Ugd2lsbCBjbGVhcmx5IGlkZW50aWZ5IHlvdXIgbmFtZShzKSBhcyB0aGUgYXV0aG9yKHMpIG9yIG93bmVyKHMpIG9mIHRoZQpzdWJtaXNzaW9uLCBhbmQgd2lsbCBub3QgbWFrZSBhbnkgYWx0ZXJhdGlvbiwgb3RoZXIgdGhhbiBhcyBhbGxvd2VkIGJ5IHRoaXMKbGljZW5zZSwgdG8geW91ciBzdWJtaXNzaW9uLgo= |
score |
13.952411 |
Nota importante:
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).