Integración de datos y análisis predictivo en tratamiento de drogodependencia
Descripción del Articulo
El análisis de datos actual se enfrenta a problemas derivados de la combinación de datos procedentes de diversas fuentes de información. El valor de la información puede enriquecerse enormemente facilitando la integración de nuevas fuentes de datos y la industria es muy consciente de ello en la actu...
| Autor: | |
|---|---|
| Formato: | tesis de maestría |
| Fecha de Publicación: | 2016 |
| Institución: | Superintendencia Nacional de Educación Superior Universitaria |
| Repositorio: | Registro Nacional de Trabajos conducentes a Grados y Títulos - RENATI |
| Lenguaje: | español |
| OAI Identifier: | oai:repositorio.sunedu.gob.pe:20.500.14366/1781 |
| Enlace del recurso: | https://eprints.ucm.es/39325/ https://hdl.handle.net/20.500.14366/1781 |
| Nivel de acceso: | acceso abierto |
| Materia: | Integración de datos (Informática) Análisis de datos Predicciones Drogodependencia Regresión lineal https://purl.org/pe-repo/ocde/ford#1.02.01 |
| id |
RENATI_ed0ada3fa50e4b0fb83cd5bcb9109116 |
|---|---|
| oai_identifier_str |
oai:repositorio.sunedu.gob.pe:20.500.14366/1781 |
| network_acronym_str |
RENATI |
| network_name_str |
Registro Nacional de Trabajos conducentes a Grados y Títulos - RENATI |
| repository_id_str |
|
| dc.title.es_PE.fl_str_mv |
Integración de datos y análisis predictivo en tratamiento de drogodependencia |
| title |
Integración de datos y análisis predictivo en tratamiento de drogodependencia |
| spellingShingle |
Integración de datos y análisis predictivo en tratamiento de drogodependencia Mariscal Carhuamaca, Victor Hugo Integración de datos (Informática) Análisis de datos Predicciones Drogodependencia Regresión lineal https://purl.org/pe-repo/ocde/ford#1.02.01 |
| title_short |
Integración de datos y análisis predictivo en tratamiento de drogodependencia |
| title_full |
Integración de datos y análisis predictivo en tratamiento de drogodependencia |
| title_fullStr |
Integración de datos y análisis predictivo en tratamiento de drogodependencia |
| title_full_unstemmed |
Integración de datos y análisis predictivo en tratamiento de drogodependencia |
| title_sort |
Integración de datos y análisis predictivo en tratamiento de drogodependencia |
| author |
Mariscal Carhuamaca, Victor Hugo |
| author_facet |
Mariscal Carhuamaca, Victor Hugo |
| author_role |
author |
| dc.contributor.advisor.fl_str_mv |
López López, María Victoria |
| dc.contributor.author.fl_str_mv |
Mariscal Carhuamaca, Victor Hugo |
| dc.subject.es_PE.fl_str_mv |
Integración de datos (Informática) Análisis de datos Predicciones Drogodependencia Regresión lineal |
| topic |
Integración de datos (Informática) Análisis de datos Predicciones Drogodependencia Regresión lineal https://purl.org/pe-repo/ocde/ford#1.02.01 |
| dc.subject.ocde.none.fl_str_mv |
https://purl.org/pe-repo/ocde/ford#1.02.01 |
| description |
El análisis de datos actual se enfrenta a problemas derivados de la combinación de datos procedentes de diversas fuentes de información. El valor de la información puede enriquecerse enormemente facilitando la integración de nuevas fuentes de datos y la industria es muy consciente de ello en la actualidad. Sin embargo, no solo el volumen sino también la gran diversidad de los datos constituye un problema previo al análisis. Una buena integración de los datos garantiza unos resultados fiables y por ello merece la pena detenerse en la mejora de procesos de especificación, recolección, limpieza e integración de los datos. Este trabajo está dedicado a la fase de limpieza e integración de datos analizando los procedimientos existentes y proponiendo una solución que se aplica a datos médicos, centrándose así en los proyectos de predicción (con finalidad de prevención) en ciencias de la salud. Además de la implementación de los procesos de limpieza, se desarrollan algoritmos de detección de outliers que permiten mejorar la calidad del conjunto de datos tras su eliminación. El trabajo también incluye la implementación de un proceso de predicción que sirva de ayuda a la toma de decisiones. Concretamente este trabajo realiza un análisis predictivo de los datos de pacientes drogodependientes de la Clínica Nuestra Señora de la Paz, con la finalidad de poder brindar un apoyo en la toma de decisiones del médico a cargo de admitir el internamiento de pacientes en dicha clínica. En la mayoría de los casos el estudio de los datos facilitados requiere un pre-procesado adecuado para que los resultados de los análisis estadísticos tradicionales sean fiables. En tal sentido en este trabajo se implementan varias formas de detectar los outliers: un algoritmo propio (Detección de Outliers con Cadenas No Monótonas), que utiliza las ventajas del algoritmo Knuth-Morris-Pratt para reconocimiento de patrones, y las librerías outliers y Rcmdr de R. La aplicación de procedimientos de cleaning e integración de datos, así como de eliminación de datos atípicos proporciona una base de datos limpia y fiable sobre la que se implementarán procedimientos de predicción de los datos con el algoritmo de clasificación Naive Bayes en R. |
| publishDate |
2016 |
| dc.date.accessioned.none.fl_str_mv |
2020-03-25T19:25:34Z |
| dc.date.available.none.fl_str_mv |
2020-03-25T19:25:34Z |
| dc.date.issued.fl_str_mv |
2016-09 |
| dc.type.es_PE.fl_str_mv |
info:eu-repo/semantics/masterThesis |
| format |
masterThesis |
| dc.identifier.uri.none.fl_str_mv |
https://eprints.ucm.es/39325/ https://hdl.handle.net/20.500.14366/1781 |
| url |
https://eprints.ucm.es/39325/ https://hdl.handle.net/20.500.14366/1781 |
| dc.language.iso.es_PE.fl_str_mv |
spa |
| language |
spa |
| dc.rights.es_PE.fl_str_mv |
info:eu-repo/semantics/openAccess |
| eu_rights_str_mv |
openAccess |
| dc.format.none.fl_str_mv |
application/pdf |
| dc.publisher.es_PE.fl_str_mv |
Universidad Complutense de Madrid |
| dc.publisher.country.none.fl_str_mv |
ES |
| dc.source.es_PE.fl_str_mv |
Superintendencia Nacional de Educación Superior Universitaria - SUNEDU |
| dc.source.none.fl_str_mv |
reponame:Registro Nacional de Trabajos conducentes a Grados y Títulos - RENATI instname:Superintendencia Nacional de Educación Superior Universitaria instacron:SUNEDU |
| instname_str |
Superintendencia Nacional de Educación Superior Universitaria |
| instacron_str |
SUNEDU |
| institution |
SUNEDU |
| reponame_str |
Registro Nacional de Trabajos conducentes a Grados y Títulos - RENATI |
| collection |
Registro Nacional de Trabajos conducentes a Grados y Títulos - RENATI |
| dc.source.uri.es_PE.fl_str_mv |
Registro Nacional de Trabajos de Investigación - RENATI |
| bitstream.url.fl_str_mv |
https://repositorio.sunedu.gob.pe/backend/api/core/bitstreams/8c079bf5-055a-4821-842e-1d62e37886dd/download https://repositorio.sunedu.gob.pe/backend/api/core/bitstreams/2ff8c55f-cdad-4a27-9e37-4bf8d6e805f3/download https://repositorio.sunedu.gob.pe/backend/api/core/bitstreams/dc8e6864-0c82-4a5a-a984-55322c4fbfe9/download https://repositorio.sunedu.gob.pe/backend/api/core/bitstreams/cc1aee29-f77e-470e-850b-85f6cc216846/download https://repositorio.sunedu.gob.pe/backend/api/core/bitstreams/c59b045d-c1d5-4bf1-aa3e-33d843cd68dc/download https://repositorio.sunedu.gob.pe/backend/api/core/bitstreams/21bd679b-be1f-4300-ad0b-a4f082a78ba9/download https://repositorio.sunedu.gob.pe/backend/api/core/bitstreams/e04293e4-82ed-4c56-93ba-bee6306ec3f1/download |
| bitstream.checksum.fl_str_mv |
ce8a0d909f89758f0a9c6ffce9d7ce90 88c821816b5eb0eaa9a8018a2d89a9ec 8a4605be74aa9ea9d79846c1fba20a33 3df572306944240f6025900c6abca9fa ff4c8ff01d544500ea4bfea43e6108c1 f5c08968d0269f01ed1ac7cbbe427da7 c25339204c2a2be77c0a91aa93984fb2 |
| bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 MD5 MD5 MD5 MD5 |
| repository.name.fl_str_mv |
Repositorio de la Superintendencia Nacional de Educación Superior |
| repository.mail.fl_str_mv |
repositorio@sunedu.gob.pe |
| _version_ |
1859284922964901888 |
| spelling |
López López, María VictoriaMariscal Carhuamaca, Victor Hugo2020-03-25T19:25:34Z2020-03-25T19:25:34Z2016-09https://eprints.ucm.es/39325/https://hdl.handle.net/20.500.14366/1781El análisis de datos actual se enfrenta a problemas derivados de la combinación de datos procedentes de diversas fuentes de información. El valor de la información puede enriquecerse enormemente facilitando la integración de nuevas fuentes de datos y la industria es muy consciente de ello en la actualidad. Sin embargo, no solo el volumen sino también la gran diversidad de los datos constituye un problema previo al análisis. Una buena integración de los datos garantiza unos resultados fiables y por ello merece la pena detenerse en la mejora de procesos de especificación, recolección, limpieza e integración de los datos. Este trabajo está dedicado a la fase de limpieza e integración de datos analizando los procedimientos existentes y proponiendo una solución que se aplica a datos médicos, centrándose así en los proyectos de predicción (con finalidad de prevención) en ciencias de la salud. Además de la implementación de los procesos de limpieza, se desarrollan algoritmos de detección de outliers que permiten mejorar la calidad del conjunto de datos tras su eliminación. El trabajo también incluye la implementación de un proceso de predicción que sirva de ayuda a la toma de decisiones. Concretamente este trabajo realiza un análisis predictivo de los datos de pacientes drogodependientes de la Clínica Nuestra Señora de la Paz, con la finalidad de poder brindar un apoyo en la toma de decisiones del médico a cargo de admitir el internamiento de pacientes en dicha clínica. En la mayoría de los casos el estudio de los datos facilitados requiere un pre-procesado adecuado para que los resultados de los análisis estadísticos tradicionales sean fiables. En tal sentido en este trabajo se implementan varias formas de detectar los outliers: un algoritmo propio (Detección de Outliers con Cadenas No Monótonas), que utiliza las ventajas del algoritmo Knuth-Morris-Pratt para reconocimiento de patrones, y las librerías outliers y Rcmdr de R. La aplicación de procedimientos de cleaning e integración de datos, así como de eliminación de datos atípicos proporciona una base de datos limpia y fiable sobre la que se implementarán procedimientos de predicción de los datos con el algoritmo de clasificación Naive Bayes en R.The current data analysis faces problems arising from the combination of data from various sources. The value of information can be enhanced greatly facilitating the integration of new data sources and industry is well aware of it today. However, not only the volume but also the great diversity of data is a problem prior to analysis. A good integration of data ensures reliable results and therefore worth stopping in the specification process improvement, collecting, cleaning and data integration. This work is dedicated to the cleaning phase and data integration analyzing existing procedures and proposing a solution that applies to medical data, thus focusing on projects prediction (with purpose of prevention) in health sciences. In addition to the implementation of cleaning processes, develop algorithms of detection of outliers that allow improving the quality of the data set after being eliminated. The work also includes the implementation of a process of prediction that serve as an aid to decision-making. Specifically this work performs a predictive analysis of the data of patients drug addicts of the clinic Nuestra Señora de la Paz, in order to be able to offer support in decisions of the physician in charge admit the internment of patients in the clinic In the majority of cases the study of data provided requires a proper pre-procesado to traditional statistical analysis results to be reliable. So in this paper are implemented various ways to detect the outliers: an own algorithm (Detection of Outliers not monotonous chains), that uses the advantages of the algorithm Knuth-Morris-Pratt for pattern recognition, and the bookshops outliers and Rcmdr of R. The application of cleaning procedures and data integration and elimination of outliers provides a clean and reliable base data on which prediction procedures be implemented data with Naive Bayes classification algorithm in R.Perú. Programa Nacional de Becas y Crédito Educativo (Pronabec) : Beca Presidente de la RepúblicaTrabajo de investigaciónapplication/pdfspaUniversidad Complutense de MadridESinfo:eu-repo/semantics/openAccessSuperintendencia Nacional de Educación Superior Universitaria - SUNEDURegistro Nacional de Trabajos de Investigación - RENATIreponame:Registro Nacional de Trabajos conducentes a Grados y Títulos - RENATIinstname:Superintendencia Nacional de Educación Superior Universitariainstacron:SUNEDUIntegración de datos (Informática)Análisis de datosPrediccionesDrogodependenciaRegresión linealhttps://purl.org/pe-repo/ocde/ford#1.02.01Integración de datos y análisis predictivo en tratamiento de drogodependenciainfo:eu-repo/semantics/masterThesisIngeniería y tecnologíaUniversidad Complutense de Madrid. Facultad de InformáticaMaestríaMáster Universitario en Ingeniería Informáticahttps://purl.org/pe-repo/renati/level#maestrohttps://purl.org/pe-repo/renati/type#trabajoDeInvestigacionORIGINALMariscal_Carhuamaca_VH.pdfMariscal_Carhuamaca_VH.pdfTFM (abierto en repositorio de origen)application/pdf5259676https://repositorio.sunedu.gob.pe/backend/api/core/bitstreams/8c079bf5-055a-4821-842e-1d62e37886dd/downloadce8a0d909f89758f0a9c6ffce9d7ce90MD51trueAdministratorREADAutorizacion.pdfAutorizacion.pdfFormato de autorizaciónapplication/pdf812239https://repositorio.sunedu.gob.pe/backend/api/core/bitstreams/2ff8c55f-cdad-4a27-9e37-4bf8d6e805f3/download88c821816b5eb0eaa9a8018a2d89a9ecMD52falseAdministratorREADLICENSElicense.txtlicense.txttext/plain; charset=utf-81748https://repositorio.sunedu.gob.pe/backend/api/core/bitstreams/dc8e6864-0c82-4a5a-a984-55322c4fbfe9/download8a4605be74aa9ea9d79846c1fba20a33MD53falseAnonymousREADTEXTMariscal_Carhuamaca_VH.pdf.txtMariscal_Carhuamaca_VH.pdf.txtExtracted texttext/plain102155https://repositorio.sunedu.gob.pe/backend/api/core/bitstreams/cc1aee29-f77e-470e-850b-85f6cc216846/download3df572306944240f6025900c6abca9faMD58falseAdministratorREADAutorizacion.pdf.txtAutorizacion.pdf.txtExtracted texttext/plain4https://repositorio.sunedu.gob.pe/backend/api/core/bitstreams/c59b045d-c1d5-4bf1-aa3e-33d843cd68dc/downloadff4c8ff01d544500ea4bfea43e6108c1MD510falseAdministratorREADTHUMBNAILMariscal_Carhuamaca_VH.pdf.jpgMariscal_Carhuamaca_VH.pdf.jpgGenerated Thumbnailimage/jpeg22673https://repositorio.sunedu.gob.pe/backend/api/core/bitstreams/21bd679b-be1f-4300-ad0b-a4f082a78ba9/downloadf5c08968d0269f01ed1ac7cbbe427da7MD59falseAdministratorREADAutorizacion.pdf.jpgAutorizacion.pdf.jpgGenerated Thumbnailimage/jpeg33173https://repositorio.sunedu.gob.pe/backend/api/core/bitstreams/e04293e4-82ed-4c56-93ba-bee6306ec3f1/downloadc25339204c2a2be77c0a91aa93984fb2MD511falseAdministratorREAD20.500.14366/1781oai:repositorio.sunedu.gob.pe:20.500.14366/17812026-01-12T04:14:27.174109Zrestrictedhttps://repositorio.sunedu.gob.peRepositorio de la Superintendencia Nacional de Educación Superiorrepositorio@sunedu.gob.peTk9URTogUExBQ0UgWU9VUiBPV04gTElDRU5TRSBIRVJFClRoaXMgc2FtcGxlIGxpY2Vuc2UgaXMgcHJvdmlkZWQgZm9yIGluZm9ybWF0aW9uYWwgcHVycG9zZXMgb25seS4KCk5PTi1FWENMVVNJVkUgRElTVFJJQlVUSU9OIExJQ0VOU0UKCkJ5IHNpZ25pbmcgYW5kIHN1Ym1pdHRpbmcgdGhpcyBsaWNlbnNlLCB5b3UgKHRoZSBhdXRob3Iocykgb3IgY29weXJpZ2h0Cm93bmVyKSBncmFudHMgdG8gRFNwYWNlIFVuaXZlcnNpdHkgKERTVSkgdGhlIG5vbi1leGNsdXNpdmUgcmlnaHQgdG8gcmVwcm9kdWNlLAp0cmFuc2xhdGUgKGFzIGRlZmluZWQgYmVsb3cpLCBhbmQvb3IgZGlzdHJpYnV0ZSB5b3VyIHN1Ym1pc3Npb24gKGluY2x1ZGluZwp0aGUgYWJzdHJhY3QpIHdvcmxkd2lkZSBpbiBwcmludCBhbmQgZWxlY3Ryb25pYyBmb3JtYXQgYW5kIGluIGFueSBtZWRpdW0sCmluY2x1ZGluZyBidXQgbm90IGxpbWl0ZWQgdG8gYXVkaW8gb3IgdmlkZW8uCgpZb3UgYWdyZWUgdGhhdCBEU1UgbWF5LCB3aXRob3V0IGNoYW5naW5nIHRoZSBjb250ZW50LCB0cmFuc2xhdGUgdGhlCnN1Ym1pc3Npb24gdG8gYW55IG1lZGl1bSBvciBmb3JtYXQgZm9yIHRoZSBwdXJwb3NlIG9mIHByZXNlcnZhdGlvbi4KCllvdSBhbHNvIGFncmVlIHRoYXQgRFNVIG1heSBrZWVwIG1vcmUgdGhhbiBvbmUgY29weSBvZiB0aGlzIHN1Ym1pc3Npb24gZm9yCnB1cnBvc2VzIG9mIHNlY3VyaXR5LCBiYWNrLXVwIGFuZCBwcmVzZXJ2YXRpb24uCgpZb3UgcmVwcmVzZW50IHRoYXQgdGhlIHN1Ym1pc3Npb24gaXMgeW91ciBvcmlnaW5hbCB3b3JrLCBhbmQgdGhhdCB5b3UgaGF2ZQp0aGUgcmlnaHQgdG8gZ3JhbnQgdGhlIHJpZ2h0cyBjb250YWluZWQgaW4gdGhpcyBsaWNlbnNlLiBZb3UgYWxzbyByZXByZXNlbnQKdGhhdCB5b3VyIHN1Ym1pc3Npb24gZG9lcyBub3QsIHRvIHRoZSBiZXN0IG9mIHlvdXIga25vd2xlZGdlLCBpbmZyaW5nZSB1cG9uCmFueW9uZSdzIGNvcHlyaWdodC4KCklmIHRoZSBzdWJtaXNzaW9uIGNvbnRhaW5zIG1hdGVyaWFsIGZvciB3aGljaCB5b3UgZG8gbm90IGhvbGQgY29weXJpZ2h0LAp5b3UgcmVwcmVzZW50IHRoYXQgeW91IGhhdmUgb2J0YWluZWQgdGhlIHVucmVzdHJpY3RlZCBwZXJtaXNzaW9uIG9mIHRoZQpjb3B5cmlnaHQgb3duZXIgdG8gZ3JhbnQgRFNVIHRoZSByaWdodHMgcmVxdWlyZWQgYnkgdGhpcyBsaWNlbnNlLCBhbmQgdGhhdApzdWNoIHRoaXJkLXBhcnR5IG93bmVkIG1hdGVyaWFsIGlzIGNsZWFybHkgaWRlbnRpZmllZCBhbmQgYWNrbm93bGVkZ2VkCndpdGhpbiB0aGUgdGV4dCBvciBjb250ZW50IG9mIHRoZSBzdWJtaXNzaW9uLgoKSUYgVEhFIFNVQk1JU1NJT04gSVMgQkFTRUQgVVBPTiBXT1JLIFRIQVQgSEFTIEJFRU4gU1BPTlNPUkVEIE9SIFNVUFBPUlRFRApCWSBBTiBBR0VOQ1kgT1IgT1JHQU5JWkFUSU9OIE9USEVSIFRIQU4gRFNVLCBZT1UgUkVQUkVTRU5UIFRIQVQgWU9VIEhBVkUKRlVMRklMTEVEIEFOWSBSSUdIVCBPRiBSRVZJRVcgT1IgT1RIRVIgT0JMSUdBVElPTlMgUkVRVUlSRUQgQlkgU1VDSApDT05UUkFDVCBPUiBBR1JFRU1FTlQuCgpEU1Ugd2lsbCBjbGVhcmx5IGlkZW50aWZ5IHlvdXIgbmFtZShzKSBhcyB0aGUgYXV0aG9yKHMpIG9yIG93bmVyKHMpIG9mIHRoZQpzdWJtaXNzaW9uLCBhbmQgd2lsbCBub3QgbWFrZSBhbnkgYWx0ZXJhdGlvbiwgb3RoZXIgdGhhbiBhcyBhbGxvd2VkIGJ5IHRoaXMKbGljZW5zZSwgdG8geW91ciBzdWJtaXNzaW9uLgo= |
| score |
13.916713 |
Nota importante:
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).