Integración de datos y análisis predictivo en tratamiento de drogodependencia

Descripción del Articulo

El análisis de datos actual se enfrenta a problemas derivados de la combinación de datos procedentes de diversas fuentes de información. El valor de la información puede enriquecerse enormemente facilitando la integración de nuevas fuentes de datos y la industria es muy consciente de ello en la actu...

Descripción completa

Detalles Bibliográficos
Autor: Mariscal Carhuamaca, Victor Hugo
Formato: tesis de maestría
Fecha de Publicación:2016
Institución:Superintendencia Nacional de Educación Superior Universitaria
Repositorio:Registro Nacional de Trabajos conducentes a Grados y Títulos - RENATI
Lenguaje:español
OAI Identifier:oai:repositorio.sunedu.gob.pe:20.500.14366/1781
Enlace del recurso:https://eprints.ucm.es/39325/
https://hdl.handle.net/20.500.14366/1781
Nivel de acceso:acceso abierto
Materia:Integración de datos (Informática)
Análisis de datos
Predicciones
Drogodependencia
Regresión lineal
https://purl.org/pe-repo/ocde/ford#1.02.01
id RENATI_ed0ada3fa50e4b0fb83cd5bcb9109116
oai_identifier_str oai:repositorio.sunedu.gob.pe:20.500.14366/1781
network_acronym_str RENATI
network_name_str Registro Nacional de Trabajos conducentes a Grados y Títulos - RENATI
repository_id_str
dc.title.es_PE.fl_str_mv Integración de datos y análisis predictivo en tratamiento de drogodependencia
title Integración de datos y análisis predictivo en tratamiento de drogodependencia
spellingShingle Integración de datos y análisis predictivo en tratamiento de drogodependencia
Mariscal Carhuamaca, Victor Hugo
Integración de datos (Informática)
Análisis de datos
Predicciones
Drogodependencia
Regresión lineal
https://purl.org/pe-repo/ocde/ford#1.02.01
title_short Integración de datos y análisis predictivo en tratamiento de drogodependencia
title_full Integración de datos y análisis predictivo en tratamiento de drogodependencia
title_fullStr Integración de datos y análisis predictivo en tratamiento de drogodependencia
title_full_unstemmed Integración de datos y análisis predictivo en tratamiento de drogodependencia
title_sort Integración de datos y análisis predictivo en tratamiento de drogodependencia
author Mariscal Carhuamaca, Victor Hugo
author_facet Mariscal Carhuamaca, Victor Hugo
author_role author
dc.contributor.advisor.fl_str_mv López López, María Victoria
dc.contributor.author.fl_str_mv Mariscal Carhuamaca, Victor Hugo
dc.subject.es_PE.fl_str_mv Integración de datos (Informática)
Análisis de datos
Predicciones
Drogodependencia
Regresión lineal
topic Integración de datos (Informática)
Análisis de datos
Predicciones
Drogodependencia
Regresión lineal
https://purl.org/pe-repo/ocde/ford#1.02.01
dc.subject.ocde.none.fl_str_mv https://purl.org/pe-repo/ocde/ford#1.02.01
description El análisis de datos actual se enfrenta a problemas derivados de la combinación de datos procedentes de diversas fuentes de información. El valor de la información puede enriquecerse enormemente facilitando la integración de nuevas fuentes de datos y la industria es muy consciente de ello en la actualidad. Sin embargo, no solo el volumen sino también la gran diversidad de los datos constituye un problema previo al análisis. Una buena integración de los datos garantiza unos resultados fiables y por ello merece la pena detenerse en la mejora de procesos de especificación, recolección, limpieza e integración de los datos. Este trabajo está dedicado a la fase de limpieza e integración de datos analizando los procedimientos existentes y proponiendo una solución que se aplica a datos médicos, centrándose así en los proyectos de predicción (con finalidad de prevención) en ciencias de la salud. Además de la implementación de los procesos de limpieza, se desarrollan algoritmos de detección de outliers que permiten mejorar la calidad del conjunto de datos tras su eliminación. El trabajo también incluye la implementación de un proceso de predicción que sirva de ayuda a la toma de decisiones. Concretamente este trabajo realiza un análisis predictivo de los datos de pacientes drogodependientes de la Clínica Nuestra Señora de la Paz, con la finalidad de poder brindar un apoyo en la toma de decisiones del médico a cargo de admitir el internamiento de pacientes en dicha clínica. En la mayoría de los casos el estudio de los datos facilitados requiere un pre-procesado adecuado para que los resultados de los análisis estadísticos tradicionales sean fiables. En tal sentido en este trabajo se implementan varias formas de detectar los outliers: un algoritmo propio (Detección de Outliers con Cadenas No Monótonas), que utiliza las ventajas del algoritmo Knuth-Morris-Pratt para reconocimiento de patrones, y las librerías outliers y Rcmdr de R. La aplicación de procedimientos de cleaning e integración de datos, así como de eliminación de datos atípicos proporciona una base de datos limpia y fiable sobre la que se implementarán procedimientos de predicción de los datos con el algoritmo de clasificación Naive Bayes en R.
publishDate 2016
dc.date.accessioned.none.fl_str_mv 2020-03-25T19:25:34Z
dc.date.available.none.fl_str_mv 2020-03-25T19:25:34Z
dc.date.issued.fl_str_mv 2016-09
dc.type.es_PE.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
dc.identifier.uri.none.fl_str_mv https://eprints.ucm.es/39325/
https://hdl.handle.net/20.500.14366/1781
url https://eprints.ucm.es/39325/
https://hdl.handle.net/20.500.14366/1781
dc.language.iso.es_PE.fl_str_mv spa
language spa
dc.rights.es_PE.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.publisher.es_PE.fl_str_mv Universidad Complutense de Madrid
dc.publisher.country.none.fl_str_mv ES
dc.source.es_PE.fl_str_mv Superintendencia Nacional de Educación Superior Universitaria - SUNEDU
dc.source.none.fl_str_mv reponame:Registro Nacional de Trabajos conducentes a Grados y Títulos - RENATI
instname:Superintendencia Nacional de Educación Superior Universitaria
instacron:SUNEDU
instname_str Superintendencia Nacional de Educación Superior Universitaria
instacron_str SUNEDU
institution SUNEDU
reponame_str Registro Nacional de Trabajos conducentes a Grados y Títulos - RENATI
collection Registro Nacional de Trabajos conducentes a Grados y Títulos - RENATI
dc.source.uri.es_PE.fl_str_mv Registro Nacional de Trabajos de Investigación - RENATI
bitstream.url.fl_str_mv https://repositorio.sunedu.gob.pe/backend/api/core/bitstreams/8c079bf5-055a-4821-842e-1d62e37886dd/download
https://repositorio.sunedu.gob.pe/backend/api/core/bitstreams/2ff8c55f-cdad-4a27-9e37-4bf8d6e805f3/download
https://repositorio.sunedu.gob.pe/backend/api/core/bitstreams/dc8e6864-0c82-4a5a-a984-55322c4fbfe9/download
https://repositorio.sunedu.gob.pe/backend/api/core/bitstreams/cc1aee29-f77e-470e-850b-85f6cc216846/download
https://repositorio.sunedu.gob.pe/backend/api/core/bitstreams/c59b045d-c1d5-4bf1-aa3e-33d843cd68dc/download
https://repositorio.sunedu.gob.pe/backend/api/core/bitstreams/21bd679b-be1f-4300-ad0b-a4f082a78ba9/download
https://repositorio.sunedu.gob.pe/backend/api/core/bitstreams/e04293e4-82ed-4c56-93ba-bee6306ec3f1/download
bitstream.checksum.fl_str_mv ce8a0d909f89758f0a9c6ffce9d7ce90
88c821816b5eb0eaa9a8018a2d89a9ec
8a4605be74aa9ea9d79846c1fba20a33
3df572306944240f6025900c6abca9fa
ff4c8ff01d544500ea4bfea43e6108c1
f5c08968d0269f01ed1ac7cbbe427da7
c25339204c2a2be77c0a91aa93984fb2
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
MD5
MD5
MD5
MD5
repository.name.fl_str_mv Repositorio de la Superintendencia Nacional de Educación Superior
repository.mail.fl_str_mv repositorio@sunedu.gob.pe
_version_ 1859284922964901888
spelling López López, María VictoriaMariscal Carhuamaca, Victor Hugo2020-03-25T19:25:34Z2020-03-25T19:25:34Z2016-09https://eprints.ucm.es/39325/https://hdl.handle.net/20.500.14366/1781El análisis de datos actual se enfrenta a problemas derivados de la combinación de datos procedentes de diversas fuentes de información. El valor de la información puede enriquecerse enormemente facilitando la integración de nuevas fuentes de datos y la industria es muy consciente de ello en la actualidad. Sin embargo, no solo el volumen sino también la gran diversidad de los datos constituye un problema previo al análisis. Una buena integración de los datos garantiza unos resultados fiables y por ello merece la pena detenerse en la mejora de procesos de especificación, recolección, limpieza e integración de los datos. Este trabajo está dedicado a la fase de limpieza e integración de datos analizando los procedimientos existentes y proponiendo una solución que se aplica a datos médicos, centrándose así en los proyectos de predicción (con finalidad de prevención) en ciencias de la salud. Además de la implementación de los procesos de limpieza, se desarrollan algoritmos de detección de outliers que permiten mejorar la calidad del conjunto de datos tras su eliminación. El trabajo también incluye la implementación de un proceso de predicción que sirva de ayuda a la toma de decisiones. Concretamente este trabajo realiza un análisis predictivo de los datos de pacientes drogodependientes de la Clínica Nuestra Señora de la Paz, con la finalidad de poder brindar un apoyo en la toma de decisiones del médico a cargo de admitir el internamiento de pacientes en dicha clínica. En la mayoría de los casos el estudio de los datos facilitados requiere un pre-procesado adecuado para que los resultados de los análisis estadísticos tradicionales sean fiables. En tal sentido en este trabajo se implementan varias formas de detectar los outliers: un algoritmo propio (Detección de Outliers con Cadenas No Monótonas), que utiliza las ventajas del algoritmo Knuth-Morris-Pratt para reconocimiento de patrones, y las librerías outliers y Rcmdr de R. La aplicación de procedimientos de cleaning e integración de datos, así como de eliminación de datos atípicos proporciona una base de datos limpia y fiable sobre la que se implementarán procedimientos de predicción de los datos con el algoritmo de clasificación Naive Bayes en R.The current data analysis faces problems arising from the combination of data from various sources. The value of information can be enhanced greatly facilitating the integration of new data sources and industry is well aware of it today. However, not only the volume but also the great diversity of data is a problem prior to analysis. A good integration of data ensures reliable results and therefore worth stopping in the specification process improvement, collecting, cleaning and data integration. This work is dedicated to the cleaning phase and data integration analyzing existing procedures and proposing a solution that applies to medical data, thus focusing on projects prediction (with purpose of prevention) in health sciences. In addition to the implementation of cleaning processes, develop algorithms of detection of outliers that allow improving the quality of the data set after being eliminated. The work also includes the implementation of a process of prediction that serve as an aid to decision-making. Specifically this work performs a predictive analysis of the data of patients drug addicts of the clinic Nuestra Señora de la Paz, in order to be able to offer support in decisions of the physician in charge admit the internment of patients in the clinic In the majority of cases the study of data provided requires a proper pre-procesado to traditional statistical analysis results to be reliable. So in this paper are implemented various ways to detect the outliers: an own algorithm (Detection of Outliers not monotonous chains), that uses the advantages of the algorithm Knuth-Morris-Pratt for pattern recognition, and the bookshops outliers and Rcmdr of R. The application of cleaning procedures and data integration and elimination of outliers provides a clean and reliable base data on which prediction procedures be implemented data with Naive Bayes classification algorithm in R.Perú. Programa Nacional de Becas y Crédito Educativo (Pronabec) : Beca Presidente de la RepúblicaTrabajo de investigaciónapplication/pdfspaUniversidad Complutense de MadridESinfo:eu-repo/semantics/openAccessSuperintendencia Nacional de Educación Superior Universitaria - SUNEDURegistro Nacional de Trabajos de Investigación - RENATIreponame:Registro Nacional de Trabajos conducentes a Grados y Títulos - RENATIinstname:Superintendencia Nacional de Educación Superior Universitariainstacron:SUNEDUIntegración de datos (Informática)Análisis de datosPrediccionesDrogodependenciaRegresión linealhttps://purl.org/pe-repo/ocde/ford#1.02.01Integración de datos y análisis predictivo en tratamiento de drogodependenciainfo:eu-repo/semantics/masterThesisIngeniería y tecnologíaUniversidad Complutense de Madrid. Facultad de InformáticaMaestríaMáster Universitario en Ingeniería Informáticahttps://purl.org/pe-repo/renati/level#maestrohttps://purl.org/pe-repo/renati/type#trabajoDeInvestigacionORIGINALMariscal_Carhuamaca_VH.pdfMariscal_Carhuamaca_VH.pdfTFM (abierto en repositorio de origen)application/pdf5259676https://repositorio.sunedu.gob.pe/backend/api/core/bitstreams/8c079bf5-055a-4821-842e-1d62e37886dd/downloadce8a0d909f89758f0a9c6ffce9d7ce90MD51trueAdministratorREADAutorizacion.pdfAutorizacion.pdfFormato de autorizaciónapplication/pdf812239https://repositorio.sunedu.gob.pe/backend/api/core/bitstreams/2ff8c55f-cdad-4a27-9e37-4bf8d6e805f3/download88c821816b5eb0eaa9a8018a2d89a9ecMD52falseAdministratorREADLICENSElicense.txtlicense.txttext/plain; charset=utf-81748https://repositorio.sunedu.gob.pe/backend/api/core/bitstreams/dc8e6864-0c82-4a5a-a984-55322c4fbfe9/download8a4605be74aa9ea9d79846c1fba20a33MD53falseAnonymousREADTEXTMariscal_Carhuamaca_VH.pdf.txtMariscal_Carhuamaca_VH.pdf.txtExtracted texttext/plain102155https://repositorio.sunedu.gob.pe/backend/api/core/bitstreams/cc1aee29-f77e-470e-850b-85f6cc216846/download3df572306944240f6025900c6abca9faMD58falseAdministratorREADAutorizacion.pdf.txtAutorizacion.pdf.txtExtracted texttext/plain4https://repositorio.sunedu.gob.pe/backend/api/core/bitstreams/c59b045d-c1d5-4bf1-aa3e-33d843cd68dc/downloadff4c8ff01d544500ea4bfea43e6108c1MD510falseAdministratorREADTHUMBNAILMariscal_Carhuamaca_VH.pdf.jpgMariscal_Carhuamaca_VH.pdf.jpgGenerated Thumbnailimage/jpeg22673https://repositorio.sunedu.gob.pe/backend/api/core/bitstreams/21bd679b-be1f-4300-ad0b-a4f082a78ba9/downloadf5c08968d0269f01ed1ac7cbbe427da7MD59falseAdministratorREADAutorizacion.pdf.jpgAutorizacion.pdf.jpgGenerated Thumbnailimage/jpeg33173https://repositorio.sunedu.gob.pe/backend/api/core/bitstreams/e04293e4-82ed-4c56-93ba-bee6306ec3f1/downloadc25339204c2a2be77c0a91aa93984fb2MD511falseAdministratorREAD20.500.14366/1781oai:repositorio.sunedu.gob.pe:20.500.14366/17812026-01-12T04:14:27.174109Zrestrictedhttps://repositorio.sunedu.gob.peRepositorio de la Superintendencia Nacional de Educación Superiorrepositorio@sunedu.gob.peTk9URTogUExBQ0UgWU9VUiBPV04gTElDRU5TRSBIRVJFClRoaXMgc2FtcGxlIGxpY2Vuc2UgaXMgcHJvdmlkZWQgZm9yIGluZm9ybWF0aW9uYWwgcHVycG9zZXMgb25seS4KCk5PTi1FWENMVVNJVkUgRElTVFJJQlVUSU9OIExJQ0VOU0UKCkJ5IHNpZ25pbmcgYW5kIHN1Ym1pdHRpbmcgdGhpcyBsaWNlbnNlLCB5b3UgKHRoZSBhdXRob3Iocykgb3IgY29weXJpZ2h0Cm93bmVyKSBncmFudHMgdG8gRFNwYWNlIFVuaXZlcnNpdHkgKERTVSkgdGhlIG5vbi1leGNsdXNpdmUgcmlnaHQgdG8gcmVwcm9kdWNlLAp0cmFuc2xhdGUgKGFzIGRlZmluZWQgYmVsb3cpLCBhbmQvb3IgZGlzdHJpYnV0ZSB5b3VyIHN1Ym1pc3Npb24gKGluY2x1ZGluZwp0aGUgYWJzdHJhY3QpIHdvcmxkd2lkZSBpbiBwcmludCBhbmQgZWxlY3Ryb25pYyBmb3JtYXQgYW5kIGluIGFueSBtZWRpdW0sCmluY2x1ZGluZyBidXQgbm90IGxpbWl0ZWQgdG8gYXVkaW8gb3IgdmlkZW8uCgpZb3UgYWdyZWUgdGhhdCBEU1UgbWF5LCB3aXRob3V0IGNoYW5naW5nIHRoZSBjb250ZW50LCB0cmFuc2xhdGUgdGhlCnN1Ym1pc3Npb24gdG8gYW55IG1lZGl1bSBvciBmb3JtYXQgZm9yIHRoZSBwdXJwb3NlIG9mIHByZXNlcnZhdGlvbi4KCllvdSBhbHNvIGFncmVlIHRoYXQgRFNVIG1heSBrZWVwIG1vcmUgdGhhbiBvbmUgY29weSBvZiB0aGlzIHN1Ym1pc3Npb24gZm9yCnB1cnBvc2VzIG9mIHNlY3VyaXR5LCBiYWNrLXVwIGFuZCBwcmVzZXJ2YXRpb24uCgpZb3UgcmVwcmVzZW50IHRoYXQgdGhlIHN1Ym1pc3Npb24gaXMgeW91ciBvcmlnaW5hbCB3b3JrLCBhbmQgdGhhdCB5b3UgaGF2ZQp0aGUgcmlnaHQgdG8gZ3JhbnQgdGhlIHJpZ2h0cyBjb250YWluZWQgaW4gdGhpcyBsaWNlbnNlLiBZb3UgYWxzbyByZXByZXNlbnQKdGhhdCB5b3VyIHN1Ym1pc3Npb24gZG9lcyBub3QsIHRvIHRoZSBiZXN0IG9mIHlvdXIga25vd2xlZGdlLCBpbmZyaW5nZSB1cG9uCmFueW9uZSdzIGNvcHlyaWdodC4KCklmIHRoZSBzdWJtaXNzaW9uIGNvbnRhaW5zIG1hdGVyaWFsIGZvciB3aGljaCB5b3UgZG8gbm90IGhvbGQgY29weXJpZ2h0LAp5b3UgcmVwcmVzZW50IHRoYXQgeW91IGhhdmUgb2J0YWluZWQgdGhlIHVucmVzdHJpY3RlZCBwZXJtaXNzaW9uIG9mIHRoZQpjb3B5cmlnaHQgb3duZXIgdG8gZ3JhbnQgRFNVIHRoZSByaWdodHMgcmVxdWlyZWQgYnkgdGhpcyBsaWNlbnNlLCBhbmQgdGhhdApzdWNoIHRoaXJkLXBhcnR5IG93bmVkIG1hdGVyaWFsIGlzIGNsZWFybHkgaWRlbnRpZmllZCBhbmQgYWNrbm93bGVkZ2VkCndpdGhpbiB0aGUgdGV4dCBvciBjb250ZW50IG9mIHRoZSBzdWJtaXNzaW9uLgoKSUYgVEhFIFNVQk1JU1NJT04gSVMgQkFTRUQgVVBPTiBXT1JLIFRIQVQgSEFTIEJFRU4gU1BPTlNPUkVEIE9SIFNVUFBPUlRFRApCWSBBTiBBR0VOQ1kgT1IgT1JHQU5JWkFUSU9OIE9USEVSIFRIQU4gRFNVLCBZT1UgUkVQUkVTRU5UIFRIQVQgWU9VIEhBVkUKRlVMRklMTEVEIEFOWSBSSUdIVCBPRiBSRVZJRVcgT1IgT1RIRVIgT0JMSUdBVElPTlMgUkVRVUlSRUQgQlkgU1VDSApDT05UUkFDVCBPUiBBR1JFRU1FTlQuCgpEU1Ugd2lsbCBjbGVhcmx5IGlkZW50aWZ5IHlvdXIgbmFtZShzKSBhcyB0aGUgYXV0aG9yKHMpIG9yIG93bmVyKHMpIG9mIHRoZQpzdWJtaXNzaW9uLCBhbmQgd2lsbCBub3QgbWFrZSBhbnkgYWx0ZXJhdGlvbiwgb3RoZXIgdGhhbiBhcyBhbGxvd2VkIGJ5IHRoaXMKbGljZW5zZSwgdG8geW91ciBzdWJtaXNzaW9uLgo=
score 13.916713
Nota importante:
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).