Integración de datos y análisis predictivo en tratamiento de drogodependencia

Descripción del Articulo

El análisis de datos actual se enfrenta a problemas derivados de la combinación de datos procedentes de diversas fuentes de información. El valor de la información puede enriquecerse enormemente facilitando la integración de nuevas fuentes de datos y la industria es muy consciente de ello en la actu...

Descripción completa

Detalles Bibliográficos
Autor: Mariscal Carhuamaca, Victor Hugo
Formato: tesis de maestría
Fecha de Publicación:2016
Institución:Superintendencia Nacional de Educación Superior Universitaria
Repositorio:Registro Nacional de Trabajos conducentes a Grados y Títulos - RENATI
Lenguaje:español
OAI Identifier:oai:renati.sunedu.gob.pe:renati/1245
Enlace del recurso:http://renati.sunedu.gob.pe/handle/sunedu/952182
https://eprints.ucm.es/39325/
Nivel de acceso:acceso abierto
Materia:Integración de datos (Informática)
Análisis de datos
Predicciones
Drogodependencia
Regresión lineal
http://purl.org/pe-repo/ocde/ford#1.02.01
id RENATI_1e096802af17b97b71967e2df60dcb5c
oai_identifier_str oai:renati.sunedu.gob.pe:renati/1245
network_acronym_str RENATI
network_name_str Registro Nacional de Trabajos conducentes a Grados y Títulos - RENATI
repository_id_str
dc.title.es_PE.fl_str_mv Integración de datos y análisis predictivo en tratamiento de drogodependencia
title Integración de datos y análisis predictivo en tratamiento de drogodependencia
spellingShingle Integración de datos y análisis predictivo en tratamiento de drogodependencia
Mariscal Carhuamaca, Victor Hugo
Integración de datos (Informática)
Análisis de datos
Predicciones
Drogodependencia
Regresión lineal
http://purl.org/pe-repo/ocde/ford#1.02.01
title_short Integración de datos y análisis predictivo en tratamiento de drogodependencia
title_full Integración de datos y análisis predictivo en tratamiento de drogodependencia
title_fullStr Integración de datos y análisis predictivo en tratamiento de drogodependencia
title_full_unstemmed Integración de datos y análisis predictivo en tratamiento de drogodependencia
title_sort Integración de datos y análisis predictivo en tratamiento de drogodependencia
author Mariscal Carhuamaca, Victor Hugo
author_facet Mariscal Carhuamaca, Victor Hugo
author_role author
dc.contributor.advisor.fl_str_mv López López, María Victoria
dc.contributor.author.fl_str_mv Mariscal Carhuamaca, Victor Hugo
dc.subject.es_PE.fl_str_mv Integración de datos (Informática)
Análisis de datos
Predicciones
Drogodependencia
Regresión lineal
topic Integración de datos (Informática)
Análisis de datos
Predicciones
Drogodependencia
Regresión lineal
http://purl.org/pe-repo/ocde/ford#1.02.01
dc.subject.ocde.none.fl_str_mv http://purl.org/pe-repo/ocde/ford#1.02.01
description El análisis de datos actual se enfrenta a problemas derivados de la combinación de datos procedentes de diversas fuentes de información. El valor de la información puede enriquecerse enormemente facilitando la integración de nuevas fuentes de datos y la industria es muy consciente de ello en la actualidad. Sin embargo, no solo el volumen sino también la gran diversidad de los datos constituye un problema previo al análisis. Una buena integración de los datos garantiza unos resultados fiables y por ello merece la pena detenerse en la mejora de procesos de especificación, recolección, limpieza e integración de los datos. Este trabajo está dedicado a la fase de limpieza e integración de datos analizando los procedimientos existentes y proponiendo una solución que se aplica a datos médicos, centrándose así en los proyectos de predicción (con finalidad de prevención) en ciencias de la salud. Además de la implementación de los procesos de limpieza, se desarrollan algoritmos de detección de outliers que permiten mejorar la calidad del conjunto de datos tras su eliminación. El trabajo también incluye la implementación de un proceso de predicción que sirva de ayuda a la toma de decisiones. Concretamente este trabajo realiza un análisis predictivo de los datos de pacientes drogodependientes de la Clínica Nuestra Señora de la Paz, con la finalidad de poder brindar un apoyo en la toma de decisiones del médico a cargo de admitir el internamiento de pacientes en dicha clínica. En la mayoría de los casos el estudio de los datos facilitados requiere un pre-procesado adecuado para que los resultados de los análisis estadísticos tradicionales sean fiables. En tal sentido en este trabajo se implementan varias formas de detectar los outliers: un algoritmo propio (Detección de Outliers con Cadenas No Monótonas), que utiliza las ventajas del algoritmo Knuth-Morris-Pratt para reconocimiento de patrones, y las librerías outliers y Rcmdr de R. La aplicación de procedimientos de cleaning e integración de datos, así como de eliminación de datos atípicos proporciona una base de datos limpia y fiable sobre la que se implementarán procedimientos de predicción de los datos con el algoritmo de clasificación Naive Bayes en R.
publishDate 2016
dc.date.accessioned.none.fl_str_mv 2020-03-25T19:25:34Z
dc.date.available.none.fl_str_mv 2020-03-25T19:25:34Z
dc.date.issued.fl_str_mv 2016-09
dc.type.es_PE.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
dc.identifier.uri.none.fl_str_mv http://renati.sunedu.gob.pe/handle/sunedu/952182
https://eprints.ucm.es/39325/
url http://renati.sunedu.gob.pe/handle/sunedu/952182
https://eprints.ucm.es/39325/
dc.language.iso.es_PE.fl_str_mv spa
language spa
dc.rights.es_PE.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.publisher.es_PE.fl_str_mv Universidad Complutense de Madrid
dc.publisher.country.none.fl_str_mv ES
dc.source.es_PE.fl_str_mv Superintendencia Nacional de Educación Superior Universitaria - SUNEDU
dc.source.none.fl_str_mv reponame:Registro Nacional de Trabajos conducentes a Grados y Títulos - RENATI
instname:Superintendencia Nacional de Educación Superior Universitaria
instacron:SUNEDU
instname_str Superintendencia Nacional de Educación Superior Universitaria
instacron_str SUNEDU
institution SUNEDU
reponame_str Registro Nacional de Trabajos conducentes a Grados y Títulos - RENATI
collection Registro Nacional de Trabajos conducentes a Grados y Títulos - RENATI
dc.source.uri.es_PE.fl_str_mv Registro Nacional de Trabajos de Investigación - RENATI
bitstream.url.fl_str_mv https://renati.sunedu.gob.pe/bitstream/renati/1245/1/Mariscal_Carhuamaca_VH.pdf
https://renati.sunedu.gob.pe/bitstream/renati/1245/2/Autorizacion.pdf
https://renati.sunedu.gob.pe/bitstream/renati/1245/3/license.txt
https://renati.sunedu.gob.pe/bitstream/renati/1245/4/Mariscal_Carhuamaca_VH.pdf.txt
https://renati.sunedu.gob.pe/bitstream/renati/1245/6/Autorizacion.pdf.txt
https://renati.sunedu.gob.pe/bitstream/renati/1245/5/Mariscal_Carhuamaca_VH.pdf.jpg
https://renati.sunedu.gob.pe/bitstream/renati/1245/7/Autorizacion.pdf.jpg
bitstream.checksum.fl_str_mv ce8a0d909f89758f0a9c6ffce9d7ce90
88c821816b5eb0eaa9a8018a2d89a9ec
8a4605be74aa9ea9d79846c1fba20a33
4d41aee387952894af79fdd69ca7b2ce
e1c06d85ae7b8b032bef47e42e4c08f9
b72e2e9392762d8e60bb2d17f76d81c4
d6e9c5c56bc836d9b3898e7af4abe450
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
MD5
MD5
MD5
MD5
repository.name.fl_str_mv Registro Nacional de Trabajos de Investigación
repository.mail.fl_str_mv renati@sunedu.gob.pe
_version_ 1816177342150606848
spelling López López, María VictoriaMariscal Carhuamaca, Victor Hugo2020-03-25T19:25:34Z2020-03-25T19:25:34Z2016-09http://renati.sunedu.gob.pe/handle/sunedu/952182https://eprints.ucm.es/39325/El análisis de datos actual se enfrenta a problemas derivados de la combinación de datos procedentes de diversas fuentes de información. El valor de la información puede enriquecerse enormemente facilitando la integración de nuevas fuentes de datos y la industria es muy consciente de ello en la actualidad. Sin embargo, no solo el volumen sino también la gran diversidad de los datos constituye un problema previo al análisis. Una buena integración de los datos garantiza unos resultados fiables y por ello merece la pena detenerse en la mejora de procesos de especificación, recolección, limpieza e integración de los datos. Este trabajo está dedicado a la fase de limpieza e integración de datos analizando los procedimientos existentes y proponiendo una solución que se aplica a datos médicos, centrándose así en los proyectos de predicción (con finalidad de prevención) en ciencias de la salud. Además de la implementación de los procesos de limpieza, se desarrollan algoritmos de detección de outliers que permiten mejorar la calidad del conjunto de datos tras su eliminación. El trabajo también incluye la implementación de un proceso de predicción que sirva de ayuda a la toma de decisiones. Concretamente este trabajo realiza un análisis predictivo de los datos de pacientes drogodependientes de la Clínica Nuestra Señora de la Paz, con la finalidad de poder brindar un apoyo en la toma de decisiones del médico a cargo de admitir el internamiento de pacientes en dicha clínica. En la mayoría de los casos el estudio de los datos facilitados requiere un pre-procesado adecuado para que los resultados de los análisis estadísticos tradicionales sean fiables. En tal sentido en este trabajo se implementan varias formas de detectar los outliers: un algoritmo propio (Detección de Outliers con Cadenas No Monótonas), que utiliza las ventajas del algoritmo Knuth-Morris-Pratt para reconocimiento de patrones, y las librerías outliers y Rcmdr de R. La aplicación de procedimientos de cleaning e integración de datos, así como de eliminación de datos atípicos proporciona una base de datos limpia y fiable sobre la que se implementarán procedimientos de predicción de los datos con el algoritmo de clasificación Naive Bayes en R.The current data analysis faces problems arising from the combination of data from various sources. The value of information can be enhanced greatly facilitating the integration of new data sources and industry is well aware of it today. However, not only the volume but also the great diversity of data is a problem prior to analysis. A good integration of data ensures reliable results and therefore worth stopping in the specification process improvement, collecting, cleaning and data integration. This work is dedicated to the cleaning phase and data integration analyzing existing procedures and proposing a solution that applies to medical data, thus focusing on projects prediction (with purpose of prevention) in health sciences. In addition to the implementation of cleaning processes, develop algorithms of detection of outliers that allow improving the quality of the data set after being eliminated. The work also includes the implementation of a process of prediction that serve as an aid to decision-making. Specifically this work performs a predictive analysis of the data of patients drug addicts of the clinic Nuestra Señora de la Paz, in order to be able to offer support in decisions of the physician in charge admit the internment of patients in the clinic In the majority of cases the study of data provided requires a proper pre-procesado to traditional statistical analysis results to be reliable. So in this paper are implemented various ways to detect the outliers: an own algorithm (Detection of Outliers not monotonous chains), that uses the advantages of the algorithm Knuth-Morris-Pratt for pattern recognition, and the bookshops outliers and Rcmdr of R. The application of cleaning procedures and data integration and elimination of outliers provides a clean and reliable base data on which prediction procedures be implemented data with Naive Bayes classification algorithm in R.Perú. Programa Nacional de Becas y Crédito Educativo (Pronabec) : Beca Presidente de la RepúblicaTrabajo de investigaciónapplication/pdfspaUniversidad Complutense de MadridESinfo:eu-repo/semantics/openAccessSuperintendencia Nacional de Educación Superior Universitaria - SUNEDURegistro Nacional de Trabajos de Investigación - RENATIreponame:Registro Nacional de Trabajos conducentes a Grados y Títulos - RENATIinstname:Superintendencia Nacional de Educación Superior Universitariainstacron:SUNEDUIntegración de datos (Informática)Análisis de datosPrediccionesDrogodependenciaRegresión linealhttp://purl.org/pe-repo/ocde/ford#1.02.01Integración de datos y análisis predictivo en tratamiento de drogodependenciainfo:eu-repo/semantics/masterThesisUniversidad Complutense de Madrid. Facultad de InformáticaIngeniería y tecnologíaMaestríaMáster Universitario en Ingeniería Informáticahttp://purl.org/pe-repo/renati/level#maestrohttp://purl.org/pe-repo/renati/type#trabajoDeInvestigacionORIGINALMariscal_Carhuamaca_VH.pdfMariscal_Carhuamaca_VH.pdfTFM (abierto en repositorio de origen)application/pdf5259676https://renati.sunedu.gob.pe/bitstream/renati/1245/1/Mariscal_Carhuamaca_VH.pdfce8a0d909f89758f0a9c6ffce9d7ce90MD51Autorizacion.pdfAutorizacion.pdfFormato de autorizaciónapplication/pdf812239https://renati.sunedu.gob.pe/bitstream/renati/1245/2/Autorizacion.pdf88c821816b5eb0eaa9a8018a2d89a9ecMD52LICENSElicense.txtlicense.txttext/plain; charset=utf-81748https://renati.sunedu.gob.pe/bitstream/renati/1245/3/license.txt8a4605be74aa9ea9d79846c1fba20a33MD53TEXTMariscal_Carhuamaca_VH.pdf.txtMariscal_Carhuamaca_VH.pdf.txtExtracted texttext/plain213158https://renati.sunedu.gob.pe/bitstream/renati/1245/4/Mariscal_Carhuamaca_VH.pdf.txt4d41aee387952894af79fdd69ca7b2ceMD54Autorizacion.pdf.txtAutorizacion.pdf.txtExtracted texttext/plain2https://renati.sunedu.gob.pe/bitstream/renati/1245/6/Autorizacion.pdf.txte1c06d85ae7b8b032bef47e42e4c08f9MD56THUMBNAILMariscal_Carhuamaca_VH.pdf.jpgMariscal_Carhuamaca_VH.pdf.jpgGenerated Thumbnailimage/jpeg1476https://renati.sunedu.gob.pe/bitstream/renati/1245/5/Mariscal_Carhuamaca_VH.pdf.jpgb72e2e9392762d8e60bb2d17f76d81c4MD55Autorizacion.pdf.jpgAutorizacion.pdf.jpgGenerated Thumbnailimage/jpeg1577https://renati.sunedu.gob.pe/bitstream/renati/1245/7/Autorizacion.pdf.jpgd6e9c5c56bc836d9b3898e7af4abe450MD57renati/1245oai:renati.sunedu.gob.pe:renati/12452020-09-21 12:08:48.085Registro Nacional de Trabajos de Investigaciónrenati@sunedu.gob.peTk9URTogUExBQ0UgWU9VUiBPV04gTElDRU5TRSBIRVJFClRoaXMgc2FtcGxlIGxpY2Vuc2UgaXMgcHJvdmlkZWQgZm9yIGluZm9ybWF0aW9uYWwgcHVycG9zZXMgb25seS4KCk5PTi1FWENMVVNJVkUgRElTVFJJQlVUSU9OIExJQ0VOU0UKCkJ5IHNpZ25pbmcgYW5kIHN1Ym1pdHRpbmcgdGhpcyBsaWNlbnNlLCB5b3UgKHRoZSBhdXRob3Iocykgb3IgY29weXJpZ2h0Cm93bmVyKSBncmFudHMgdG8gRFNwYWNlIFVuaXZlcnNpdHkgKERTVSkgdGhlIG5vbi1leGNsdXNpdmUgcmlnaHQgdG8gcmVwcm9kdWNlLAp0cmFuc2xhdGUgKGFzIGRlZmluZWQgYmVsb3cpLCBhbmQvb3IgZGlzdHJpYnV0ZSB5b3VyIHN1Ym1pc3Npb24gKGluY2x1ZGluZwp0aGUgYWJzdHJhY3QpIHdvcmxkd2lkZSBpbiBwcmludCBhbmQgZWxlY3Ryb25pYyBmb3JtYXQgYW5kIGluIGFueSBtZWRpdW0sCmluY2x1ZGluZyBidXQgbm90IGxpbWl0ZWQgdG8gYXVkaW8gb3IgdmlkZW8uCgpZb3UgYWdyZWUgdGhhdCBEU1UgbWF5LCB3aXRob3V0IGNoYW5naW5nIHRoZSBjb250ZW50LCB0cmFuc2xhdGUgdGhlCnN1Ym1pc3Npb24gdG8gYW55IG1lZGl1bSBvciBmb3JtYXQgZm9yIHRoZSBwdXJwb3NlIG9mIHByZXNlcnZhdGlvbi4KCllvdSBhbHNvIGFncmVlIHRoYXQgRFNVIG1heSBrZWVwIG1vcmUgdGhhbiBvbmUgY29weSBvZiB0aGlzIHN1Ym1pc3Npb24gZm9yCnB1cnBvc2VzIG9mIHNlY3VyaXR5LCBiYWNrLXVwIGFuZCBwcmVzZXJ2YXRpb24uCgpZb3UgcmVwcmVzZW50IHRoYXQgdGhlIHN1Ym1pc3Npb24gaXMgeW91ciBvcmlnaW5hbCB3b3JrLCBhbmQgdGhhdCB5b3UgaGF2ZQp0aGUgcmlnaHQgdG8gZ3JhbnQgdGhlIHJpZ2h0cyBjb250YWluZWQgaW4gdGhpcyBsaWNlbnNlLiBZb3UgYWxzbyByZXByZXNlbnQKdGhhdCB5b3VyIHN1Ym1pc3Npb24gZG9lcyBub3QsIHRvIHRoZSBiZXN0IG9mIHlvdXIga25vd2xlZGdlLCBpbmZyaW5nZSB1cG9uCmFueW9uZSdzIGNvcHlyaWdodC4KCklmIHRoZSBzdWJtaXNzaW9uIGNvbnRhaW5zIG1hdGVyaWFsIGZvciB3aGljaCB5b3UgZG8gbm90IGhvbGQgY29weXJpZ2h0LAp5b3UgcmVwcmVzZW50IHRoYXQgeW91IGhhdmUgb2J0YWluZWQgdGhlIHVucmVzdHJpY3RlZCBwZXJtaXNzaW9uIG9mIHRoZQpjb3B5cmlnaHQgb3duZXIgdG8gZ3JhbnQgRFNVIHRoZSByaWdodHMgcmVxdWlyZWQgYnkgdGhpcyBsaWNlbnNlLCBhbmQgdGhhdApzdWNoIHRoaXJkLXBhcnR5IG93bmVkIG1hdGVyaWFsIGlzIGNsZWFybHkgaWRlbnRpZmllZCBhbmQgYWNrbm93bGVkZ2VkCndpdGhpbiB0aGUgdGV4dCBvciBjb250ZW50IG9mIHRoZSBzdWJtaXNzaW9uLgoKSUYgVEhFIFNVQk1JU1NJT04gSVMgQkFTRUQgVVBPTiBXT1JLIFRIQVQgSEFTIEJFRU4gU1BPTlNPUkVEIE9SIFNVUFBPUlRFRApCWSBBTiBBR0VOQ1kgT1IgT1JHQU5JWkFUSU9OIE9USEVSIFRIQU4gRFNVLCBZT1UgUkVQUkVTRU5UIFRIQVQgWU9VIEhBVkUKRlVMRklMTEVEIEFOWSBSSUdIVCBPRiBSRVZJRVcgT1IgT1RIRVIgT0JMSUdBVElPTlMgUkVRVUlSRUQgQlkgU1VDSApDT05UUkFDVCBPUiBBR1JFRU1FTlQuCgpEU1Ugd2lsbCBjbGVhcmx5IGlkZW50aWZ5IHlvdXIgbmFtZShzKSBhcyB0aGUgYXV0aG9yKHMpIG9yIG93bmVyKHMpIG9mIHRoZQpzdWJtaXNzaW9uLCBhbmQgd2lsbCBub3QgbWFrZSBhbnkgYWx0ZXJhdGlvbiwgb3RoZXIgdGhhbiBhcyBhbGxvd2VkIGJ5IHRoaXMKbGljZW5zZSwgdG8geW91ciBzdWJtaXNzaW9uLgo=
score 13.905282
Nota importante:
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).