Integración de datos y análisis predictivo en tratamiento de drogodependencia
Descripción del Articulo
El análisis de datos actual se enfrenta a problemas derivados de la combinación de datos procedentes de diversas fuentes de información. El valor de la información puede enriquecerse enormemente facilitando la integración de nuevas fuentes de datos y la industria es muy consciente de ello en la actu...
| Autor: | |
|---|---|
| Formato: | tesis de maestría |
| Fecha de Publicación: | 2016 |
| Institución: | Superintendencia Nacional de Educación Superior Universitaria |
| Repositorio: | Registro Nacional de Trabajos conducentes a Grados y Títulos - RENATI |
| Lenguaje: | español |
| OAI Identifier: | oai:renati.sunedu.gob.pe:renati/1245 |
| Enlace del recurso: | http://renati.sunedu.gob.pe/handle/sunedu/952182 https://eprints.ucm.es/39325/ |
| Nivel de acceso: | acceso abierto |
| Materia: | Integración de datos (Informática) Análisis de datos Predicciones Drogodependencia Regresión lineal http://purl.org/pe-repo/ocde/ford#1.02.01 |
| id |
RENATI_1e096802af17b97b71967e2df60dcb5c |
|---|---|
| oai_identifier_str |
oai:renati.sunedu.gob.pe:renati/1245 |
| network_acronym_str |
RENATI |
| network_name_str |
Registro Nacional de Trabajos conducentes a Grados y Títulos - RENATI |
| repository_id_str |
|
| dc.title.es_PE.fl_str_mv |
Integración de datos y análisis predictivo en tratamiento de drogodependencia |
| title |
Integración de datos y análisis predictivo en tratamiento de drogodependencia |
| spellingShingle |
Integración de datos y análisis predictivo en tratamiento de drogodependencia Mariscal Carhuamaca, Victor Hugo Integración de datos (Informática) Análisis de datos Predicciones Drogodependencia Regresión lineal http://purl.org/pe-repo/ocde/ford#1.02.01 |
| title_short |
Integración de datos y análisis predictivo en tratamiento de drogodependencia |
| title_full |
Integración de datos y análisis predictivo en tratamiento de drogodependencia |
| title_fullStr |
Integración de datos y análisis predictivo en tratamiento de drogodependencia |
| title_full_unstemmed |
Integración de datos y análisis predictivo en tratamiento de drogodependencia |
| title_sort |
Integración de datos y análisis predictivo en tratamiento de drogodependencia |
| author |
Mariscal Carhuamaca, Victor Hugo |
| author_facet |
Mariscal Carhuamaca, Victor Hugo |
| author_role |
author |
| dc.contributor.advisor.fl_str_mv |
López López, María Victoria |
| dc.contributor.author.fl_str_mv |
Mariscal Carhuamaca, Victor Hugo |
| dc.subject.es_PE.fl_str_mv |
Integración de datos (Informática) Análisis de datos Predicciones Drogodependencia Regresión lineal |
| topic |
Integración de datos (Informática) Análisis de datos Predicciones Drogodependencia Regresión lineal http://purl.org/pe-repo/ocde/ford#1.02.01 |
| dc.subject.ocde.none.fl_str_mv |
http://purl.org/pe-repo/ocde/ford#1.02.01 |
| description |
El análisis de datos actual se enfrenta a problemas derivados de la combinación de datos procedentes de diversas fuentes de información. El valor de la información puede enriquecerse enormemente facilitando la integración de nuevas fuentes de datos y la industria es muy consciente de ello en la actualidad. Sin embargo, no solo el volumen sino también la gran diversidad de los datos constituye un problema previo al análisis. Una buena integración de los datos garantiza unos resultados fiables y por ello merece la pena detenerse en la mejora de procesos de especificación, recolección, limpieza e integración de los datos. Este trabajo está dedicado a la fase de limpieza e integración de datos analizando los procedimientos existentes y proponiendo una solución que se aplica a datos médicos, centrándose así en los proyectos de predicción (con finalidad de prevención) en ciencias de la salud. Además de la implementación de los procesos de limpieza, se desarrollan algoritmos de detección de outliers que permiten mejorar la calidad del conjunto de datos tras su eliminación. El trabajo también incluye la implementación de un proceso de predicción que sirva de ayuda a la toma de decisiones. Concretamente este trabajo realiza un análisis predictivo de los datos de pacientes drogodependientes de la Clínica Nuestra Señora de la Paz, con la finalidad de poder brindar un apoyo en la toma de decisiones del médico a cargo de admitir el internamiento de pacientes en dicha clínica. En la mayoría de los casos el estudio de los datos facilitados requiere un pre-procesado adecuado para que los resultados de los análisis estadísticos tradicionales sean fiables. En tal sentido en este trabajo se implementan varias formas de detectar los outliers: un algoritmo propio (Detección de Outliers con Cadenas No Monótonas), que utiliza las ventajas del algoritmo Knuth-Morris-Pratt para reconocimiento de patrones, y las librerías outliers y Rcmdr de R. La aplicación de procedimientos de cleaning e integración de datos, así como de eliminación de datos atípicos proporciona una base de datos limpia y fiable sobre la que se implementarán procedimientos de predicción de los datos con el algoritmo de clasificación Naive Bayes en R. |
| publishDate |
2016 |
| dc.date.accessioned.none.fl_str_mv |
2020-03-25T19:25:34Z |
| dc.date.available.none.fl_str_mv |
2020-03-25T19:25:34Z |
| dc.date.issued.fl_str_mv |
2016-09 |
| dc.type.es_PE.fl_str_mv |
info:eu-repo/semantics/masterThesis |
| format |
masterThesis |
| dc.identifier.uri.none.fl_str_mv |
http://renati.sunedu.gob.pe/handle/sunedu/952182 https://eprints.ucm.es/39325/ |
| url |
http://renati.sunedu.gob.pe/handle/sunedu/952182 https://eprints.ucm.es/39325/ |
| dc.language.iso.es_PE.fl_str_mv |
spa |
| language |
spa |
| dc.rights.es_PE.fl_str_mv |
info:eu-repo/semantics/openAccess |
| eu_rights_str_mv |
openAccess |
| dc.format.none.fl_str_mv |
application/pdf |
| dc.publisher.es_PE.fl_str_mv |
Universidad Complutense de Madrid |
| dc.publisher.country.none.fl_str_mv |
ES |
| dc.source.es_PE.fl_str_mv |
Superintendencia Nacional de Educación Superior Universitaria - SUNEDU |
| dc.source.none.fl_str_mv |
reponame:Registro Nacional de Trabajos conducentes a Grados y Títulos - RENATI instname:Superintendencia Nacional de Educación Superior Universitaria instacron:SUNEDU |
| instname_str |
Superintendencia Nacional de Educación Superior Universitaria |
| instacron_str |
SUNEDU |
| institution |
SUNEDU |
| reponame_str |
Registro Nacional de Trabajos conducentes a Grados y Títulos - RENATI |
| collection |
Registro Nacional de Trabajos conducentes a Grados y Títulos - RENATI |
| dc.source.uri.es_PE.fl_str_mv |
Registro Nacional de Trabajos de Investigación - RENATI |
| bitstream.url.fl_str_mv |
https://renati.sunedu.gob.pe/bitstream/renati/1245/1/Mariscal_Carhuamaca_VH.pdf https://renati.sunedu.gob.pe/bitstream/renati/1245/2/Autorizacion.pdf https://renati.sunedu.gob.pe/bitstream/renati/1245/3/license.txt https://renati.sunedu.gob.pe/bitstream/renati/1245/4/Mariscal_Carhuamaca_VH.pdf.txt https://renati.sunedu.gob.pe/bitstream/renati/1245/6/Autorizacion.pdf.txt https://renati.sunedu.gob.pe/bitstream/renati/1245/5/Mariscal_Carhuamaca_VH.pdf.jpg https://renati.sunedu.gob.pe/bitstream/renati/1245/7/Autorizacion.pdf.jpg |
| bitstream.checksum.fl_str_mv |
ce8a0d909f89758f0a9c6ffce9d7ce90 88c821816b5eb0eaa9a8018a2d89a9ec 8a4605be74aa9ea9d79846c1fba20a33 4d41aee387952894af79fdd69ca7b2ce e1c06d85ae7b8b032bef47e42e4c08f9 b72e2e9392762d8e60bb2d17f76d81c4 d6e9c5c56bc836d9b3898e7af4abe450 |
| bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 MD5 MD5 MD5 MD5 |
| repository.name.fl_str_mv |
Registro Nacional de Trabajos de Investigación |
| repository.mail.fl_str_mv |
renati@sunedu.gob.pe |
| _version_ |
1816177342150606848 |
| spelling |
López López, María VictoriaMariscal Carhuamaca, Victor Hugo2020-03-25T19:25:34Z2020-03-25T19:25:34Z2016-09http://renati.sunedu.gob.pe/handle/sunedu/952182https://eprints.ucm.es/39325/El análisis de datos actual se enfrenta a problemas derivados de la combinación de datos procedentes de diversas fuentes de información. El valor de la información puede enriquecerse enormemente facilitando la integración de nuevas fuentes de datos y la industria es muy consciente de ello en la actualidad. Sin embargo, no solo el volumen sino también la gran diversidad de los datos constituye un problema previo al análisis. Una buena integración de los datos garantiza unos resultados fiables y por ello merece la pena detenerse en la mejora de procesos de especificación, recolección, limpieza e integración de los datos. Este trabajo está dedicado a la fase de limpieza e integración de datos analizando los procedimientos existentes y proponiendo una solución que se aplica a datos médicos, centrándose así en los proyectos de predicción (con finalidad de prevención) en ciencias de la salud. Además de la implementación de los procesos de limpieza, se desarrollan algoritmos de detección de outliers que permiten mejorar la calidad del conjunto de datos tras su eliminación. El trabajo también incluye la implementación de un proceso de predicción que sirva de ayuda a la toma de decisiones. Concretamente este trabajo realiza un análisis predictivo de los datos de pacientes drogodependientes de la Clínica Nuestra Señora de la Paz, con la finalidad de poder brindar un apoyo en la toma de decisiones del médico a cargo de admitir el internamiento de pacientes en dicha clínica. En la mayoría de los casos el estudio de los datos facilitados requiere un pre-procesado adecuado para que los resultados de los análisis estadísticos tradicionales sean fiables. En tal sentido en este trabajo se implementan varias formas de detectar los outliers: un algoritmo propio (Detección de Outliers con Cadenas No Monótonas), que utiliza las ventajas del algoritmo Knuth-Morris-Pratt para reconocimiento de patrones, y las librerías outliers y Rcmdr de R. La aplicación de procedimientos de cleaning e integración de datos, así como de eliminación de datos atípicos proporciona una base de datos limpia y fiable sobre la que se implementarán procedimientos de predicción de los datos con el algoritmo de clasificación Naive Bayes en R.The current data analysis faces problems arising from the combination of data from various sources. The value of information can be enhanced greatly facilitating the integration of new data sources and industry is well aware of it today. However, not only the volume but also the great diversity of data is a problem prior to analysis. A good integration of data ensures reliable results and therefore worth stopping in the specification process improvement, collecting, cleaning and data integration. This work is dedicated to the cleaning phase and data integration analyzing existing procedures and proposing a solution that applies to medical data, thus focusing on projects prediction (with purpose of prevention) in health sciences. In addition to the implementation of cleaning processes, develop algorithms of detection of outliers that allow improving the quality of the data set after being eliminated. The work also includes the implementation of a process of prediction that serve as an aid to decision-making. Specifically this work performs a predictive analysis of the data of patients drug addicts of the clinic Nuestra Señora de la Paz, in order to be able to offer support in decisions of the physician in charge admit the internment of patients in the clinic In the majority of cases the study of data provided requires a proper pre-procesado to traditional statistical analysis results to be reliable. So in this paper are implemented various ways to detect the outliers: an own algorithm (Detection of Outliers not monotonous chains), that uses the advantages of the algorithm Knuth-Morris-Pratt for pattern recognition, and the bookshops outliers and Rcmdr of R. The application of cleaning procedures and data integration and elimination of outliers provides a clean and reliable base data on which prediction procedures be implemented data with Naive Bayes classification algorithm in R.Perú. Programa Nacional de Becas y Crédito Educativo (Pronabec) : Beca Presidente de la RepúblicaTrabajo de investigaciónapplication/pdfspaUniversidad Complutense de MadridESinfo:eu-repo/semantics/openAccessSuperintendencia Nacional de Educación Superior Universitaria - SUNEDURegistro Nacional de Trabajos de Investigación - RENATIreponame:Registro Nacional de Trabajos conducentes a Grados y Títulos - RENATIinstname:Superintendencia Nacional de Educación Superior Universitariainstacron:SUNEDUIntegración de datos (Informática)Análisis de datosPrediccionesDrogodependenciaRegresión linealhttp://purl.org/pe-repo/ocde/ford#1.02.01Integración de datos y análisis predictivo en tratamiento de drogodependenciainfo:eu-repo/semantics/masterThesisUniversidad Complutense de Madrid. Facultad de InformáticaIngeniería y tecnologíaMaestríaMáster Universitario en Ingeniería Informáticahttp://purl.org/pe-repo/renati/level#maestrohttp://purl.org/pe-repo/renati/type#trabajoDeInvestigacionORIGINALMariscal_Carhuamaca_VH.pdfMariscal_Carhuamaca_VH.pdfTFM (abierto en repositorio de origen)application/pdf5259676https://renati.sunedu.gob.pe/bitstream/renati/1245/1/Mariscal_Carhuamaca_VH.pdfce8a0d909f89758f0a9c6ffce9d7ce90MD51Autorizacion.pdfAutorizacion.pdfFormato de autorizaciónapplication/pdf812239https://renati.sunedu.gob.pe/bitstream/renati/1245/2/Autorizacion.pdf88c821816b5eb0eaa9a8018a2d89a9ecMD52LICENSElicense.txtlicense.txttext/plain; charset=utf-81748https://renati.sunedu.gob.pe/bitstream/renati/1245/3/license.txt8a4605be74aa9ea9d79846c1fba20a33MD53TEXTMariscal_Carhuamaca_VH.pdf.txtMariscal_Carhuamaca_VH.pdf.txtExtracted texttext/plain213158https://renati.sunedu.gob.pe/bitstream/renati/1245/4/Mariscal_Carhuamaca_VH.pdf.txt4d41aee387952894af79fdd69ca7b2ceMD54Autorizacion.pdf.txtAutorizacion.pdf.txtExtracted texttext/plain2https://renati.sunedu.gob.pe/bitstream/renati/1245/6/Autorizacion.pdf.txte1c06d85ae7b8b032bef47e42e4c08f9MD56THUMBNAILMariscal_Carhuamaca_VH.pdf.jpgMariscal_Carhuamaca_VH.pdf.jpgGenerated Thumbnailimage/jpeg1476https://renati.sunedu.gob.pe/bitstream/renati/1245/5/Mariscal_Carhuamaca_VH.pdf.jpgb72e2e9392762d8e60bb2d17f76d81c4MD55Autorizacion.pdf.jpgAutorizacion.pdf.jpgGenerated Thumbnailimage/jpeg1577https://renati.sunedu.gob.pe/bitstream/renati/1245/7/Autorizacion.pdf.jpgd6e9c5c56bc836d9b3898e7af4abe450MD57renati/1245oai:renati.sunedu.gob.pe:renati/12452020-09-21 12:08:48.085Registro Nacional de Trabajos de Investigaciónrenati@sunedu.gob.peTk9URTogUExBQ0UgWU9VUiBPV04gTElDRU5TRSBIRVJFClRoaXMgc2FtcGxlIGxpY2Vuc2UgaXMgcHJvdmlkZWQgZm9yIGluZm9ybWF0aW9uYWwgcHVycG9zZXMgb25seS4KCk5PTi1FWENMVVNJVkUgRElTVFJJQlVUSU9OIExJQ0VOU0UKCkJ5IHNpZ25pbmcgYW5kIHN1Ym1pdHRpbmcgdGhpcyBsaWNlbnNlLCB5b3UgKHRoZSBhdXRob3Iocykgb3IgY29weXJpZ2h0Cm93bmVyKSBncmFudHMgdG8gRFNwYWNlIFVuaXZlcnNpdHkgKERTVSkgdGhlIG5vbi1leGNsdXNpdmUgcmlnaHQgdG8gcmVwcm9kdWNlLAp0cmFuc2xhdGUgKGFzIGRlZmluZWQgYmVsb3cpLCBhbmQvb3IgZGlzdHJpYnV0ZSB5b3VyIHN1Ym1pc3Npb24gKGluY2x1ZGluZwp0aGUgYWJzdHJhY3QpIHdvcmxkd2lkZSBpbiBwcmludCBhbmQgZWxlY3Ryb25pYyBmb3JtYXQgYW5kIGluIGFueSBtZWRpdW0sCmluY2x1ZGluZyBidXQgbm90IGxpbWl0ZWQgdG8gYXVkaW8gb3IgdmlkZW8uCgpZb3UgYWdyZWUgdGhhdCBEU1UgbWF5LCB3aXRob3V0IGNoYW5naW5nIHRoZSBjb250ZW50LCB0cmFuc2xhdGUgdGhlCnN1Ym1pc3Npb24gdG8gYW55IG1lZGl1bSBvciBmb3JtYXQgZm9yIHRoZSBwdXJwb3NlIG9mIHByZXNlcnZhdGlvbi4KCllvdSBhbHNvIGFncmVlIHRoYXQgRFNVIG1heSBrZWVwIG1vcmUgdGhhbiBvbmUgY29weSBvZiB0aGlzIHN1Ym1pc3Npb24gZm9yCnB1cnBvc2VzIG9mIHNlY3VyaXR5LCBiYWNrLXVwIGFuZCBwcmVzZXJ2YXRpb24uCgpZb3UgcmVwcmVzZW50IHRoYXQgdGhlIHN1Ym1pc3Npb24gaXMgeW91ciBvcmlnaW5hbCB3b3JrLCBhbmQgdGhhdCB5b3UgaGF2ZQp0aGUgcmlnaHQgdG8gZ3JhbnQgdGhlIHJpZ2h0cyBjb250YWluZWQgaW4gdGhpcyBsaWNlbnNlLiBZb3UgYWxzbyByZXByZXNlbnQKdGhhdCB5b3VyIHN1Ym1pc3Npb24gZG9lcyBub3QsIHRvIHRoZSBiZXN0IG9mIHlvdXIga25vd2xlZGdlLCBpbmZyaW5nZSB1cG9uCmFueW9uZSdzIGNvcHlyaWdodC4KCklmIHRoZSBzdWJtaXNzaW9uIGNvbnRhaW5zIG1hdGVyaWFsIGZvciB3aGljaCB5b3UgZG8gbm90IGhvbGQgY29weXJpZ2h0LAp5b3UgcmVwcmVzZW50IHRoYXQgeW91IGhhdmUgb2J0YWluZWQgdGhlIHVucmVzdHJpY3RlZCBwZXJtaXNzaW9uIG9mIHRoZQpjb3B5cmlnaHQgb3duZXIgdG8gZ3JhbnQgRFNVIHRoZSByaWdodHMgcmVxdWlyZWQgYnkgdGhpcyBsaWNlbnNlLCBhbmQgdGhhdApzdWNoIHRoaXJkLXBhcnR5IG93bmVkIG1hdGVyaWFsIGlzIGNsZWFybHkgaWRlbnRpZmllZCBhbmQgYWNrbm93bGVkZ2VkCndpdGhpbiB0aGUgdGV4dCBvciBjb250ZW50IG9mIHRoZSBzdWJtaXNzaW9uLgoKSUYgVEhFIFNVQk1JU1NJT04gSVMgQkFTRUQgVVBPTiBXT1JLIFRIQVQgSEFTIEJFRU4gU1BPTlNPUkVEIE9SIFNVUFBPUlRFRApCWSBBTiBBR0VOQ1kgT1IgT1JHQU5JWkFUSU9OIE9USEVSIFRIQU4gRFNVLCBZT1UgUkVQUkVTRU5UIFRIQVQgWU9VIEhBVkUKRlVMRklMTEVEIEFOWSBSSUdIVCBPRiBSRVZJRVcgT1IgT1RIRVIgT0JMSUdBVElPTlMgUkVRVUlSRUQgQlkgU1VDSApDT05UUkFDVCBPUiBBR1JFRU1FTlQuCgpEU1Ugd2lsbCBjbGVhcmx5IGlkZW50aWZ5IHlvdXIgbmFtZShzKSBhcyB0aGUgYXV0aG9yKHMpIG9yIG93bmVyKHMpIG9mIHRoZQpzdWJtaXNzaW9uLCBhbmQgd2lsbCBub3QgbWFrZSBhbnkgYWx0ZXJhdGlvbiwgb3RoZXIgdGhhbiBhcyBhbGxvd2VkIGJ5IHRoaXMKbGljZW5zZSwgdG8geW91ciBzdWJtaXNzaW9uLgo= |
| score |
13.905282 |
Nota importante:
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).