Predicción de la demanda de pasajeros a clústeres de estaciones del Metropolitano usando métodos de Data Mining, la metodología Box-Jenkins y Sarima

Descripción del Articulo

The level of passenger demand for the Metropolitan service has increased and the planning called JICA, currently used, is not enough, causing the saturation of passengers in their 38 stations. According to experts and reports made by the Metropolitan Municipality of Lima and ProTransporte in 2018, c...

Descripción completa

Detalles Bibliográficos
Autor: Roque Rojas, Edwin
Formato: tesis de grado
Fecha de Publicación:2022
Institución:Universidad de Lima
Repositorio:ULIMA-Institucional
Lenguaje:español
OAI Identifier:oai:repositorio.ulima.edu.pe:20.500.12724/16675
Enlace del recurso:https://hdl.handle.net/20.500.12724/16675
Nivel de acceso:acceso abierto
Materia:Transporte de pasajeros
Minería de datos
Prospectiva
Transporte urbano
Passanger transport
Data mining
Forecasting
Urban transportation
Lima Metropolitana (Perú)
https://purl.org/pe-repo/ocde/ford#2.02.04
id RULI_662d50674f17ceb094d73054847f3941
oai_identifier_str oai:repositorio.ulima.edu.pe:20.500.12724/16675
network_acronym_str RULI
network_name_str ULIMA-Institucional
repository_id_str 3883
dc.title.es_PE.fl_str_mv Predicción de la demanda de pasajeros a clústeres de estaciones del Metropolitano usando métodos de Data Mining, la metodología Box-Jenkins y Sarima
title Predicción de la demanda de pasajeros a clústeres de estaciones del Metropolitano usando métodos de Data Mining, la metodología Box-Jenkins y Sarima
spellingShingle Predicción de la demanda de pasajeros a clústeres de estaciones del Metropolitano usando métodos de Data Mining, la metodología Box-Jenkins y Sarima
Roque Rojas, Edwin
Transporte de pasajeros
Minería de datos
Prospectiva
Transporte urbano
Passanger transport
Data mining
Forecasting
Urban transportation
Lima Metropolitana (Perú)
https://purl.org/pe-repo/ocde/ford#2.02.04
title_short Predicción de la demanda de pasajeros a clústeres de estaciones del Metropolitano usando métodos de Data Mining, la metodología Box-Jenkins y Sarima
title_full Predicción de la demanda de pasajeros a clústeres de estaciones del Metropolitano usando métodos de Data Mining, la metodología Box-Jenkins y Sarima
title_fullStr Predicción de la demanda de pasajeros a clústeres de estaciones del Metropolitano usando métodos de Data Mining, la metodología Box-Jenkins y Sarima
title_full_unstemmed Predicción de la demanda de pasajeros a clústeres de estaciones del Metropolitano usando métodos de Data Mining, la metodología Box-Jenkins y Sarima
title_sort Predicción de la demanda de pasajeros a clústeres de estaciones del Metropolitano usando métodos de Data Mining, la metodología Box-Jenkins y Sarima
author Roque Rojas, Edwin
author_facet Roque Rojas, Edwin
author_role author
dc.contributor.student.none.fl_str_mv 3
dc.contributor.advisor.fl_str_mv Cárdenas Garro, José Antonio
dc.contributor.author.fl_str_mv Roque Rojas, Edwin
dc.subject.es_PE.fl_str_mv Transporte de pasajeros
Minería de datos
Prospectiva
Transporte urbano
Passanger transport
Data mining
Forecasting
Urban transportation
Lima Metropolitana (Perú)
topic Transporte de pasajeros
Minería de datos
Prospectiva
Transporte urbano
Passanger transport
Data mining
Forecasting
Urban transportation
Lima Metropolitana (Perú)
https://purl.org/pe-repo/ocde/ford#2.02.04
dc.subject.ocde.none.fl_str_mv https://purl.org/pe-repo/ocde/ford#2.02.04
description The level of passenger demand for the Metropolitan service has increased and the planning called JICA, currently used, is not enough, causing the saturation of passengers in their 38 stations. According to experts and reports made by the Metropolitan Municipality of Lima and ProTransporte in 2018, claim that the maximum station capacity of 700,000 passengers was exceeded daily, which was planned, being twice as much as 2010 and suggesting updating demand planning. So, it was proposed to predict the passenger demand of station clusters using SARIMA from a spatio-temporal analysis using two data mining methods and the Box-Jenkins methodology to get the best possible model for cluster. The results of the spatio-temporal analysis showed similar behavior between stations when grouped into clusters with weekly seasonality. The models didn't make a correct prediction for the annual holidays, as they were interpreted as outlier´s values, so the demand that recorded these dates was replaced to make the models more accurate; finally getting good results with a RMSPE, MAPE and ¿ 2 between 6.37% - 8.13%, 4.19% - 5.93% y 0.91 - 0.98 respectively between the four models, below the ceiling for each forecast metric that was proposed as targets. Despite the problem, model predictions can be used to optimize the Metropolitan's resources in the distribution of its buses, adequately taking care of the demand that saturates its stations, not counting the annual holidays.
publishDate 2022
dc.date.accessioned.none.fl_str_mv 2022-10-04T20:13:17Z
dc.date.available.none.fl_str_mv 2022-10-04T20:13:17Z
dc.date.issued.fl_str_mv 2022
dc.type.none.fl_str_mv info:eu-repo/semantics/bachelorThesis
dc.type.other.none.fl_str_mv Tesis
format bachelorThesis
dc.identifier.citation.es_PE.fl_str_mv Roque Rojas, E. (2022). Predicción de la demanda de pasajeros a clústeres de estaciones del Metropolitano usando métodos de Data Mining, la metodología Box-Jenkins y Sarima [Tesis para optar el Título Profesional de Ingeniero de Sistemas, Universidad de Lima]. Repositorio institucional de la Universidad de Lima. https://hdl.handle.net/20.500.12724/16675
dc.identifier.uri.none.fl_str_mv https://hdl.handle.net/20.500.12724/16675
identifier_str_mv Roque Rojas, E. (2022). Predicción de la demanda de pasajeros a clústeres de estaciones del Metropolitano usando métodos de Data Mining, la metodología Box-Jenkins y Sarima [Tesis para optar el Título Profesional de Ingeniero de Sistemas, Universidad de Lima]. Repositorio institucional de la Universidad de Lima. https://hdl.handle.net/20.500.12724/16675
url https://hdl.handle.net/20.500.12724/16675
dc.language.iso.none.fl_str_mv spa
language spa
dc.relation.ispartof.fl_str_mv SUNEDU
dc.rights.*.fl_str_mv info:eu-repo/semantics/openAccess
dc.rights.uri.*.fl_str_mv https://creativecommons.org/licenses/by-nc-sa/4.0/
eu_rights_str_mv openAccess
rights_invalid_str_mv https://creativecommons.org/licenses/by-nc-sa/4.0/
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Universidad de Lima
dc.publisher.country.none.fl_str_mv PE
publisher.none.fl_str_mv Universidad de Lima
dc.source.es_PE.fl_str_mv Repositorio Institucional - Ulima
Universidad de Lima
dc.source.none.fl_str_mv reponame:ULIMA-Institucional
instname:Universidad de Lima
instacron:ULIMA
instname_str Universidad de Lima
instacron_str ULIMA
institution ULIMA
reponame_str ULIMA-Institucional
collection ULIMA-Institucional
bitstream.url.fl_str_mv https://repositorio.ulima.edu.pe/bitstream/20.500.12724/16675/2/license_rdf
https://repositorio.ulima.edu.pe/bitstream/20.500.12724/16675/4/Roque_Prediccion-demanda-pasajeros-clusteres.pdf.txt
https://repositorio.ulima.edu.pe/bitstream/20.500.12724/16675/6/Tesis.pdf.txt
https://repositorio.ulima.edu.pe/bitstream/20.500.12724/16675/3/license.txt
https://repositorio.ulima.edu.pe/bitstream/20.500.12724/16675/1/Tesis.pdf
https://repositorio.ulima.edu.pe/bitstream/20.500.12724/16675/5/Roque_Prediccion-demanda-pasajeros-clusteres.pdf.jpg
https://repositorio.ulima.edu.pe/bitstream/20.500.12724/16675/7/Tesis.pdf.jpg
bitstream.checksum.fl_str_mv 5a4ffbc01f1b5eb70a835dac0d501661
59e99fadcdec4cf66722726712668494
59e99fadcdec4cf66722726712668494
8a4605be74aa9ea9d79846c1fba20a33
480f79c7b0e7a5aacf506ae0ecf6baab
a283b7a3d5d35b2fd3d394ce493d2693
a283b7a3d5d35b2fd3d394ce493d2693
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
MD5
MD5
MD5
MD5
repository.name.fl_str_mv Repositorio Universidad de Lima
repository.mail.fl_str_mv repositorio@ulima.edu.pe
_version_ 1847246010746667008
spelling Cárdenas Garro, José AntonioRoque Rojas, Edwin32022-10-04T20:13:17Z2022-10-04T20:13:17Z2022Roque Rojas, E. (2022). Predicción de la demanda de pasajeros a clústeres de estaciones del Metropolitano usando métodos de Data Mining, la metodología Box-Jenkins y Sarima [Tesis para optar el Título Profesional de Ingeniero de Sistemas, Universidad de Lima]. Repositorio institucional de la Universidad de Lima. https://hdl.handle.net/20.500.12724/16675https://hdl.handle.net/20.500.12724/16675The level of passenger demand for the Metropolitan service has increased and the planning called JICA, currently used, is not enough, causing the saturation of passengers in their 38 stations. According to experts and reports made by the Metropolitan Municipality of Lima and ProTransporte in 2018, claim that the maximum station capacity of 700,000 passengers was exceeded daily, which was planned, being twice as much as 2010 and suggesting updating demand planning. So, it was proposed to predict the passenger demand of station clusters using SARIMA from a spatio-temporal analysis using two data mining methods and the Box-Jenkins methodology to get the best possible model for cluster. The results of the spatio-temporal analysis showed similar behavior between stations when grouped into clusters with weekly seasonality. The models didn't make a correct prediction for the annual holidays, as they were interpreted as outlier´s values, so the demand that recorded these dates was replaced to make the models more accurate; finally getting good results with a RMSPE, MAPE and ¿ 2 between 6.37% - 8.13%, 4.19% - 5.93% y 0.91 - 0.98 respectively between the four models, below the ceiling for each forecast metric that was proposed as targets. Despite the problem, model predictions can be used to optimize the Metropolitan's resources in the distribution of its buses, adequately taking care of the demand that saturates its stations, not counting the annual holidays.El nivel de demanda de pasajeros del servicio del Metropolitano ha aumentado y la planificación llamada JICA, actualmente utilizada, no es suficiente, causando saturación de pasajeros en sus 38 estaciones. Según expertos e informes realizados por la Municipalidad Metropolitana de Lima y ProTransporte en el 2018, afirman que se sobrepasó la capacidad máxima de estaciones de 700 mil pasajeros diariamente que se planificó, siendo el doble que el año 2010 y sugieren actualizar la planificación de demanda. Por lo que se propuso predecir la demanda de pasajeros en clústeres de estaciones usando SARIMA a partir de un análisis espacio-temporal usando dos métodos de data mining y la metodología Box-Jenkins para obtener el mejor modelo por clúster. Los resultados del análisis espacio temporal mostraron un comportamiento similar entre estaciones al agruparlos en clústeres con estacionalidad semanal. Los modelos no realizaron una predicción correcta para los días festivos anuales, ya que fueron interpretados como valores outliers, por lo que se reemplazó la demanda que registraron estas fechas para que los modelos fueran más precisos; obteniendo finalmente buenos resultados con un RMSPE, MAPE y ¿ entre un 6.37% - 8.13%, 4.19% - 5.93% y 0.91 - 0.98 respectivamente entre los modelos, estando por debajo del límite máximo en cada métrica de pronóstico que se propusieron como objetivos. A pesar del problema, las predicciones de los modelos pueden ser usados para optimizar los recursos del Metropolitano en la distribución de sus buses atendiendo adecuadamente la demanda que satura sus estaciones, sin contar los días festivos anuales.application/pdfspaUniversidad de LimaPEinfo:eu-repo/semantics/openAccesshttps://creativecommons.org/licenses/by-nc-sa/4.0/Repositorio Institucional - UlimaUniversidad de Limareponame:ULIMA-Institucionalinstname:Universidad de Limainstacron:ULIMATransporte de pasajerosMinería de datosProspectivaTransporte urbanoPassanger transportData miningForecastingUrban transportationLima Metropolitana (Perú)https://purl.org/pe-repo/ocde/ford#2.02.04Predicción de la demanda de pasajeros a clústeres de estaciones del Metropolitano usando métodos de Data Mining, la metodología Box-Jenkins y Sarimainfo:eu-repo/semantics/bachelorThesisTesisSUNEDUTítulo ProfesionalIngeniería de sistemasUniversidad de Lima. Facultad de Ingeniería y ArquitecturaIngeniero de sistemashttps://orcid.org/0000-0002-8343-25404719999361207675326051https://purl.org/pe-repo/renati/level#tituloProfesionalDavila Calle, Guillermo AntonioQuintana Cruz, Hermán AlejandroTeshima Guibu, Hiroaki Fernandohttps://purl.org/pe-repo/renati/type#tesisOICC-LICENSElicense_rdflicense_rdfapplication/rdf+xml; charset=utf-8914https://repositorio.ulima.edu.pe/bitstream/20.500.12724/16675/2/license_rdf5a4ffbc01f1b5eb70a835dac0d501661MD52TEXTRoque_Prediccion-demanda-pasajeros-clusteres.pdf.txtRoque_Prediccion-demanda-pasajeros-clusteres.pdf.txtExtracted texttext/plain70611https://repositorio.ulima.edu.pe/bitstream/20.500.12724/16675/4/Roque_Prediccion-demanda-pasajeros-clusteres.pdf.txt59e99fadcdec4cf66722726712668494MD54Tesis.pdf.txtTesis.pdf.txtExtracted texttext/plain70611https://repositorio.ulima.edu.pe/bitstream/20.500.12724/16675/6/Tesis.pdf.txt59e99fadcdec4cf66722726712668494MD56LICENSElicense.txtlicense.txttext/plain; charset=utf-81748https://repositorio.ulima.edu.pe/bitstream/20.500.12724/16675/3/license.txt8a4605be74aa9ea9d79846c1fba20a33MD53ORIGINALTesis.pdfTesis.pdfTesisapplication/pdf1713610https://repositorio.ulima.edu.pe/bitstream/20.500.12724/16675/1/Tesis.pdf480f79c7b0e7a5aacf506ae0ecf6baabMD51THUMBNAILRoque_Prediccion-demanda-pasajeros-clusteres.pdf.jpgRoque_Prediccion-demanda-pasajeros-clusteres.pdf.jpgGenerated Thumbnailimage/jpeg12648https://repositorio.ulima.edu.pe/bitstream/20.500.12724/16675/5/Roque_Prediccion-demanda-pasajeros-clusteres.pdf.jpga283b7a3d5d35b2fd3d394ce493d2693MD55Tesis.pdf.jpgTesis.pdf.jpgGenerated Thumbnailimage/jpeg12648https://repositorio.ulima.edu.pe/bitstream/20.500.12724/16675/7/Tesis.pdf.jpga283b7a3d5d35b2fd3d394ce493d2693MD5720.500.12724/16675oai:repositorio.ulima.edu.pe:20.500.12724/166752024-11-05 15:04:06.576Repositorio Universidad de Limarepositorio@ulima.edu.peTk9URTogUExBQ0UgWU9VUiBPV04gTElDRU5TRSBIRVJFClRoaXMgc2FtcGxlIGxpY2Vuc2UgaXMgcHJvdmlkZWQgZm9yIGluZm9ybWF0aW9uYWwgcHVycG9zZXMgb25seS4KCk5PTi1FWENMVVNJVkUgRElTVFJJQlVUSU9OIExJQ0VOU0UKCkJ5IHNpZ25pbmcgYW5kIHN1Ym1pdHRpbmcgdGhpcyBsaWNlbnNlLCB5b3UgKHRoZSBhdXRob3Iocykgb3IgY29weXJpZ2h0Cm93bmVyKSBncmFudHMgdG8gRFNwYWNlIFVuaXZlcnNpdHkgKERTVSkgdGhlIG5vbi1leGNsdXNpdmUgcmlnaHQgdG8gcmVwcm9kdWNlLAp0cmFuc2xhdGUgKGFzIGRlZmluZWQgYmVsb3cpLCBhbmQvb3IgZGlzdHJpYnV0ZSB5b3VyIHN1Ym1pc3Npb24gKGluY2x1ZGluZwp0aGUgYWJzdHJhY3QpIHdvcmxkd2lkZSBpbiBwcmludCBhbmQgZWxlY3Ryb25pYyBmb3JtYXQgYW5kIGluIGFueSBtZWRpdW0sCmluY2x1ZGluZyBidXQgbm90IGxpbWl0ZWQgdG8gYXVkaW8gb3IgdmlkZW8uCgpZb3UgYWdyZWUgdGhhdCBEU1UgbWF5LCB3aXRob3V0IGNoYW5naW5nIHRoZSBjb250ZW50LCB0cmFuc2xhdGUgdGhlCnN1Ym1pc3Npb24gdG8gYW55IG1lZGl1bSBvciBmb3JtYXQgZm9yIHRoZSBwdXJwb3NlIG9mIHByZXNlcnZhdGlvbi4KCllvdSBhbHNvIGFncmVlIHRoYXQgRFNVIG1heSBrZWVwIG1vcmUgdGhhbiBvbmUgY29weSBvZiB0aGlzIHN1Ym1pc3Npb24gZm9yCnB1cnBvc2VzIG9mIHNlY3VyaXR5LCBiYWNrLXVwIGFuZCBwcmVzZXJ2YXRpb24uCgpZb3UgcmVwcmVzZW50IHRoYXQgdGhlIHN1Ym1pc3Npb24gaXMgeW91ciBvcmlnaW5hbCB3b3JrLCBhbmQgdGhhdCB5b3UgaGF2ZQp0aGUgcmlnaHQgdG8gZ3JhbnQgdGhlIHJpZ2h0cyBjb250YWluZWQgaW4gdGhpcyBsaWNlbnNlLiBZb3UgYWxzbyByZXByZXNlbnQKdGhhdCB5b3VyIHN1Ym1pc3Npb24gZG9lcyBub3QsIHRvIHRoZSBiZXN0IG9mIHlvdXIga25vd2xlZGdlLCBpbmZyaW5nZSB1cG9uCmFueW9uZSdzIGNvcHlyaWdodC4KCklmIHRoZSBzdWJtaXNzaW9uIGNvbnRhaW5zIG1hdGVyaWFsIGZvciB3aGljaCB5b3UgZG8gbm90IGhvbGQgY29weXJpZ2h0LAp5b3UgcmVwcmVzZW50IHRoYXQgeW91IGhhdmUgb2J0YWluZWQgdGhlIHVucmVzdHJpY3RlZCBwZXJtaXNzaW9uIG9mIHRoZQpjb3B5cmlnaHQgb3duZXIgdG8gZ3JhbnQgRFNVIHRoZSByaWdodHMgcmVxdWlyZWQgYnkgdGhpcyBsaWNlbnNlLCBhbmQgdGhhdApzdWNoIHRoaXJkLXBhcnR5IG93bmVkIG1hdGVyaWFsIGlzIGNsZWFybHkgaWRlbnRpZmllZCBhbmQgYWNrbm93bGVkZ2VkCndpdGhpbiB0aGUgdGV4dCBvciBjb250ZW50IG9mIHRoZSBzdWJtaXNzaW9uLgoKSUYgVEhFIFNVQk1JU1NJT04gSVMgQkFTRUQgVVBPTiBXT1JLIFRIQVQgSEFTIEJFRU4gU1BPTlNPUkVEIE9SIFNVUFBPUlRFRApCWSBBTiBBR0VOQ1kgT1IgT1JHQU5JWkFUSU9OIE9USEVSIFRIQU4gRFNVLCBZT1UgUkVQUkVTRU5UIFRIQVQgWU9VIEhBVkUKRlVMRklMTEVEIEFOWSBSSUdIVCBPRiBSRVZJRVcgT1IgT1RIRVIgT0JMSUdBVElPTlMgUkVRVUlSRUQgQlkgU1VDSApDT05UUkFDVCBPUiBBR1JFRU1FTlQuCgpEU1Ugd2lsbCBjbGVhcmx5IGlkZW50aWZ5IHlvdXIgbmFtZShzKSBhcyB0aGUgYXV0aG9yKHMpIG9yIG93bmVyKHMpIG9mIHRoZQpzdWJtaXNzaW9uLCBhbmQgd2lsbCBub3QgbWFrZSBhbnkgYWx0ZXJhdGlvbiwgb3RoZXIgdGhhbiBhcyBhbGxvd2VkIGJ5IHRoaXMKbGljZW5zZSwgdG8geW91ciBzdWJtaXNzaW9uLgo=
score 12.884794
Nota importante:
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).