Effect of the number of samples on parameter bias in closed-loop system identification with routine-operating data

Descripción del Articulo

In many industrial applications, system models are identified using routine closed-loop operating data. However, such data are often limited in length and variability due to operational constraints and feedback suppression, which challenge the reliability of parameter estimates. A key question there...

Descripción completa

Detalles Bibliográficos
Autor: Durand Solis, Jocelyn Alicia
Formato: tesis de maestría
Fecha de Publicación:2025
Institución:Pontificia Universidad Católica del Perú
Repositorio:PUCP-Tesis
Lenguaje:español
OAI Identifier:oai:tesis.pucp.edu.pe:20.500.12404/33025
Enlace del recurso:http://hdl.handle.net/20.500.12404/33025
Nivel de acceso:acceso abierto
Materia:Región de confianza
Sistemas de control por retroalimentación
Método de Montecarlo
Modelos matemáticos
https://purl.org/pe-repo/ocde/ford#2.00.00
id PUCP_7c28a64b2f65073c2e45627d8a5da5d0
oai_identifier_str oai:tesis.pucp.edu.pe:20.500.12404/33025
network_acronym_str PUCP
network_name_str PUCP-Tesis
repository_id_str .
dc.title.none.fl_str_mv Effect of the number of samples on parameter bias in closed-loop system identification with routine-operating data
title Effect of the number of samples on parameter bias in closed-loop system identification with routine-operating data
spellingShingle Effect of the number of samples on parameter bias in closed-loop system identification with routine-operating data
Durand Solis, Jocelyn Alicia
Región de confianza
Sistemas de control por retroalimentación
Método de Montecarlo
Modelos matemáticos
https://purl.org/pe-repo/ocde/ford#2.00.00
title_short Effect of the number of samples on parameter bias in closed-loop system identification with routine-operating data
title_full Effect of the number of samples on parameter bias in closed-loop system identification with routine-operating data
title_fullStr Effect of the number of samples on parameter bias in closed-loop system identification with routine-operating data
title_full_unstemmed Effect of the number of samples on parameter bias in closed-loop system identification with routine-operating data
title_sort Effect of the number of samples on parameter bias in closed-loop system identification with routine-operating data
author Durand Solis, Jocelyn Alicia
author_facet Durand Solis, Jocelyn Alicia
author_role author
dc.contributor.advisor.fl_str_mv Pérez Zuñiga, Carlos Gustavo
Shardt Wolchuk, Yuri Andri
dc.contributor.author.fl_str_mv Durand Solis, Jocelyn Alicia
dc.subject.none.fl_str_mv Región de confianza
Sistemas de control por retroalimentación
Método de Montecarlo
Modelos matemáticos
topic Región de confianza
Sistemas de control por retroalimentación
Método de Montecarlo
Modelos matemáticos
https://purl.org/pe-repo/ocde/ford#2.00.00
dc.subject.ocde.none.fl_str_mv https://purl.org/pe-repo/ocde/ford#2.00.00
description In many industrial applications, system models are identified using routine closed-loop operating data. However, such data are often limited in length and variability due to operational constraints and feedback suppression, which challenge the reliability of parameter estimates. A key question therefore arises: how many data points are needed to obtain trustworthy estimates when working with routine operating data? This thesis addresses this question by evaluating two complementary methods for constructing confidence regions of model parameters under closed-loop conditions with different data length. The first method is an empirical Monte Carlo approach, which estimates the parameters of the autoregres- sive with exogenous inputs (ARX) model through repeated simulations and applies kernel density estimation (KDE) to construct the empirical 95% confidence regions. The second method is the sign-perturbed sums (SPS) approach, which guarantees nonasymptotic confidence regions with exact coverage probability under the assumption of symmetric and independent noise. Using three first-order plus dead-time (FOPDT) process models and different noise levels, the thesis investigates how sample size and noise variance influence the accuracy and robustness of parameter estimates. The results show that classical asymptotic confidence intervals often underestimate uncer- tainty with small datasets, while SPS maintains valid coverage. Three-dimensional plots of the Monte Carlo results and a summary plot of the median versus data size indicate that, for the three plants studied, at least 2,000 samples are required to obtain accurate, approximately unbiased estimates with a 95% confidence region. Overlays of SPS and KDE confidence regions provide additional insight into bias. They suggest that it is possible to obtain 95% confidence regions with a dataset on the order of 2,000 samples too. The effect of noise variance was also examined. It was found that the controller was largely able to suppress its impact on system identification.
publishDate 2025
dc.date.created.none.fl_str_mv 2025
dc.date.accessioned.none.fl_str_mv 2026-01-30T14:30:51Z
dc.date.available.none.fl_str_mv 2026-01-30T14:30:51Z
dc.date.issued.fl_str_mv 2026-01-30
dc.type.none.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
dc.identifier.uri.none.fl_str_mv http://hdl.handle.net/20.500.12404/33025
url http://hdl.handle.net/20.500.12404/33025
dc.language.iso.none.fl_str_mv spa
language spa
dc.relation.ispartof.fl_str_mv SUNEDU
dc.rights.none.fl_str_mv info:eu-repo/semantics/openAccess
dc.rights.uri.none.fl_str_mv http://creativecommons.org/licenses/by/2.5/pe/
eu_rights_str_mv openAccess
rights_invalid_str_mv http://creativecommons.org/licenses/by/2.5/pe/
dc.publisher.es_ES.fl_str_mv Pontificia Universidad Católica del Perú
dc.publisher.country.none.fl_str_mv PE
dc.source.none.fl_str_mv reponame:PUCP-Tesis
instname:Pontificia Universidad Católica del Perú
instacron:PUCP
instname_str Pontificia Universidad Católica del Perú
instacron_str PUCP
institution PUCP
reponame_str PUCP-Tesis
collection PUCP-Tesis
bitstream.url.fl_str_mv https://tesis.pucp.edu.pe/bitstreams/7ffc6b74-8d1a-4903-8289-39900072b4c8/download
https://tesis.pucp.edu.pe/bitstreams/5b0e3dfe-5b04-4433-a24c-9f75dbf8aef4/download
https://tesis.pucp.edu.pe/bitstreams/78ad78bf-a5d5-479d-92fa-f86dea344357/download
https://tesis.pucp.edu.pe/bitstreams/828aa316-7d82-44df-a337-faa6cbd83460/download
https://tesis.pucp.edu.pe/bitstreams/426c6d95-6348-4095-bad0-d4e05679876d/download
https://tesis.pucp.edu.pe/bitstreams/46c35245-fdbb-45c6-b404-f7dd4ea5e6e1/download
https://tesis.pucp.edu.pe/bitstreams/dad2cc5c-6ade-4fbc-8c98-63fffde35bf1/download
https://tesis.pucp.edu.pe/bitstreams/2f063dce-92f0-491e-a085-719c964fc1e5/download
bitstream.checksum.fl_str_mv 3c326e768424c9d49da99bff980034ba
dbb7a6913ebfbeace54f52d513948d3e
48725b7f9a634bc551f52084693052d1
bb9bdc0b3349e4284e09149f943790b4
c11ad66fad3588b5a7b07592d93912df
12ab452c2e3dd0f08eaefb55ecd44bb9
799e406d9d7508cad93b9f224b55a4a4
c540c4ad51361db222df6e15de7dec7b
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
MD5
MD5
MD5
MD5
MD5
repository.name.fl_str_mv Repositorio de Tesis PUCP
repository.mail.fl_str_mv raul.sifuentes@pucp.pe
_version_ 1856298855174242304
spelling Pérez Zuñiga, Carlos GustavoShardt Wolchuk, Yuri AndriDurand Solis, Jocelyn Alicia2026-01-30T14:30:51Z2026-01-30T14:30:51Z20252026-01-30http://hdl.handle.net/20.500.12404/33025In many industrial applications, system models are identified using routine closed-loop operating data. However, such data are often limited in length and variability due to operational constraints and feedback suppression, which challenge the reliability of parameter estimates. A key question therefore arises: how many data points are needed to obtain trustworthy estimates when working with routine operating data? This thesis addresses this question by evaluating two complementary methods for constructing confidence regions of model parameters under closed-loop conditions with different data length. The first method is an empirical Monte Carlo approach, which estimates the parameters of the autoregres- sive with exogenous inputs (ARX) model through repeated simulations and applies kernel density estimation (KDE) to construct the empirical 95% confidence regions. The second method is the sign-perturbed sums (SPS) approach, which guarantees nonasymptotic confidence regions with exact coverage probability under the assumption of symmetric and independent noise. Using three first-order plus dead-time (FOPDT) process models and different noise levels, the thesis investigates how sample size and noise variance influence the accuracy and robustness of parameter estimates. The results show that classical asymptotic confidence intervals often underestimate uncer- tainty with small datasets, while SPS maintains valid coverage. Three-dimensional plots of the Monte Carlo results and a summary plot of the median versus data size indicate that, for the three plants studied, at least 2,000 samples are required to obtain accurate, approximately unbiased estimates with a 95% confidence region. Overlays of SPS and KDE confidence regions provide additional insight into bias. They suggest that it is possible to obtain 95% confidence regions with a dataset on the order of 2,000 samples too. The effect of noise variance was also examined. It was found that the controller was largely able to suppress its impact on system identification.In vielen industriellen Anwendungen werden Systemmodelle auf Basis von Daten identifiziert, die aus dem geschlossenen Regelkreis mit Festwertregelung stammen. Solche Daten sind jedoch aufgrund betrieblicher Einschränkungen und der Rückkopplung häufig sowohl in ihrer Länge als auch in ihrer Variabilität eingeschränkt, was die Verlässlichkeit der Parameterschätzungen beeinträchtigen kann. Daraus ergibt sich die zentrale Frage: Wie viele Datenpunkte sind erforderlich, um bei Daten von Festwertregelung vertrauenswürdige Parameterschätzungen zu erhalten? Diese Arbeit geht dieser Frage nach, indem zwei komplementäre Methoden zur Bestimmung von Vertrauensbereichen für Modellparameter im geschlossenen Regelkreis unter Festwertregelung mit unterschiedlichen Datengrößen untersucht werden. Die erste Methode ist ein empirischer Monte- Carlo-Ansatz, bei dem die Parameter eines autoregressiven Modells mit externen Eingängen (ARX) durch wiederholte Simulationen geschätzt und empirische 95%-Vertrauensbereiche mittels Kerndich- teschätzung (KDE) konstruiert werden. Die zweite Methode ist der Ansatz der Vorzeichen-gestörten Summen (SPS), der unter der Annahme von unabhängigem und symmetrischem Rauschen nichta- symptotische Vertrauensbereiche mit garantierter Abdeckwahrscheinlichkeit liefert. Die Auswirkungen von Stichprobengröße und Rauschvarianz auf die Genauigkeit und Robust- heit der Parameterschätzungen werden anhand von drei PT1-mit-Totzeit-Prozessmodellen und un- terschiedlichen Rauschpegeln untersucht. Die Ergebnisse zeigen, dass klassische asymptotische Ver- trauensintervalle bei kleinen Datensätzen die Unsicherheit häufig unterschätzen, während SPS eine gültige Abdeckung sicherstellt. Dreidimensionale Darstellungen der Monte-Carlo-Ergebnisse sowie eine Übersichtsabbildung des Medianwerts in Abhängigkeit von der Stichprobengröße deuten darauf hin, dass für die drei betrachteten Prozesse mindestens etwa 2 000 Datenpunkte pro ARX-Schätzung erforderlich sind, um akkurate Schätzungen mit einem 95%-Vertrauensbereich zu erhalten. Die Über- lagerungen von SPS- und KDE-Vertrauensbereichen liefert zusätzliche Einblicke in den Bias und legt nahe, dass auch mit Datensätzen auch im Bereich von 2 000 Stichproben Parameter mit einem 95%-Vertrauensbereich geschätzt werden können. Zudem wurde der Einfluss der Rauschvarianz un- tersucht. Der Regler unterdrückt diesen Effekt in der Systemidentifikation weitgehend.En muchas aplicaciones industriales, la identificación de sistemas de los modelos de los procesos se realizan con datos de operación rutinaria en lazo cerrado. Sin embargo, dichos datos suelen estar limitados en tamaño y variabilidad debido a restricciones de operación y a los efectos de la retroali- mentación. Esto dificulta la estimación confiable de los parámetros del proceso. Surge entonces una pregunta clave: ¿cuántos datos son necesarios para obtener estimaciones confiables cuando se trabaja con datos de operación rutinaria? Esta tesis aborda esta cuestión evaluando dos métodos complementarios para la construcción de regiones de confianza de los parámetros del modelo en condiciones de lazo cerrado con conjuntos de datos de diferente tamaño. El primer método consiste en la generación de varios conjuntos de datos con varias simulaciones de Monte Carlo, luego se procede con la estimación de los parámetros del modelo autorregresivo con entradas exógenas (ARX) y se aplica la estimación de densidad del núcleo (KDE) para construir y estimar regiones de confianza empíricas del 95%. El segundo método es el de sumas perturbadas por signo (SPS), que garantiza regiones de confianza no asintóticas con probabilidad de cobertura exacta, bajo la suposición de ruido simétrico e independiente. Utilizando tres modelos de proceso de primer orden con tiempo muerto (FOPDT) y diferentes niveles de ruido, la tesis investiga cómo el tamaño de la muestra y la varianza del ruido influyen en la precisión y la robustez de las estimaciones de parámetros. Los resultados muestran que los intervalos de confianza asintóticos clásicos suelen subestimar la incertidumbre con conjuntos de datos pequeños, mientras que SPS mantiene una cobertura válida. Gráficos tridimensionales de los resultados de Monte Carlo y un gráfico resumen de la mediana frente al tamaño de muestra indican que, para los tres procesos estudiados, se requieren al menos 2 000 muestras por ajuste ARX para obtener estimaciones precisas y aproximadamente insesgadas con una región de confianza del 95%. Las superposiciones de las regiones de confianza de SPS y KDE ofrecen información adicional sobre el sesgo y sugieren que también es posible obtener regiones de confianza del 95% con conjuntos de datos en el orden de las 2 000 muestras. También se examinó el efecto de la varianza del ruido, y se observó que el controlador suprime en gran medida su impacto en la identificación del sistema.spaPontificia Universidad Católica del PerúPEinfo:eu-repo/semantics/openAccesshttp://creativecommons.org/licenses/by/2.5/pe/Región de confianzaSistemas de control por retroalimentaciónMétodo de MontecarloModelos matemáticoshttps://purl.org/pe-repo/ocde/ford#2.00.00Effect of the number of samples on parameter bias in closed-loop system identification with routine-operating datainfo:eu-repo/semantics/masterThesisreponame:PUCP-Tesisinstname:Pontificia Universidad Católica del Perúinstacron:PUCPSUNEDUMaestro en Ingeniería de Control y AutomatizaciónMaestríaPontificia Universidad Católica del Perú. Escuela de Posgrado.Ingeniería de Control y Automatización41864666---https://orcid.org/0000-0001-5946-1395https://orcid.org/0000-0002-9311-773947116105712037Velasco Mellado, Luis AngelPérez Zuñiga, Carlos GustavoShardt Wolchuk, Yuri Andrihttps://purl.org/pe-repo/renati/level#maestrohttps://purl.org/pe-repo/renati/type#tesisORIGINALDURAND_SOLIS_JOCELYN_ALICIA_EFFECT_NUMBER.pdfDURAND_SOLIS_JOCELYN_ALICIA_EFFECT_NUMBER.pdfTexto completoapplication/pdf2801211https://tesis.pucp.edu.pe/bitstreams/7ffc6b74-8d1a-4903-8289-39900072b4c8/download3c326e768424c9d49da99bff980034baMD51trueAnonymousREADDURAND_SOLIS_JOCELYN_ALICIA_T.pdfDURAND_SOLIS_JOCELYN_ALICIA_T.pdfReporte de originalidadapplication/pdf28987758https://tesis.pucp.edu.pe/bitstreams/5b0e3dfe-5b04-4433-a24c-9f75dbf8aef4/downloaddbb7a6913ebfbeace54f52d513948d3eMD52falseAdministratorREADCC-LICENSElicense_rdflicense_rdfapplication/rdf+xml; charset=utf-81025https://tesis.pucp.edu.pe/bitstreams/78ad78bf-a5d5-479d-92fa-f86dea344357/download48725b7f9a634bc551f52084693052d1MD53falseAnonymousREADLICENSElicense.txtlicense.txttext/plain; charset=utf-81748https://tesis.pucp.edu.pe/bitstreams/828aa316-7d82-44df-a337-faa6cbd83460/downloadbb9bdc0b3349e4284e09149f943790b4MD54falseAnonymousREADTEXTDURAND_SOLIS_JOCELYN_ALICIA_EFFECT_NUMBER.pdf.txtDURAND_SOLIS_JOCELYN_ALICIA_EFFECT_NUMBER.pdf.txtExtracted texttext/plain164540https://tesis.pucp.edu.pe/bitstreams/426c6d95-6348-4095-bad0-d4e05679876d/downloadc11ad66fad3588b5a7b07592d93912dfMD55falseAnonymousREADDURAND_SOLIS_JOCELYN_ALICIA_T.pdf.txtDURAND_SOLIS_JOCELYN_ALICIA_T.pdf.txtExtracted texttext/plain8789https://tesis.pucp.edu.pe/bitstreams/46c35245-fdbb-45c6-b404-f7dd4ea5e6e1/download12ab452c2e3dd0f08eaefb55ecd44bb9MD57falseAdministratorREADTHUMBNAILDURAND_SOLIS_JOCELYN_ALICIA_EFFECT_NUMBER.pdf.jpgDURAND_SOLIS_JOCELYN_ALICIA_EFFECT_NUMBER.pdf.jpgGenerated Thumbnailimage/jpeg10951https://tesis.pucp.edu.pe/bitstreams/dad2cc5c-6ade-4fbc-8c98-63fffde35bf1/download799e406d9d7508cad93b9f224b55a4a4MD56falseAnonymousREADDURAND_SOLIS_JOCELYN_ALICIA_T.pdf.jpgDURAND_SOLIS_JOCELYN_ALICIA_T.pdf.jpgGenerated Thumbnailimage/jpeg6486https://tesis.pucp.edu.pe/bitstreams/2f063dce-92f0-491e-a085-719c964fc1e5/downloadc540c4ad51361db222df6e15de7dec7bMD58falseAdministratorREAD20.500.12404/33025oai:tesis.pucp.edu.pe:20.500.12404/330252026-02-02 09:28:12.883http://creativecommons.org/licenses/by/2.5/pe/info:eu-repo/semantics/openAccessopen.accesshttps://tesis.pucp.edu.peRepositorio de Tesis PUCPraul.sifuentes@pucp.peTk9URTogUExBQ0UgWU9VUiBPV04gTElDRU5TRSBIRVJFClRoaXMgc2FtcGxlIGxpY2Vuc2UgaXMgcHJvdmlkZWQgZm9yIGluZm9ybWF0aW9uYWwgcHVycG9zZXMgb25seS4KCk5PTi1FWENMVVNJVkUgRElTVFJJQlVUSU9OIExJQ0VOU0UKCkJ5IHNpZ25pbmcgYW5kIHN1Ym1pdHRpbmcgdGhpcyBsaWNlbnNlLCB5b3UgKHRoZSBhdXRob3Iocykgb3IgY29weXJpZ2h0IG93bmVyKSBncmFudHMgdG8gRFNwYWNlIFVuaXZlcnNpdHkgKERTVSkgdGhlIG5vbi1leGNsdXNpdmUgcmlnaHQgdG8gcmVwcm9kdWNlLCB0cmFuc2xhdGUgKGFzIGRlZmluZWQgYmVsb3cpLCBhbmQvb3IgZGlzdHJpYnV0ZSB5b3VyIHN1Ym1pc3Npb24gKGluY2x1ZGluZyB0aGUgYWJzdHJhY3QpIHdvcmxkd2lkZSBpbiBwcmludCBhbmQgZWxlY3Ryb25pYyBmb3JtYXQgYW5kIGluIGFueSBtZWRpdW0sIGluY2x1ZGluZyBidXQgbm90IGxpbWl0ZWQgdG8gYXVkaW8gb3IgdmlkZW8uCgpZb3UgYWdyZWUgdGhhdCBEU1UgbWF5LCB3aXRob3V0IGNoYW5naW5nIHRoZSBjb250ZW50LCB0cmFuc2xhdGUgdGhlIHN1Ym1pc3Npb24gdG8gYW55IG1lZGl1bSBvciBmb3JtYXQgZm9yIHRoZSBwdXJwb3NlIG9mIHByZXNlcnZhdGlvbi4KCllvdSBhbHNvIGFncmVlIHRoYXQgRFNVIG1heSBrZWVwIG1vcmUgdGhhbiBvbmUgY29weSBvZiB0aGlzIHN1Ym1pc3Npb24gZm9yIHB1cnBvc2VzIG9mIHNlY3VyaXR5LCBiYWNrLXVwIGFuZCBwcmVzZXJ2YXRpb24uCgpZb3UgcmVwcmVzZW50IHRoYXQgdGhlIHN1Ym1pc3Npb24gaXMgeW91ciBvcmlnaW5hbCB3b3JrLCBhbmQgdGhhdCB5b3UgaGF2ZSB0aGUgcmlnaHQgdG8gZ3JhbnQgdGhlIHJpZ2h0cyBjb250YWluZWQgaW4gdGhpcyBsaWNlbnNlLiBZb3UgYWxzbyByZXByZXNlbnQgdGhhdCB5b3VyIHN1Ym1pc3Npb24gZG9lcyBub3QsIHRvIHRoZSBiZXN0IG9mIHlvdXIga25vd2xlZGdlLCBpbmZyaW5nZSB1cG9uIGFueW9uZSdzIGNvcHlyaWdodC4KCklmIHRoZSBzdWJtaXNzaW9uIGNvbnRhaW5zIG1hdGVyaWFsIGZvciB3aGljaCB5b3UgZG8gbm90IGhvbGQgY29weXJpZ2h0LCB5b3UgcmVwcmVzZW50IHRoYXQgeW91IGhhdmUgb2J0YWluZWQgdGhlIHVucmVzdHJpY3RlZCBwZXJtaXNzaW9uIG9mIHRoZSBjb3B5cmlnaHQgb3duZXIgdG8gZ3JhbnQgRFNVIHRoZSByaWdodHMgcmVxdWlyZWQgYnkgdGhpcyBsaWNlbnNlLCBhbmQgdGhhdCBzdWNoIHRoaXJkLXBhcnR5IG93bmVkIG1hdGVyaWFsIGlzIGNsZWFybHkgaWRlbnRpZmllZCBhbmQgYWNrbm93bGVkZ2VkIHdpdGhpbiB0aGUgdGV4dCBvciBjb250ZW50IG9mIHRoZSBzdWJtaXNzaW9uLgoKSUYgVEhFIFNVQk1JU1NJT04gSVMgQkFTRUQgVVBPTiBXT1JLIFRIQVQgSEFTIEJFRU4gU1BPTlNPUkVEIE9SIFNVUFBPUlRFRCBCWSBBTiBBR0VOQ1kgT1IgT1JHQU5JWkFUSU9OIE9USEVSIFRIQU4gRFNVLCBZT1UgUkVQUkVTRU5UIFRIQVQgWU9VIEhBVkUgRlVMRklMTEVEIEFOWSBSSUdIVCBPRiBSRVZJRVcgT1IgT1RIRVIgT0JMSUdBVElPTlMgUkVRVUlSRUQgQlkgU1VDSCBDT05UUkFDVCBPUiBBR1JFRU1FTlQuCgpEU1Ugd2lsbCBjbGVhcmx5IGlkZW50aWZ5IHlvdXIgbmFtZShzKSBhcyB0aGUgYXV0aG9yKHMpIG9yIG93bmVyKHMpIG9mIHRoZSBzdWJtaXNzaW9uLCBhbmQgd2lsbCBub3QgbWFrZSBhbnkgYWx0ZXJhdGlvbiwgb3RoZXIgdGhhbiBhcyBhbGxvd2VkIGJ5IHRoaXMgbGljZW5zZSwgdG8geW91ciBzdWJtaXNzaW9uLgo=
score 13.927238
Nota importante:
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).