Numerische Wettervorhersagemodelle liefern physikalisch konsistente Vorhersagen über den Zustand der Atmosphäre. Obwohl Messungen im Prozess der Datenassimilation eingebunden werden, sind die Oberflächenvariablen dieser Modelle nicht auf einzelne Wetterstationen kalibriert, besonders in gebirgigen Regionen. Um solche kalibrierten Vorhersagen zu erlangen, ist eine statistische Nachbearbeitung der Modelldaten erforderlich, die diese mit den Stationsbeobachtungen verbindet. Die Frage, ob nichtlineare Interaktionen eine wesentliche Rolle in dieser Verbindung spielen, ist noch nicht abschließend geklärt. Künstliche neuronale Netzwerke - eine Klasse von statistischen Modellen, die in letzter Zeit für Rekordergebnisse in vielen Forschungsbereichen gesorgt haben - können diese Nicht-Linearitäten abbilden. Trotz der bedeutenden Veränderungen, die diese herausragenden Ergebnisse ermöglicht haben, wurden neuronale Netzwerke in den letzten Jahren wenig in der statistischen Nachbearbeitung von Wettermodelldaten verwendet. Um das Potential von neuronalen Netzwerken abzuschätzen, vergleiche ich in dieser Arbeit ein vorwärtsgerichtetes neuronales Netzwerk mit einem generalisierten linearen Modell, der regularisierten logistischen Regression, in einer klassischen Nachbearbeitungsaufgabe: die Vorhersage von dreistündiger Niederschlagswahrscheinlichkeit am Innsbrucker Flughafen für verschiedene Vorhersagehorizonte zwischen 3 und 144 Stunden mit bi-linear interpolierten Modelldaten des Europäischen Zentrums für mittelfristige Wettervorhersagen (ECMWF) zwischen 2012 und 2017. Das neuronale Netzwerk erreicht ein um (1.0 +- 0.1)% besseres Ergebnis (Brier skill score gemittelt über alle Vorhersagehorizonte) als die logistische Regression, jedoch mit einer etwa 220 mal längeren Trainingszeit. Auch mit einem reduzierten Trainingsdatensatz von einem statt fünf Jahren ist das neuronale Netzwerk genauer als die logistische Regression. Die Vorhersagen der beiden Modelle weisen eine hohe Korrelation von 0.974 miteinander auf. Die zehn für das neuronale Netzwerk wichtigsten Prediktorvariablen hängen entweder direkt mit dem Modellniederschlag zusammen oder mit der Entstehung und Präsenz von Wolken. Sieben dieser Variablen sind auch unter den wichtigsten Variablen für die logistische Regression. Wegen der eher geringen Leistungsverbesserung bezüglich der logistischen Regression und dem deutlich höheren Aufwand für Anpassung, Training und Interpretation des neuronalen Netzwerks, schließe ich, dass im gegebenen Fall das neuronale Netzwerk weniger geeignet ist als die regularisierte logistische Regression. Mit mehr Trainingsdaten, mehr Expertise in der Anpassung und im Training des Modells und ausgefeilteren Modellarchitekturen, bleiben neuronale Netzwerke trotzdem eine vielversprechende Option zur statistischen Nachbearbeitung von numerischen Wettervorhersagemodellen.
Titelaufnahme
- TitelStatistical post-processing of a numerical weather prediction model with neural networks / by Matthias Göbel
- Weitere TitelStatistische Nachbearbeitung eines numerischen Wettervorhersagemodells mit neuronalen Netzwerken
- verfasst von
- betreut von
- ErschienenInnsbruck, November 2018
- Umfangiv, 68 Seiten : Illustrationen, Diagramme
- AnmerkungAbweichender Titel laut Übersetzung der Verfasserin/des VerfassersKurzfassung in deutscher Sprache
- Datum der AbgabeNovember 2018
- SpracheEnglisch
- DokumenttypMasterarbeit
- Schlagwörter
- Schlagwörter (DE)
- Schlagwörter (EN)
- URN
- Das Dokument ist online verfügbar
- Nachweis
Numerical weather prediction models provide physically consistent forecasts of the state of the atmosphere. Although observations are taken into account in the process of data assimilation, the surface variables of these models are not calibrated for individual weather stations, especially in mountainous terrain. To obtain such calibrated forecasts, statistical post-processing of the model data is required, which establishes a link between the model output and the station observations. There is still debate on whether non-linear interactions play an essential role in this link. Artificial neural networks, a class of statistical models that have recently achieved record results in many research areas, can capture these non-linearities. Despite the major improvements that lead to these outstanding results, neural networks have not been used extensively for statistical post-processing of weather prediction models in recent years. To assess its potential, I compared a feed-forward neural network with a generalized linear model, the regularized logistic regression, on a classical post-processing task: forecasting 3-hourly probability of precipitation at Innsbruck Airport for lead times (forecast horizons) between 3 and 144 hours, given bi-linearly interpolated model data of the European Centre for Medium-Range Weather Forecasts between 2012 and 2017. The neural network outperforms the logistic regression by (1.0 +- 0.1)% (Brier skill score averaged over all lead times) but takes about 220 times longer to train. If the size of the training dataset is reduced from five years to one year, the neural network is still slightly more accurate than the logistic regression. The predictions of the two models are well correlated with each other with a correlation coefficient of 0.974. The ten predictor variables that are most important for the neural network are either directly related to precipitation or the formation and presence of clouds. Seven of these variables are also among the most important variables for the logistic regression. Due to the rather low performance gain compared with logistic regression and the considerably higher effort for tuning, training, and interpretation of the neural network, I conclude that, for the given set-up, neural networks are less suited than regularized logistic regression models. With more training data, more expertise in tuning and training the model and more sophisticated architectures, neural networks may, however, remain a promising option for statistical post-processing of numerical weather prediction models.
- Das PDF-Dokument wurde 322 mal heruntergeladen.