Wisergy-das Strompreisprognosemodell

Wisergy
3. März
8 Min. Lesezeit

1. Einleitung

Es besteht kein Zweifel daran, dass der Einfluss erneuerbarer Energien auf den Energiepreis erheblich ist. Eine berechtigte Frage lautet daher: wie groß ist der Einfluss erneuerbarer Energien auf den Preis? In diesem Dokument beschreiben wir das Wisergy-Modell, das diese Frage beantwortet und die Antwort nutzt, um Prognosen für den stündlichen Strompreis in Deutschland zu erstellen. Die Komplexität des Problems erfordert die Berücksichtigung einer Vielzahl von Faktoren, die sich laufend auf den Preis auswirken.

2. Vorgeschlagene Lösung (Das „Was“)

Der Strompreis eines Landes wird nahezu nie ausschließlich durch nationale Einflussfaktoren bestimmt. Für eine belastbare Analyse und Prognose ist es entscheidend, das Gesamtsystem zu betrachten und insbesondere die engen Wechselwirkungen mit den Nachbarländern einzubeziehen. Über grenzüberschreitende Stromflüsse, gekoppelte Märkte und gemeinsame Netzrestriktionen wirken sich Angebot und Nachfrage in einer Region oftmals unmittelbar auf die Preisbildung in einer anderen aus. In Phasen knapper Erzeugungskapazitäten oder hoher Last kann die Versorgung eines Landes temporär durch Importe aus benachbarten Märkten abgesichert werden – und umgekehrt. Diese gegenseitige Ausgleichsfunktion, verstärkt durch volatile erneuerbare Einspeisung, macht eine rein nationale Betrachtung unvollständig. Aus diesem Grund fokussieren wir uns nicht allein auf Deutschland, sondern berücksichtigen konsequent auch sämtliche angrenzenden Länder, um Marktmechanismen realitätsnah abzubilden und Prognosen robuster zu gestalten.

2.1. Sammlung und Eingabe

Die Eingangsdaten werden täglich vollautomatisiert über mehrere APIs zu definierten Zeitpunkten im Tagesverlauf erhoben, um Aktualität, Konsistenz und eine zuverlässige Datenverfügbarkeit sicherzustellen. Im ersten Schritt erfolgt der strukturierte Abruf von Wetterbeobachtungen der festgelegten Wetterstationen (siehe unten) sowie der dazugehörigen Wetterprognosen, da meteorologische Bedingungen einen wesentlichen Einfluss auf Erzeugung und Nachfrage haben. Im zweiten Schritt werden sämtliche relevanten regionalen und nationalen Feiertage erfasst, um kalendarische Effekte auf Lastprofile und Marktverhalten präzise abzubilden. Im dritten Schritt werden energiewirtschaftliche Kennzahlen gesammelt, insbesondere Daten zur Stromerzeugung und zum Verbrauch, die als zentrale Fundamentaldaten die Grundlage für eine robuste Modellierung und Prognose der Preisentwicklung bilden.

Abbildung 1. Kategorien der Eingangsdaten; Quelle: eigene Darstellung.

2.2. Die Auswahl der Wetterstationen für das Strompreisprognosemodell

Da sich die Verfügbarkeit aktiver Stationen täglich ändern kann, würde eine direkte Nutzung dieser dynamischen Stationsliste zu unnötiger Volatilität in den Eingangsdaten führen und damit die Stabilität sowie Reproduzierbarkeit des Modells beeinträchtigen. Um eine konsistente Datenbasis sicherzustellen, haben wir daher feste Messpunkte (Referenzstandorte) definiert, die dauerhaft unverändert bleiben.

Jedem dieser Messpunkte wird täglich automatisiert genau eine aktuell aktive Wetterstation zugeordnet. Dabei wird stets die geografisch nächstgelegene verfügbare Station ausgewählt, sodass eine möglichst hohe räumliche Repräsentativität gewährleistet ist – auch dann, wenn einzelne Stationen temporär ausfallen oder neu hinzukommen.

Im untenstehenden Beispiel sind insgesamt 261 aktive Wetterstationen dargestellt, von denen 116 für die Zuordnung herangezogen werden. Die blauen Kreise markieren die definierten Messpunkte, während die roten Punkte die jeweils aktiven Wetterstationen repräsentieren. Auf diese Weise bleibt die Struktur der Features stabil, während die Datenquellen flexibel auf die tägliche Verfügbarkeit der Stationen reagieren können.

Abbildung 2. Tägliche Zuordnung der Wetterstationen (rote Punkte) zu festgelegten Messpunkten (blaue Kreise);

Quelle: eigene Darstellung in Anlehnung an die Daten von DWD (2025)¹,² und MaStR (2025)³.

Die Messpunkte werden zu Beginn der Modellentwicklung einmalig und verbindlich festgelegt, um über die gesamte Laufzeit eine konsistente räumliche Abdeckung und damit stabile Eingangsdaten zu gewährleisten. Die Auswahl dieser Messpunkte erfolgt systematisch durch die Selektion geeigneter Standorte mit einem Abdeckungsradius von ca. 30–40 km je Punkt. Ziel ist es, mit einer begrenzten Anzahl an Messpunkten eine möglichst hohe Abdeckung der installierten Windleistung zu erzielen und damit die wesentlichen Erzeugungsschwerpunkte in Deutschland repräsentativ abzubilden.

Als Optimierungskriterium wird die maximale erfasste Nettonennleistung der deutschen Winderzeugung innerhalb dieser räumlichen Bedeckung herangezogen. Grundlage hierfür sind strukturierte Stammdaten zu sämtlichen registrierten Windkraftanlagen in Deutschland, einschließlich Brutto- und Nettonennleistung, Standortinformationen sowie weiteren anlagenspezifischen Merkmalen[4].

Durch diesen datengetriebenen Ansatz stellen wir sicher, dass die Messpunkte nicht zufällig gewählt sind, sondern die reale Anlagenverteilung und Leistungsstruktur des deutschen Windparks bestmöglich widerspiegeln.

2.3. Vorhersagetechnik

Wir wenden einfache (1) und rekursive (2) Prognosetechniken an. Ein einfacher Ansatz besteht aus einer Runde Training und einer anschließenden Prognose. Bei der rekursiven Vorhersage werden die Prognosen in 24-Stunden-Schritten erstellt. Das bedeutet, dass für 48-Stunden-Vorhersagen zwei Trainingsrunden auf folgende Weise durchgeführt werden: Training auf historischen Daten und Vorhersage der ersten 24-Stunden. Dann wird der neu vorhergesagte 24-Stunden-Bereich zum Trainingssatz hinzugefügt und das Modell erneut trainiert, um den Preis für die nächsten 24 Stunden vorherzusagen. Diese Technik erhöht die Vorhersagegenauigkeit bei höherer Rechenleistung.

Abbildung 3. Zeitliche Aufteilung in Modelltraining (blau) und Vorhersage (gelb);

Quelle: eigene Darstellung.

Im ersten Schritt werden die zentralen Fundamentaldaten für sämtliche Nachbarländer modelliert und prognostiziert – insbesondere Erzeugung und Netzlast. Damit bilden wir die grenzüberschreitenden Wechselwirkungen und die Kopplung der Strommärkte realitätsnah ab, bevor die Preis- und Marktdynamik für Deutschland abgeleitet wird.

Auf Basis dieser vorgelagerten Prognosen erfolgt im zweiten Schritt die Vorhersage für Deutschland (DE), wobei die zuvor berechneten Werte der Nachbarländer als wesentliche erklärende Einflussgrößen einfließen. Dieser zweistufige Ansatz erhöht die Robustheit der Ergebnisse und verbessert die Abbildung von Import-/Export-Effekten sowie regionalen Knappheitssituationen.

2.4. Hyperparameter-Abstimmung

Die Abstimmung von Hyperparametern ist ein wesentlicher Bestandteil des Modelltrainings. Hyperparameter sind jene Parameter, die man für das Modell im Vorhinein festlegt, um zu bestimmen, wie das Modell Vorhersagen macht. Bei der Abstimmung werden die Regularisierung, die Lernrate und weitere kritische Parameter ermittelt und festgesetzt, die Probleme der Verzerrung und Varianz während der Trainierung des Modells adressieren sollten. Als rechenintensivster Teil des Modells wird die Schulung sowohl bei der einfachen als auch bei der rekursiven Vorhersage einmal auf die gesamte Trainingsmenge angewandt.

Zur Sicherstellung einer hohen Prognosequalität und belastbarer Ergebnisse setzen wir bewährte Verfahren aus dem Machine-Learning- und Statistik-Umfeld ein. Dazu zählen insbesondere systematische Feature-Selektion, um die relevantesten Einflussgrößen zu identifizieren, Redundanzen zu reduzieren und die Modellkomplexität kontrolliert zu halten. Ergänzend nutzen wir N-fold Cross-Validation, um die Leistungsfähigkeit des Modells robust über mehrere Datenaufteilungen hinweg zu prüfen und eine stabile Generalisierungsfähigkeit sicherzustellen. Dieser methodische Ansatz minimiert das Risiko von Overfitting, erhöht die Transparenz der Modellentscheidung und sorgt dafür, dass die Ergebnisse auch unter wechselnden Marktbedingungen zuverlässig reproduzierbar bleiben.

Zeitliche Aufteilung Hyperparameter-Abstimmung

Abbildung 4. Zeitliche Aufteilung der Hyperparameter-Abstimmung via N-Fold Cross Validation in Trainingszeitraum (blau) und Vorhersage (gelb); Quelle: eigene Darstellung.

3. Prognosediagramm und wie man es liest

Die Prognosen werden täglich aktualisiert und auf unserer Website www.wisergy.com veröffentlicht. Abbildung 5 zeigt den stündlichen Vergleich des tatsächlichen Strompreises mit den Prognosen für 1 Tag, 2 Tage und 3 Tage.

Abbildung 5. Erstellte Grafik der 1-Tages-, 2-Tages- und 3-Tages-Vorhersage und tatsächliche Preise;

Quelle: eigene Darstellung.

Das Schema der Datentransformationen der Prognosen ist in Abbildung 6 dargestellt. Die ursprünglichen Prognosen werden täglich zunächst in der Darstellung (1) erstellt. In dieser granularen Form sind die Ergebnisse jedoch nur eingeschränkt geeignet, um sie übersichtlich zu visualisieren, zu kommunizieren oder konsistent zu interpretieren. Insbesondere die Zuordnung zu einzelnen Kalendertagen kann – abhängig von Startzeitpunkt, Zeitzonen- bzw. Tageswechseln und dem jeweiligen Forecast-Horizont – zu unnötiger Komplexität und potenziellen Missverständnissen führen.

Abbildung 6. Darstellung verschiedener Vorhersagehorizonte gegenüber dem tatsächlichen Preis;

Quelle: eigene Darstellung.

Um diese Komplikationen zu vermeiden, verwenden wir für die Aufbereitung und Darstellung standardmäßig die Form (2), also eine zusammengefasste Sicht über die Zeiträume D1 bis D8. Dieses Format ist deutlich intuitiver, leicht in Charts und Tabellen abzubilden und vermittelt dennoch präzise die intendierte Kernaussage der Prognose. Zusätzlich ermöglicht es eine klare Beschreibung der Ergebnisse ohne den Einsatz technischer Zeitindizes (T-Werte). Genau in dieser Form werden die Prognosen auch auf der Webseite sowie in den täglichen Morning-Emails dargestellt, um eine einheitliche und geschäftsorientierte Kommunikation sicherzustellen.

4. Prognosen der letzten 3 Monate und Beurteilung der Qualität

In diesem Abschnitt bewerten wir die stündlichen Strompreisprognosen. Die Analyse umfasst mehrere Kennzahlen zur Leistungsmessung und -interpretation. Die Kennzahlen werden für jeden Monat separat vom 01.12.2025 00:00 Uhr bis zum 18.02.2026 23:00 Uhr berechnet.

4.1. Ausmaß des Fehlers (MAE, RMSE)

Die typische Größe der Prognoseabweichungen wird in absoluten Werten (€/MWh) angegeben. Der MAE (Mean Absolute Error) beschreibt die durchschnittliche absolute Abweichung zwischen Prognose und tatsächlichem Preis und ist daher der intuitivste Indikator für die tägliche Genauigkeit.

Die Formel (1) zeigt, wie der MAE berechnet wird, wobei i den Prognosetag bezeichnet, für den die Kennzahl berechnet wird. Somit ist MAE¹ der mittlere absolute Fehler der Ein-Tages-Prognose, MAE² der der Zwei-Tages-Prognose und so weiter.

Abbildung 7 zeigt beispielsweise, dass der MAE¹ für Dezember 2025 bei 12,70 €/MWh liegt, während der MAE² für Februar 2026 bei 10,59 €/MWh liegt.

Aus Abbildung 7 geht hervor, dass sich der MAE mit zunehmender Prognosedauer verschlechtert. Dieses Verhalten lässt sich dadurch erklären, dass die Unsicherheiten sich über einen längeren Prognosezeitraum hinweg kumulieren und verstärken. Dies gilt insbesondere für die erklärenden Faktoren, die für die Strompreisprognosen verwendet werden.

Abbildung 7. Mean Absolute Error der 1-Tages-, 2-Tages- und 3-Tages-Vorhersagen gegenüber dem tatsächlichen Preis im Zeitraum von 01.12.2025 bis 18.02.2026;

Quelle: eigene Darstellung.

Der RMSE (Root Mean Squared Error) gewichtet größere Abweichungen stärker und wird verwendet, um das Risiko seltener, aber kostspieliger Fehlentwicklungen wie Preisspitzen oder abrupte Regimewechsel zu bewerten. Zusammen bieten MAE und RMSE ein ausgewogenes Bild: der MAE spiegelt das „normale” Leistungsniveau wider, während der RMSE die Sensitivität gegenüber Extremrisiken hervorhebt. Ein niedriger MAE-Wert deutet auf konsistent genaue Prognosen hin, während ein deutlich höherer RMSE-Wert signalisiert, dass extreme Preisbewegungen nach wie vor der Hauptgrund für die verbleibende Prognoseunsicherheit sind.

Aus Abbildung 8 geht hervor, dass der RMSE² für Dezember 2025 bei 20,25 €/MWh lag und der RMSE³ für Januar 2026 26,07 €/MWh betrug. Beim Vergleich von MAE und RMSE für Dezember 2025 und Januar 2026 ist der MAE in etwa gleich, während der RMSE für Januar 2026 höher ist als für Dezember 2025. Dies deutet darauf hin, dass der Preis im Januar 2026 volatiler war und die Prognosen der Preisspitzen näher am tatsächlichen Preis im Dezember 2025 lagen.

Abbildung 8. Root Mean Squared Error der 1-Tages-, 2-Tages- und 3-Tages-Vorhersagen gegenüber dem tatsächlichen Preis im Zeitraum von 01.12.2025 bis 18.02.2026;

Quelle: eigene Darstellung.

Es ist auch wichtig, die Bedeutung des RMSE im Verhältnis zum MAE zu erwähnen. In diesem Zusammenhang lässt sich aus Abbildung 7 und Abbildung 8 erkennen, dass dieses Verhältnis zwischen 1,35 und 1,66 variiert, was ein starkes Maß für die Qualität der Prognosen ist.

4.2. Relativer Fehler und Interpretierbarkeit (Fehlquote)

Absolute Fehler lassen sich schwerer vergleichen, wenn der Markt zwischen Niedrigpreis- und Hochpreisregimen wechselt. In diesem Abschnitt wird daher die Fehlquote als MAE im Verhältnis zum durchschnittlichen Preisniveau angegeben, um die Genauigkeit als prozentuale Größe auszudrücken. Die Kennzahl beantwortet eine praktische Frage: wie groß ist die typische Prognoseabweichung im Verhältnis zum Marktniveau, dem die Kunden ausgesetzt sind? Dadurch wird die Performance über Monate, Jahre oder Volatilitätsregime hinweg vergleichbar und die Interpretierbarkeit für die Budgetierung, Risikolimits und KPI-Berichterstattung verbessert. Eine im Zeitverlauf stabile Fehlquote deutet auf Robustheit in verschiedenen Preisumfeldern hin, während signifikante Anstiege in der Regel auf Perioden hinweisen, in denen sich die Marktdynamik schneller als in historischen Mustern verändert hat und eine genauere Überwachung oder zusätzliche Sicherheitsvorkehrungen erforderlich sind.

Beispielsweise ist in Abbildung 9 dargestellt, dass die Fehlquote² für Februar 2026 9,85 % beträgt. Dies ergibt sich, indem die MAE² für Februar 2026 (10,59 €/MWh) durch den Durchschnittspreis im Februar 2026 geteilt wird.

Abbildung 9. Relative Fehlerquote der 1-Tages-, 2-Tages- und 3-Tages-Vorhersagen gegenüber dem tatsächlichen Preis im Zeitraum von 01.12.2025 bis 18.02.2026; Quelle: eigene Darstellung.

Aus Abbildung 9 geht hervor, dass die Fehlquote im Dezember 2025 höher ist als im Januar 2026. Das bedeutet, dass der Preis im Januar 2026 zwar volatiler war, die Prognosen jedoch faktisch näher am tatsächlichen Preis im Januar 2026 lagen als im Dezember 2025. Somit liefert die Fehlquote wichtige Erkenntnisse über die Qualität der Prognosen.

Download pdf

[1] DWD (2025). Historische stündliche Stationsmessungen der Windstärke in Deutschland. DWD Climate Data Center (CDC). Online verfügbar unter: https://opendata.dwd.de/climate_environment/CDC/observations_germany/climate/hourly/wind/historical/FF_Stundenwerte_Beschreibung_Stationen.txt (abgerufen am: 13.05.2025).

[2] DWD (2025). MOSMIX Stationsparameterliste. Online verfügbar unter: https://www.dwd.de/DE/leistungen/met_verfahren_mosmix/mosmix_stationsparameterliste.xlsx (abgerufen am: 11.04.2025).

[3] Bundesnetzagentur für Elektrizität, Gas, Telekommunikation, Post und Eisenbahnen (BNetzA) (2025): Marktstammdatenregister (MaStR). Online verfügbar unter: https://www.marktstammdatenregister.de/MaStR/Datendownload (abgerufen am: 02.04.2025).

[4] Bundesnetzagentur für Elektrizität, Gas, Telekommunikation, Post und Eisenbahnen (BNetzA) (2025): Marktstammdatenregister (MaStR). Online unter: https://www.marktstammdatenregister.de/MaStR/ (abgerufen am: 02.04.2025)

Kommentare