Data Science für bessere Datenqualität in der Digitalisierung der Fernwärme
Das kürzlich abgeschlossene Projekt untersuchte die Verknüpfung von Daten und Berechnungsmethoden im Fernwärmesektor und konnte spannende Ergebnisse generieren. AEE INTEC und das Forschungszentrum Know-Center, das auf Data Science-Methoden spezialisiert ist, arbeiteten in diesem Projekt interdisziplinär zusammen.
Datengetriebene Analyse-, Prognose- und Fehlerdetektionsmethoden bieten vielfältige Möglichkeiten zur Optimierung des Fernwärmenetzbetriebs. Dafür kommen Machine Learning Techniken wie Neuronale Netzwerke, Support Vector Machine oder regressionsbasierte Verfahren zum Einsatz, die wissenschaftlich gut erforscht und validiert sind. Die Anwendung dieser Techniken setzt jedoch Daten in einer entsprechenden Qualität voraus.
Die vorhandene Datenbasis kann aufgrund mangelnder Datenqualität oftmals nicht für die datengetriebene Optimierung verwendet werden (Ausfall von Sensoren oder Probleme bei Aufzeichnung, Speicherung und Übertragung, physikalisch unplausible Werte, Ausreißer etc.). Bei schlechter Datenqualität liefern datengetriebene Methoden keine oder verzerrte Ergebnisse. Ein im Rahmen des Projekts durchgeführter Review von 69 wissenschaftlichen Papers zeigte, dass in 80 Prozent der Publikationen über Fernwärmeanwendungen Messdaten verwendet wurden (in 20 Prozent der Paper wurden Simulationsdaten verwendet), wovon 49 Prozent über Probleme mit Messdaten berichten.
Im Sondierungsprojekt wurden anhand realer Messdaten von Fernwärmenetzen Data Science-Methoden entwickelt und evaluiert, um die Datenqualität zu verbessern. Ergebnis ist eine „Data Cleaning Pipeline“ für Zeitreihendaten, um typische Fehlermuster von Fernwärmedaten (z. B. Ausreißer) zu erkennen und zu korrigieren. Keine der untersuchten Methoden zeigte für alle Datenprobleme die besten Resultate, womit in der Praxis die Auswahl der besten Methode immer auf den konkreten Anwendungsfall abgestimmt werden muss.
Ein gänzlich neuer Ansatz für den Umgang mit Datenlücken, der im Sondierungsprojekt entwickelt wurde, ist die simulationsbasierte Generierung von fehlenden Messdaten. Diese Data Imputation-Methode eignet sich besonders für längere Datenlücken bzw. gleichzeitigen Ausfall mehrerer Kanäle. Nach der automatisierten Detektion der Datenlücken wird ein Simulationsmodell ausgewählt, das fehlende Datenkanäle als Simulationsoutput hat. Dieses wird mit Messdaten unmittelbar vor dem Auftreten der Datenlücke initialisiert, eine Simulation für den fehlenden Zeitraum durchgeführt und fehlende Messdaten schließlich durch Simulationsdaten ersetzt. Das Vorgehen ist vollständig automatisierbar.
Die vorliegenden Ergebnisse zeigen, dass sowohl Data Science- und Data Imputation-Methoden leistungsfähige Werkzeuge für die Verbesserung der Datenqualität von Messdaten von Fernwärmenetzen sind und einen entscheidenden Schritt zu deren Digitalisierung beitragen können.
Partner
Kontakt