Wie künstliche Intelligenz Prozesse für Unternehmen und deren Kund*innen erleichtern kann, ist Gegenstand der Kooperation „Kundenfokussierte Zukunftstrends“ zwischen Universität Salzburg (Machine Learning/ Fachbereich Computerwissenschaft und Statistik/Fachbereich Mathematik) und der Porsche Holding Salzburg. Wir stellen Daten zur Verfügung, die dann von den Studierenden in Vorhersage-, Optimierungs- oder Mustererkennungsprobleme eingebettet werden. Einer von ihnen ist Sebastian Zeng – im Gespräch stellt er uns sein Forschungsprojekt vor.
Sebastian, in deinem Projekt geht es um Zeitreihenanalysen. Was genau hast du untersucht?
In Wissenschaft und Wirtschaft müssen ständig Entscheidungen bei der Wahl geeigneter Methoden zur Prozessoptimierung getroffen werden. Auch im Bereich der Porsche Holding: Hier stellt sich zum Beispiel die Frage nach den richtigen Tools zum Vorausberechnen der Nachfrage nach Ersatzteilen, zum Prognostizieren der Besucherzahlen in einem Autohaus oder auch dafür zu messen, welchen Einfluss historische Ereignisse auf die Liquiditätsplanung haben.
Ich habe Methoden untersucht, die dafür auf Basis historischer Daten geeignete Wahrscheinlichkeitsprognosen ableiten. Die Zeitreihenanalyse ist ein relativ gut erforschtes Wissenschaftsfeld. Es gibt zahlreiche traditionelle Lösungsansätze, die auf rein statistischen Modellen basieren. Einen bemerkenswerten Fortschritt bieten aber seit einiger Zeit Methoden des maschinellen Lernens. Trotzdem bleibt es eine Herausforderung, ein interpretierbares Modell zum Erstellen akkurater Wahrscheinlichkeitsprognosen zu entwickeln. Dieser Aufgabe habe ich mich in meiner Arbeit gestellt.
Wie hat dich die Porsche Holding bei deiner Studie unterstützt?
Die Kollaboration des Fachbereichs Computerwissenschaften der Uni Salzburg und der Porsche Informatik bringt mit der Synergie von Wirtschafts- und Wissenschaftsinteressen eine Reihe interessanter Themen ins Spiel. Mit Unterstützung des Data-Driven Business Solutions Teams der Porsche Informatik habe ich mich für mein Doktoratsstudium für die Analyse von Zeitreihen entschieden – sowohl ein spannendes Forschungsthema als auch sehr nutzbringend in der Anwendung.
Moderne Lösungen zur Entwicklung von Analysemodellen für Zeitreihen müssen gegenüber dem Datenursprung flexibel sein. Das heißt, das Analysemodell soll universell zuverlässige Prognosen berechnen, unabhängig vom vorliegenden Datensatz und dem Anwendungsbereich. Man muss davon ausgehen, dass das Datenverarbeitungsvolumen in Zukunft ständig steigen wird. Daher muss es möglich sein, auch eine Vielzahl von Zeitreihen simultan zu verarbeiten.
Die Porsche Informatik hat mir umfangreiche Daten aus diversen Anwendungsgebieten innerhalb der Porsche Holding Salzburg zur Verfügung gestellt. Diese haben wir in regelmäßigen Meetings eingehend diskutiert und Fragen zum Inhalt und zur Verarbeitung besprochen. Besonders hilfreich war die Unterstützung des Teams beim Verschnitt der Daten und der Entwicklung bewältigbarer Teilziele zum Erreichen einer zuverlässigen Datenbasis. Und das DBS-Team hat mich mit seinem Know-how über die Automobilbranche unterstützt.
Was ist das Ergebnis deiner Arbeit?
Ziel meiner Forschung war es, ein neues Modell zur Zeitreihenanalyse zu erarbeiten, das moderne Ansätze aus den Bereichen tiefe neuronale Netze, maschinelles Lernen und topologische Datenanalyse aufgreift. Modelle, die auf diesen Methoden basieren, liefern wie gesagt bessere Resultate als rein statistische Modelle. Viele der Lösungen sind von den Anwender*innen ohne Expertise in Zeitreihenanalyse ausführbar und zeigen Vorteile bei der Verarbeitung großer Datenbanken.
Außerdem habe ich mathematische Theorien aus der topologischen Datenanalyse integriert, einem Forschungsgebiet, das sich mit der Strukturanalyse von geometrischen Objekten beschäftigt und diese Information quantifiziert. Die daraus gewonnenen Ergebnisse fließen ergänzend zu den Rohdaten in mein Vorhersagemodell ein und verbessern damit die Prognose.
Als Ergebnis habe ich ein Modell entwickelt, das die genannten Ideen integriert, das bisher in dieser Form unveröffentlicht ist und sehr gute Vorhersageergebnisse auf dem neuesten Stand liefert. Nach ausführlichen empirischen Vergleichen habe ich meine Arbeit im Mai 2021 zur wissenschaftlichen Veröffentlichung eingereicht.
Welchen konkreten Nutzen haben die Ergebnisse deiner Arbeit? Wie können sie z. B. die Porsche Holding im Automotive Business unterstützen?
Im Anschluss an die erfolgreiche Erforschung neuer Methoden möchte ich jetzt in Zusammenarbeit mit dem DBS-Team die Ansätze und Modellvarianten evaluieren, die Porsche Holding und Porsche Informatik derzeit einsetzen. Diese Ergebnisse vergleichen wir mit denen, die auf meinen Entwicklungen basieren. Sollte sich die Qualität der Prognosen verbessern – was ich erwarte -, werden diese Algorithmen in den Data Lake der Porsche Holding integriert und in den Produkten der Porsche Holding zum Einsatz kommen. Das werden wir von Seiten der Uni zusätzlich unterstützen, indem wir Programmcodebibliotheken bereitstellen und bei Fragen zur Funktionalität helfen.