Das Thema Data Lake ist im Rahmen der Datenstrategie der Porsche Holding ein wichtiger Baustein, um organisationsweit datengetriebenes Arbeiten zu ermöglichen. Laura König, die Leiterin unseres Teams Data-Driven Business Solutions, erzählt im Interview, wie wir den Data Lake einsetzen und was technologisch dahintersteckt.
Laura, warum braucht die Porsche Holding einen Data Lake?
Mit dem Data Lake verfolgen wir das Ziel, die Produkte der Porsche Holding und der Porsche Informatik intelligenter zu gestalten. Dazu arbeiten wir mit Methoden aus dem Bereich Data Science und Artificial Intelligence. Der Data Lake erlaubt es uns, strukturierte und unstrukturierte Daten aus den unterschiedlichsten Quellen zu speichern, zu verknüpfen und zu analysieren. Damit können wir dann zum Beispiel globale und automatische Vorhersagen treffen und Empfehlungen abgeben, die das Geschäft weiter verbessern.
Das alles soll natürlich nicht nur einem Anwender auf seinem PC zur Verfügung stehen, sondern frei skalierbar einer Vielzahl von Anwender*innen innerhalb unserer internationalen Organisation. Dafür stellen wir den Data Lake als Plattform bereit.
Welche Technologie steckt hinter dem Data Lake?
Der Porsche Holding Data Lake basiert auf erstklassigen Big Data Technologien, zum Beispiel Spark, Airflow und HDFS, wodurch große Datenmengen verschiedener Quellen kombiniert, analysiert und prozessiert werden können. Er bietet eine hochverfügbare, skalierbare und zu 100 Prozent DSGVO-konforme Lösung mit strikter Berechtigungs- und Zugriffskontrolle.
Und wo genau setzt ihr den Data Lake ein?
Die Use Cases aus dem Bereich Data Science, die wir bisher umgesetzt haben, sind sehr divers. Das reicht von fachlichen Themen wie der Unterstützung bei der Finanzplanung bis hin zu Produkt-Verbesserungen wie schlaue Datensortierung oder proaktives Erkennen möglicher Systemeinschränkungen, um ein noch besseres Kundenservice leisten zu können.
Wie beim Data-driven Support für CROSS 2, für den es letztes Jahr einen Porsche Informatik Change Award gab?
Ja genau! In diesem Use Case ging es um Predictive Maintenance: Ziel war die proaktive Erkennung von Fehlern in CROSS 2. Damit ermöglichen wir dem Support-Team, Probleme im System proaktiv zu beheben, bevor es die Kunden überhaupt bemerken.
Woran arbeitet dein Team aktuell?
Derzeit arbeitet wir an der produktiven Umsetzung einer Bilderkennung für die Gebrauchtwagenbörse Das WeltAuto: Hier verwenden wir Computer Vision, um die Ausrichtung von Fahrzeugen auf Bildern zu erkennen und diese automatisch zu sortieren. Das Modul schneidet das Bild so zu, dass das Fahrzeug in einer idealen Größe angezeigt wird, prüft die Helligkeit und soll zukünftig den Hintergrund automatisch ersetzen.
Außerdem befindet sich die Porsche Holding Salzburg derzeit in einer mehrjährigen Kooperation mit dem Fachbereich Computerwissenschaften und Mathematik der Universität Salzburg. Ziel dieser Zusammenarbeit ist es, neue wissenschaftliche Methoden im Bereich Data Science zu entwickeln und somit unsere Use Cases im Data Lake laufend zu verbessern.
Danke für das spannende Gespräch! Wir freuen uns darauf, hier in Zukunft noch weitere Anwendungsfälle unseres Data Lakes vorzustellen.