01_good to know.
Datenflut – Ist Ihre Datenbasis geeignet für Industrial Analytics?
Die Auswertung von Daten im Unternehmen birgt zahlreiche Nutzenpotentiale. Aus Maschinendaten können Produktionsschwankungen und Maschinenausfälle erkannt werden, Vertriebsdaten bieten das Potential zur Vorhersage von Verkaufszahlen und Prozessdaten können zur Optimierung von Abläufen genutzt werden. Schnell stellt sich die Frage: Wie viele Daten benötige ich, um eine automatische Erkennung, Vorhersage oder Optimierung umsetzen zu können? „Big Data“ alleine bedeutet noch lange keinen erfolgreichen Anwendungsfall.
02_good to know.
Kernaufgaben eines Data Scientists liegen in der Modellbildung und Interpretation. Ein mathematisches Modell – eine einfache lineare Funktion, ein statistisches Modell, oder ein Maschinelles Lernverfahren – beschreibt den jeweiligen Sachverhalt abstrakt. Modellausgaben müssen anschließend im Kontext des Einsatzgebietes interpretiert werden. Dies funktioniert nur dann, wenn folgende Kriterien beachtet werden:
Datenvielfalt: Für die erfolgreiche Modellbildung müssen Daten eine hinreichende Vielfalt bieten. Wird das Beispiel Verkaufszahlen betrachtet, gibt es saisonale Effekte, wie beispielsweise ein erhöhter Absatz zur Weihnachtszeit – somit müssen Daten für den gesamten Jahresablauf vorhanden sein. Deutlich schwieriger ist es bei Maschinendaten aus der Produktion. Maschinen erzeugen stetig wiederholende Daten. Für die Beschreibung eines Maschinenausfalls benötigt man Daten außerhalb des typischen Betriebsbereiches – dies ist selten in den aufgezeichneten Produktionsdaten vorhanden.
Datenqualität: Daten müssen fehlerfrei und zuverlässig aufgezeichnet sein sowie den Sachverhalt korrekt darstellen. Dies wird durch die Bereinigung und kontinuierliche Pflege ermöglicht. Ausreißer lassen sich bei hinreichend großer Datenmenge durch statistische Eigenschaften identifizieren.
Annotationen: Für die Interpretation der Ergebnisse ist Kontextwissen aus dem Anwendungsgebiet notwendig. Dazu müssen Daten mit Meta-Informationen und Annotationen ergänzt werden. Beispielsweise können Maschinenexperten ein fehlerhaftes Verhalten in den Daten markieren oder Prozessexperten Zielgrößen für einen optimalen Prozess ergänzen.
Daneben gibt es noch weitere Kriterien, welche sich nicht in Gigabyte messen lassen und individuell bewertet werden müssen. Die Einhaltung lässt sich durch ein systematisches Datenmanagement im Unternehmen gewährleisten und ist die Basis für erfolgreiche datengetriebene Anwendungen.
Haben Sie schon die Schätze in den Tiefen Ihrer Daten entdeckt? Wir beraten Sie gerne!
Eine Initiative des