6 Schritte zum erfolgreichen Data Science-Projekt

Sie planen die Umsetzung eines Data Science-Projektes? Folgen Sie unseren Veröffentlichungen zum Thema “6 Schritte zum erfolgreichen Data Science-Projekt” und erhalten final unser kostenfreies Whitepaper.

Übersicht
Noch nie standen den Unternehmen so viele Kundendaten zur Verfügung wie heute. Mit diesen Daten gezielt Geschäftsprozesse zu optimieren, um z. B. einen höheren Ertrag oder niedrigere Kosten zu erreichen, bleibt jedoch eine große Herausforderung. Bei der Verwertung ihrer Daten zur Umsetzung solcher Data Use Cases stoßen viele Unternehmen auf Probleme. Eine falsche Herangehensweise kann im schlimmsten Fall sogar zu einem erfolglosen Projektabschluss führen. Anhand des Cross Industry Standard Process for Data Mining (CRISP-DM) beleuchten wir in diesem Whitepaper typische Probleme bei der Umsetzung von Data Use Cases und stellen Lösungen vor.

Einleitung
Die erfolgreiche Implementierung von datengetriebenen Geschäftsprozessen (Data Use Cases) in die produktiven Systeme eines Unternehmens ist ein wesentlicher Meilenstein auf dem Weg zur daten-getriebenen Unternehmenssteuerung. Denn nachweislich erfolgreiche Data Use Cases helfen dabei, Vorbehalte gegen eine datenbasierte Unternehmenssteuerung abzubauen und Vertrauen zu entwickeln. Heutzutage sind Daten über Konsumenten und deren Verhalten leichter zugänglich als je zuvor. Die Verwertung der daraus resultierenden Datenmengen zur Optimierung der Geschäftsprozesse stellt viele Unternehmen allerdings noch vor große Herausforderungen. Es besteht die Gefahr, sprichwörtlich im (Big) Data Lake zu ertrinken.

In diesem Whitepaper stellen wir Ihnen anhand des Cross Industry Standard Process for Data Mining (CRISP-DM) sechs verbreitete Herausforderungen bei der Realisierung von Data Use Cases vor und beschreiben passende Lösungsansätze. Der CRISP-DM beschreibt ein standardisiertes Vorgehen zur datengetriebenen Lösung von Business-Problemen mit Hilfe von z.B. Machine Learning, Data Mining oder statistischen Methoden (siehe Abbildung 1). Das Vorgehen lässt sich prinzipiell auch für Big Data Use Cases einsetzen. Einziger Unterschied sind die in den einzelnen Prozessschritten eingesetzten Technologien. Jeder Teilschritt des CRISP-DM birgt seine eigenen Herausforderungen. Wir haben jedoch auf Basis unserer Erfahrung in der erfolgreichen Umsetzung von Data Use Cases folgende erfolgsrelevante Kernprobleme identifiziert:

Übersicht der Herausforderungen:

Quelle: https://commons.wikimedia.org/wiki/- File:CRISP-DM_Process_Diagram.png; Autor: Kenneth Jensen [CC BY-SA 3.0 (https://creativecommons. org/licenses/by-sa/3.0)], via Wikimedia Commons

Priorisierung von Data Use Cases
Übersetzung des unternehmerischen Ziels in ein Analyse-Design
Ausreichende Qualität des Modells
Eine stabile Qualität des Modells in Produktion
Verwaltung verschiedener Data Use Cases in Produktion
Große Bandbreite benötigter Methoden und Technologien

Herausforderung 1: Priorisierung von Data Use Cases
Bevor mit Hilfe des CRISP-DM die Umsetzung von Data Use Cases angegangen werden kann, werden oftmals in einer „Ideation Phase“ eine Vielzahl von Use Case Ideen generiert. Doch nicht alle Use Cases sind gleichermaßen relevant. Gerade für Unternehmen, die sich noch im Aufbau einer datengetriebenen Unternehmenskultur befinden, ist es jetzt wichtig, sich auf wenige „Hero Use Cases“ zu fokussieren, die den größten Mehrwert für das Business liefern. Ziel sollte sein, durch eine richtige Priorisierung diese Leuchtturmprojekte zu erkennen, welche dann der Wegbereiter für weitere Data Use Cases sein können. Mit der richtigen Priorisierung lässt sich eine langfristige Roadmap inkl. Abhängigkeiten erstellen, die entsprechend abgearbeitet werden kann.

Lösung

Wie können nun diese „Hero Use Cases“ identifiziert werden? Grundsätzlich empfiehlt es sich für die Hero-Use-Cases eine Mischung aus sogenannten „Quick-Wins“ und „Big-Bets“ auszuwählen:

Quick Wins sind die Use Cases mit geringem Aufwand bei mittlerem bis hohem erwarteter Zusatznutzen.
Die Big Bets sind eher aufwändig zu realisieren lassen aber einen hohen bis sehr hohen Zusatznutzen erwarten.
Die Data Use Cases sollten also zunächst einer groben Kosten-Nutzen-Analyse unterzogen werden.

Dazu bieten sich cross-funktionale Workshops an, in denen die Data Use Cases in einer Kosten-Nutzen-Matrix mit Hilfe eines Design-Thinking Ansatzes verortet werden können. Darüber lassen sich bereits erste „Quick-Wins“ identifizieren, mit deren Umsetzung relativ schnell erste Erfolge aufgezeigt werden können. Für die „Big Bets“ sollte eine detaillierte Potenzialanalyse durchgeführt werden, in der der mengenmäßige (z. B. Anzahl Kunden in Zielgruppe) und wertmäßige Hebel (z. B. Zusatzdeckungsbeitrag je Kunde) genauer geschätzt wird. Während der Umfang eines Data-Use-Cases oftmals auf Basis historischer Daten relativ gut abgeschätzt werden kann, ist die Abschätzung des wertmäßigen Hebels meist die größere Herausforderung. Hier helfen strukturierte Experteninterviews den Effekt über Worst-Case- und Best-Case-Szenarien einzugrenzen. Sind die Zusatzkosten des Data Use Cases gut abschätzbar, kann vorbereitend der notwendige Wert-Effekt zur Erreichung eines Break-Even ermittelt werden. Mit diesem Input lassen sich die Experteninterviews zielgerichtet durchführen. Die Kosten des Data Use Cases sind dann dem erwarteten Zusatznutzen gegenüberzustellen. Hauptkostenblöcke sind:

• Kosten für Marketingmaßnahme
• IT-Kosten für Hardware z.B. für das Speichern und Verarbeiten von Big Data
• Kosten für Software-Lizenzen

Public Cloud-Dienste wie AWS oder Microsoft Azure bieten den Vorteil, dass die Kosten für Datenspeicherung und Datenverarbeitung exakt je Use Case dargestellt werden können. Über den Einsatz von Open-Source Software lassen sich die Lizenzkosten weiter im Griff halten.

Nehmen Sie sich die Zeit und priorisieren Sie Ihre Data Use Cases. Im nächsten Schritt am 17. Juli erläutern wir, wie Sie das unternehmerische Ziel in ein Analyse-Design übersetzen.

6 Schritte zum erfolgreichen Data Science-Projekt

Navigation

Archives