Mit einem unfassbaren Anwendungsspektrum und sich schnell entwickelnden Frameworks strahlt Machine Learning (ML) eine große Faszination aus. Immer mehr Unternehmen lassen das Trendthema in ihre Geschäftsprozesse einfließen. Damit die Projekte ein voller Erfolg werden, geben wir von NextLytics Ihnen heute Erfolgsstrategien an die Hand und zeigen Ihnen auf, wie übliche Fallstricke in Machine Learning Projekten vermieden werden können.
Warum benötigen Machine Learning Projekte eine Sonderstellung? Ein wesentlicher Unterschied zu normalen IT-Projekten, ergibt sich meistens schon aus dem Anwendungsfall heraus. Bei Machine Learning-Projekten sind die Fragestellungen in eine multidimensionale, komplexe Umwelt eingebettet. Es wird sich für diese Technologie entschieden, da herkömmliche Methode nicht ausreichen. Jedes ML-Projekt bringt zudem neue, typische Herausforderungen mit sich. Die Interpretierbarkeit des Modells und die Auswahl von repräsentativen Daten sind nur einige davon.
Zudem sind die Modelle an sich - besonders im Deep Learning Bereich - oftmals schwer nachzuvollziehen. Auch wenn die Ergebnisse passen, ist die Frage nach dem “Wieso” nicht einfach zu beantworten. Unter dem Schlagwort ExplainableAI finden sich Ansätze für die Auflösung der Black-Box, jedoch ist dieses Feld erst im Kommen. Nicht zuletzt deswegen ist die Vorhersagbarkeit der benötigten Ressourcen und Zeit eine heikle Aufgabe. Zumal in vielen Fällen nicht aus der Vorerfahrung von ähnlichen Projekten geschöpft werden kann.
Noch bevor das Projekt gestartet ist, können Sie mithelfen, typische Fallstricke zu vermeiden:
Vermeiden Sie eine unrealistische Erwartungshaltung. Machine Learning ist keine eierlegende Wollmilchsau. Auch wenn die Medien und Projektpräsentationen von digitalen Vorreitern etwas anderes vermuten lassen, steckt eine Menge Zeit und Arbeit hinter den beeindruckenden Ergebnissen. Eine angemessene Erwartungshaltung ist demnach unabdingbar, um langfristig die Begeisterung und Motivation der Beteiligten oben zu halten. Kleinere Projekte sind essentiell, um Erfahrungen zu sammeln und abzustecken, was in der Praxis möglich ist. Alternativ kann die Einschätzung eines erfahrenen Data Scientists helfen. Falls im Team keine Person mit ausgeprägter Projekterfahrung vorhanden ist, kann die Expertise extern eingekauft werden. Ebenfalls hilfreich für die Erwartungshaltung von Außen ist ein aufklärendes Kick-Off Meeting mit allen Beteiligten. Dort sollten die Ziele und auch Herausforderungen durchgesprochen werden. In weiteren Zwischenpräsentationen ist es empfehlenswert, sich ebenfalls auf diese Ziele zu beziehen.
Sind die Daten ausreichend für die Projektanforderung? Daten sind die Grundlage alles Weiteren. Sie werden für die Konfiguration des Modells gebraucht. Zum einen sollten die Daten in einem ausreichenden Umfang zugänglich sein. Zum anderen sollten die Daten qualitativ hochwertig und repräsentativ sein. Das Modell besitzt keinerlei Funktionen, um schlechte Daten zu erkennen. Diese werden einfach akzeptiert und führen zur Minderung der Ergebnisqualität.
Als Gegenmaßnahme muss die Beschaffenheit der Daten schon vor Projektbeginn geprüft werden. Im Idealfall sind Prozesse zur Sicherung der Datenqualität bereits im Unternehmen etabliert. Wichtige Faktoren für die Beurteilung sind die Menge an fehlenden/ungültigen Werten, die Korrektheit und Aktualität. In der explorativen Datenanalyse zum Projektbeginn können nicht offensichtliche Faktoren wie Ausreißer, verzerrte Wertebereiche und Redundanzen entdeckt werden. Im Einzelfall ist dann zu entscheiden, welche Maßnahme zur Behebung für den Anwendungsfall (und das verwendete Modell!) am besten geeignet sind.
Bedenken Sie unbedingt auch etwaige datenschutzrechtliche Fragestellungen. Muss das Datenmodell im Nachhinein geändert werden, beginnt der Prozess der Modellgenerierung von Vorne.
Zuletzt ist zu klären, ob das maximale Potenzial des Projektes ausgenutzt wird und ein echter Business Value entsteht. Oft ist die Begeisterung für Künstliche Intelligenz sehr stark und es wird zusätzliches Budget für Vorzeigeprojekte zur Seite gelegt. Das kann leider auch dazu führen, dass die Projekte zwar schnell gestartet werden, dann aber in einem Proof-of-Concept-Stadium stehen bleiben. Zwar werden die Fähigkeiten und das Vertrauen ins Team durch solche Projekte gestärkt, aber ein nachhaltiger geschäftlicher Mehrwert bleibt aus. Die Lösung hierfür besteht darin, sich vor allem auf die Produktivsetzung des Modells zu konzentrieren. Während des Projekts sollten Sie stets bestrebt sein zuerst ein Minimal Viable Product (MVP) hervorzubringen, bevor aufwendige Optimierungsschritte eingeleitet werden. Sobald die Ergebnisqualität für den Geschäftskontext ausreichend ist, geht es mit der Implementierung und Automatisierung weiter. Die Optimierung findet danach in einer Phase statt, in der das Modell bereits einen Mehrwert bringt und langsam an Akzeptanz gewinnt.
Im Gegensatz zu den Fallstricken, die Sie vermeiden sollten, gibt es wichtige Erfolgsstrategien, die Ihren Projektalltag einfacher machen:
Holen Sie alle mit an Board. Schaffen Sie ein interdisziplinäres Team aus IT-Fachleuten und der Fachabteilung. Sorgen Sie dafür, dass die Projektstände nachvollziehbar sind und keinem Statistik-Vortrag gleichen. Für die effektive Zielerreichung ist das Kontextwissen des Fachexperten genauso wichtig wie das Wissen über die richtige Implementierung im Produktivsystem. Mit der Einbindung von Fachexperten des Anwendungsbereiches beflügeln Sie die Datenanalysen mit bekannten Zusammenhängen aus der Praxis - aber auch intuitiven Vermutungen.
Zudem weiß der Fachexperte genau, worin der Mehrwert der Machine-Learning-Anwendung aus Anwendersicht besteht. Bei der Implementierung ist unter diesem Gesichtspunkt eine enge Zusammenarbeit erfolgskritisch. Hier entscheidet sich, ob das Projekt aus der Pilotphase hinauswächst und produktiv im Betriebsalltag genutzt werden kann. Um diesen Prozess zu meistern, kann ML Operations (MLOps) eine vielversprechende Lösung sein.
MLOps Hintergrundinformationen |
MLOps beschreibt eine Reihe von Prozessen, Methoden und Tools für reproduzierbare ML-Workflows und eine effektivere Zusammenarbeit zwischen Data Scientists und Mitarbeitern im operativen Bereich. Der Machine Learning Lebenszyklus wird von der Modellgenerierung bis zur Implementierung in der Qualität und Geschwindigkeit positiv beeinflusst. Abgeleitet von den DevOps hilft MLOps mit ihren Tools und Best Practices bei der Integration des Machine Learning Modells ins Daily Business. Besonderer Fokus liegt hierbei auf der Skalierbarkeit, Reproduzierbarkeit der Ergebnisse, Diagnosemöglichkeiten und der gelungenen Zusammenarbeit der Fachteams. |
Gewöhnen Sie sich an das agile, iterative Arbeiten - bei Machine Learning Projekten kommen Sie nicht drumherum. Definieren Sie Zwischenziele. Gerade am Anfang sind die Gegebenheiten noch nicht ausgekundschaftet. Viele Ideen werden ausprobiert und wieder verworfen. So kann es passieren, dass neue Datenquellen, Merkmale und Modellbausteine hinzukommen oder sich Projektanforderungen im Laufe der Zeit ändern. Je mehr es in Richtung Implementierung geht, umso mehr verläuft das Projekt mit typischen Meilensteinen. Der Fokus sollte auf dem Aufbau eines Produktivsystems liegen, welches im Nachhinein optimiert werden kann. So verliert sich Ihr Projektteam nicht im Detail der Modelloptimierung oder Datensäuberung.
Zuletzt sollten Sie beachten, ausreichend Ressourcen einzuplanen. Das gilt sowohl für das Budget, die benötigte Infrastruktur, den angemessenen Zeitrahmen für eine ausreichende Ergebnisreife sowie Personen mit dem richtigen Know-How. Eine kostengünstige Alternative zur Beschaffung von eigener Infrastruktur besteht in der Verwendung von diversen Cloud-Dienstleistungen und Plattformlösungen.
In unserem Machine Learning Whitepaper finden Sie einige Empfehlungen hinsichtlich Hardware, Software und für die Teamzusammenstellung.
Falls Sie Unterstützung bei der Planung und Durchführung von Machine Learning Projekten benötigen, helfen wir Ihnen gerne im gewünschten Umfang mit wertvoller Praxiserfahrung weiter. Gemeinsam schöpfen wir die Erfolgsfaktoren im vollen Umfang aus.