NextLytics Blog

Machine Learning mit SAP Predictive Analytics - Möglichkeiten und Grenzen

Geschrieben von Sebastian Uhlig | 20.05.2020 08:50:20

SAP Predictive Analytics erlaubt es Unternehmen, zukünftige Ereignisse zu prognostizieren und datenbasierte, fundierte Entscheidungen zu treffen. Dabei werden verschiedene statistische und analytische Techniken eingesetzt, um enorme Datenmengen nach versteckten Mustern und Beziehungen zu durchleuchten. So können Vorhersagen bezüglich des Kundenverhaltens, der Produktnachfrage, des Umsatzes und Gewinns sowie vielem mehr getroffen werden.

SAP Predictive Analytics deckt acht Funktionsbereiche ab: Automatisierte Analysen, Expertenanalysen, Modell-Management, Daten-Management, Predictive Scoring, Social Media Analytics und Produktempfehlungen sowie Visualisierung. Dank der benutzerfreundlichen Oberfläche können Machine Learning Workflows ohne Coding per Drag & Drop erstellt werden. 

Dabei beinhaltet SAP Predictive Analytics mehrere Werkzeuge, wie Automated Analytics, Expert Analytics und Predictive Factory. Während Automated Analytics eine niedrige Einstiegshürde für Geschäftsanwender bietet, ist Expert Analytics auf professionelle Datenanalytiker und Data Scientists ausgerichtet. Mit Predictive Factory wird der Prognosemodell-Lebenszyklus vereinfacht und automatisiert.

Einordnung in andere Tools

SAP Predictive Analytics vereint die ehemaligen Produkte SAP Infinite Insight und SAP Predictive Analysis zu einem einzigen Datenanalyse-Produkt. So wurde Automated Analytics, welches früher als Infinite Insight vermarktet wurde, von KXEN entwickelt und 2013 von SAP übernommen. Expert Analytics dagegen wurde bis vor wenigen Jahren als SAP Predictive Analysis vertrieben. Mit Predictive Analytics versucht SAP, den Umstieg für Personen, die zuvor entweder SAP Infinite Insight oder SAP Predictive Analysis verwendet haben, reibungslos zu gestalten und stellt alle Funktionen der zwei unabhängigen Produkte zur Verfügung.

SAP Predictive Analytics kann als eine eigenständige On-Premise-Software oder als eine Cloud-Lösung eingesetzt werden. Über eine Integration in SAP Cloud Platform können Sie von frei skalierbaren Kapazitäten für Big Data und Machine Learning profitieren. Darüber hinaus können Sie auch SAP Vora einsetzen, um große Datenmengen aus Hadoop nutzen zu können.

Detaillierte Vorstellung der Funktionen

Wie bereits erwähnt, beinhaltet SAP Predictive Analytics eigentlich drei verschiedene Toolsets: Automated Analytics für Geschäftsanwender, Expert Analytics für Data Scientists und Predictive Factory, um die Verwaltung von Modellen zu automatisieren. Automated Analytics enthält einfach einzusetzende und weitestgehend automatisierte Funktionen, mit denen man Datenanalysen und Prognosen durchführen kann. Darüber hinaus hilft Automated Analytics auch dabei, die Daten für die Analyse vorzubereiten. Expert Analytics verfolgt einen etwas allgemeineren Ansatz und enthält verschiedene Modelle, die in einer eigenen Analyse verwendet werden können, sowie Data Mining Werkzeuge. Predictive Factory ermöglicht es, einen vollständigen Prognose-Lebenszyklus abzubilden: von der Projekterstellung bis zu Modellerzeugung und -neuaufbau, Modellauswertung, Implementierung, Überwachung und Versionierung.

Nachfolgend stelle ich die einzelnen Bestandteile im Detail vor.

Automated Analytics

Automated Analytics beinhaltet die automatisierte Datenaufbereitung, prädiktive Modellierung und eine Scoring-Lösung für Anwender, die keinen formalen Hintergrund in Data Science oder Datenanalytik haben. Das Werkzeug ermöglicht es Anwendern, erweiterte Analysemodelle zu implementieren, die Klassifizierung, Regression, Segmentierung, Zeitreihen und soziale Netzwerk-Analysen und Produktempfehlung umfassen.

Dabei unterstützt Automated Analytics den Anwender, indem es automatisierte Prozesse für die Datenaufbereitung, Modellierung und das Deployment zur Verfügung stellt. So wird einerseits die Datenqualität erhöht, da die Fehler beseitigt werden, die über manuelle Verfahren eingeschleust werden. Andererseits benötigen auch die Anwender weniger Prozessschritte.

Folgende Bausteine werden mit Automated Analytics ausgeliefert:

  • Data Manager vereinfacht die Vorbereitung der für das Analyseprojekt benötigten Daten.
  • Modeler ermöglicht es Fachanwendern, Modelle für Klassifizierung, Regression, Clustering, Zeitreihen und Assoziationsregeln anzulegen. Modelle aus der Entwicklungsumgebung können exportiert und in der Produktion angewendet werden.
  • Social extrahiert und verwendet Daten aus sozialen Netzwerken, um die Entscheidungs- und Prognosefähigkeit der Modelle zu verbessern. Mithilfe von Diagrammen können Verbindungen zwischen den verschiedenen Daten dargestellt werden. Dabei können Sie auch Kollokationsanalysen anhand georeferenzierter Daten anlegen.
  • Recommendation generiert Produktempfehlungen für Ihre Kunden. Als Basis dient die durch Social bereitgestellte Analyse.

Expert Analytics

Im Gegensatz zu Automated Analytics ist Expert Analytics auf professionelle Data Scientists und Datenanalytiker ausgerichtet. Es umfasst verschiedene Algorithmen zur Datenanalyse, wie zum Beispiel Zeitreihenvorhersage, Ausreißererkennung, Trendanalysen, Segmentierungsanalysen und Affinitätsanalysen. Ferner wird auch die Programmiersprache R unterstützt, um eigene Algorithmen einzusetzen. Darüber hinaus können Sie die Daten visualisieren, indem Sie Streuungsmatrix-Diagramme, parallele Koordinaten, Cluster-Diagramme und Entscheidungsbäume verwenden. Außerdem enthält Expert Analytics In-Memory Data Mining Funktionen, mit denen Sie auch große Datenmengen analysieren können.

Mit Expert Analytics lassen sich verschiedene Datenquellen, wie Flatfiles, relationale Datenbanken und In-Memory-Datenbanken verwenden. So können Sie mit unterschiedlichen Datenmengen umgehen, von kleinen CSV-Dateien bis zu großen Datenvolumen aus SAP HANA. 

Expert Analytics beinhaltet folgende Bausteine:

  • Data Visualization ermöglicht es Ihnen anhand verschiedener Visualisierungstechniken, wie Streumatrixdiagrammen, Parallelkoordinaten und Entscheidungsstrukturen, tiefgehende Datenanalysen zu erstellen.
  • Mit Data Analysis können Sie eine Reihe verschiedener Datenanalysen durchführen und Modelle erstellen, um z.B. Zeitreihenprognosen, Ausreißererkennung sowie Trend-, Klassifikations-, Segmentierungs- und Affinitätsanalysen durchzuführen.
  • Data Analytics bietet eine Reihe von Algorithmen für analytische Prognosen und In-Memory Data Mining Funktionen. Darüber hinaus wird auch die Sprache R für eigene Auswertungen unterstützt.

Predictive Factory

Mit Predictive Factory können Sie die Verwaltung von Prognosemodellen, die mit SAP Predictive Analytics angelegt wurden, automatisieren. Dabei wird der vollständige Prognose-Lebenszyklus abgedeckt: von der Projekterstellung bis zu Modellerzeugung und -neuaufbau, Modellauswertung, Implementierung, Überwachung und Versionierung.

Mit Predictive Factory können Sie:

  • Klassifizierungs-, Regressions- und Zeitreihenprognose-Modelle erstellen und trainieren
  • bestehende Modelle, die in Automated Analytics oder Expert Analytics angelegt wurden, importieren
  • Predictive Model-Pipelines importieren und diese trainieren sowie anwenden
  • Aufgaben zum erneuten Trainieren und Anwenden von Modellen, Testen der Modellabweichung, Durchführen von Prognosen und Ausführen externer Befehle automatisieren
  • Zeitreihenmodelle segmentieren. So können Sie denselben Prognosemechanismus für verschiedene Segmente des Datensets gleichzeitig anwenden.
  • Performance Ihrer Modelle im Zeitablauf überwachen und Abweichungen erkennen
  • Klassifikations- oder Regressionsmodellversionen an eine externe Anwendung übertragen

Zusammenfassend lässt sich sagen, dass die Kombination aus der automatisierten Analyse und Expertenanalyse Werkzeuge sowohl für Anwender aus dem Fachbereich als auch professionelle Datenanalysten zur Verfügung stellt. Dabei wird der gesamte Lebenszyklus der Analyse abgedeckt. Im nächsten Abschnitt gehen wir detailliert auf die Vor- und Nachteile des Werkzeugs ein.

Wie Sie SAP BW und State of the Art Machine Learning zusammenbringen 

Vor- und Nachteile

SAP Predictive Analytics hat aus der historischen Entwicklung zweifelsohne eine Daseinsberechtigung. Als Vorteile sind eine einfache Anbindung an Datenquellen und eine benutzerfreundliche Oberfläche hervorzuheben. Das Werkzeug verfügt über ein modernes, intuitives User Interface, welche einfache Bedienung erlaubt. Die Erstellung von Modellen kann ohne Programmierkenntnisse per Drag&Drop erfolgen. Automated Analytics unterstützt den Benutzer bei der Datenanalyse, ohne dass dieser die Modellwahl und das Fine-tuning der Parameter übernehmen muss.

Darüber hinaus werden integrierte Funktionen für Data Preprocessing und Visualisierung im Lumira-Style angeboten. Ferner kann auch kundeneigener R-Code durch eine R-Schnittstelle integriert werden. Und auch die Hadoop Integration über SAP VORA erleichtert die Arbeit mit Big Data enorm.

Als Nachteil kann die begrenzte Anzahl der bereitgestellten Machine Learning Algorithmen angeführt werden. Insbesondere komplexere Tree-basierte Verfahren und Deep Learning-Algorithmen wird keine Unterstützung angeboten. Auch im Bereich der Zeitreihenanalyse verfügen erfahrene Nutzer nur über einen begrenzten Spielraum, da der primäre Fokus auf statistischen Modellen wie beispielsweise der exponentieller Glättung liegt. 

Viele State-of-the-Art Algorithmen werden dagegen nicht abgebildet. Hohe Innovationskraft im Bereich Entwicklung neuer, vielversprechender Algorithmen ist nicht abdeckbar, da diese nicht integriert werden. Aufgrund der ausschließlichen Nutzung der angebotenen Methoden und Funktionen ist die Flexibilität begrenzt. 

Zwar können über R eigene Algorithmen integriert werden, jedoch verfügt dieses über geringere Akzeptanz bei der Data Science Community. Die Programmiersprache Python verfügt über größere Verbreitung, ist jedoch noch nicht integriert. Somit verfügt das Werkzeug leider nur über begrenzte Fähigkeiten und benötigt zusätzlich die Predictive Factory, um den Produktivbetrieb zu ermöglichen.

Beachten Sie bitte, dass die Client-Lösung die zugrunde liegende Hardware des Clients für die Berechnungen nutzt. Aufgrund der fehlenden GPU-Unterstützung erhöht sich außerdem die Trainingszeit von Modellen. Schließlich sind auch steigende Kosten durch die Lizenzen zu beachten.

Wie Sie sehen können, verfügt SAP Predictive Analytics sowohl über Vor- als auch Nachteile. Doch wie sieht die zukünftige SAP Produktstrategie aus?

Einordnung in SAP Produktstrategie

SAP setzt verstärkt auf Cloud Produkte wie SAP Analytics Cloud und SAP Cloud Platform, die auch über eigene Predictive Funktionen verfügen. Daher wird SAP Predictive Analytics im Moment nicht mehr weiterentwickelt. 

Laut der Product Availability Matrix (PAM) von SAP endet am 31.12.2022 die Wartung von SAP Predictive Analytics. Daher lohnt sich der Neueinstieg in SAP Predictive Analytics aus unserer Sicht nicht mehr. Als Nachfolger wird SAP Data Intelligence positioniert, allerdings ist das Werkzeug technisch noch nicht ausgereift:

Unser Fazit -Machine Learning mit SAP Predictive Analytics

Aufgrund der zahlreichen Nachteile ist SAP Predictive Analytics noch nicht das Gelbe vom Ei. Besonders schwerwiegend ist die begrenzte Anzahl der Algorithmen, die auch nicht State-of-the-Art sind. Als Programmiersprache für kundeneigene Algorithmen wird R benutzt, welche allerdings über eine deutlich kleinere Community als Python besitzt. Python verfügt über eine vielfach größere Community und ein etabliertes Data Science Ökosystem, wird jedoch nicht von Predictive Analytics unterstützt. Schließlich ist das Produkt auch im Hinblick auf Nachhaltigkeit negativ zu bewerten, da es bald aus der Maintenance läuft. Die Zukunft ist ungewiss, da der Nachfolger noch unausgereift ist. Daher kann SAP Predictive Analytics nicht empfohlen werden.

Wenn Sie wissen wollen, wie Sie Ihre Daten in Erkenntnisse umwandeln können, die das Kundenengagement und die Verkaufszahlen fördern, betriebliche Leistung verbessern und Risiken im gesamten Unternehmen reduzieren können, legen wir Ihnen unser Whitepaper “SAP BW und State of the Art Machine Learning” ans Herz. In diesem zeigen wir Ihnen, wie Sie Machine Learning effektiv nutzen, um Geschäftsprobleme schneller, besser und billiger zu lösen.