SAP Analytics Cloud (SAC) vereinfacht die Datenanalyse sowie Planung, dabei gibt es mit SAC Story und SAC Analytics Designer umfangreiche Möglichkeiten Dashboards zu erstellen. Neben den Dashboarding-Möglichkeiten werden die Benutzer mit Machine Learning, Augmented Analytics und Smart Predict bei Simulationsszenarien unterstützt. In diesem Artikel betrachten wir diese Predictive Analytics Funktionen im Detail.
Anwendungsszenarien und Benutzergruppe
SAP Analytics Cloud hat vor allem die Nutzer aus dem Fachbereich im Fokus. Diese können mit den vordefinierten Inhalten interagieren und über intuitive Steuerung neue Erkenntnisse aufdecken. Neben Smart Insights und Smart Discovery, wo automatisch Vorschläge generiert werden, kann auch Search to Insight genutzt werden, um dem System mündlich über Natural Language Processing (NLP) Fragen zu stellen und schnelle Antworten zu erhalten. Benutzer mit mehr Erfahrung können Smart Predict nutzen, um die Analysefunktionen von Smart Insights mit der Möglichkeit zu erweitern, Ergebnisse vorherzusagen.
Ausgebildete Data Scientists finden in SAP Analytics Cloud jedoch zu wenig Gestaltungsspielraum. Für sie bietet SAP separat unter anderem das Werkzeug SAP Predictive Analytics an. Daneben werden auch SCP Predictive Services für Entwickler positioniert.
Im Hintergrund nutzen jedoch alle Anwendungen eine gemeinsame Engine. So nutzt SAP Analytics Cloud die SCP Predictive Services, welche wiederum auf der Automated Predictive Library (APL) basieren. Dieselbe Bibliothek ist auch Teil von SAP Predictive Analytics.
Detaillierte Vorstellung der Predictive Features
Nachfolgend werden die Bestandteile von Augmented Analytics und Smart Predict im Detail vorgestellt. Dabei erläutere ich, was es mit Smart Insights, Smart Discovery, Search to Insight auf sich hat. Anschließend werden Classification, Regression und Time Series Modelle von Smart Predict genauer untersucht.
Augmented Analytics
Unter Augmented Analytics fasst SAP Analytics Cloud Funktionen zusammen, die Ihren Analyseprozess mithilfe von maschinellem Lernen erweitern. Dazu zählen Smart Insights, Search to Insight und Smart Discovery.
Smart Insights stellt zusätzliche Informationen zu einem bestimmten Datenpunkt bereit, damit Sie ein klares Verständnis für die komplexen Aspekte Ihrer Geschäftsdaten haben. Mit Smart Discovery können Sie tiefer graben und neue, noch unbekannte Beziehungen in Ihren Daten aufdecken. Und mit Search to Insight steht Ihnen eine Natural Language Processing (NLP) Schnittstelle zur Verfügung, die auf einer Sprachverarbeitung basiert. So können Sie mit dem System reden, um die benötigten Daten abzufragen.
Smart Insights
Smart Insights nutzt Machine Learning Technologien, um automatisch Erkenntnisse bereitzustellen, die Ihnen dabei helfen, Ihre Daten besser zu verstehen. Über einen Klick auf einen Datenpunkt werden zusätzliche Einblicke angeboten. Dabei werden Dimensionen und Elemente mit dem größten Einfluss auf die Kennzahlen dargestellt.
Wenn Sie zum Beispiel mehr über Ihren Umsatz im Einzelhandel erfahren wollen, kann Smart Insights Antworten liefern. So sehen Sie die wichtigsten Einflussfaktoren, ohne manuell in den Daten navigieren zu müssen. Sie sparen Zeit, um sich auf höherwertige Aktivitäten konzentrieren zu können. Die gewonnenen Erkenntnisse können einfach zu Ihrer SAC Story hinzugefügt und visuell dargestellt werden.
Je nach dem ausgewählten Datenpunkt kann Smart Insight Antworten auf die folgenden Fragen liefern:
- Was hat sich geändert? - Sie sehen, wie sich Ihr Datenpunkt im Zeitverlauf entwickelt hat.
- Was sind die wichtigsten Treiber? - Hebt die Einflussfaktoren hervor. Dabei wird jeder Einflussfaktor anhand einer Beschreibung und eines Diagramms erklärt.
- Wie wird dies berechnet? - Es wird angezeigt, wie Ihr Datenpunkt berechnet wird. Sollte dieser auf einer Berechnung beruhen, werden die verwendete Formel sowie der Aggregationstyp angezeigt. Darüber hinaus sehen Sie auch die eventuell vorhandenen Ausreißer.
Smart Discovery
Smart Discovery deckt mithilfe von Machine Learning Algorithmen neue oder unbekannte Beziehungen in Ihren Daten auf, damit Sie die wichtigsten Einflussfaktoren hinter Ihren KPIs besser verstehen. So können Sie zum Beispiel die Treiber Ihrer Einnahmen, Fluktuation oder Mitarbeiterproduktivität aufdecken.
Bei dieser Analyse können Sie bestimmte Dimensionen oder Kennzahlen ausschließen und den Fokus auf bestimmte Dimensionselemente legen. Anschließend können Sie die Ergebnisse als Story speichern, um diese in Ihrer Organisation zu teilen.
Darüber hinaus können Sie mit Smart Discovery Simulation die Auswirkungen Ihrer strategischen Geschäftsentscheidungen prognostizieren. Auf der Grundlage Ihrer Geschäftsszenarien können Sie so mögliche Ergebnisse simulieren. Dabei können Sie experimentieren, um festzustellen, wie bestimmte Dimensionswerte oder Kennzahlen das Ergebnis beeinflussen. So können Sie zum Beispiel den Wert einer neuen Verkaufschance einschätzen.
Wie Sie SAP BW und State of the Art Machine Learning zusammenbringen
Search to Insight
Search to Insight ist eine Schnittstelle, die auf natürlicher Sprache basiert, um Daten abzufragen. Sie können dem System einfach eine Frage stellen, um schnelle, visualisierte Antworten zu erhalten und diese Informationen in Ihre Story zu integrieren.
Sie könnten beispielsweise Folgendes abfragen:
- Umsatz in einem bestimmten Jahr
- Umsatz für eine Region oder mehrere Regionen
- Vergleich von Ist- und Planwerten für eine bestimmte Kennzahl in einem bestimmten Zeitraum
Dabei gilt allerdings die Einschränkung, dass Search to Insight nur Englisch versteht. Darüber hinaus können nur vordefinierte Phrasen verwendet werden.
Smart Predict
Smart Predict erweitert die Analysefunktionen von Augmented Analytics um die Möglichkeit, Ergebnisse vorherzusagen. Angenommen, Sie haben in der Vergangenheit Marketingkampagnen für Kunden mit unterschiedlichen demografischen Merkmalen und unterschiedlichem Kaufverhalten durchgeführt. Mit Smart Predict können Sie diese Daten nutzen, um vorherzusagen, welche Kunden im Zuge einer neuen Kampagne kaufen werden.
Dabei wird automatisch ein Machine Learning Modell auf Basis der historischen Daten gebildet. Smart Predict nutzt einen Anteil von 75% der Daten, um ein prädiktives Modell zu finden. Dieses Modell wird auf ein Validations-Subset (25% der Daten) angewendet, um die Prognosegenauigkeit des Modells zu prüfen.
Nachdem Ihr Modell erstellt wurde, erhalten Sie im Debriefing alle wichtigen Informationen zur Modellgenauigkeit, Anwendbarkeit auf neue Daten und wichtige Einflussfaktoren. So können Sie die Qualität des Modells einschätzen. Anschließend können Sie das Modell verwenden, um Vorhersagen zu generieren. Alternativ können Sie auch eine Kopie des Modells erstellen und mit den Parametern experimentieren, um eine bessere Genauigkeit und Stabilität zu erzielen. Danach können Sie die jeweiligen Modelle miteinander vergleichen.
Smart Predict umfasst Classification, Regression und Time Series Szenarien. Wenn Sie versuchen zu bestimmen, ob ein Kunde Ihr neues Produkt kauft oder nicht, haben Sie es mit einem Classification Szenario zu tun. Wenn Sie versuchen, einen numerischen Wert vorherzusagen und die Schlüsselfaktoren dahinter zu erforschen, haben Sie es mit einem Regression Szenario zu tun. Bei einem Time Series Szenario versuchen Sie, einen zukünftigen Wert auf der Grundlage von historischen Schwankungen im Laufe der Zeit, Jahreszeiten und anderen Faktoren zu prognostizieren. Nachfolgend werden die einzelnen Szenarien im Detail vorgestellt.
Classification
Classification Szenario wird bei einem binären Ereignis eingesetzt. Zum Beispiel, wenn Sie versuchen zu bestimmen, ob etwas passieren wird oder nicht. Wer wird Ihr neues Produkt voraussichtlich kaufen? Welcher Kunde könnte abwandern, welcher nicht?
Mit einem Classification Szenario können Sie vorhersagen, ob Ihre Kunden auf ein Marketingangebot reagieren werden oder nicht und die Wahrscheinlichkeit für jeden Ihrer potenziellen Kunden bestimmen. Auf diese Weise können Sie sich auf Kunden konzentrieren, die am ehesten zum Kauf bereit sind.
Regression
Ein Regression Szenario kommt zum Einsatz, wenn Sie versuchen, einen numerischen Wert vorherzusagen und die wichtigsten Treiber dahinter zu ergründen. So können Sie eine Prognose des Geschäftswerts unter Berücksichtigung seines Kontexts erstellen.
Sie können Smart Predict mit einem Regression Szenario verwenden, um die Anstellungsdauer eines Mitarbeiters vorherzusagen. Dabei werden automatisch Beziehungen in Ihren Daten identifiziert, damit Sie besser verstehen können, welche Faktoren zu einer langfristigen Beschäftigung führen. Die dabei gewonnenen Erkenntnisse können Sie in Ihrer Personalpolitik verwenden, um die Mitarbeiterfluktuation zu reduzieren. Ein anderes Beispiel wäre die Umsatzprognose einer Produktlinie auf der Grundlage der geplanten Transportkosten und Steuern.
Time Series
Mit dem Time Series Szenario können Sie die zukünftigen Werte vorhersagen. So können Sie zum Beispiel zukünftige Verkaufsmengen prognostizieren, indem historische Verkaufsdaten analysiert werden. Darüber hinaus können Sie zusätzliche Informationen heranziehen, wie zum Beispiel Ihre aktuellen Vertriebsmitarbeiter, Marketingaktivitäten oder Umweltfaktoren wie das Wetter, um zukünftige Trends zu projizieren.
Die Vorhersagen werden in Form eines Graphs visualisiert, damit Sie sofort den notwendigen Durchblick gewinnen können. Anhand des Konfidenzintervalls, Backtesting und der Indikatoren für die Prognosegüte (wie z.B. MAPE - Mean Absolute Percentage Error) können Sie die Qualität des Modells validieren.
R Scripting
Neben Augmented Analytics und Smart Predict können Sie auch eigene R Skripte nutzen, um kundenindividuelle Visualisierungen zu erstellen. R ist eine Open-Source-Programmiersprache, die Pakete für fortgeschrittene Visualisierungen, Statistik und maschinelles Lernen enthält.
Sie können die R-Visualisierungen in Ihre SAC-Story einfügen und mit anderen Benutzern teilen. Dabei können Sie mit den R-Visualisierungen wie gewohnt mithilfe von SAC-Steuerelementen, wie z.B. Filtern, interagieren. Wenn Sie die Visualisierungen mit anderen Nutzern teilen, bleiben diese interaktiv und berücksichtigen die Berechtigungen der jeweiligen Benutzer.
Einordnung in SAP Produkt-Strategie
SAP fokussiert sich stark auf SAP Analytics Cloud und entwickelt kontinuierlich weitere Funktionalitäten. So wird in Zukunft Smart Insights für weitere Live-Daten-Verbindungen ausgerollt und auch Smart Discovery für Live SAP HANA Verbindungen angeboten. Search to Insight soll zukünftig mehr Sprachbegriffe und geschäftliche Begriffe verstehen.
Auch bei Smart Predict wird an neuen Funktionalitäten gearbeitet. So sollen Business Analysten befähigt werden, die Genauigkeit der Prognosen untersuchen zu können. Gleichzeitig soll der Übergang von Smart Discovery zu Smart Predict nahtlos gestaltet werden. Auch sollen die Prognosen zukünftig automatisch aktualisiert werden. Es bleibt also spannend.
Vor- und Nachteile von SAC Machine Learning
SAP Analytics Cloud bietet benutzergesteuerte, einfach zu bedienende Machine Learning Methoden. Diese werden auch kontinuierlich weiterentwickelt. Darüber hinaus wird ein einfaches Teilen der Erkenntnisse und Kollaboration ermöglicht. Die Predictive Funktionen sind in das SAP-Ökosystem integriert und weisen ein benutzerfreundliches UI auf.
Als Nachteil ist jedoch die sehr eingeschränkte Funktionalität zu nennen. Search to Insight kann nur englische Wörter erkennen und verwenden. Außer den von SAP vordefinierten Anwendungsfällen sind zumindest derzeit keine kundeneigenen Funktionen möglich. Darüber hinaus stellt die Machine Learning Funktion eine “Black Box” dar und ermöglicht keine Kontrolle über die Parameter und das Ergebnis. Das Training der Modelle erfolgt automatisiert anhand von SAP Algorithmen. Man kann keine eigenen Algorithmen verwenden, nur die Visualisierung kann mit R individualisiert werden.
Unser Fazit -SAP Analytics Cloud und Machine Learning
Keine Frage, SAP Analytics Cloud bietet dem Anwender aus dem Fachbereich sehr ansprechende Machine Learning Funktionen. Der Anwender wird bei der Entscheidungsfindung unterstützt. Das System generiert automatisch Einblicke und gibt wichtige Gedankenanstöße.
Das sind zwar wichtige Punkte für einen Anwender aus dem Fachbereich, allerdings nichts für einen Data Scientist. Besonders schwerwiegend ist die eingeschränkte Funktionalität. Da es sich auch um sogenannte BlackBox-Modelle handelt, ist es unmöglich nachzuvollziehen, was im Hintergrund passiert und wie die Ergebnisse zustandekommen. Ferner kann man auch keine eigenen Algorithmen einbinden.
Wenn Sie Ihre Prozesse mit Machine Learning verbessern und dabei den vollen Durchblick sowie Kontrolle behalten wollen, legen wir Ihnen unser Whitepaper “SAP BW und State of the Art Machine Learning” ans Herz. In diesem beleuchten wir das Machine Learning Portfolio von SAP und geben klare Empfehlungen.