In den letzten Jahren war SAP Data Intelligence die konsolidierte Lösung des Walldorfer Herstellers für Datenverarbeitung, Metadatenmanagement und die Entwicklung von Machine Learning Applikationen. Data Intelligence hat in dieser Zeit einige wichtige Verbesserungen gesehen und ist zu einer zuverlässigen All-in-One-Lösung für Data Engineering- und Data Science Teams geworden. Diese Errungenschaften werden in naher Zukunft einem breiteren Publikum zur Verfügung stehen, da SAP im August 2022 eine überarbeitete Produkt Roadmap für das Datenmanagement veröffentlicht hat: Data Intelligence wird in der Data Warehouse Cloud aufgehen.
Angesichts dieses drastischen, aber sinnvollen Schrittes laden wir Sie ein, gemeinsam mit uns einen kurzen Rückblick auf die wichtigsten Merkmale von Data Intelligence und seine Entwicklungsgeschichte zu wagen sowie einen Ausblick auf die mögliche Zukunft der SAP Business Datenplattform zu werfen.
Die digitalen Prozesse und datengetriebenen Analysen eines jeden Unternehmens sind einzigartig und damit auch die Anforderungen an die notwendige Datenmanagement Plattform. Für die Aufbereitung, Automatisierung und Analyse von Daten gibt es zahlreiche Möglichkeiten. Die Entscheidung hängt von den beteiligten Systemen, der Art der Daten und dem vorhandenen Knowhow ab. Die SAP Komplettlösung Data Intelligence verfügt über eine sehr sinnvolle Kombination von Komponenten, die - gerade im SAP Kontext - einen schnellen und flexiblen Weg für das Datenmanagement bieten. Auch für Projekte im Bereich der Künstlichen Intelligenz (KI) und des Maschinellen Lernens (ML) ergeben sich dank der intuitiven, unterstützenden Oberfläche erhebliche Potenziale für Fachanwender.
Data Intelligence Architektur: Das System ist eine Sammlung von Funktionsmodulen, die ein breites Spektrum von Datenmanagementaufgaben abdecken.
Data Intelligence kann in der Infrastruktur aller gängigen Cloud Anbieter unter Verwendung der Kubernetes-Cluster Technologie eingesetzt werden.
SAP Data Intelligence ist die leicht verständliche Datenmanagement-, Verarbeitungs- und Orchestrierungslösung des Unternehmens, die On-Premise im eigenen Rechenzentrum, in der Private Cloud oder über alle großen Cloud Service Anbieter eingesetzt werden kann. Das System orientiert sich an aktuellen IT Trends wie Self-Service Analytics und automatischer Skalierung. Diese Features sind in einem stabilen Backend implementiert, das SAP eigene Systeme und Open Source Technologien wie Kubernetes und Docker kombiniert. Der Anwendungsbereich ist die Integration, Verarbeitung und Anreicherung von Daten, vor allem für automatisierte Analyseprozesse. Die Daten werden über mehrere Workflows und Endpunkte hinweg verknüpft und sind zentral über das Webinterface verfügbar.
Data Intelligence Modeler: Das Drag-and-Drop-Werkzeug für die Modellierung und Orchestrierung von Datenpipelines in SAP Data Intelligence
ermöglicht es Anwendern, Daten aus verschiedenen Quellen zu extrahieren, zu transformieren und in diese in verschiedene Zielsysteme zu laden.
Für komplexere Operationen kann Python- oder R-Code innerhalb von Pipelines ausgeführt werden.
Data Intelligence versteckt seinen Patchwork Charakter nicht, sondern bewirbt die verschiedenen spezialisierten Komponenten in der zentralen Benutzeroberfläche: "Metadata Explorer", "ML Data Manager", "ML Scenario Manager", und "Modeler" - um nur einige zu nennen. Die Modeler Komponente ist der ausgereifte grafische Datenpipeline Editor und Orchestrierungsdienst von SAP. Der Drag and Drop Pipeline Builder enthält viele nützliche, sofort einsetzbare Operatoren. Neben Konnektoren für alle wichtigen Datenbank- und Speicherquellsysteme und -protokolle wird die Verwendung der neuesten Algorithmen für fortgeschrittene Benutzer durch die Integration von Python- und R-Bibliotheken ermöglicht. Für technisch versierte Anwender in den Fachbereichen kann die Einstiegshürde für Datenprojekte gesenkt werden. Ähnlich wie bei Tableau und SAP Analytics Cloud (SAC) im Dashboarding werden Nutzerzentriertheit und schnelle Bedienbarkeit genutzt, um ein unternehmensweites Umdenken in Bezug auf Datenprozesse einzuleiten.
Die SAP Data Intelligence Lösung wird bereits seit 2019 als Kombination aus dem Vorgänger SAP Data Hub und SAP Leonardo Machine Learning angeboten. Die zahlreichen Komponenten wie Modeler, Metadata Explorer und ML Scenario Manager sind eng miteinander verzahnt und sollen die Entwicklungsphasen eines KI Projekts optimal begleiten und die Ergebnisse zentral bündeln. Ergänzt werden kann die Plattform durch die SAP AI Business Services, die zum Beispiel automatisiertes maschinelles Lernen (AutoML) über eine eigenständige API bereitstellen.
Data Intelligence wird 2023 im Rahmen des Projekts "Data Suite" mit Data Warehouse Cloud zusammengeführt.
Während des derzeitigen Lebenszyklus von Data Intelligence wurde das System um eine lange Liste von Funktionen erweitert. Viele dieser Funktionen haben die Fähigkeiten der Komponente "Data Pipeline Modeler" verbessert. Die Verfolgung des Datenflusses durch Pipelines und Debugging Funktionen wurden ebenso hinzugefügt wie Analysewerkzeuge für Nachrichten, die die verschiedenen Operatoren innerhalb einer Pipeline durchlaufen. Neue Operatoren wurden aufgenommen, um die Verbindung zu immer mehr Remote-Systemen und Protokollen zu ermöglichen. Data Intelligence Version 3.2 ist damit eine ausgereifte, voll funktionsfähige Plattform für Datenverarbeitung, Orchestrierung und Machine Learning.
Mit der strategischen Entscheidung, Data Intelligence mit Data Warehouse Cloud zu verschmelzen, räumt SAP die Gesamtarchitektur ihrer Datenmanagement Lösungen auf. Anstatt die Datenintegrationskomponenten in beiden Systemen parallel zu entwickeln, wird Data Intelligence diese Rolle in der kombinierten "Data Suite", wie das Projekt derzeit genannt wird, übernehmen. Die vielleicht weniger prominente, aber als Hidden Champion der Data Intelligence Komponenten geltende Komponente Metadata Explorer wird auch für DWC Anwender verfügbar sein. Diese Datenkatalogisierungslösung bietet eine intuitive Benutzererfahrung hinsichtlich Definition von Datenmodellen, semantischen Metadaten und Data Governance Aspekten wie der Zugriffskontrolle für bestimmte Datenobjekte. In Anbetracht der Trends im gesamten Datenmanagement Ökosystem wird die leicht zugängliche Metadatenverwaltung in absehbarer Zukunft ein wichtiger Faktor sein.
Die Zusammenlegung von Data Intelligence mit Data Warehouse Cloud wird das Ende von SAP DI als eigenständiges Produkt einläuten. Nach den derzeitigen Plänen soll die Integration der beiden Systeme im ersten Quartal 2023 beginnen. Da diese Nachricht sehr frisch ist, kann sich der Zeitplan noch ändern.
ML Scenario Manager: Die Self-Service-Plattform für maschinelles Lernen wird in naher Zukunft für alle Nutzer der Data Warehouse Cloud verfügbar sein.
Die strategische Entscheidung von SAP, ihre eigenständigen Produkte zu einer einzigen cloudbasierten Datenmanagementlösung zusammenzufassen, entspricht den neuesten Trends im Ökosystem der Geschäftsdatenverarbeitung: Da die Komponenten der Datenverarbeitungssoftware einen Reifegrad erreicht haben, bei dem die meisten gängigen Anwendungsfälle problemlos abgedeckt werden können, verlagert sich der Schwerpunkt der Aufmerksamkeit auf die höhere Abstraktionsebene der tatsächlichen Benutzererfahrung. Datenverarbeitungsplattformen sollten nicht mehr nur für IT Mitarbeiter - Datenbankadministratoren und Softwareingenieure mit entsprechender langjähriger Ausbildung -, sondern auch für die Anwender in der Fachabteilungen gedacht sein. Wenn Geschäftsanwender in die Lage versetzt werden, Datenmodelle und Analysen selbst zu erstellen, erhöht sich die Effizienz und Genauigkeit von Business Intelligence Prozessen. Die Semantik der Geschäftsdaten muss nicht mehr übersetzt und buchstabiert werden, damit IT Mitarbeiter das richtige Datenmodell und die richtigen Abfragen erstellen können. In dem Maße, wie die Datenkompetenz der Mitarbeiter in den Fachabteilungen zunimmt, stärkt dieser Trend die Verantwortung nicht nur für die Quelldaten, sondern für die gesamte Wertschöpfungskette bis hin zu den getroffenen Entscheidungen.
Dieser Trend zur Demokratisierung von Daten geht einher mit dem architektonischen Konzept des Data Mesh. Die Data Mesh Architektur fördert eine zentrale Self Service Datenplattform und einen Data Governance Rahmen. Innerhalb dieser infrastrukturellen Grenzen arbeiten die Geschäftsabteilungen autonom und erstellen sogenannte Datenprodukte, die mit anderen Bereichen geteilt werden. Die Zusammenführung der Datenverarbeitungsfunktionen von SAP Data Intelligence in Data Warehouse Cloud passt perfekt in dieses Muster. In einem früheren Blogbeitrag haben wir bereits DWC Spaces als Mittel zum Self Service Datenmanagement für Fachabteilungen vorgestellt. Nun wird dieser Mechanismus um ausgereifte Datenverarbeitungs-, Analyse- und Machine Learning Tools erweitert, die in der Data Intelligence Sparte entwickelt wurden. Das Ergebnis wird eine Cloud-Geschäftsdatenplattform sein, die moderne datengesteuerte Organisationen auf die nächste Effizienzstufe heben kann.
Wenn Sie mehr über die Data Mesh Architektur erfahren möchten und darüber, wie DWC Ihrem Unternehmen bei der digitalen Transformation helfen kann, verfolgen Sie weiterhin unseren NextLytics-Blog! In den kommenden Wochen werden wir weitere Beiträge zu diesem Themenkomplex veröffentlichen.
Haben Sie Fragen zu diesem oder anderen Themen? Senden Sie uns eine Nachricht oder vereinbaren Sie einen Termin für einen Austausch. Wir helfen Ihnen gerne bei der strategischen Auswahl eines Datenmanagementsystems - Open Source Architektur oder lizenziert - und unterstützen Sie bei der Implementierung und Konzeptionierung erster Anwendungsfälle.