SAP und Databricks haben im Februar 2025 endlich greifbare Ergebnisse ihrer bereits seit 2 Jahren währenden strategischen Partnerschaft angekündigt: das Produkt Databricks wird zukünftig als eine Komponente für pro-code Datenintegration und ML/AI-Entwicklungsprozesse in der neuen SAP Business Data Cloud für Kunden unter dem namen “SAP databricks” zur Verfügung stehen. Bereits vor dieser Ankündigung gab es viele Argumente für einen gemeinsamen Betrieb von SAP- und Databricks-Systemen. Die offizielle Zusammenarbeit und Integration von Databricks in das SAP Produktportfolio unterstreicht diese Synergien und öffnet gleichzeitig den Raum für viele Fragen zur tatsächlichen Umsetzung. Wir haben für Sie mit SAP und Databricks gesprochen und helfen Ihnen bei der Bewertung und Definition der passenden Plattformstrategie für Ihr Unternehmen. Lesen Sie heute das exklusive Interview mit dem Technical General Manager DACH von Databricks, Matthias Ingerfeld.
Unsere Blogreihe "Business Data Cloud" im Überblick
|
Seit einigen Wochen ist die große Strategie der SAP für ihre Datencloud bekannt: Unter dem Banner der Business Data Cloud laufen die Analytics Cloud, Datasphere und das bewährte Business Warehouse in einer Private-Cloud Edition zusammen. Für anspruchsvolle Data Science mit Machine Learning-Methoden und neuesten KI-Generationen wird mit Databricks eine führende Lösung im Markt eingekauft. SAP Databricks wird in einer leicht abgewandelten Version der innovativen Data Lakehouse Plattform als voll integrierte Systemkomponente neben SAC und Datasphere für Anwender zur Verfügung stehen. Zentral für die technische Integration ist dabei ein Paradigmenwechsel innerhalb der SAP Datasphere hin zur von Databricks angeführten Lakehouse-Architektur.
Eine Bewertung von Dr. Hagen Jander, Vice President of Data Warehouse Product Management & Strategy bei SAP, haben wir an dieser Stelle vor kurzem bereits veröffentlicht.
Doch wie bewertet Databricks das neue Produkt und die konkrete operative Zusammenarbeit mit SAP? Matthias leitet als Technical General Manager für Zentraleuropa (DACH-Region und Osteuropa) das Presales-Team von Databricks und ordnet für uns zentrale Fragen zur Kooperation ein. Er und sein Team begleiten Kunden bei der Implementierung der sogenannten Data Intelligence Platform von Databricks.
Wie bewertet ihr die strategische Bedeutung dieser tiefgreifenden Integration von Databricks in die SAP Business Data Cloud?
Die strategische Partnerschaft zwischen SAP und Databricks sowie die Integration von Databricks in BDC ist für unsere Kunden von enormer Bedeutung. Diese Partnerschaft ermöglicht es ihnen, ihre wertvollen Geschäftsdaten aus SAP-Anwendungen direkt und ohne Kontextverlust zu nutzen, um Data Science und KI-Anwendungen nativ auf Databricks zu entwickeln.
Delta Sharing, Delta Lake, Unity Catalog: Einige technische Begriffe sind in den ersten Pressemitteilungen schon genannt worden, aber wie genau wird die Integration von Databricks in die SAP Cloud umgesetzt werden? Wie ermöglicht ihr den wechselseitigen Zugriff auf Daten über die Systemgrenzen hinweg?
Databricks ist ein zentraler Bestandteil der SAP Business Data Cloud. Der Datenaustausch mit anderen BDC-Komponenten wird durch offene Standards ermöglicht. Sowohl BDC als auch Databricks verwenden Delta Lake – das führende offene Format für zuverlässige und performante Datenspeicherung in der Cloud. Der bidirektionale Datenaustausch erfolgt über Delta Sharing, eine weitere Open-Source-Technologie von Databricks für sicheren und skalierbaren Datenaustausch über System- und Organisationsgrenzen hinweg.
Ein weiterer wichtiger BDC-Bestandteil ist der native Databricks Connector. Damit können SAP-Daten ohne Kopieren auf bestehenden Databricks-Plattformen genutzt und beispielsweise mit anderen Datensätzen kombiniert werden.
SAP Databricks wird nicht alle bekannten Databricks Systemkomponenten enthalten. Für welche Szenarien sollten Kunden auch weiterhin eine eigenständige Databricks-Umgebung in Betracht ziehen?
Databricks im SAP BDC umfasst Data Science, SQL Serverless und KI-Komponenten. Diese ermöglichen das Training von KI-Anwendungen direkt auf SAP-Daten, einschließlich Business-Logik. Darüber hinaus ist der Zugriff auf diese Daten mit gängigen BI-Anwendungen wie PowerBI und Tableau möglich. Außerhalb von SAP bietet Databricks zusätzliche Komponenten für Data Engineering, wie Echtzeitdatenverarbeitung. Kunden können so Echtzeit-Telemetriedaten aus ihren Maschinen in Non-SAP Databricks verarbeiten und diese mit SAP-Daten aus BDC anreichern. Umgekehrt kann in SAP-Databricks auf die verarbeiteten und aggregierten Maschinendaten für das Reporting zugegriffen werden.
Databricks steht für Offenheit: für Open Source Code, offene Datenformate und Kommunikationsprotokolle, und die Interoperabilität über Cloud- und Systemgrenzen hinweg. Wird SAP Databricks wie gewohnt freien Zugriff auf Daten insbesondere der über Delta Share verfügbaren SAP-Daten erlauben oder gibt es Einschränkungen wie z.B. Lizenzbedingungen?
Ein großer Vorteil dieser Partnerschaft für unsere Kunden besteht darin, dass SAP-Daten in Databricks sowohl innerhalb als auch außerhalb von BDC ohne zusätzliche Kosten verarbeitet werden können. Die Governance durch Unity Catalog innerhalb von Databricks gewährleistet, dass diese Daten unter Einhaltung der Governance über Cloud- und Systemgrenzen hinweg weiterverarbeitet werden können.
Habt ihr noch Aufgaben auf der Roadmap, bevor SAP Databricks für Kunden verfügbar sein wird und gibt es schon ein Zeitfenster, wann mit dem Launch gerechnet werden kann?
Im Moment bereiten sich bei SAP und Databricks alle auf den heiß erwarteten Launch vor. Die technischen Vorarbeiten sind aber weitestgehend abgeschlossen und erste Testkunden haben bereits positive Erfahrungen mit dem neuen Produkt machen können. Wir gehen weiterhin davon aus, dass es schon nächsten Monat, also im April 2025, für die ersten Kunden losgeht!
Wir möchten uns ausdrücklich bei Matthias und dem Team bei Databricks für diese Einblicke bedanken!
Bemerkenswert sind die Implikationen für reguläre Databricks-Kunden: SAP Business Data Cloud wird nicht nur in der Lage sein, Datenprodukte ohne Replikation mit der integrierten Databricks-Umgebung zu teilen, sondern auch mit beliebigen freistehenden Databricks Workspaces. Auch bestehende bzw. unabhängigen Databricks-Systemumgebungen werden damit in die Lage versetzt, SAP Daten zu verarbeiten - ohne Reibungs- und Bedeutungsverluste oder zusätzliche Lizenzkosten oder Integrations-Drittsysteme. Multi-Cloud und systemübergreifende Datenarchitekturen werden möglich und erlangen performanten Zugriff auf SAP Daten, wie es in dieser Form bislang nicht möglich ist. Die Business Data Cloud bleibt aber der Gatekeeper für diesen Zugang, auch wenn nicht der integrierte SAP Databricks Workspace genutzt werden soll.
Eine große Frage, die derzeit viele SAP-Kunden umtreibt, ist natürlich, ob sich ein unabhängiges Databricks noch lohnt oder die integrierte SAP Databricks allen Anforderungen gerecht werden kann. Während in unserem Interview die ganz konkreten Aussagen zu den in SAP Databricks fehlenden Features ausbleiben, ist eine Tendenz zu erkennen: Insbesondere Streaming- und Echtzeitdatenverarbeitung wird als Königsdisziplin gesehen, in der die SAP-Variante von Databricks nur eingeschränkte Möglichkeiten bietet. Delta Live Tables als einfaches und mächtiges Werkzeug für Live-Datenmodelle und Echtzeit-BI dürften somit in SAP Databricks fehlen. Unsere Interpretation der Unterschiede haben wir im folgenden Diagramm für Sie zusammengefasst:
SAP Databricks Funktionsumfang, soweit wir die bisher vorhandenen Informationen interpretieren: Ausgegraute Boxen stellen bekannte
Databricks Features und Komponenten dar, welche in der SAP-Version des Databricks Workspace wahrscheinlich nicht verfügbar sein werden.
Wir sind weiterhin gespannt auf den offiziellen Stapellauf der SAP Business Data Cloud im April und sehen großes Potenzial in den technologischen Entwicklungen, die auf diesem Wege Einzug in die SAP Systemlandschaft halten. SAP und Databricks ergänzen sich in vielen Bereichen sehr gut und die vertiefte Partnerschaft öffnet auch für erfahrene BI Teams neue Möglichkeiten. Klar ist aber auch: Nur BDC-Kunden fahren zukünftig in der ersten Klasse Richtung Data Lakehouse, die anderen stehen noch am Bahnhof.
Haben Sie Fragen zu SAP Business Data Cloud, Databricks oder dem bestmöglichen Zusammenspiel für Ihre BI- und KI-Anforderungen? Versuchen Sie das nötige Know-How in Ihrer Abteilung aufzubauen oder benötigen Sie Unterstützung bei einer konkreten Fragestellung? Wir helfen Ihnen gerne dabei. Fordern Sie noch heute ein unverbindliches Beratungsangebot an.