Skip to content
NextLytics
Megamenü_2023_Über-uns

Shaping Business Intelligence

Ob clevere Zusatzprodukte für SAP BI, Entwicklung aussagekräftiger Dashboards oder Implementierung KI-basierter Anwendungen - wir gestalten zusammen mit Ihnen die Zukunft von Business Intelligence. 

Megamenü_2023_Über-uns_1

Über uns

Als Partner mit tiefem Prozess-Know-how, Wissen der neuesten SAP-Technologien sowie hoher sozialer Kompetenz und langjähriger Projekterfahrung gestalten wir die Zukunft von Business Intelligence auch in Ihrem Unternehmen.

Megamenü_2023_Methodik

Unsere Methodik

Die Mischung aus klassischem Wasserfallmodell und agiler Methodik garantiert unseren Projekten eine hohe Effizienz und Zufriedenheit auf beiden Seiten. Erfahren Sie mehr über unsere Vorgehensweise.

Produkte
Megamenü_2023_NextTables

NextTables

Daten in SAP BW out of the Box bearbeiten: Mit NextTables wird das Editieren von Tabellen einfacher, schneller und intuitiver, egal ob Sie SAP BW on HANA, SAP S/4HANA oder SAP BW 4/HANA nutzen.

Megamenü_2023_Connector

NextLytics Connectoren

Die zunehmende Automatisierung von Prozessen erfordert die Konnektivität von IT-Systemen. Die NextLytics Connectoren ermöglichen eine Verbindung Ihres SAP Ökosystems mit diversen open-source Technologien.

IT-Services
Megamenü_2023_Data-Science

Data Science & Engineering

Bereit für die Zukunft? Als starker Partner stehen wir Ihnen bei der Konzeption, Umsetzung und Optimierung Ihrer KI-Anwendung zur Seite.

Megamenü_2023_Planning

SAP Planning

Wir gestalten neue Planungsanwendungen mithilfe von SAP BPC Embedded, IP oder  SAC Planning, die einen Mehrwert für Ihr Unternehmen schaffen.

Megamenü_2023_Dashboarding

Dashboarding

Mit unserer Expertise verhelfen wir Ihnen auf Basis von Tableau, Power BI, SAP Analytics Cloud oder SAP Lumira zu aussagekräftigen Dashboards. 

Megamenü_2023_Data-Warehouse-1

SAP Data Warehouse

Planen Sie eine Migration auf SAP HANA? Wir zeigen Ihnen, welche Herausforderungen zu beachten sind und welche Vorteile eine Migration bringt.

Business Analytics
Megamenü_2023_Procurement

Procurement Analytics

Transparente und valide Zahlen sind vor allem in Unternehmen mit dezentraler Struktur wichtig. SAP Procurement Analytics ermöglicht die Auswertung von SAP ERP-Daten in SAP BI.

Megamenü_2023_Reporting

SAP HR Reporting & Analytics

Mit unserem Standardmodell für Reporting von SAP HCM mit SAP BW beschleunigen Sie administrative Tätigkeiten und stellen Daten aus verschiedenen Systemen zentral und valide zur Verfügung.

Megamenü_2023_Dataquality

Data Quality Management

In Zeiten von Big Data und IoT kommt der Vorhaltung einer hohen Datenqualität eine enorm wichtige Bedeutung zu. Mit unserer Lösung für Datenqualitätsmanagement (DQM) behalten Sie stets den Überblick.

Karriere
Megamenü_2023_Karriere-2b

Arbeiten bei NextLytics

Wenn Du mit Freude zur Arbeit gehen möchtest und dabei Deine berufliche und persönliche Weiterentwicklung nicht zu kurz kommen soll, dann bist Du bei uns genau richtig! 

Megamenü_2023_Karriere-1

Berufserfahrene

Zeit für etwas Neues? Gehe Deinen nächsten beruflichen Schritt und gestalte Innovation und Wachstum in einem spannenden Umfeld zusammen mit uns!

Megamenü_2023_Karriere-5

Berufseinsteigende

Schluss mit grauer Theorie - Zeit, die farbenfrohe Praxis kennenzulernen! Gestalte bei uns Deinen Einstieg ins Berufsleben mit lehrreichen Projekten und Freude an der Arbeit.

Megamenü_2023_Karriere-4-1

Studierende

Du möchtest nicht bloß die Theorie studieren, sondern Dich gleichzeitig auch praktisch von ihr überzeugen? Teste mit uns Theorie und Praxis und erlebe wo sich Unterschiede zeigen.

Megamenü_2023_Karriere-3

Offene Stellen

Hier findest Du alle offenen Stellenangebote. Schau Dich um und bewirb Dich - wir freuen uns! Falls keine passende Stelle dabei ist, sende uns gerne Deine Initiativbewerbung zu.

Blog
NextLytics Newsletter Teaser
Hier für unseren monatlichen Newsletter anmelden!
Newsletter abonnieren
 

Delta Loading in SAP Datasphere

Delta Loading ist eine wichtige Funktion von Enterprise Data Warehouses (DWH), die, bei regelmäßiger Replikation von Daten aus Quellsystemen in das DWH, eine kontinuierliche und stabile Performance gewährleistet und minimale Auswirkungen auf beteiligte Systeme sicherstellt. Dies wird in der Regel durch den Einsatz eines Mechanismus erreicht, der die minimal erforderlichen Zeilen der Quelldaten bestimmt, die in das DWH übertragen werden müssen, um die Aktualität des Zielmodells zu gewährleisten. Die konkrete Umsetzung dieses Mechanismus variiert stark zwischen verschiedenen DWH-Lösungen auch innerhalb der SAP-Produktlandschaft.

In diesem Artikel möchten wir unsere Erfahrungen aus Kundeneinsätzen und internen Tests über den Umfang und die Funktionsweise der Delta Loading Möglichkeiten in SAP Datasphere [früher bekannt unter dem Namen "Data Warehouse Cloud (DWC)"] teilen und aufzeigen. Während die Delta Möglichkeiten in Datasphere im Vergleich zu SAP Business Warehouse tatsächlich noch recht eingeschränkt sind, haben wir zwei Ansätze gefunden, die sich für eine Vielzahl von Anwendungsfällen eignen.

Szenario Einrichtung

In diesem Szenario haben wir ein S/4HANA OnPrem-System untersucht, welches als Testinstanz über die SAP Cloud Application Library (CAL) eingerichtet wurde und als Datenquelle für unseren internen Datasphere-Tenant dient. Wir haben eine Verbindung zwischen S/4HANA und Datasphere hergestellt, sowie einen Data Provisioning Agent konfiguriert, um die Nutzung von Remote-Tabellen und der Real-Time-Replication Funktionalität zu ermöglichen.

Unsere verwendete Architektur besteht weiterhin aus S/4HANA Change Data Capture (CDC) fähigen Core Data Service (CDS) Views, auf die als Remote-Tabellen in Datasphere zugegriffen wird und welche damit als Staging Layer fungieren.

Der geneigte Leser kann unter folgendem Link mehr über die Funktionsweise von CDC in CDS Views erfahren: CDS based data extraction – Part II Delta Handling | SAP Blogs

An dieser Stelle sollte es jedoch genügen, darauf hinzuweisen, dass CDC es dem Zielsystem ermöglicht, zu erkennen, welche Zeilen im Quellobjekt seit der letzten Replikation geändert worden sind.

Lösungsansätze

Wir haben zwei wesentliche Designansätze für die Implementierung von Delta Loading in einem enterprise Szenario mit Datasphere ermittelt:

Real-Time-Replication auf Remote-Tabellen

Der einfachste Ansatz Delta Loading zu implementieren, ist die Nutzung von CDC-fähigen CDS Views. Diese werden als Remote-Tabellen in Datasphere importiert und für den Echtzeit-Zugriff im Data Integration Monitor freigeschaltet.

Blogpost Mid-August DWC_Delta Loading

Dadurch wird sichergestellt, dass die Remote-Tabelle in Datasphere eine nahezu in Echtzeit aktualisierte Kopie der CDS View in der Quelle ist. Dies ist ein sehr einfacher, schneller und effektiver Ansatz, der jedoch auch einige Einschränkungen mit sich bringt.

a) Die Aktualisierungsfrequenz kann nicht angepasst werden

Es gibt zwar Anzeichen dafür, dass diese Funktion mittelfristig von SAP eingeführt werden könnte, aber es ist derzeit nicht möglich die Häufigkeit der Replikation anzupassen, d. h. sie erfolgt immer nahezu in Echtzeit. Während dies für die meisten Szenarien kein Problem darstellt, werden Kunden, die an nächtliche Upload-Zyklen gewöhnt sind, feststellen, dass ein Change-Management-Konzept erforderlich sein wird, da Änderungen am Quellsystem unmittelbar im DWH vorhanden sein werden, anstatt erst am nächsten Arbeitstag verfügbar zu sein.

b) Die Remote-Tabelle ist immer eine 1:1-Kopie der Quelle

Da wir eine Remote-Tabelle replizieren und eine Remote-Tabelle nur eine Kopie der Metadaten des Quellobjekts ist, können wir sie in Datasphere nicht anpassen, indem wir z. B. zusätzliche technische Felder anlegen. Anpassungen in nachträglich verwendeten Views sind natürlich trotzdem möglich.


Schauen Sie sich unser Webinar an:
SAP Datasphere - Bereit für den Einsatz? 

 

Neuer Call-to-Action


Data Flows mit Filter auf geeigneten Delta Indikator

Bei diesem Ansatz muss im Quellobjekt ein geeignetes Feld ermittelt werden, welches als Delta Indikator verwendet werden kann. Idealerweise sollte die Quelle so etwas wie ein LastChangeDate-Feld vorweisen, das den Zeitpunkt markiert, an dem ein neuer Datensatz erstellt, oder ein bestehender Datensatz gelöscht oder geändert wird. Für das Lösch Szenario wäre zusätzlich ein binäres Feld wie DeletionFlag erforderlich. Wenn diese Anforderungen erfüllt sind, können wir dem Ansatz in Datasphere folgen, indem wir ein Data Flow Objekt erstellen, eine Remote-Tabelle, eine lokale Zieltabelle und einen Filter einfügen, um damit den Data Flow z. B. auf LastChangeDate = CurrentDate - 1 zu beschränken. Anschließend würden wir diesen Data Flow in einer Schedule einplanen, sodass dieser jede Nacht ausgeführt wird. Auf diese Weise werden bei jedem nächtlichen Lauf nur die Datensätze zu geladen, die am Vortag geändert wurden.

Blogpost Mid-August DWC_Delta Loading

Dieser Ansatz funktioniert für Inserts und Updates, wenn garantiert werden kann, dass alle Änderungen dieser Art in einem Feld wie LastChangeDate reflektiert sind. Das Deletion Szenario hingegen wäre nur dann gelöst, wenn einer der folgenden Punkte zutrifft:

a) Löschungen in der Quelle sind nicht möglich

In einem ERP-Quellsystem könnten viele potenzielle Quellobjekte bereits so eingerichtet sein, dass dort niemals ein Datensatz gelöscht wird.

b) Löschungen in der Quelle werden über einen Löschvermerk durchgeführt

Wenn Löschungen stattfinden, dann ist es notwendig, dass dies nicht durch ein tatsächliches Löschen der Zeile im Quellobjekt geschieht, sondern durch das Setzen eines Indikatorfeldes wie DeletionFlag.

c) Löschungen in der Quelle müssen nicht im DWH gelöscht werden

Selbst wenn Löschungen im Quellobjekt stattfinden und durch tatsächliches Löschen der Zeile erfolgen, ist das Deletion Problem gelöst, wenn zumindest die Anforderungen des Datasphere-Modells keine Löschung im Data Warehouse erfordern. Dabei müssen jedoch weiterhin Randfälle berücksichtigt werden, wie z. B. die Erstellung und Löschung eines bestimmten Datensatzes am selben Arbeitstag, welcher hierdurch entsprechend niemals im DWH-Modell erscheinen würde.

Trifft keiner der oben genannten Punkte zu, oder gibt es kein LastChangeDate-ähnliches Feld zur Behandlung von Inserts/Updates, ist es immer noch möglich ein Pseudo-Delta zu implementieren, indem einige SQL-basierte Quell-/Zielabgleiche durchgeführt werden, um festzustellen, welche Datensätze geändert wurden und daher übertragen werden sollten. Leider hat dieser Ansatz weitaus größere Performance Auswirkungen, da wir zusätzliche Daten aus der Quelle abrufen müssen, um diesen Vergleich zu ermöglichen. Wenn alles andere fehlschlägt, kann dieser Ansatz als letzter Ausweg verwendet werden.

Delta Loading - Unser Fazit

Wir haben zwei wesentliche Ansätze für die Implementierung eines Delta Mechanismus in Datasphere aufgezeigt. Diese sind geeignet, um einige der häufigsten Szenarien abzudecken. Der Ansatz der Real-Time-Replication auf Remote-Tabellen ist die bequemste Lösung, wenn diese im konkreten Integrationsszenario möglich ist und wenn die genannten Einschränkungen kein Problem darstellen. Andere Fälle können größtenteils mit dem Data Flow Ansatz abgedeckt werden, solange die beschriebenen Limitierungen berücksichtigt werden.

Es sollte erwähnt werden, dass wir auch weitere mögliche Lösungen untersucht haben, u.a. jene, welche die Integration zusätzlicher Softwarekomponenten wie SAP Landscape Transformation Replication Server (SLT) oder SAP Data Intelligence erfordern würden. Wenn Ihr Unternehmen diese Softwarekomponenten jedoch nicht bereits einsetzt, empfehlen wir einen reinen Datasphere-Ansatz zu verwenden, um Overengineering zu vermeiden.

Im Rahmen der kontinuierlichen weiterentwicklung von Datasphere als Produkt hoffen wir auf mehr Freiheiten bei der Implementierung der beschriebenen Ansätze, um komplexere Szenarien abdecken zu können und gleichzeitig die Vorteile der CDC basierten Architektur beizubehalten.

Haben Sie Fragen zu diesem oder anderen Themen? Versuchen Sie das nötige Know-How in Ihrer Abteilung aufzubauen oder benötigen Sie Unterstützung bei einer konkreten Fragestellung? Wir helfen Ihnen gerne dabei. Fordern Sie noch heute ein unverbindliches Beratungsangebot an. 

Erfahren Sie mehr über  SAP Datasphere

,

avatar

Irvin Rodin

Irvin ist seit 2019 im HANA Native und Datasphere-Umfeld unterwegs. Dabei kann er vor allem auf Erfahrungen als Berater und in der Entwicklung auf der XSA Plattform mittels SQLScript zurückgreifen. In seiner Freizeit spielt er leidenschaftlich Basketball und ist auch großer NBA Fan.

Sie haben eine Frage zum Blog?
Fragen Sie Irvin Rodin

Gender Hinweis Aufgrund der besseren Lesbarkeit wird im Text das generische Maskulinum verwendet. Gemeint sind jedoch immer alle Menschen.

Blog - NextLytics AG 

Welcome to our blog. In this section we regularly report on news and background information on topics such as SAP Business Intelligence (BI), SAP Dashboarding with Lumira Designer or SAP Analytics Cloud, Machine Learning with SAP BW, Data Science and Planning with SAP Business Planning and Consolidation (BPC), SAP Integrated Planning (IP) and SAC Planning and much more.

Informieren Sie mich über Neuigkeiten

Verwandte Beiträge

Letzte Beiträge