NextLytics Blog

SAP Datasphere Katalog verständlich erklärt

Geschrieben von Irvin Rodin | 16.11.2023 08:19:31

Bei zahlreichen Projekten beobachten wir, dass viele Ressourcen in die Erstellung von Datenmodellen und Berichten investiert werden. Am Ende des Projektes bleibt jedoch wenig Budget für das Training der Leute, die diese Berichte nutzen sollen. Wenn die Berater nach der Hypercare Phase das Unternehmen verlassen oder auch die Wissensträger aufgrund der normalen Fluktuation gehen, stecken viele Unternehmen in der Klemme. Und so wird auch viele Jahre nach der Einführung die Definition und die wahre Bedeutung von bestimmten Kennzahlen diskutiert.

Mithilfe von SAP Datasphere Katalog will SAP diese und ähnliche Probleme aus der Welt schaffen. Der Endnutzer aus dem Fachbereich soll befähigt werden, die benötigten Daten schnell zu finden und auszuwerten. Der Datenkatalog liefert Erkenntnisse über den Ursprung der Daten, erklärt die verwendeten Dimensionen und gibt Aufschluss über die Kalkulation der Kennzahlen. So wird die Datenqualität innerhalb des Unternehmens erhöht und ein gemeinsames Verständnis der verwendeten Geschäftssprache geschaffen.

In diesem Beitrag geben wir eine Übersicht über die Funktionen vom Datenkatalog innerhalb von SAP Datasphere, beleuchten die möglichen Einsatzgebiete und geben einen Ausblick auf die kommenden Weiterentwicklungen.

Definition, Zielsetzung und Anforderungen

Was ist überhaupt ein Datenkatalog? Dabei handelt es sich um eine Software, welche den Katalogisierer in die Lage versetzt, eine effiziente sowie strukturierte Dokumentation von Metainformationen zu Datenprodukten wie Tabellen, Views und Stories zu erstellen. Auf Basis dieser Dokumentation ist es dem Konsumierer möglich, eine intuitive und schnelle Evaluation durchzuführen.

Dabei soll das Business Know-how dokumentiert, zentral abgelegt und mit relevanten Datenprodukten verknüpft werden. Mit dem Ziel, dass Konsumierer verlässlich die richtigen Datenprodukte finden können.

Hieraus entstehen folgende Anforderungen: Für den Katalogisierer ist effizientes Dokumentieren durch Wiederverwendbarkeit, Vorlagen und Verlinkungen von Dokumenten zu Datenprodukten essentiell. Für den Konsumierer steht dagegen die intuitive und detaillierte Suche sowie die verlässliche und schnelle Evaluation der benötigten Datenprodukte im Vordergrund. Wenn zum Beispiel ein Nutzer nach einer bestimmten Kennzahl sucht, muss er schnell ein Datenprodukt finden können, welches die relevanten Informationen enthält.

Datenkatalog Elemente

Hier kommt SAP Datasphere Datenkatalog ins Spiel. Dieser bietet erweiterte Auskunft über Datenprodukte (Assets) aus SAP Datasphere und SAP Analytics Cloud (SAC). Bei einem Asset handelt es sich um ein technisches Objekt wie zum Beispiel eine Remote bzw. lokale Tabelle, View, Datenfluss oder auch eine Story. Diese Datenprodukte werden zwecks besserem Verständnis mit Elementen wie KPIs, Glossarbegriffen und Tags angereichert. Zusammen mit den Eigenschaften, der Beschreibung sowie der Herkunft bieten diese Elemente hilfreiche Metainformationen über das jeweilige Asset.

Alle Elemente werden durch Hierarchien verwaltet. So können zum Beispiel die KPIs in verschiedenen Kategorien wie Finanz- und Nachhaltigkeits-Kennzahlen gruppiert werden. Die Erstellung von KPIs und Glossarbegriffen wird durch Vorlagen erleichtert. Dabei ist es auch möglich, benutzerdefinierte Reiter und Attribute zu erstellen, die im Zuge der Definition einer zugehörigen KPI bzw. eines zugehörigen Begriffs ausgefüllt werden können. Beispielsweise wäre in einem Glossar ein obligatorisches, benutzerdefiniertes Attribut “Approved By” definierbar, welches eine Liste von Business Know-How-Trägern enthält. Beim Anlegen eines zugehörigen Begriffs müsste der Katalogisierer entsprechend einen Eintrag (Know-How-Träger) aus der Liste auswählen. So können auf Basis der individuellen Anforderungen des Unternehmens zahlreiche zusätzliche Attribute dokumentiert werden.

KPIs

Bei KPIs handelt es sich um die fachliche Definition der jeweiligen Kennzahlen. Neben der detaillierten Erklärung wird auch die für die Berechnung verwendete Formel angezeigt. Darüber hinaus können auch Schwellenwerte festgelegt werden. So ist direkt ersichtlich, was als gute Zielerreichung gilt und wo der kritische Wert überschritten wurde und eine Überprüfung notwendig ist.

Dadurch wird ein gemeinsames Verständnis dafür geschaffen, was die jeweiligen KPIs bedeuten und ob das Geschäftsziel erreicht wurde oder nicht. Was wiederum das Vertrauen in die Kennzahl erhöht.

Finden Sie heraus welches Produkt sich am besten für Ihre Data-Warehousing-Strategie eignet -
Laden Sie sich unser Whitepaper herunter!

Begriffe

Zusätzlich zu den Kennzahlen werden Begriffe verwendet, mit denen die in der Organisation verwendete Terminologie erklärt wird. Ein zentral definiertes betriebswirtschaftliches Glossar trägt zu einem einheitlichen Verständnis betriebswirtschaftlicher Begriffe bei. Neben der fachlichen Definition der jeweiligen Begriffe können auch Schlagwörter und Synonyme hinzugefügt werden, um die Suche zu erleichtern.

Tags

Die Verwendung von Tags ermöglicht es Ihnen, die Daten besser zu verstehen und Beziehungen zu anderen Assets darzustellen. So können die Benutzer ganz einfach alle Assets finden, denen ein bestimmter Tag zugeordnet ist. Darüber hinaus können Tags Aussagen zur Datenqualität treffen.

Assets

Alle diese Elemente werden dem jeweiligen Datenprodukt zugeordnet und stellen neben den Eigenschaften und Beschreibungen eine bessere Informationsgrundlage bereit, um fundiertere Entscheidungen treffen zu können.

Die Kombination von Begriffen, Tags und KPIs trägt zum Verständnis der vorliegenden Daten bei und liefert zusätzlichen Kontext. Das hilft zu beurteilen, ob dieses Asset die Anforderungen des Benutzers erfüllt oder nicht.

In diesem Kontext stellt die Möglichkeit, die Herkunft der Daten anzuzeigen, eine weitere hilfreiche Funktion dar. In der Registerkarte Herkunft wird die Datenherkunft des jeweiligen Assets über mehrere Schichten und Systeme hinweg visualisiert. Darüber hinaus können Sie einsehen, wo dieses Asset verwendet wird.

Lebenszyklus der Daten-Governance

Nachdem Sie nun die Grundprinzipien des Datenkatalogs verinnerlicht haben, stellen wir einen praxisnahen Workflow vor. Dieser umfasst fünf Schritte. Als Erstes verbinden Sie den Datenkatalog mit dem Quellsystem, um automatisch die dort verfügbaren Metadaten zu extrahieren und die Assets anzulegen. Dabei handelt es sich um einen einmaligen Aufwand. Die anschließenden Updates der Metadaten erfolgen ohne Ihr Zutun. Zurzeit werden nur SAP Datasphere und SAP Analytics Cloud Systeme unterstützt. In der Zukunft sollen weitere Systeme wie SAP BW, SAP HANA und SAP S/4HANA sowie ECC hinzukommen.

Danach wird das im Unternehmen verfügbare Wissen über die Geschäftsvorgänge gesammelt und mithilfe von KPI-Definitionen, Glossar Begriffen und Tags katalogisiert. Der erste Teil ist sicherlich der zeitintensivste, da all dies manuell erfolgt. Anschließend werden die Datenprodukte (Assets) aus dem ersten Schritt mit den zuvor kreierten Metadaten angereichert. Diese Schritte erfolgen durch die Katalogadministratoren.

Im Anschluss können die Katalogbenutzer, basierend auf ihrem Business Know-How, nach den gewünschten Daten anhand von definierten Begriffen, Tags und KPIs suchen. Da diese vorher durch die Administratoren mit den Datenprodukten verknüpft wurden, finden die Benutzer eher die richtigen Views und Stories. Die Suche gestaltet sich einfacher und genauer. Die Benutzer können anhand der Metadaten entscheiden, ob sie das richtige Asset gefunden haben und mit ihrer Analyse beginnen.

 

Ausblick

SAP investiert langfristig in den Datenkatalog und garantiert somit eine kontinuierliche Weiterentwicklung. Kurzfristig geht es darum, die noch fehlenden Schlüsselfunktionen wie Berechtigungen und Transportwesen anzubieten. Mittelfristig sollen mehr Quellsysteme unterstützt werden: SAP BW, SAP HANA sowie die ERP Systeme SAP S/4HANA und ECC. Langfristig ist die Integration zwischen Data Catalog und Data Marketplace die zentrale Baustelle aus Sicht der SAP.

SAP Datasphere Datenkatalog - Unser Fazit

Der Datasphere Datenkatalog bietet Lösungen für viele Probleme, die wir in der Praxis des Datenmanagements beobachten. Er schafft ein effizientes, zentrales Repository zur unternehmensweiten Definition von Begriffen und KPIs. Durch Verlinkung dieser Definitionen zu Datenprodukten wird es Endbenutzern ermöglicht (auf Basis ihres Business Know-Hows) die korrekten Modelle und Berichte zu finden, die für ihren aktuellen Anwendungsfall relevant sind. Dabei ist kein technisches Wissen über die Architektur der Datenmodelle mehr notwendig. Dadurch trägt der Datasphere Datenkatalog maßgeblich zur Auflösung von Datensilos bei.

Haben Sie Fragen zu SAP Datasphere? Versuchen Sie das nötige Know-how in Ihrer Abteilung aufzubauen oder benötigen Sie Unterstützung bei einer konkreten Fragestellung? Wir helfen Ihnen gerne dabei.