Heute wird es technisch, dafür beleuchten wir allerdings eine sehr spannende neue Entwicklung. Seit der ersten Stunde des „Data Warehouses“ (DWH) gibt es immer wieder Versuche allgemeingültige Konzepte für Datenladeprozesse und Datenmodelle zu entwickeln. Als Modellierungsart für multidimensionale Daten hat sich das Sternschema profiliert, welches bewusst auf redundante Datenhaltung setzt. Diese Modellierungsart ist optimiert für die flexible und performante Abfrage der Daten.

In den letzten Jahren hat sich mit „Data Vault“ eine neue Modellierungstechnik für DWHs etabliert, die insbesondere für agile DWHs geeignet ist. Eine neue Modellierungstechnik, die sich insbesondere für agile DWHs eignet. Sie bietet eine hohe Flexibilität bei Erweiterungen, eine vollständige Historisierung der Daten und erlaubt eine starke Parallelisierung der Datenladeprozesse.

Entwickelt wurde die Data Vault Modellierung seit 1990 von Daniel Linstedt, wobei erst im Jahr 2000 die erste Veröffentlichung erschien.

Sie ist im Grunde genommen eine Kombination aus der relationalen Datenbankmodellierung mit der dritten Normalform (3NF) und dem Sternschema. Bei der Modellierung werden alle zu einem Objekt gehörenden Informationen in drei Kategorien eingeteilt und strikt voneinander getrennt.

Sie benötigen Unterstützung beim Aufbau Ihres Datawarehouses?

Jetzt Termin für ein kostenloses 30 minütiges Gespräch mit einem Berater vereinbaren

In die erste Kategorie „Hub“ gehören Informationen, die ein Objekt eindeutig beschreiben, d.h. seine Identität gibt (z.B. Kundennummer beim Kunden). Attribute, die ein Objekt beschreiben (z.B. Kundenname) gehören in die zweite Kategorie „Satellit“. Die dritte Kategorie „Link“ beschreiben Beziehungen zwischen Objekten (z.B. Zuordnung eines Kunden zu einer Branche).

Durch diese Art der Modellierung sind Änderungen flexibel möglich, so dass i.d.R. keine bestehenden Tabellen angepasst werden müssen, sondern einfach neue Tabellen (z.B. neue Attribute als Satellit) hinzugefügt. Durch die starke Schematisierung der Datenladeprozesse können ETL Templates verwendet werden, so dass im besten Fall eine Änderung bzw. Erweiterung des Datenladeprozesses nur durch Anpassung der Konfiguration möglich ist.

Mit dem „PDI Data Vault framework“ ist es z.B. sehr einfach möglich ein Data Vault auf Basis von Metadaten vollautomatisch aufzubauen. Dabei setzt das Framework komplett auf das Open Source ETL Tool „Pentaho Data Integration“ (Kettle) auf, welches wir bereits bei vielen Kundenprojekten schätzen gelernt haben und erfolgreich einsetzen.

Uns hat die Data Vault Modellierung bereits überzeugt und ist der neue Standard beim Aufbau von großen DWHs! Wie sieht Ihre Erfahrung mit dieser Modellierung aus? Ich bin gespannt auf Ihre Einschätzung.

Über linkFISH: Wir sind eine spezialisierte Management- und IT-Beratung zur Durchführung von Controlling-, Business Intelligence- und Datawarehouse-Projekten. Wir unterstützen Sie bei Aufbau und Optimierung Ihrer kaufmännischen Abteilungen, Prozesse und Systeme. Ziel hierbei ist, für Sie schnelle und effiziente Entscheidungsprozesse zu schaffen und die Performance Ihres Unternehmens zu steigern.

Sie finden diesen Beitrag interessant? Dann leiten Sie ihn doch an Ihr Netzwerk weiter.

Über
Letzte Artikel

Markus Bellmann - Geschäftsführer

Diplom-Informatiker, Geschäftsführer, Technologie, Business IntelligenceSeit vielen Jahren tätig als Berater, Entwickler und Projektmanager in Business Intelligence, IT, Data Warehousing, ETL-Prozessen, Softwareentwicklung, Controlling, Reporting und Planung

Letzte Artikel von Markus Bellmann - Geschäftsführer (Alle anzeigen)

Wir freuen uns über vier neue linkFISHe in 2020! - 28. Oktober 2020
Data Vault – die revolutionäre Data Warehouse Modellierung? - 19. Januar 2015
Keiner sollte heutzutage mehr sagen müssen … - 13. Oktober 2014

1 Kommentar

Edwin Weber am 4. Oktober 2017 um 12:39

„Hello Markus,

I came across this article, which mentions my “PDI Data Vault Framework”.
Thanks for mentioning my project.

Do you actually use it with some customers?
If so, you might be interested in recent changes. I have added PostgreSQL support and made changes that improve performance.

If you experience problems using my software, please let me know, so maybe I can fix it.

Best regards,

Edwin Weber”
Antworten

Data Vault – die revolutionäre Data Warehouse Modellierung?

Sie benötigen Unterstützung beim Aufbau Ihres Datawarehouses?

1 Kommentar

Kommentar absenden Antworten abbrechen

Neueste Beiträge

Neueste Kommentare

Kategorien