Michael Schmahl

Wenn Analyseergebnisse nicht stimmig sind, dann ist zumeist mangelnde Data Quality der Grund. Schon wenige, unsaubere Inhalte bei den Kundendaten können beträchtliche Auswirkungen auf das Geschäft haben, etwa in Form hoher Zusatzkosten oder einer verärgerten Klientel. Entsprechend findet die Analyseplattform auch innerhalb des Unternehmens keine Akzeptanz.

Somit ist Data Quality ein entscheidender Faktor für den Erfolg von Business-Intelligence- und Big-Data-Lösungen. Dabei handelt es sich um einen höchst subjektiven Begriff, der in jedem Projekt anders definiert wird. Allgemein lassen sich unter Data Quality alle Eigenschaften eines Datenbestandes fassen, mit denen die Anforderungen des Anwenders erfüllt werden. Folgende Kriterien stehen im Fokus:

  • Konsistenz: Daten müssen widerspruchs- und doublettenfrei sein.
  • Vollständigkeit: Die Datenmenge muss exakt stimmen.
  • Validität: Daten müssen aus glaubwürdigen Quellen stammen.
  • Genauigkeit: Daten müssen im geeigneten Format mit der erforderlichen Anzahl an Nachkommastellen vorliegen
  • Aktualität: Daten müssen entsprechend der Erwartungen pünktlich bereitgestellt werden.

Data Quality als fortlaufender Prozess

Über die allgemeine Begriffsdefinition hinaus verlangt jedes BI- oder Big-Data-Projekt nach eigenen Schwerpunkten bezüglich der erforderlichen Data Quality. Die Ansatzpunkte reichen vom Datenimport über den Systembetrieb bis hin zur Dateneingabe. Bei der Planung einer ORAYLIS Data Analytics Platform wird das Thema bereits frühzeitig auf die Agenda gesetzt – denn: Fehler lassen sich im Nachhinein nur mit hohem Aufwand identifizieren und beseitigen. Zunächst wird festgelegt, was im konkreten Fall unter Data Quality zu verstehen ist. Mit diesem Maßstab als Basis, kann Data Quality gemessen werden. Fehler lassen sich frühzeitig identifizieren und proaktiv beheben. Im Zuge laufender Verbesserungen wird der Qualitätsbegriff immer wieder auf den Prüfstand gestellt und modifiziert.

Mix aus Software und Best-Practices

Data Quality sollte also keine einmalige Maßnahme sein. Vielmehr gilt es, einen fortlaufenden Prozess zu etablieren, der eine kontinuierliche Messung, Bewertung und Justierung beinhaltet. Den Ausgangspunkt bilden verschiedene Software-Tools. So hat ORAYLIS mit BI.Quality ein Werkzeug entwickelt, das eine umfassende Qualitätsprüfung sowohl während als auch nach der Bewirtschaftung ermöglicht. Abhängig vom konkreten Projekt können Tools für eine tiefgehende Analyse von Datenzusammenhängen, manuelle Korrekturen, die Verwaltung von Masterdaten oder die Doublettenanalyse hinzukommen.

Jedoch lässt sich Data Quality nicht allein mit der richtigen Werkzeug-Kombination sicherstellen. Gerade im Bereich der Implementierung gibt es Situationen, in denen ausschließlich Best Practices und umfangreiches Spezialwissen zum Ziel führen. Hier ist ein intensiver Austausch zwischen den Projektbeteiligten und im Regelfall auch eine externe Beratung erforderlich. Letztlich ist also der passende Mix aus Tools und Know-how, der eine hohe Datenqualität herbeiführt.

Sind Sie mit der Qualität Ihrer Daten und Analyseergebnisse unzufrieden? Gerne stehen wir Ihnen für eine persönliche Beratung zur Verfügung.

 

Data Quality ist ein fortlaufender Prozess.

Data Quality ist ein fortlaufender Prozess, in dessen Kontext die Qualitätsmaßstäbe immer wieder auf Neue definiert, geprüft und optimiert werden. (Grafik: ORAYLIS GmbH)