+49 89 998 299 150 info@glanos.com

Datenqualität Voraussetzung für Nutzung von Big Data

Datenqualität Voraussetzung für Nutzung von Big Data

Das Wissen um das Phänomen Big Data ist inzwischen in den meisten Unternehmen angekommen. Der Fokus liegt darauf auf mehr Transparenz für eine bessere Entscheidungsfindung oder zur Steigerung der Effizienz in operativen Prozessen. Ein Problem, das in diesem Rahmen oft zu wenig problematisiert wird, ist die Datenqualität. Doch Analysen und darauf beruhende Entscheidungen sind nur so gut wie die Daten, die ihnen zu Grunde liegen.

Dies gilt sowohl für bestehende als auch für neu aus den unterschiedlichsten Quellen gewonnene Daten. Die Deutsche Gesellschaft für Informations- und Datenqualität (dgiq) definiert die Datenqualität anhand von 15 Kriterien. Zu den wichtigsten zählen die Faktoren Zugänglichkeit, Bearbeitbarkeit, Fehlerfreiheit, Objektivität, eindeutige Auslegbarkeit, Verständlichkeit, Relevanz, Vollständigkeit und Aktualität

Analyse der Prozesse und Datenverbindungen

Daten- bzw. Informationsqualität ist jedoch kein fester Zustand, sondern ein Prozess, der über den gesamten Lebenszyklus der Daten – von der Erfassung/Gewinnung über die Speicherung und Nutzung – gesteuert werden muss. Am Anfang jedes Datenmanagements stehen eine Analyse der möglichen Fehler und das Suchen von Kriterien, die Daten in einem Unternehmen erfüllen müssen. Dazu gehören auch die Analyse der verschiedenen Formate und Formen, in denen Daten vorliegen, und die Verknüpfungen von Prozessen und Geschäftsbereichen im Unternehmen.

Daraus ergeben sich unter Umständen bereits durchzuführende Maßnahmen, um eine durchgängig einheitliche Datenqualität zu gewährleisten. Sollen beispielsweise Mailings in elektronischer oder gedruckter Form versendet werden, müssen die Kundendaten in einer Form zugänglich und verwendbar sein, die dies ohne großen Aufwand ermöglicht.

Datenbereinigung- und anreicherung

Im nächsten Schritt müssen die vorhandenen Daten anhand der festgelegten Kriterien untersucht und gegebenenfalls in einem weiteren Schritt bearbeitet werden, um den Standards zu genügen und weitere Fehler oder Fehlinterpretationen von Daten zu vermeiden. Hierzu werden Daten durch Strukturierung und Normierung in ein standardisiertes Format gebracht, das einen Zugriff auf alle Daten in gleicher Form ermöglicht

Darüber hinaus werden fehlerhafte Daten entfernt und durch korrekte ersetzt sowie Dubletten eliminiert. Wichtige fehlende Datensätze wie etwa Postleitzahlen oder BIC-Codes werden aus internen und externen Quellen ergänzt und in die bereinigten Daten integriert.

Fehlerhafte und unnötige Informationen vermeiden

Erst im nächsten Schritt spielt das Phänomen Big Data eine Rolle. Zur Sammlung von externen Informationen von Webseiten oder Social Media Portalen werden spezielle Methoden des Web und Text Mining genutzt, um zu garantieren, dass nur Informationen mit ausreichender Qualität in das Datensystem eingespeist werden. So wird verhindert, dass das Unternehmen bei seinen Analysen und Prozessen mit nicht relevanten Daten arbeitet.

Bei Daten, die per Hand oder Scans, beispielsweise Kunden- und CRM-Daten, in das System gelangen verhindern automatische Abgleiche mit elektronischen Lexika und bereits vorhandenen, dass inkorrekte Informationen gespeichert und weiter verarbeitet werden. Durch solche Automatismen können beispielsweise Fehler bei den IBAN-Daten oder die doppelte Eingabe von Kunden erkannt und vermieden werden.

Kontinuierliche Verbesserung der Daten

Eine kontinuierliche Verbesserung der Daten gelingt jedoch nur dann, wenn Abteilungen zusammenarbeiten und die Hoheit ihrer Daten zugunsten einer besseren Datenqualität aufgeben. Denn oft beharren diese auf ihren alt hergebrachten, gewohnten Strukturen und Formaten, da dies ihnen zunächst einmal scheinbar die Arbeit erleichtert. Um diese Vorbehalte aufzulösen ist es nötig, alle Mitarbeiter für das Thema Datenqualität und -management zu sensibilisieren und ihnen aufzuzeigen, welche Vorteiles sie davon haben, Kompromisse einzugehen, um Prozesse zu vereinfachen und zu garantieren, dass das Unternehmen durch Big Data den Mehrwert generiert, der seine Wettbewerbsfähigkeit sichert.

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.

Suche