Wie Sie Ihr Unternehmen vor Silos schützen
13.10.2023 Datensilos - eine Erfindung aus der IT-Hölle, die Unternehmen schwerfällig bis unlenkbar machen können. In fast jedem Unternehmen verstecken sie sich - und lassen sich mit der richtigen Strategie fast immer auflösen.

Meist gar nicht aus schlechter Absicht, sondern schlicht, weil eine bessere Lösung fehlt oder niemand einen bestimmten Ablauf bedacht hat. Gerade in gewachsenen IT-Infrastrukturen gedeihen die Datenverstecke besonders gut.
Trotzdem sind Datensilos nicht unbedingt ein Zeichen von schlechtem IT-Management oder einem mangelhaften Verständnis für digitale Prozesse. Die meisten Datensilos entstehen, wenn Unternehmen erfolgreich sind und schnell wachsen:
- Für verschiedene Teams und neue Aufgaben werden spezialisierte Anwendungen angeschafft. Diese lösen wie vorgesehen das Problem, greifen aber nicht ineinander.
- Produktpalette, Produktionsabläufe und -Dienstleister ändern sich, die bestehenden IT-Prozesse werden daran händisch angepasst und fallen aus dem vorgesehenen Raster.
- Gerade in Wachstumsphasen ist viel Flexibilität gefordert. Schnelle, schlanke und effiziente Lösungen sind dann wichtiger als Grundlagenüberlegungen.
Denn mit den Silodaten sind dem Unternehmen - oder zumindest Teilen davon - Informationen entzogen. Sie sind anderen Mitarbeitern unbekannt, was zu teuren Fehlentscheidungen führen kann. Parallel entsteht die Gefahr, dass auch die Daten im Silo nicht mehr auf dem aktuellen Stand sind, weil die Rückkopplung zu anderen Abläufen fehlt. Auch dadurch können Fehler und Mehrarbeit entstehen.
Zuletzt entstehen Ineffizienz und Reibungsverluste, weil Daten inkompatibel werden und in mühsamer manueller Arbeit konvertiert werden müssen. Auf lange Sicht können Datensilos daher zu einem teuren und gefährlichen Problem werden. Die gute Nachricht: Meist kommt es nicht so weit. Schlicht, weil sie den geschäftlichen Alltag schon zuvor mit einer ganzen Reihe weniger dramatischen Problemen behindern. Denn Datensilos stören die Arbeit in vielerlei Hinsicht.
Datensilos ...
- ... führen zu einer großen Abhängigkeit von einzelnen Systemen.
- ... erschweren die Implementierung neuer Anwendungen.
- ... behindern den Datenaustausch über standardisierte Schnittstellen und ...
- ... erfordern daher ein hohes Maß an Customizing, ...
- ... was wiederum die Updatefähigkeit und Sicherheit beeinträchtigt.
- ... führen in der Summe zu einer umständlich zu pflegenden, wenig flexiblen und kaum agilen IT-Infrastruktur.
Daten zentralisieren
Nicht nur aus Management, sondern auch aus IT-Sicht sprechen also gute Argumente dafür, Datensilos zu vermeiden beziehungsweise aufzubrechen. Doch wie geht man dabei am besten vor? Schließlich ist das Kind ja meist schon in den Brunnen gefallen. Müssen überhaupt alle Daten zentral gehalten werden - also auch die Einladungen zur Weihnachtsfeier? Welches System im Unternehmen soll dazu den "Hut" aufhaben? Oder sollen alle Apps gleichberechtigt sein und lediglich auf eine gemeinsame Datenbank zugreifen? Und wie geht man mit Anwendungen um, die schlicht und einfach selbst ihre Datenhoheit beanspruchen?
Szenario 1: Alles in den Data Lake
In den vergangenen Jahren ist ein Begriff populär geworden, der eine sehr radikale und endgültige Lösung verspricht: Der Data Lake. In ihn werden im besten Falle einfach alle Daten und Dateien aus dem Unternehmen "gekippt". Völlig unstrukturiert, ohne jede Aufbereitung. Die Kundenstammdaten ebenso wie die eben erwähnte EMail-Einladung zur Weihnachtsfeier.
Eine leistungsfähige Software ist später in der Lage, alle relevanten Informationen zu finden und zusammenzuführen. Vorbild für dieses Konzept sind das Internet und Google - oder besser noch: ChatGPT mit seinen KI-Funktionen. Schließlich sind auch im Web Informationen gänzlich unstrukturiert gespeichert und können trotzdem jederzeit gefunden und vorbildlich aufbereitet ausgegeben werden.
Vorteil dieser Idee:
- Flexibilität: Data Lakes ermöglichen die Speicherung von strukturierten und unstrukturierten Daten aus verschiedensten Quellen.
- Zukunftssicherheit: Bei der Implementation des Data Lakes muss nicht festgelegt werden, welche Informationen in Zukunft genutzt werden sollen. Alle Daten sind vorhanden und es gehen keinerlei Informationen verloren, weil die Daten in ihrem Rohformat gespeichert bleiben.
- Skalierbarkeit: Data Lakes können große Datenmengen aufnehmen und sind in der Regel gut skalierbar, sodass sie mit den Anforderungen wachsen können.
- Datenintegration: Ein Data Lake erlaubt die Integration verschiedener Datenquellen und -formate an einem Ort. Dadurch wird es einfacher, Daten zu kombinieren und neue Erkenntnisse zu gewinnen.
- Datenanalyse: Durch die zentrale Speicherung können Analysten und Data Scientists leichter auf die Daten zugreifen und fortschrittliche Analysen durchführen. Dies kann zu besseren Einblicken und datengesteuerten Entscheidungen führen.
Nachteile des Data Lake-Konzepts:
- Datenqualität: Da Data Lakes unterschiedliche Datenquellen und -formate akzeptieren, kann die Qualität der gespeicherten Daten variieren. Es ist wichtig, Maßnahmen zur Datenbereinigung und -qualitätssicherung zu implementieren, um sicherzustellen, dass die Daten zuverlässig und aussagekräftig sind.
- Komplexität: Data Lakes können aufgrund ihrer Flexibilität und der Vielfalt der gespeicherten Daten komplex sein. Die Verwaltung und Organisation der Daten erfordert entsprechendes Fachwissen und eine klare Datenstrategie.
- Datenschutz und Sicherheit: Da Data Lakes verschiedene Arten von Daten enthalten, ist es wichtig, Maßnahmen zum Schutz der Daten und zur Einhaltung der Datenschutzvorschriften zu ergreifen. Dies beinhaltet den Zugriffsschutz, die Verschlüsselung und die Überwachung der Daten.
Szenario 2: Data Quality Management im Data Warehouse
Strukturierte Daten sind unter diesem Aspekt deutlich dankbarer - zumal damit oft gar kein entscheidender Informationsverlust einhergeht.
Schließlich kennen Unternehmen ihre Geschäftsprozesse genau und wissen, welche Informationen sie dafür benötigen. Nur leider sind diese in den verschiedenen Sub-Systemen verteilt.
Um die Silos zu heben, bietet sich ein Umweg durch den Data Lake an: Mittels individuellen Scripten und speziellen Helfer-Tools werden alle Daten von Interesse aus ihren Anwendungen extrahiert, transformiert und in den Datensee gepumpt. Dort werden sie durch ein Data Warehouse (etwa Big Query von Google) homogenisiert, den Anforderungen entsprechend aufbereitet und im passenden Exportformat ausgegeben.
Damit lässt sich beispielsweise die Datenbank einer zentralen Unternehmensapplikation befüllen, die anschließend alle maßgeblichen Prozesse steuert beziehungsweise alle ihr untergeordneten Anwendungen über Schnittstellen mit Daten bedient. Sofern die Anwendungen nun im Unternehmen nun ordentlich aufgesetzt sind, und sich nicht wieder erneute Parallelabläufe und Schattenprozesse einschleichen, gehören Datensilos damit der Vergangenheit an.
Szenario 3: Data Management Platform - Zentral speichern, dezentral verteilen
Gerade an diesen stringent geordneten Abläufen fehlt es allerdings oft - sonst wären die Datensilos ja gar nicht erst entstanden. Und oftmals ist dieser Perfektionismus
in der unternehmerischen Praxis gar nicht umzusetzen. Denn wirklich gut könnte dies nur gelingen, wenn die gesamte IT-Infrastrukur für die eigenen Ansprüche maßgeschneidert wäre. In allen anderen Fällen ist oft schon die Frage schwierig zu beantworten, welches System überhaupt das Unternehmen steuern soll. Ist ein kunden- oder Produktzentrierter Ansatz gewünscht? Soll das ERP (Enterprise Resource Management) oder das CDP (Customer Data Platform) den Lead erhalten? Welche Einschränkungen ergeben sich daraus für die folgenden Systeme?
Aber selbst wenn sich diese Fragen aus dem Stehgreif beantworten lassen würden, würde es oft nicht weiterhelfen. Denn in der Praxis sind viele Unternehmen ganz oder in Teilen auf Standard-Anwendungen angewiesen, die ihre eigenen Einschränkungen mitbringen und in deren Architektur ein Zusammenspiel mit fremden Prozessen nur auf bestimmte Weise oder gar nicht vorgesehen ist. Dies kann so weit gehen, dass sie als typische Stand-Alone-Applikation eine bestimmte Vorgehensweise und damit auch die komplette Datenhoheit für sich beanspruchen.
Aber auch in diesen Fällen gibt es eine Lösung: Mittels einer Zwischenschicht lässt sich die Datenspeicherung von den Applikationen entkoppeln. Dazu wird eine Data Management Platform oder Data Governance Framework als Middleware zwischen dem (Cloud)-Speicher und den Applikationen gezogen. Datenanfragen werden nun nicht mehr direkt aus einer Datenbank oder dem Dateisystem bedient, sondern statt dessen durch die Middelware gemanaged. Jede Information, die durch die Middelware geht, kann von ihr konsistent und nach einheitlichen Regeln aufbereitet werden. Auf diese Weise lassen sich die Daten beliebiger Applikationen in Echtzeit durch eine zentrale Instanz kontrollieren und manipulieren, selbst wenn eine andere Applikation die Hoheit über diese Daten für sich beanspruchen will.
Selbst in einer heterogenen Systemlandschaft kann so eine hohe Datenkonsistenz, -qualität und -sicherheit hergestellt werden, die sich von einer zentralen Stelle aus managen und kontrollieren lässt. Vor allem ist sichergestellt, dass alle wesentlichen Unternehmensdaten in einer zentralen Datenbank bereitgestellt werden und alle Applikationen aus dieser Datenbank bedient werden können. Neue Anwendungen lassen sich in dieses Konzept zudem leicht andocken, weil Schnittstellen oder Exportfunktionen quasi jedes beliebige Format erzeugen und entgegennehmen können. Zuletzt lassen sich Analysefunktionen schnell auf- und Compliance-Regeln zuverlässig umsetzen.
Eine Frage der Technik - und der Kultur
Datensilos sind eine ernstzunehmende, aber keine unüberwindbare Herausforderung. Es gibt technische Ansätze, die die Daten-Konsolidierung erleichtern und die Silo-Bildung zumindest erschweren. Trotzdem sollte man sich nicht der Illusion hingeben, man könne mit Technik alleine den geheimen Datenspeichern ein für alle mal Herr werden. Letztlich entstehen Informationssilos, weil in Unternehmen die (berechtigte) Forderung nach schnellen und flexiblen Lösungen dem (ebenso berechtigten) Wunsch nach festen und zuverlässigen Prozessen entgegen steht. Je starrer eine Organisation ist, desto größer der Drang nach alternativen Lösungsweg. Wenn Datensilos entstehen, sollte sich das Management daher durchaus fragen, ob strukturellen Maßnahmen dafür sorgen können, dass alle Informationen wieder in einem gemeinsamen Kanal landen.
Endgültig kommt diese Frage in der Chefetage an, wenn die Silos gar nicht erst erkannt werden - und zwar nicht, weil sie übersehen werden, sondern weil man sie nicht ernst nimmt oder gar nicht sehen will.
Abonnieren Sie unseren kostenlosen wöchentlichen Newsletter!