Geheimnisse, die Dokumente verbergen
Ein mangelnder Einblick in den Inhalt unstrukturierter Daten kann große Herausforderungen verursachen. Doch wie können diese Herausforderungen gemeistert werden?

Unternehmen verfügen über eine enorme Menge an Dokumenten mit unstrukturierten Daten, die über die gesamte IT-Umgebung verstreut sind: Word-Dokumente, PDFs, E-Mails, Powerpoint-Präsentationen, etc. Und täglich werden weitere Dateien erstellt. Nutzer teilen und kopieren diese Dateien oder ändern sie ab – und das selten mit dem Bewusstsein für Sicherheits- und Compliance-Regeln. Doch häufig enthalten diese Dokumente äußerst sensible Informationen, die die verschiedensten Konsequenzen für das Unternehmen haben können, wenn sie unzureichend geschützt oder verteilt werden.
Unstrukturierte Daten sind für Sicherheits- und Compliance-Beauftragte nicht ersichtlich und bleiben auf verschiedene Arten ein „Geheimnis“. Dies birgt natürlich gewisse Risiken für die Informationssicherheit in sich. Beispielsweise können zwei verschiedene Dokumente, verfasst von einer Person, anhand ihrer äußeren Charakteristika auf den ersten Blick sehr ähnlich erscheinen: Ein Dokument beinhaltet möglicherweise eine Liste von Personen, die zu einer Geburtstagsfeier eingeladen sind, das andere Dokument hingegen vielleicht eine Liste der wichtigsten Kunden und der jeweiligen Kontakte in den Unternehmen. Um Dateien effektiv zu verwalten und zu schützen, muss man den Überblick bewahren, welche davon sensible Informationen enthalten und welche nicht. Ohne diesen Überblick sind Daten entweder nicht ausreichend geschützt oder unterliegen unnötigerweise viel zu strengen Policies.
Häufig werden sensible Dateien geschützt, indem man sie auf speziell gesicherte Server oder Datenspeicher verschiebt. Eine weitere Möglichkeit ist, sie nur auf Maschinen abzulegen, die nicht jedem erlauben, die Dateien auf USB-Medien oder anderen lokalen Medien zu speichern. Trotzdem können Nutzer sämtliche Files, die sie selbst erstellen, auch überall abspeichern, wo sie möchten. Deshalb ist es wichtig zu wissen, wo genau sich diese Dokumente befinden, die sensible Informationen enthalten. Nur wenn man weiß, wo sie sich befinden, kann man sie auch ausreichend schützen. Und nur wenn man Muster erkennt, nach denen sensible Daten an ungeeigneten Orten abgelegt werden, kann man die nötigen Schritte einleiten, damit interne Policies und Best Practices eingehalten werden.
E-Mails entziehen sich dem Überblick
Auch ist nicht immer direkt ersichtlich, bei welchen Dateien es sich um Kopien bzw. Versionen anderer Dateien handelt. Ein Beispiel: Eine Mitarbeiterin kopiert vertrauliche Geschäftsinformationen und sendet sie an einen Kollegen im Verkauf. Dieser leitet sie an seinen Vorgesetzten weiter, der daraus eine neue Datei mit einem anderen Namen erstellt. Es gibt also eine neue, ungeschützte Datei, die sensible Informationen enthält. Und das Unternehmen weiß davon nichts. Dies kommt täglich in allen Unternehmen vor, und Nutzer werden weiterhin Inhalte kopieren, abändern, umbenennen und neu verwenden. Darüber hinaus können Nutzer jeglichen Schutz der Dokumente mit wenigen Mausklicks zunichte machen. Um dies zu verhindern, muss man in der Lage sein zu erkennen, welche Dateien ähnlichen Text enthalten. Das sollte selbst dann möglich sein, wenn die Dateien in verschiedenen Formaten vorliegen. Des Weiteren ist es wichtig zu erkennen, wer neue Kopien oder Versionen erstellt. Nur dann kann man sicherstellen, dass dies auch legitim ist.
Es ist selbstverständlich, Revisionsaufzeichnungen und Zugriffslisten von Datenbanken sowie Systeme zur Transaktionsverarbeitung zu überwachen, von denen bekannt ist, dass sie sensible und/oder vertrauliche Daten enthalten. Es ist allerdings recht unwahrscheinlich, dass dieselbe nötige Sorgfalt auch bei all den anderen Dateien im Unternehmensnetz angewandt werden, die sensible und/oder vertrauliche unstrukturierte Daten enthalten.
Ein direkter Zugriff auf die Dateien ist nicht das einzige Risiko. Ein Mitarbeiter mit legitimen Zugriffsrechten kann ohne weiteres Teile oder den gesamten Inhalt des Dokuments an Dritte versenden. Sei es als E-Mail-Anhang oder als Kopie eines Teils in der E-Mail selbst. E-Mail-Aussendungen stellen weiterhin ein erhebliches Risiko dar, das sich häufig dem Überblick entzieht.
Datenklassifizierung als praktischer Ansatz
Die gute Nachricht ist, dass es mit der geeigneten Kombination aus Datenklassifizierung und Best Practices kein Problem ist, alles Nötige über seine unstrukturierten Daten zu erfahren. Dies senkt entschieden die Risiken und verbessert Sicherheit und Compliance im Unternehmen. Um beispielsweise den Inhalt einer Datei oder einer E-Mail genau zu verstehen, ist es wichtig in der Lage zu sein, sie anhand ihres geschäftlichen Kontexts zu identifizieren und zu interpretieren. Man muss ebenso erkennen können, ob darin Kunden, Produkte, Partner, Technologien oder andere geschäftlich relevante Kategorien erwähnt sind.
Dies manuell zu erledigen, ist natürlich aufwendig. Deshalb macht bei entsprechender Datenmenge womöglich der Einsatz einer Datenklassifizierungslösung Sinn, die sämtliche unstrukturierte Daten automatisch entdeckt, deren Inhalt analysiert und ihn basierend auf deren geschäftlichen Kontext klassifiziert. Basierend auf dem Wissen über den geschäftlichen Kontext sind nun sämtliche Dateien, die wahrscheinlich sensible Geschäftsinformationen enthalten, mit Tags zu versehen. Diese Tags können auf den geschäftlichen Kategorien basieren, die in den Dokumenten erwähnt werden, seien es Namen von Kunden, proprietäre IP-Adressen oder andere erkennbare alphanumerische Muster oder eindeutige Wörter wie „geheim“ oder „vertraulich“.
Sobald die sensiblen Dateien erkannt sind, kann man nun damit beginnen, die zuvor genannten „Geheimnisse“ zu ergründen. Man weiß, wo die Dateien gespeichert sind und erkennt inhaltliche Ähnlichkeiten untereinander, um Kopien oder Versionen zu bestimmen. Man sieht, wann diese erstellt wurden und durch wen. Zugriffe und Zugriffsrechte werden ersichtlich, genauso wie Information darüber, wer diese Dateien verschickt hat und an wen.
Nötige Schritte zur Abhilfe
Sobald diese Informationen vorliegen, sollte man nach Anomalien und Trends Ausschau halten, die nach weiteren Nachforschungen oder Nachforschungen verlangen. So sieht man, ob regelmäßig bestimmte Arten sensibler Informationen an E-Mail-Adressen außerhalb des Unternehmens versendet werden und an welche. Man erkennt Zugriffsrechte, die nicht gelöscht wurden, obwohl Nutzer schon längst das Unternehmen verlassen haben oder mittlerweile in einer anderen Position arbeiten. Ebenso werden sensible Dateien ersichtlich, die auf unzureichend gesicherten Servern abgelegt sind.
Basierend auf dieser Analyse ist man dann in der Lage, die nötigen Maßnahmen zur Abhilfe einzuleiten. Darunter fallen die Feinabstimmung der Zugriffsmöglichkeiten und die Erstellung von Berechtigungen für Dateien mit Hilfe neuer Policies oder Nachschulungen zu bereits bestehenden Regularien.
Transparenz und das Wissen um die „Geheimnisse“ und das Verhalten der unstrukturierten Daten sind essentiell. Erst durch dieses Wissen und diese Transparenz gewinnt man den Überblick, der erforderlich ist, um konkrete Schutzmaßnahmen zu ergreifen, die die geschäftswichtigen Investitionsgüter gegen die Folgen beabsichtigen und unbeabsichtigten Datenmissbrauchs absichern.
Bildquelle: © Rainer Sturm/pixelio.de
Titelinterview
mit Stefan Maierhofer, Senior Director für Zentral- und Osteuropa bei F5 Networks
Titelthema
IT-Infrastrukturen: Ruckzuck von 0 auf 100
Software
Business Intelligence: Datenberge bezwingen
Interview mit Stefan Maierhofer, Senior Director für Zentral- und Osteuropa bei F5 Networks, über die Herausforderungen der Anwendungsbereitstellung - neudeutsch Application Delivery - in traditonellen, applikationspezifisch dedizierten Umgebungen und virtuellen, cloudbasierten Umgebungen... mehr lesen »
In den kommenden Jahren verbreitet sich im Data Center eine vorgefertigte Kombination aus Server, Speicher, Netzwerk und Managementsoftware, kurz der "Building Block". CIOs können mit dieser Infrastruktur neue Anwendungen rasch zum Laufen bringen... mehr lesen »
Haben klassische Business-Intelligence-Lösungen (BI) ausgedient? Man könnte es fast meinen, denn alle Welt spricht nur noch von Big Data... mehr lesen »
















