15.11.2011
Branche, Business Intelligence
Von: Ina Schlücker

Dr. Marcus Dill, Mayato

Terabyte war gestern, Petabyte ist heute

Interview mit Dr. Marcus Dill, Geschäftsführer der Mayato GmbH, über das Potential von Big-Data-Analysen


Dr. Marcus Dill, Geschäftsführer der Mayato GmbH

IT-DIRECTOR: Herr Dill, was genau versteht man unter „Big Data“?
M. Dill: „Big Data“ ist ein aktuell viel verwendeter Begriff für anfallende Datenmengen, die für die Verarbeitung in herkömmlichen Datenbanken, Datenmanagementwerkzeugen und Analysetools nicht mehr geeignet sind. Hierbei kann es sich um Daten ganz unterschiedlicher Art und Herkunft handeln. Beispiele: Protokolldateien aus dem Web- oder Telekommunikationsumfeld, verschiedenste Ton- und Bilddaten, Wetter- und Klimadaten, astronomische oder andere wissenschaftliche Daten.

IT-DIRECTOR: Über welche Datenvolumina spricht man hier?

M. Dill: Terabyte war gestern. Großunternehmen kämpfen heute schon mit Datenmengen im Bereich Petabyte. Viele Softwareprodukte, die für Big Data gemacht sind, führen aber schon das Präfix „Exa“ in ihrem Namen, um ihre Leistungsfähigkeit auch für die nahe Zukunft zu demonstrieren.

IT-DIRECTOR: Vor welche Herausforderungen stellt die Analyse unstrukturierter Daten gemeinhin die Verantwortlichen?

M. Dill: Die Herausforderungen bei der Analyse unstrukturierter Daten sind vielfältig. Im Kern geht es aber fast immer um die Semantik, die eine Analyse in unstrukturierte Daten hineininterpretieren muss. Die Forschung an neuen Algorithmen boomt und wird in den nächsten Jahren noch massive Fortschritte erbringen. Neben der technischen Phantasie für die Analyse ist aber auch Kreativität im Auffinden von geeigneten Business Cases gefragt, die sich oft ganz anders darstellen, als die Business Cases für die Analyse strukturierter Daten.

IT-DIRECTOR: Weshalb kann die Auswertung von Big Data für Unternehmen so nützlich sein?
M. Dill: Grundsätzlich können mit Analysen von Big Data ganz neue Fragestellungen bearbeitet werden. Allerdings erfordern diese Auswertungen und schon die Aufbewahrung der Datenmengen den Einsatz spezieller, teurer Technologie und damit eine genaue Definition und präzise Kalkulation des Business Case. Viele Unternehmen kämpfen noch mit den Basics im Bereich Analyse auch bei vergleichsweise kleinen Datenmengen. Für sie ist die Analyse von Big Data noch Zukunftsmusik.

IT-DIRECTOR: Inwieweit können herkömmliche BI-Lösungen für Big-Data-Analysen herangezogen werden? Wann sollte man besser auf ein spezielles Tool setzen?
M. Dill: Für klar definierte einfach Fragestellungen lassen sich in vielen Fällen Workarounds implementieren, die aber in aller Regel zu Lasten der Flexibilität bei der Analyse gehen. Insbesondere Adhoc-Analysen sind auf Big Data eigentlich nur unter Einsatz spezieller Technologie möglich.

IT-DIRECTOR: Welche Technologien bilden die Grundlage für Big-Data-Analysen?

M. Dill: Die Grundlage für Big-Data-Analysen sind zum einen Architekturen, die eine massive Parallelisierung von Abfragen und Verarbeitungsschritten ermöglichen, in Verbindung mit spaltenbasierten Speicherkonzepten und In-Memory-Technologie. Analysealgorithmen müssen auf diese Plattformen optimiert sein, um deren Nutzenpotential zu heben.

IT-DIRECTOR: Inwieweit können die Auswertungen von großen, unstrukturierten Datenmengen wie Blogs oder sozialen Netzwerken zu einer Verletzung von Compliance-Vorgaben und Gesetzen führen?
M. Dill: Kritisch betrachtet werden müssen alle jene Analysen, bei denen der Personenbezug der Daten innerhalb des Datengebirges erhalten bleibt. Hier setzt der Datenschutz in Europa enge Grenzen und stellt hohe Anforderungen an die beteiligten Systeme und Prozesse. Eine Herausforderung ist z.B. das Löschen von Daten zu inaktiven Kunden nach Ablauf gewisser Fristen. Zugriffe auf die Daten müssen eingeschränkt bleiben und ihre Weiterverbreitung verhindert werden.

IT-DIRECTOR: Können Sie uns bitte ein Anwenderbeispiel nennen?
M. Dill: Banken versuchen heute schon, aus Blogs und sonstigen Webdaten Frühwarnsysteme im Risikomanagement abzuleiten. Beispielsweise kann die Häufung kritischer Kommentare zu einem Unternehmen oder einer Branche Hinweise auf bevorstehende Liquiditätsprobleme einer Firma oder zukünftige Markttendenzen geben.


WEB-Special

EPICOR
VORBEREITUNG AUF CO2-BILANZIERUNG


Epicor Software, Anbieter von Unternehmenssoftware, gab die Ergebnisse ihrer ersten weltweiten Umfrage zur CO2-Bilanzierung bekannt...
   
mehr lesen »

            

             

Aktuelle Ausgabe

Titelinterview
mit Stefan Maierhofer, Senior Director für Zentral- und Osteuropa bei F5 Networks

Titelthema
IT-Infrastrukturen: Ruckzuck von 0 auf 100

Software
Business Intelligence: Datenberge bezwingen

Stefan Maierhofer, F5 Networks

Interview mit Stefan Maierhofer, Senior Director für Zentral- und Osteuropa bei F5 Networks, über die Herausforderungen der Anwendungsbereitstellung - neudeutsch Application Delivery - in traditonellen, applikationspezifisch dedizierten Umgebungen und virtuellen, cloudbasierten Umgebungen... mehr lesen »

Ruckzuck von 0 auf 100

In den kommenden Jahren verbreitet sich im Data Center eine vorgefertigte Kombination aus Server, Speicher, Netzwerk und Managementsoftware, kurz der "Building Block". CIOs können mit dieser Infrastruktur neue Anwendungen rasch zum Laufen bringen... mehr lesen »

Der Stepstone-Stellenmarkt bei MEDIENHAUS Verlag
IT-Director Newsletter
Datenberge bezwingen

Haben klassische Business-Intelligence-Lösungen (BI) ausgedient? Man könnte es fast meinen, denn alle Welt spricht nur noch von Big Data... mehr lesen »