Big Data
Viele Daten, wenige Analytiker
Die Datenmassen in den Unternehmen wachsen. Doch bei der Auswertung hapert es: die Technologie ist Neuland und Datenanalytiker fehlen.

Menschenmassen saorgen für "Big Data"
"Big Data" gehört bei Gartner und Forrester Research zu den Trend-Stichworten für die nächsten Jahre. Damit ist in erster Linie die gigantische Datenhalde Internet gemeint. Millionen Menschen nutzen Blogs und Foren, Facebook, Twitter, Qype, Ciao und die vielen anderen Online-Communitys für den Austausch untereinander.
Unter anderen erzeugen sie damit recht wertvolle Daten für Unternehmen. Jeden Tag entstehen zu praktisch jedem verfügbaren Produkt, zu jeder Dienstleistung und zu jeder bekannten Marke positive und negative Äußerungen aller Art. In der Theorie können Unternehmen diese Daten nutzen, um ein relativ unverfälschtes Meinungsbild zu ihren Produkten zu bekommen.
Big Data, big Problems
Die Praxis von "Big Data" stößt allerdings recht schnell an Grenzen. Dies liegt unter anderem an den geradezu fantastischen Datenmengen, die bei einer Auswertung von Internetdiensten aller Art anfallen. Hierzu sind größtenteils neue Verfahren notwendig, zum Beispiel bei der notwendigen Sicherung und Archivierung der Daten.
So hat der Backup-Spezialist Spectra Logic vor kurzem eine spezielle Tape-Library vorgestellt, die in der größten Ausbaustufe 3,6 Exabtye Daten speichern kann. Das entspricht der Datenmenge von 3,6 Millionen handelsüblichen Terabyte-Festplatten. Gesichert werden diese Mengen in einem raumfüllenden Tape-Monster mit 400.000 Laufwerksschächten und Roboterarmen, die sich um die Befüllung mit Cartridges kümmern
Auch die Auswertung der Daten ist keine einfache Aufgabe. Herkömmliche Datenbanksysteme stoßen dabei schnell an Grenzen - egal, ob Mainframe-Anwendungen wie DB/2 oder weit verbreitete Server wie MySQL genutzt werden. Diese relationalen Datenbanksysteme (RDBMS, Relational Database Management Systems) sind in Unternehmen heutzutage noch die Regel.
Big Data erfordert jedoch verbesserte DBMS wie zum Beispiel InfiniDB. "Das System kann anspruchsvollen Aufgaben im Bereich Business Intelligence, Data Warehousing und analytischen Umgebungen gerecht werden", meint Christian Niemann, CEO der Uniique AG, die den Vertrieb der Open-Source-Lösung in Deutschland übernommen hat.
Bei einer solchen spaltenorientierte Datenbank ist optimiert für die effiziente Speicherung gleichartiger Daten, wie sie typischerweise in großen Business-Datenbanken anfallen. Für die nur wenig strukturierten Datensammlungen aus dem Web sind in der letzten Zeit vollkommen neu konzipierte Datenmanagementsysteme wie Apache Hadoop entwickelt worden.
Experten für Big Data sind Mangelware
Es ist ein Open-Source-Framework für verteilt arbeitende Software und erlaubt die Verarbeitung großer Datenmengen im Petabyte-Bereich auf Computerclustern. Genutzt werden diese Systeme bisher unter anderem von Facebook und dem Medien-Hoster Imageshack. Für "Business Intelligence" ist Hadoop allerdings Neuland.
Doch technische Probleme lassen sich für gewöhnlich recht schnell lösen. Die typische Dynamik der IT-Branche wird schon für eine permanente Verbesserung der Tools sorgen. Die Euphorie über "Big Data" könnte aus einem anderen Grund einen Dämpfer erleiden: Es gibt kaum Experten, die sich mit der sinnvollen Analyse von Webdaten auskennen.
Nach einer Studie der Technologieberatung EMC schafft die starke Zunahme digitaler Datenbestände in Verbindung mit neuen Analyse-Tools ebenso stark wachsende Möglichkeiten schafft, neue Umsätze und Erkenntnisse aus diesen Daten zu generieren. Durch diese Entwicklung ist der Bedarf an Data Scientists stark angewachsen und übersteigt bei weitem das Angebot an verfügbaren Experten auf dem Arbeitsmarkt.
"Das Big-Data-Zeitalter ist angebrochen", sagt Sabine Bendiek, Geschäftsführerin der EMC Deutschland GmbH. "Was wir brauchen, um alle Potenziale voll auszuschöpfen, sind exzellent ausgebildete, miteinander vernetzte und dynamische Data Science Experten. Nur diese werden in der Lage sein, verborgene Trends in den Datenmengen zu entdecken und neue Erkenntnisse aus ihnen zu ziehen."
Bildquelle: S. Hofschlaeger / pixelio.de
Titelinterview
mit Stefan Maierhofer, Senior Director für Zentral- und Osteuropa bei F5 Networks
Titelthema
IT-Infrastrukturen: Ruckzuck von 0 auf 100
Software
Business Intelligence: Datenberge bezwingen
Meistgelesene Artikel
BT-Studie: Risiken neu bewerten
Cybercrime und private Endgeräte bereiten Sorgen
Lifesize holt Uwe Klatt
Neuer Vertriebsleiter für EMEA
Ciber mit neuem Deutschland- und Europe-Central-Chef
Zwei Topmanager befördert
PWC-Studie: Datenschutz im Fokus
Unternehmen leisten sich Schwächen
T-Systems intensiviert Zusammenarbeit mit SAP
Erweitertes Serviceangebot
Interview mit Stefan Maierhofer, Senior Director für Zentral- und Osteuropa bei F5 Networks, über die Herausforderungen der Anwendungsbereitstellung - neudeutsch Application Delivery - in traditonellen, applikationspezifisch dedizierten Umgebungen und virtuellen, cloudbasierten Umgebungen... mehr lesen »
In den kommenden Jahren verbreitet sich im Data Center eine vorgefertigte Kombination aus Server, Speicher, Netzwerk und Managementsoftware, kurz der "Building Block". CIOs können mit dieser Infrastruktur neue Anwendungen rasch zum Laufen bringen... mehr lesen »
Haben klassische Business-Intelligence-Lösungen (BI) ausgedient? Man könnte es fast meinen, denn alle Welt spricht nur noch von Big Data... mehr lesen »















