Ralf Conrads, msg systems
Spezielle Data-Mining-Tools für Big-Data-Analysen
Interview mit Ralf Conrads, Experte für Business Intelligence bei msg systems

Ralf Conrads, Experte für Business Intelligence bei msg systems
IT-DIRECTOR: Herr Conrads, was genau versteht man unter „Big Data“?
R. Conrads: Zur Erläuterung des Begriffes „Big Data“ bieten sich „die drei Vs“ Volume, Variety und Velocity als charakterisierende Eigenschaften an. Volume bedeutet, dass es sich hier um sehr große Mengen sehr detaillierter Daten handelt – dies allein charakterisiert „Big Data“ aber nur ungenügend. Variety meint zusätzlich die Vielfältigkeit der Daten und umfasst strukturierte, teilstrukturierte und unstrukturierte Daten. Velocity schließlich fokussiert auf die Häufigkeit und Dauer des Datenflusses und umfasst die Spanne von batchgesteuerten bis zu kontinuierlich fließenden Daten. Die oftmals kurzfristig erforderliche (zusätzliche) Analyse von Big Data (Big Data Analytics) stellt gewachsene BI-Landschaften aufgrund der Menge, Detailtiefe und Vielfalt der Daten auf die Probe.
IT-DIRECTOR: Über welche Datenvolumina spricht man hier?
R. Conrads: Insbesondere die für „Big Data Analytics“ relevanten Datenvolumina wachsen rasant. Letztlich haben aber auch die analytische Fragestellung sowie der fachliche und organisatorische Scope entscheidenden Einfluss auf das zu analysierende Datenvolumen. Die meisten Unternehmen dürften sich allein bezüglich „Big Data“ 2011 im ein- und vor allem zweistelligen Terabyte-Bereich bewegen. In zwei bis drei Jahren werden wir überwiegend von zwei- und in den meisten Fällen dreistelligen Terabytes sprechen. Die Petabyte-Grenze mögen manche Großunternehmen bereits überschritten haben, als übliche Größe herangezogen wird diese Grenze jedoch heute noch nicht.
IT-DIRECTOR: Vor welche Herausforderungen stellt die Analyse unstrukturierter Daten gemeinhin die Verantwortlichen?
R. Conrads: Die Analyse unstrukturierter Daten als solche ist nicht neu, wird aber für immer weitere Benutzerkreise interessant. Hier sind die Softwarehersteller gefragt, intuitive „Big Data“-geeignete Visualisierungsmöglichkeiten zu schaffen. Große Herausforderungen für IT- und BI-Organisationen resultieren aus den Entwicklungen der Datenvolumina, der Datenvielfalt, der Häufigkeiten und Dauer, mit der Daten auf die bestehenden BI-Infrastrukturen, BI-Tool-Landschaften, BI-Architekturen und BI-Designs „einwirken“.
IT-DIRECTOR: Weshalb kann die Auswertung von Big Data für Unternehmen so nützlich sein? Wo liegt der große Mehrwert für das Business?
R. Conrads: Die bis dato in Unternehmen eingesetzten Standardreports decken die Analyse bekannter Zusammenhänge ab und sind vergangenheits- bis maximal gegenwartsorientiert. Der Nutzen der Auswertung von „Big Data“ für das Unternehmen liegt im Entdecken unbekannter Zusammenhänge und Fakten. Der große Mehrwert für das Business entsteht dann, wenn hierdurch beispielsweise Möglichkeiten für Neugeschäft frühzeitig entdeckt und entsprechende Maßnahmen eingeleitet werden können. Die Auswertung von „Big Data“ birgt also Potenzial für die engere Verzahnung von BI und operativen Geschäftsprozessen.
IT-DIRECTOR: Inwieweit können herkömmliche BI-Lösungen für Big-Data-Analysen herangezogen werden? Wann sollte man besser auf ein spezielles Tool setzen?
R. Conrads: Für die „Big-Data-Analysen“ bieten sich verfügbare Data-Mining-Tools an. Letztlich muss aber das gesamte BI-System den „Big-Data-Analysen“ gewachsen sein. Ob eine bereits bestehende BI-Infrastruktur, -Architektur und die BI-Designs zusätzlich „Big Data-Analysen“ verkraften, ohne die zeitgleichen Standardreportings und OLAP-Analysen zu gefährden, kann nur eine unternehmensspezifische Betrachtung zeigen. Bei häufigen, zeitkritischen und umfangreichen „Big-Data-Analysen“ wird man sich sicher Gedanken über separate „Big Data Analytics“-Umgebungen, den Einsatz spezieller Datenbanktechnologien etc. machen.
IT-DIRECTOR: Welche Technologien bilden die Grundlage für Big-Data-Analysen?
R. Conrads: Für „Big Data Analytics“ werden Technologien eingesetzt, die allgemein unter „Advanced Analytics“ beziehungsweise unter „Discovery Analytics“ subsumiert werden. Hierzu zählen neben Data Mining allgemein fortgeschrittene Techniken zur Datenvisualisierung, Techniken zur Verarbeitung und Analyse von Text, Audio- und Videodaten und im weiteren Sinne der performanten Analyse entsprechender Datenvolumina gewachsene analytische Datenbank- und Infrastrukturtechnologien. Zu den analytischen Datenbank- und Infrastrukturtechnologien zählen „In-Memory-“ und „In-Database-Analytics“, spaltenbasierende Datenbanken sowie DWH-/BI-Appliances und Hadoop.
IT-DIRECTOR: Inwieweit können die Auswertungen von großen, unstrukturierten Datenmengen wie Blogs oder sozialen Netzwerken zu einer Verletzung von Compliance-Vorgaben und Gesetzen führen?
R. Conrads: Die Auswertung von Daten aus Blogs oder sozialen Netzwerken ist ein nicht ganz einfaches Thema. Grundsätzlich müssen Organisationen gerade bei der Auswertung von Daten natürlich darauf achten, dass die gesetzlichen sowie eventuelle interne Vorgaben eingehalten werden. Um den Schutz beispielsweise personenbezogener Daten zu gewährleisten, gibt es verschiedene technische Ansätze. Hier sind die Organisationen in der Pflicht, ihrer Verantwortung entsprechend sensibel und gesetzeskonform mit den ihnen überlassenen Informationen umzugehen.
IT-DIRECTOR: Können Sie uns bitte ein Anwenderbeispiel nennen?
R. Conrads: Das typische Beispiel für „Big Data Analytics“ ist das frühzeitige Erkennen von Kundenabwanderungstendenzen durch Anreichern der bestehenden CRM-Daten mit „Big Data“ und das Ab- und Einleiten entsprechender Maßnahmen, um die Abwanderung wichtiger Kunden zu vermeiden. Infragekommende Daten können beispielsweise Äußerungen zu Produktqualitäten oder zur Kulanzbereitschaft eines Unternehmens sein.
Ein aktuelles, aber bislang weniger typisches Beispiel ist das frühzeitige Erkennen eines möglichen Maschinenversagens durch die Analyse sensorgenerierter Daten und das Ab- und Einleiten entsprechender Maßnahmen – beispielsweise eines vorzeitigen Teiletausches. Die kontinuierlichen Datenflüsse von maschinen- beziehungsweise sensorgenerierten Daten werden in Zukunft einen signifikanten Anteil an Big Data haben.
Titelinterview
mit Stefan Maierhofer, Senior Director für Zentral- und Osteuropa bei F5 Networks
Titelthema
IT-Infrastrukturen: Ruckzuck von 0 auf 100
Software
Business Intelligence: Datenberge bezwingen
Meistgelesene Artikel
BT-Studie: Risiken neu bewerten
Cybercrime und private Endgeräte bereiten Sorgen
Lifesize holt Uwe Klatt
Neuer Vertriebsleiter für EMEA
Ciber mit neuem Deutschland- und Europe-Central-Chef
Zwei Topmanager befördert
PWC-Studie: Datenschutz im Fokus
Unternehmen leisten sich Schwächen
T-Systems intensiviert Zusammenarbeit mit SAP
Erweitertes Serviceangebot
Interview mit Stefan Maierhofer, Senior Director für Zentral- und Osteuropa bei F5 Networks, über die Herausforderungen der Anwendungsbereitstellung - neudeutsch Application Delivery - in traditonellen, applikationspezifisch dedizierten Umgebungen und virtuellen, cloudbasierten Umgebungen... mehr lesen »
In den kommenden Jahren verbreitet sich im Data Center eine vorgefertigte Kombination aus Server, Speicher, Netzwerk und Managementsoftware, kurz der "Building Block". CIOs können mit dieser Infrastruktur neue Anwendungen rasch zum Laufen bringen... mehr lesen »
Haben klassische Business-Intelligence-Lösungen (BI) ausgedient? Man könnte es fast meinen, denn alle Welt spricht nur noch von Big Data... mehr lesen »















