Bert Oosterhof, Informatica
Auswertung von Social Media
Interview mit Bert Oosterhof, Director of Technology EMEA bei Informatica

Interview mit Bert Oosterhof, Director of Technology EMEA bei Informatica
IT-DIRECTOR: Herr Oosterhof, was genau versteht man unter „Big Data“?
B. Oosterhof: Unter Big Data versteht man das Zusammenwirken dreier großer Technologietrends: Big Data aus Transaktionsdaten – dazu zählen beispielsweise Adressen, Daten von Finanztransaktionen oder Verbrauchsdaten aus dem Energiesektor –, Big Data aus Interaktionsdaten – z.B. Social-Media-Daten oder Sensordaten, die bei der automatischen Erfassung von RFID-Lesern, Kameras oder Mikrofonen entstehen – sowie die Verarbeitung von Big Data. Da diese Daten aufgrund ihres enormen Umfangs und ihrer hohen Komplexität nicht mit herkömmlichen Technologien verarbeitet werden können, kommen hierfür hochskalierbare Lösungen zum Einsatz, die intensive Rechenprozesse mit auf miteinander vernetzten Rechnern ermöglichen, wie zum Beispiel die Open-Source-Software Hadoop.
IT-DIRECTOR: Über welche Datenvolumina spricht man hier?
B. Oosterhof: Bei Big Data handelt es sich um Datenvolumina im Petabyte-Bereich. Für den Zeitraum von 2009 bis 2020 sagt IDC ein Wachstum um 44 bis 35 Zettabyte, d.h. 35 Mio. Petabyte, voraus.
IT-DIRECTOR: Vor welche Herausforderungen stellt die Analyse unstrukturierter Daten gemeinhin die Verantwortlichen?
B. Oosterhof: Bei der Verarbeitung von Big Data kommt es darauf an, große Datensätze zu importieren und zu verarbeiten, gleichzeitig viele Abfragen zu bewältigen, Ergebnisse in Echtzeit zu liefern und auch komplexe Anfragen innerhalb kürzester Zeit zu beantworten. Herkömmliche Technologien zum Datenmanagement sind in der Regel nicht oder nur unzureichend für die Bewältigung dieser Aufgaben ausgestattet und können Unternehmen daher nicht den Mehrwert bieten, den die Analyse von Big Data erlaubt.
IT-DIRECTOR: Weshalb kann die Auswertung von Big Data für Unternehmen so nützlich sein? Wo liegt der große Mehrwert für das Business?
B. Oosterhof: Ihre Analyse bietet Unternehmen wesentliche Wettbewerbsvorteile, indem sie wichtige Informationen liefert, mit deren Hilfe sie Verkaufszahlen erhöhen, Prozesse optimieren und ihre Flexibilität steigern können. Dies gilt beispielsweise für das Kundenmanagement, das durch die Auswertung von Social-Media-Seiten nicht nur besser gerüstet ist, Neukunden zu erwerben oder Bestandskunden zu halten, sondern auch die Effektivität des Cross Selling zu verbessern und damit letztlich den Umsatz zu steigern. Big Data ist aber auch in anderen Branchen wichtig. Im Finanzbereich kommt die Auswertung von Big Data unter anderem beim Fraud Detection zum Einsatz, wenn es durch die Analyse der riesigen Datenmengen, die beispielsweise bei Transaktionen anfallen, möglich wird, Unregelmäßigkeiten aufzudecken.
IT-DIRECTOR: Inwieweit können herkömmliche BI-Lösungen für Big-Data-Analysen herangezogen werden? Wann sollte man besser auf ein spezielles Tool setzen?
B. Oosterhof: Herkömmlichen Systemen fehlt in der Regel die flexible und skalierbare Dateninfrastruktur, die notwendig ist, um Big Data zu analysieren. Das Unvermögen dieser Lösungen bedeutet für Unternehmen aber nicht nur einfach eine verpasste Geschäftschance, es stellt vielmehr ein erhebliches Risiko dar. Denn die wachsenden Datenmengen können die Sicht auf Geschäftschancen und -bedrohungen aber auch Verkauf und Kundendienst mindern; zudem kann die zunehmende Komplexität die Compliance beeinträchtigen.
IT-DIRECTOR: Welche Technologien bilden die Grundlage für Big-Data-Analysen?
B. Oosterhof: Um Big Data zu bewältigen, empfiehlt sich der Einsatz von hochskalierbaren Technologien wie beispielsweise die Open-Source-Software Hadoop, die intensive Rechenprozesse auf miteinander vernetzten Rechnern ermöglicht und so die Datenmenge in den Griff bekommen. Mit Hilfe einer Datenintegrationslösung können die Daten aus beliebigen Quellen in Hadoop geladen und Daten daraus für beliebige Quellen bereitgestellt werden. Die Datenintegrationssoftware von Informatica verfügt zum Beispiel über eine native Hochleistungskonnektivität für das Hadoop Distributed File System (HDFS) und erlaubt die Nutzung von Big Data mit der vorhandenen IT-Infrastruktur und den Unternehmenssystemen.
IT-DIRECTOR: Inwieweit können die Auswertungen von großen, unstrukturierten Datenmengen wie Blogs oder sozialen Netzwerken zu einer Verletzung von Compliance-Vorgaben und Gesetzen führen?
B. Oosterhof: Da Blogs und soziale Netzwerke im Internet für die Öffentlichkeit frei zugänglich sind, führt ihre Auswertung nicht zu einer Verletzung von Compliance-Vorgaben und Gesetzen.
IT-DIRECTOR: Können Sie uns bitte ein Anwenderbeispiel nennen?
B. Oosterhof: Durch die Kombination von Social-Media- und Transaktionsdaten konnte eine große US-amerikanische Einzelhandelskette ihr Marketing nachhaltig verbessern: Mit Hilfe der Big-Data-Analyse – insbesondere Daten aus Twitter und Facebook – erkannte das Unternehmen, dass es zwei verschiedene Gruppen wertvoller Kunden halten muss: die mit hohen Umsätzen und die mit hohem Einfluss. Es revidierte daraufhin das bisherige Marketing und führte sein zuvor wegen fehlender Umsatzsteigerungen abgeschafftes kostenloses Schminkangebot wieder ein. Die Analyse hatte ergeben, dass dies ein probates Mittel war, um die einflussreiche Gruppe für sich zu gewinnen und mit Hilfe ihrer positiven Äußerungen in den Social Networks das Image der Einzelhandelskette insgesamt zu stärken und das Kaufverhalten indirekt zu fördern.
Titelinterview
mit Stefan Maierhofer, Senior Director für Zentral- und Osteuropa bei F5 Networks
Titelthema
IT-Infrastrukturen: Ruckzuck von 0 auf 100
Software
Business Intelligence: Datenberge bezwingen
Interview mit Stefan Maierhofer, Senior Director für Zentral- und Osteuropa bei F5 Networks, über die Herausforderungen der Anwendungsbereitstellung - neudeutsch Application Delivery - in traditonellen, applikationspezifisch dedizierten Umgebungen und virtuellen, cloudbasierten Umgebungen... mehr lesen »
In den kommenden Jahren verbreitet sich im Data Center eine vorgefertigte Kombination aus Server, Speicher, Netzwerk und Managementsoftware, kurz der "Building Block". CIOs können mit dieser Infrastruktur neue Anwendungen rasch zum Laufen bringen... mehr lesen »
Haben klassische Business-Intelligence-Lösungen (BI) ausgedient? Man könnte es fast meinen, denn alle Welt spricht nur noch von Big Data... mehr lesen »
















