News Kurs

Chancen, Kosten und Risiken von Data-Mining-Projekten

Von: Marcus Dill

Die Zeiten, in denen sich Unternehmen Datenbrachen leisten können, sind laut Marktforschern wie Gartner vorbei. Die gute Nachricht: Vorbei sind auch die Zeiten, in denen Data Mining ausschließlich von Statisikprofis in kostenintensivem, monatelangem Feintuning betrieben werden konnte.

Dr. Marcus Dill, Geschäftsführer des BI-Beratungshauses mayato GmbH

Dr. Marcus Dill, Geschäftsführer des BI-Beratungshauses mayato GmbH

Anders als bei einfachen Reports oder OLAP-Analysen geht es beim Data Mining (DM) um das Auffinden von Mustern, die mit dem bloßen Auge trotz intensiver Analyse nicht erkennbar sind – sich aber sehr wohl mit Hilfe von intelligenten Algorithmen aufspüren lassen. Typische Anwendungsgebiete finden sich verstärkt im Bereich des Kundenbeziehungsmanagements (CRM), in Kundensegmentierung, Warenkorbanalysen und beim Erkennen von Cross-Selling-Potentialen, bei Frühwarnsystemen für Kundenabwanderung oder Betrug. Hinzu kommen Anwendungen in Einkauf, Produktion, Qualitäts- und Reklamationsmanagement – zum Beispiel bei der Prognose von Ersatzteilausfällen und Beschaffungsbedarfen. Data Mining rechnet sich vergleichsweise schnell durch mehr Effizienz, zusätzliche Umsätze oder vermiedene Verluste: Nicht selten erreichen Business Cases eine Größenordnung von Millionen Euro.


Kostentreiber und Risiken


Traditionelles Data Mining ist Spezialisten vorbehalten: Die Erstellung von Modellen und die Aufbereitung der Daten erfordern Expertenwissen, sie nehmen teilweise Monate in Anspruch. Dieser Aufwand treibt nicht nur die Kosten von DM-Analysen in die Höhe, sondern beschränkt auch deren Anzahl. Hinzu kommt die Ungewissheit, ob sich überhaupt relevante Muster in den gegebenen Daten finden lassen: Selbst mit dem besten Werkzeug ist nicht in jedem Berg eine Goldader zu finden. Bis zu dieser Erkenntnis hat ein traditionelles Data-Mining-Projekt häufig schon Personentage in sechsstelliger Höhe mit den entsprechenden Kosten verschlungen. Hinzu kommen Lizenzkosten von nicht selten mehreren 100.000 Euro und jährliche Wartungskosten in fünf- bis sechsstelliger Höhe. Weitere Investitionen in Millionenhöhe können durch den Aufbau einer Data-Warehouse-Infrastruktur entstehen.


In den letzten Jahren entstanden jedoch eine Reihe alternativer Ansätze, die das Verhältnis von Risiken und Chancen von Data-Mining-Projekten positiv verschoben haben. In der Open-Source-Welt sind Produkte wie Rapidminer, KNIME oder Weka verfügbar, die einen ähnlich mächtigen Funktionsumfang aufweisen wie klassische DM-Suiten von SAS oder SPSS. Den Einsparungen bei Lizenzkosten steht jedoch im Normalfall ein erhöhter Aufwand durch weniger gute Prozess-Unterstützung und kompliziertere Bedienung gegenüber. Für statistische Laien sind diese Werkzeuge kaum beherrschbar. Eine andere Option ist die Nutzung bereits im Unternehmen vorhandener Lizenzen für Datenbank- oder Data-Warehouse-Software. DM-Funktionen und -Algorithmen finden sich in Software von Oracle und Microsoft. Auch Besitzer von IBM- oder SAP-Lizenzen sollten sich nach zusätzlichen DM-Features erkundigen.


Schnupperkurs für Data Mining


Einen Umbruch im Markt stellen im Hinblick auf Projektdauer und einfache Anwendung vor allem Produkte für das Self-Acting Data Mining dar, wie zum Beispiel das Analytic Framework von KXEN. Sie nehmen den Anwendern durch einen automatisierten Ansatz die Arbeit der Datenvorbereitung und Parametrisierung weitgehend ab. Projektlaufzeiten gehen deutlich zurück, sodass erste Ergebnisse schon nach wenigen Tagen verfügbar sind. So lässt sich schon relativ früh sagen, ob vorhandene Daten überhaupt weitere Investitionen rechtfertigen. Auch für Unternehmen, die mehrere Hundert Modelle im Jahr im Jahr erstellen, ergibt sich durch den Zeitgewinn ein Kostenvorteil. Durch die einfachere Bedienbarkeit erschließt sich das Self-Acting Data Mining auch für Fachanwender und rückt zudem erstmals für Mittelständler in Reichweite. Mittlerweile lassen sich einige Data-Mining-Werkzeuge auf Monatsbasis zu Preisen im vierstelligen Eurobereich mieten. Für eine gezielte Fragestellung wie zum Beispiel die Ermittlung von Cross-Selling-Potentialen liegen die Kosten für ein Pilotprojekt mit Software und Beratung bei unter 20.000 Euro – Kosten, die sich in vielen Fällen schon durch die im Pilotprojekt gewonnenen Erkenntnisse amortisieren.


ANZEIGE

Brennpunkt

IT-Themen im Fokus

Aktuelle Ausgabe > Juni 2010

Highlights der aktuellen Ausgabe von IT-DIRECTOR ...


IT-Wartung: Vom Klassiker bis zum Neusystem

Interview mit Claus Fischer, Geschäftsführer der Technogroup IT-Service GmbH, über die...


Nicht im Regen stehen

Zur Kostenreduktion greifen Unternehmen häufig auf das IT-Outsourcing zurück. Doch was muss...


Servermarkt im Umbruch?

Stehen im Rechenzentrum alle Zeichen auf x86-basierte Bladeserver, nachdem sich HP im ersten...


IT-DIRECTOR Special 05/2010

Das Neue Arbeiten: Dank Dynamic IT geht die Rechnung auf


Mehr Transparenz für die Infrastruktur

Interview mit Anton Kreuzer, Geschäftsführer bei Frontrange Solutions Deutschland, über...


Die Notwendigkeit intelligenter Energienetze

© Erich Werner / Pixelio

Seit dem 1. Januar 2010 gelten neue Bestimmungen auf dem deutschen Energiemarkt: Neubauten müssen...


Automatisierte Rechnungsprüfung

Die Cormeta AG hat eine Schnittstelle zur ene’t-Datenbank der gültigen Netznutzungstarife...


Unternehmen nachhaltig steuern

Ein berufsbegleitender Studiengang bildet Führungskräfte aus, die in der Lage sind, mit Hilfe von...


Mit Krücken in die Wolke

Bildquelle: iStockphoto

Eigentlich klingen Cloud Computing und Software as a Service (SaaS) so gut, wenn der Blick auf...


Zu viel heiße Luft im Umlauf

Für eine Ballonfahrt mag heiße Luft unverzichtbar sein, im Rechenzentrum hingegen ist sie alles...


Damit die Räder nicht stillstehen

Bildquelle: © Berwis / Pixelio

Was bringt ein zügiges Backup, wenn alle Applikationen stillstehen? Abhilfe verspricht ein Mix aus...


Die Zukunft liegt in den Wolken

Interview mit Tony Scott, Chief Information Officer und Corporate Vice President bei Microsoft in...


Cloud Computing aus Entwicklersicht

Bildquelle: © Mamarone / Pixelio

Der größte Vorteil von Cloud-Anwendungen liegt in der dynamischen, ortsunabhängigen Bereitstellung...


Braucht das Internet Werte?

Bisher lautet die Antwort auf alle Fragen nach Daten­sicherheit im Web: Eigenverantwortung. Wie...