Wie Big Data auf den Hund kommt


Big Data steht für viele, oft unstrukturierte Daten. Diesen Daten mangelt es meist am nötigen Kontext. Deshalb kommt es bei der Auswertung der vorhandenen Daten oft zu Ergebnissen, die mit der Realität wenig gemeinsam haben. Ein Beispiel.

Siri
Der Hund braucht Futter. Der Halter kauft Futter. Aber der Halter ist nur temporär. Die Futterbeschaffung durch diesen Halter deshalb auch. Für die Datenanalyse ein unbekanntes Szenario.

Die Tücken von Daten-Analysen in der Praxis.

Loyalitätsprogramme haben Konjunktur. Der Anbieter offeriert Gutscheine und Spezialaktionen gegen Kundenidentifikation. Die jeweils getätigten Einkäufe können so einem Mitglied des Loyalitätsprogrammes zugewiesen werden. So ergibt jeder Einkauf gleich mehrere Datenpunkte. Diese Daten werden gespeichert und ausgewertet. Über einen längeren Zeitraum zeigen sich gewisse Verhaltensmuster. Das Marketing des Anbieters kann diese Erkenntnisse nutzen, um zu versuchen, das Verhalten des Kunden mittels Spezialangeboten zu beeinflussen. 

Big Data: Vier Faktoren sind zu berücksichtigen

Big Data ist ein rein quantitativer Begriff und steht für grosse Datenmengen. Wie diese grossen Datenmengen entstehen, spielt dabei keine Rolle. Gleiches gilt für die Qualität und die Aussagekraft der Daten. Bei einer grossen Datenmenge und guter Datenqualität ist zwar die Grundlage für eine belastbare Analyse gegeben, doch hängt die Aussagekraft von der Vollständigkeit der verfügbaren Daten ab. 

Manchmal ist diese gegeben, aber sehr oft nicht. So stehen beispielsweise bei der Analyse von Kaufverhalten die Daten bezüglich Motivation und Kausalität meist nicht zur Verfügung. Aus Handlungen auf Motivation und Kausalität zu schliessen, ist keine gute Idee, sondern Spekulation nach dem Wahrscheinlichkeitsprinzip. 

Gleiches gilt für den Bereich der voraussagenden Analyse ("predictive analysis"), welche auf Daten aus der Vergangenheit basiert und damit Daten, die in Zukunft entstehen, voraussagen will. Wird dabei nicht berücksichtigt, wie und weshalb die analysierten Daten entstanden sind und wie vollständig sie sind, so ist die Vorhersage im besten Fall probabilistisch. 

Die Wahrscheinlichkeit der Korrektheit einer solchen Voraussage hängt von vier Faktoren ab: (1) Qualität der Daten, (2) Vollständigkeit der Daten, (3) Aussagekraft der Daten, und (4) Zeitraum zwischen letzter Datenerhebung und Eintrittsdatum der vorausgesagten Entwicklung.

Der Hund und sein Hunger

Hunde brauchen Nahrung. Das führt fast zwangsläufig dazu, dass Hundebesitzer – auch temporäre – Hundefutter kaufen. Kauft nun ein Mitglied eines Loyalitätsprogrammes wie "M-Cumulus" Hundefutter, so wird das wie jedes andere Einkaufsdetail registriert und verarbeitet. 

Das Registrieren und Zuweisen ist einfach, die korrekte Verarbeitung nicht. 

Bekannt sind nämlich nur folgende Tatsachen: (1) Beim Kauf von Hundefutter wurde eine Mitgliedskarte vorgelegt, (2) der Kauf erfolgte an einem bestimmten Ort zu einer bestimmten Zeit, und (3) wie oft über welchen Zeitraum Hundefutter gekauft wurde. Alles andere ist Spekulation.

Und so kommt Big Data auf den Hund

Für die Auswertung der Daten des M-Cumulus-Systems gilt offensichtlich die Annahme, dass nur wer einen Hund hat, auch Hundefutter kauft. Im Umkehrschluss bedeutet dies, dass jeder, der Hundefutter kauft, auch Hundeeigentümer sein muss. Unberücksichtigt bleiben alle anderen Fälle.

In der Realität kommt es oft vor, dass Hunde während den Ferien oder während einem Spitalaufenthalt des Eigentümers von einer Drittperson aufgenommen und betreut werden. Diese Drittpersonen kaufen während der Betreuungszeit Hundefutter, aber eben nur während der Betreuungszeit.

Ist der Hund wieder zurück beim Eigentümer, so braucht die Drittperson kein Hundefutter mehr. Das System konstatiert entsprechend, dass die Drittperson nach ein paar Einkäufen kein Hundefutter mehr gekauft hat. Die Folgerung des Systems: Die Drittperson hat einen Hund, kauft aber das Hundefutter nicht mehr bei uns. 

Entsprechend wird mittels personalisierter Werbung, verbunden mit einer Spezialofferte, versucht, das Verhalten des Kunden so zu beeinflussen, dass er wieder Hundefutter in der Migros kauft. Dass ein Hundebesitz temporär sein kann und dass ein Hundefutterkauf wegen des Nichtvorhandenseins eines zu fütternden Hundes ausbleibt, ist dem System offensichtlich unbekannt. Wer mehrfach Hundefutter gekauft hat, muss Hundeeigentümer sein. 

Den Hund kümmert dies alles wenig. Der bekommt sein Futter jetzt wieder von seinem Eigentümer. 

 

Dier Artikel erschien ursprünglich am 25. April 2017 auf Inside-IT.