Data Mining im E-Commerce: Von Big Data zu Informationen

Data Mining: In Datenberge graben

Daten spielen im E-Commerce eine zentrale Rolle. Viele Online-Shops sammeln Daten zu Kundengewohnheiten, Einkaufswagen und Produkten, um ihre Verkaufsprozesse zu optimieren. Ein Datenberg allein sagt jedoch wenig aus. Die Umwandlung dieser Rohdaten in nützliche Informationen trägt zur Verbesserung des Geschäftsbetriebs und zur Steigerung des Umsatzes bei. Hier kommen in einem Analysetool massive Daten zum Einsatz, die als Data Mining oder Data Mining bezeichnet werden .

Was ist Data Mining?

Um dieses Konzept zu verstehen, das sich auf Informatik und Statistik stützt, ist es nützlich, die im Namen enthaltene Metapher zu verstehen. Wenn das Ergebnis der nahezu absoluten Verfolgung des Benutzerverhaltens im Internet als scheinbar nutzloser Datenberg angesehen wird, bietet Data Mining, was als Data Mining übersetzt wird, die erforderlichen Tools, um diese riesige Datenmenge zu untersuchen und daraus zu extrahieren. ihre relevanten Informationen. Diese Tools bestehen aus statistischen Methoden , mit denen Verhaltensmuster und Verbindungen in Daten identifiziert werden können, die für sich genommen nichts bedeuten.

Data Mining bezieht sich häufig auf Big Data , ein Konzept, das sich auf Datenbanken bezieht, deren Volumen keine konventionelle Analyse mehr zulässt und daher auf Rechenprozessen beruht. Während des Data Mining-Prozesses kann jedoch jede Datenmenge untersucht werden.

In Wirklichkeit ist die Datenexploration eine der Phasen eines größeren Prozesses, der sogenannten “Wissensextraktion in Datenbanken”. ( Knowledge Discovery in Databases oder KDD ), das die folgenden Schritte abdeckt:

  • Auswahl der zu analysierenden Datenbank
  • Vorverarbeitung, die die Datenbank bereinigt und vorbereitet
  • Transformation wie es der Analyseprozess erfordert
  • Analyseprozess selbst durch einen mathematischen Prozess (Data Mining)
  • Ergebnisanalyse

Die von einem KDD extrahierten Informationen können auf eine Vielzahl von Bereichen angewendet werden, beispielsweise auf die strategische Planung eines Online-Geschäfts und auf das Treffen von Marketingentscheidungen.

Was ist Data Mining?

Anwendungsbereiche für Data Mining

Mit Data Mining können Sie den E-Commerce auf wissenschaftlicher Basis optimieren . Die großen Datenbanken von Online-Shops sind der Ausgangspunkt, um Schlussfolgerungen und Prognosen zu ziehen. Diese statistisch aufbereiteten und strukturierten Daten ermöglichen es Online-Shop-Administratoren, die Faktoren zu identifizieren , die den Erfolg eines Online-Geschäfts beeinflussen, und Strategien neu zu berechnen. Data Mining wird in diesem Fall verwendet, um:

  • Segmentmärkte
  • Analysieren Sie die Nachfrage
  • Erstellen Sie Käuferprofile
  • Warenkörbe analysieren
  • Produktpreise berechnen
  • Identifizieren Sie Fehler in Verkaufsprozessen
  • Erstellen Sie eine Prognose zum Ablauf von Verträgen

Data Mining-Methoden

Um relevante Informationen für Unternehmen zu extrahieren, wurden verschiedene Methoden implementiert, die auf der Identifizierung von Verbindungen, Modellen und signifikanten Mustern basieren und die für statistische Wissenschaften typischen Verfahren verwenden:

  • Ausreißererkennung : Ausreißerwerte sind diejenigen Werte, die extrem weit vom Rest entfernt sind, da sie von einem allgemeinen Muster oder Trend abweichen. Beim Data Mining wird diese Analyse verwendet, um überzeugende Daten zu identifizieren, die zu Kreditkartenbetrug führen können.
  • Clusteranalyse oder Clustering : Ein Cluster ist eine Gruppe von Objekten, die auf Beziehungen von gegenseitiger Ähnlichkeit beruhen. Das Ziel dieser Analyse ist die Segmentierung unstrukturierter Daten, für die Algorithmen verwendet werden, die Datenbanken auf der Suche nach scheinbaren Strukturen untersuchen, um neue Cluster zu identifizieren. Im Gegensatz zur Klassifizierung zielt die Clusteranalyse darauf ab, neue Clustering-Möglichkeiten zu entdecken. Daten, die keiner Gruppe untergeordnet werden können, können als Ausreißer interpretiert werden. Ein sehr häufiger Anwendungsfall im E-Commerce ist die Identifizierung von Benutzergruppen.
  • Klassifizierung (Diskriminanzanalyse) : Während bei der vorherigen Analysemethode der Schwerpunkt auf der Identifizierung neuer Gruppen liegt, werden bei der Diskriminanzanalyse vordefinierte Klassen angewendet. Die Verteilung erfolgt anhand von Merkmalen, die einzelnen Daten gemeinsam sind. Eine sehr verbreitete Methode zur automatischen Klassifizierung von Daten besteht aus Entscheidungsbäumen, Vorhersagemodellen, die in der künstlichen Intelligenz verwendet werden, um logische Konstruktionsschemata zu erstellen, mit denen eine Reihe aufeinanderfolgender Bedingungen kategorisiert werden können. Es funktioniert von Knoten aus, in denen jeweils ein Aspekt des Objekts festgelegt ist. Seine Konstanz oder Nichtkonstanz im Objekt entscheidet über die Wahl des nächsten Knotens (oder der Eigenschaft des Objekts). Im Bereich E-Commerce wird dieses Data Mining-Verfahren verwendet, um Kunden in verschiedene Gruppen zu unterteilen.
  • Assoziationsanalyse (Assoziationsregeln) : Eine Analyse dieses Typs versucht, Verbindungen zu identifizieren, die als absolute Regel formuliert werden können. Für Online-Shops könnte dieses Data Mining-Verfahren angewendet werden, um Korrelationen in einem typischen Einkaufswagen gemäß dem Muster “Kunden, die Produkt A kaufen, kaufen auch Produkt B” zu identifizieren.
  • Regressionsanalyse : Mit dieser Art der statistischen Analyse können Modelle erstellt werden, die eine abhängige Variable aus unabhängigen Varianten erklären. In der Praxis ist es möglich, eine Prognose für den Verkauf eines Produkts zu erstellen, die den Preis des Produkts und das Durchschnittsgehalt des Kunden in einem Regressionsmuster in Beziehung setzt.

Einschränkungen des Data Mining

Data Mining gruppiert statistische Methoden, die eine grundsätzlich objektive Analyse von Datenbanken ermöglichen. Die subjektive Wahl der Art der Analyse und der verschiedenen Algorithmen und Parameter nach bestimmten Zielen kann jedoch möglicherweise auf gewünschte Weise zu einer Verfälschung der Ergebnisse führen. Eine Möglichkeit, dies zu vermeiden, könnte die Verwendung eines externen Data Mining-Dienstes sein.

Der Status der Datenbank ist auch entscheidend für die Qualität der extrahierten Informationen. Repräsentative Ergebnisse werden nur extrahiert, wenn die verfügbaren Daten auch repräsentativ sind. Aus diesem Grund wird in den meisten Fällen vor dem Starten des Data Mining-Prozesses eine vorherige Verarbeitung der Datenbank durchgeführt , um Leerstellen und Verzerrungen zu vermeiden.

Schließlich dürfen wir nicht vergessen, dass Data Mining die Ergebnisse in Form von Mustern und Verbindungen liefert . Um Antworten zu erhalten, müssen die Ergebnisse gemäß den Fragen und den zuvor festgelegten Zielen interpretiert werden.

administrator

Leave a Reply

Your email address will not be published.