Kann maschinelles Lernen Missbrauch von Kundenbindungsprogrammen aufdecken?
- Veröffentlicht
- 4 min Lesezeit
Groß angelegte Kundenbindungs- oder Loyalty-Plattformen verarbeiten Millionen von Transaktionen aus Hunderten von Standorten und verwalten gleichzeitig Tausende Teilnehmerkonten. Betrügerische Aktivitäten bei diesem Datenumfang und der zugehörigen Verarbeitungsgeschwindigkeit aufzudecken, stellt eine sehr komplexe Herausforderung dar, der mit herkömmlichen Verfahren kaum bis gar nicht beizukommen ist. Abhilfe verspricht Programmbetreibern hier der Einsatz von maschinellem Lernen (ML) bzw. künstlicher Intelligenz (KI). Beide Konzepte können bei effektiver Anwendung zum Schutz vor potentiellen Gewinn- und Imageverlusten beitragen, die bei Missbrauch des für die Geschäftstätigkeit entscheidenden Kundenbindungssystems drohen.
Zunächst ist zu betonen, dass keines der in diesem Artikel beschriebenen Verfahren eine Patentlösung für den Schutz von Kundenbindungsprogrammen vor Missbrauch darstellt. Kundenbindungsprogramme sind sehr vielfältig; sie werden durch den betreffenden Industriezweig, die verfolgten Geschäftsziele, ihre individuelle Konfiguration und verschiedene andere Faktoren bestimmt. Auch kann ein maschinelles Lernsystem klassische Schutzmechanismen, wie die Festlegung von Vergabe- und Einlösegrenzen, die Kontrolle der Anzahl an Registrierungen, die Verifizierung der Daten, die Überwachung der Anzahl risikobehafteter Transaktionen oder den Einsatz von Deduplizierungsverfahren, keinesfalls vollständig ersetzen. ML-/KI-Lösungen können jedoch mit sehr gutem Ergebnis als Ergänzung bestehender Maßnahmen der Betrugsvorbeugung genutzt werden.
Was genau ist unter Missbrauch von Kundenbindungsprogrammen zu verstehen?
Missbrauch im Kontext eines Kundenbindungsprogramms lässt sich nur schwer definieren. Ebenso schwierig ist es, eine prägnante Formel zu finden, die als Algorithmus von verschiedenen automatischen Mechanismen angewendet werden kann. Ganz allgemein wird unter dieser Art von Missbrauch die Ausnutzung technischer oder konfigurationsbedingter Schlupflöcher verstanden, wodurch gegen die Regeln und Bedingungen des betreffenden Kundenbindungsprogramms verstoßen wird. Resultat sind zumeist Unverhältnismäßigkeiten in den Kauf- oder Prämientransaktionen eines Programmteilnehmers. Ausgehend von der Annahme, dass sich die große Mehrheit der Teilnehmer an die Programmbedingungen hält, scheinen betrügerische Aktivitäten in der Gesamtheit der rechtmäßigen Programmtransaktionen als Anomalien auf. Ein solches Szenario ist ein bewährter Anwendungsfall von ML-/KI-Lösungen: Erkennen von Abweichungen in riesigen, vielfältigen Datenmengen.
Grundsätzlich werden zwei Hauptkategorien von ML-Lösungen unterschieden: überwachtes und unüberwachtes maschinelles Lernen. Eine überwachte ML-Lösung wird mit Daten von Transaktionen, Konten oder Aktivitäten gespeist, die explizit als betrügerisch eingestuft sind. Anschließend kann ein ML-basierter Klassifikator anhand spezifischer Dateneigenschaften neue Transaktionen mit den betrügerischen vergleichen und bestimmen, wie ähnlich sich diese sind, um Missbrauchsfälle zu identifizieren und zu melden. Beim unüberwachten Lernen werden dem ML-System keine markierten Datensätze vorgegeben, sondern es versucht selbst, Muster und Verbindungen in den Daten zu erkennen. Auch wenn eine Datenquelle mit ausgewiesenen Missbrauchsfällen sehr hilfreich sein kann, konzentriert sich Comarch auf unüberwachte Verfahren, da sich diese nach Einschätzung des IT-Dienstleisters für eine größere Bandbreite an Anwendungsszenarien anpassen lassen.
Die Geschäftsvorgaben und Zielsetzungen für Kundenbindungsprogramme sind meist sehr verschieden, doch der Hauptzweck ist derselbe: wiederkehrende Kunden belohnen und halten, die eigene Markenbekanntheit erhöhen und den Verkaufsumsatz steigern. Im Falle einer relativ statischen Programmkonfiguration sollten einige Muster in der Interaktion zwischen Programm und Teilnehmer erkennbar sein, die sich messen lassen, wie z. B.:
- Vergabe-/Einlöseverhältnis – übliche Anzahl an Vergabetransaktionen, bis die Punkte im Regelfall von einem Großteil der Programmteilnehmer eingelöst werden
- Sammelgeschwindigkeit – wie schnell steigt das Punkteguthaben
- Übliche Frequenz von Vergabe- und Einlösetransaktionen
- Gewöhnliche Kontolaufzeit
- Wertverhältnis zwischen Einkäufen und Punktetransaktionen
- Mögliche Beziehung zwischen dem Zeitpunkt der Registrierung für das Programm und der Gesamtzahl an Interaktionen
Maschinelle Lernsysteme sind in der Lage, diese und ähnliche Muster in Transaktionsdaten zu erkennen und dann Konten oder einzelne Transaktionen festzustellen, die von einem erkannten Muster abweichen.
Einsatz von maschinellem Lernen in Kundenbindungsprogrammen
Die Mehrheit der Kundenbindungsprogramme vergibt Bonuspunkte an die Kunden in einer Anzahl, die dem Wert einer bestimmten Kauftransaktion entspricht. Damit besteht bei den meisten Programmkonfigurationen ein annähernd lineares Verhältnis zwischen der Gesamtsumme der Ausgaben eines Kunden und seiner gesammelten Punkte. Dieses ist in der folgenden Abbildung grafisch dargestellt:
Die Analyse einer sehr simplen Programmkonfiguration, nach der bspw. für jeden ausgegebenen Dollar ein Punkt gutgeschrieben wird, müsste ein exakt lineares Verhältnis zwischen den Gesamtausgaben und der Punktesumme eines Programmteilnehmers ergeben. In der Realität sind derartige Programme jedoch kaum anzutreffen. Vielmehr definieren die Programmbetreiber zumeist zusätzliche Aktionen, Sonderangebote, begrenzte Sonderkonditionen, Sonderpunkte usw. Für die daraus resultierenden Zusatzpunkte bzw. die mit diesen verbundene größte nachvollziehbare Abweichung von einem exakt linearen Verhältnis muss ein entsprechender Toleranzbereich angesetzt werden. Sollten bei fortlaufender Überwachung der Kennzahlen einige Teilnehmerkonten Ausreißerwerte zeigen, kann dies zwei Ursachen haben:
- Fehlerhafte Konfiguration des Programms – ein Teilnehmer mit hohen Gesamtausgaben hat weniger Punkte erhalten als andere Teilnehmer, die einen ähnlichen Geldbetrag ausgegeben haben
- Betrügerische Aktivitäten auf dem betreffenden Konto – die Gesamtzahl der gesammelten Punkte ist im Vergleich zur Summe der Ausgaben unverhältnismäßig hoch
Beide beschriebenen Fälle sollten untersucht werden.
Im Rahmen der Forschung und Entwicklung für das Kundenbindungssystem Comarch Loyalty Management wird untersucht, wie sich maschinelles Lernen zur Erkennung von Abweichungen bzw. Betrug nutzen lässt.
Das wichtigste ML-Verfahren, das hierzu bei Comarch analysiert wurde, ist der Einsatz eines Autoencoders, einer Art künstlichem neuronalen Netz, das lernt, Eingabedaten zu komprimieren und wieder zu rekonstruieren. Wie dies abläuft, zeigt das folgende Schema:
Um die Leistungsfähigkeit des verwendeten Algorithmus und seine allgemeine Eignung für den vorgesehenen Zweck zu ermitteln, werden die rekonstruierten Ausgabedaten mit der ursprünglichen Eingabe verglichen. Je stärker die Rekonstruktion des Autoencoders abweicht, desto wahrscheinlicher handelt es sich bei dem untersuchten Datensatz um eine Anomalie. In seiner Untersuchung hat Comarch echte Daten zur Interaktion zwischen Teilnehmern und Kundenbindungsprogramm sowie Punkteständen genutzt. Im Ergebnis konnten Konten identifiziert werden, die ein zweifelhaftes Vergabe-/Einlöseverhältnis, ungewöhnlich schnelle Punktegewinne oder -verluste, bedeutende manuelle Punktekorrekturen, wiederholte Transaktionen oder andere unübliche Muster aufwiesen. Sämtliche festgestellten Anomalien sind nur schwer mit anderen Verfahren zu erkennen. So wurden auch verschiedene Tests mit Klassifikationsbäumen und Cluster-Algorithmen durchgeführt, doch Autoencoder haben sich bisher als am effektivsten erwiesen.
Zusammenfassend kann man sagen, dass ML-Lösungen in der Vorbeugung und Erkennung von betrügerischen Aktivitäten in Kundenbindungsprogrammen auf jeden Fall von Vorteil sind. Die Herausforderung, die nun für Comarch bleibt, ist es, derartige Lösungen in die angebotene Kundenbindungsplattform einzubinden und sicherzustellen, dass sie zur zuverlässigen Echtzeitverarbeitung enormer Mengen an Transaktionsdaten gerüstet sind. Das übergeordnete Ziel heißt höhere Sicherheit im Kundenbindungserlebnis und rechtfertigt den erforderlichen Aufwand allemal.
Mehr über Künstliche Inteligenz und Betrug bei Kundenbindung erfahren Sie im aktuellen Whitepaper von Comarch:
https://www.comarch.de/service-und-support/whitepaper-und-webcasts/whitepaper-kundenbindung-durch-ki-und-machine-learning/
Comments
Keine Kommentare vorhanden