Häufige Mustererkennung in sequenziellen Phasendatenbanken. Data-Mining und Prognoseerstellung am Beispiel von Bausparkollektiven

Schwalb, Marcel (2019). Häufige Mustererkennung in sequenziellen Phasendatenbanken. Data-Mining und Prognoseerstellung am Beispiel von Bausparkollektiven. PhD thesis, Universität zu Köln. Open Access

[thumbnail of Dissertation_Veroeffentlichung.pdf]

Preview

PDF
Dissertation_Veroeffentlichung.pdf - Submitted Version
Bereitstellung unter der CC-Lizenz: Creative Commons Attribution No Derivatives.
Download (4MB) | Preview

Abstract

Die vorliegende Arbeit beschäftigt sich ausgiebig mit der häufigen Musterkennung in Bausparkollektiven und darauf aufbauend mit dem Entwurf und der Verbesserung von Prognoseverfahren zur Vorhersage des Verhaltens von Bausparern. Die häufige Mustererkennung in Sequenzen ist ein klassisches Data-Mining-Gebiet. Ausgehend von einer Datenbank an endlichen, linear geordneten Sequenzen von Produkten oder Ereignissen werden alle häufigen Teilsequenzen dieser Menge gesucht, die eine Mindestanzahl von Supersequenzen in der Menge besitzen. Anhand dieser häufigen Teilsequenzen können grundlegende Charakteristika der Datenbank ermittelt werden. Weiterhin lassen sich Assoziationsregeln der Form: "Kunden die Verhalten X gezeigt haben, zeigen später auch Verhalten Y" formulieren, die mit Wahrscheinlichkeiten versehen werden können. Die Dissertation erweitert das bestehende Standardmodell der Suche nach häufigen Teilsequenzen in Sequenzen um ein Phasenmodell, in dem Sequenzelemente in Phasen eingeteilt werden können. Diese Phasen müssen von allen Sequenzen in einer festen Reihenfolge durchlaufen werden, wenn auch beliebige Phasen übersprungen werden können. Zusätzlich wird das neue Phasenmodell um den Umgang mit multidimensionalen, zeitunabhängigen Attributen und multistufigen Sequenzen erweitert. Hierbei werden Eigenschaften der Modelle durchleuchtet und effiziente Unterteilungsstrategien diskutiert. Es werden insgesamt 5 neue Algorithmen für die Suche nach häufigen Teilsequenzen in sequenziellen Phasendatenbanken und 5 neue Algorithmen für die Suche in komplexeren Modellen vorgestellt. In dieser Arbeit inkludierte Testergebnisse zeigen, dass einige dieser Algorithmen die bisherigen Standardalgorithmen im Falle von Phasendatenbanken um ein Vielfaches in der Geschwindigkeit übertreffen können. Erstmalig werden in dieser Arbeit die theoretischen Ergebnisse auf die Daten von Bausparkollektiven angewandt. Hierzu wird ebenso erstmalig ein vollumfänglicher Kundenansatz statt des bisher üblichen Vertragsansatzes zur Modellierung von Bausparkollektiven genutzt. In dieser Arbeit konnte gezeigt werden, dass das Vorliegen von zusätzlichen Daten auf Kundenebene signifikanten Einfluss auf die Verhaltensweisen und Entscheidungen der Bausparer offenlegt. Die Ergebnisse dieser Arbeit können zukünftig genutzt werden, um ein tieferes Verständnis für die Struktur und Dynamik in Bausparkollektiven zu gewinnen. Aufbauend auf den vorgestellten Ansätzen können neue Formen der Kollektivprognose und der Vorhersage von Individualverhalten konstruiert werden.

Item Type:	Thesis (PhD thesis)
Creators:	Creators Email ORCID ORCID Put Code Schwalb, Marcel schwalb.marcel@gmail.com UNSPECIFIED UNSPECIFIED
URN:	urn:nbn:de:hbz:38-99850
Date:	11 September 2019
Language:	German
Faculty:	Faculty of Mathematics and Natural Sciences
Divisions:	Faculty of Mathematics and Natural Sciences > Department of Mathematics and Computer Science > Institute of Computer Science
Subjects:	Data processing Computer science General statistics Economics Mathematics
Uncontrolled Keywords:	Keywords Language Mustererkennung, Data-Mining, Big-Data, Bausparen, Prognose, Bausparkollektiv, Kundenvorhersage UNSPECIFIED
Date of oral exam:	15 October 2018
Referee:	Name Academic Title Schrader, Rainer Prof. Dr. Schaudt, Oliver Prof. Dr.
Refereed:	Yes
URI:	http://kups.ub.uni-koeln.de/id/eprint/9985

Downloads

Downloads per month over past year

Export

Actions (login required)

View Item