Schwalb, Marcel (2019). Häufige Mustererkennung in sequenziellen Phasendatenbanken. Data-Mining und Prognoseerstellung am Beispiel von Bausparkollektiven. PhD thesis, Universität zu Köln.

[img]
Preview
PDF
Dissertation_Veroeffentlichung.pdf - Submitted Version
Bereitstellung unter der CC-Lizenz: Creative Commons Attribution No Derivatives.

Download (4MB) | Preview

Abstract

Die vorliegende Arbeit beschäftigt sich ausgiebig mit der häufigen Musterkennung in Bausparkollektiven und darauf aufbauend mit dem Entwurf und der Verbesserung von Prognoseverfahren zur Vorhersage des Verhaltens von Bausparern. Die häufige Mustererkennung in Sequenzen ist ein klassisches Data-Mining-Gebiet. Ausgehend von einer Datenbank an endlichen, linear geordneten Sequenzen von Produkten oder Ereignissen werden alle häufigen Teilsequenzen dieser Menge gesucht, die eine Mindestanzahl von Supersequenzen in der Menge besitzen. Anhand dieser häufigen Teilsequenzen können grundlegende Charakteristika der Datenbank ermittelt werden. Weiterhin lassen sich Assoziationsregeln der Form: "Kunden die Verhalten X gezeigt haben, zeigen später auch Verhalten Y" formulieren, die mit Wahrscheinlichkeiten versehen werden können. Die Dissertation erweitert das bestehende Standardmodell der Suche nach häufigen Teilsequenzen in Sequenzen um ein Phasenmodell, in dem Sequenzelemente in Phasen eingeteilt werden können. Diese Phasen müssen von allen Sequenzen in einer festen Reihenfolge durchlaufen werden, wenn auch beliebige Phasen übersprungen werden können. Zusätzlich wird das neue Phasenmodell um den Umgang mit multidimensionalen, zeitunabhängigen Attributen und multistufigen Sequenzen erweitert. Hierbei werden Eigenschaften der Modelle durchleuchtet und effiziente Unterteilungsstrategien diskutiert. Es werden insgesamt 5 neue Algorithmen für die Suche nach häufigen Teilsequenzen in sequenziellen Phasendatenbanken und 5 neue Algorithmen für die Suche in komplexeren Modellen vorgestellt. In dieser Arbeit inkludierte Testergebnisse zeigen, dass einige dieser Algorithmen die bisherigen Standardalgorithmen im Falle von Phasendatenbanken um ein Vielfaches in der Geschwindigkeit übertreffen können. Erstmalig werden in dieser Arbeit die theoretischen Ergebnisse auf die Daten von Bausparkollektiven angewandt. Hierzu wird ebenso erstmalig ein vollumfänglicher Kundenansatz statt des bisher üblichen Vertragsansatzes zur Modellierung von Bausparkollektiven genutzt. In dieser Arbeit konnte gezeigt werden, dass das Vorliegen von zusätzlichen Daten auf Kundenebene signifikanten Einfluss auf die Verhaltensweisen und Entscheidungen der Bausparer offenlegt. Die Ergebnisse dieser Arbeit können zukünftig genutzt werden, um ein tieferes Verständnis für die Struktur und Dynamik in Bausparkollektiven zu gewinnen. Aufbauend auf den vorgestellten Ansätzen können neue Formen der Kollektivprognose und der Vorhersage von Individualverhalten konstruiert werden.

Item Type: Thesis (PhD thesis)
Creators:
CreatorsEmailORCID
Schwalb, Marcelschwalb.marcel@gmail.comUNSPECIFIED
URN: urn:nbn:de:hbz:38-99850
Subjects: Data processing Computer science
General statistics
Economics
Mathematics
Uncontrolled Keywords:
KeywordsLanguage
Mustererkennung, Data-Mining, Big-Data, Bausparen, Prognose, Bausparkollektiv, KundenvorhersageUNSPECIFIED
Faculty: Faculty of Mathematics and Natural Sciences
Divisions: Faculty of Mathematics and Natural Sciences > Department of Mathematics and Computer Science > Institute of Computer Science
Language: German
Date: 11 September 2019
Date of oral exam: 15 October 2018
Referee:
NameAcademic Title
Schrader, RainerProf. Dr.
Schaudt, OliverProf. Dr.
Refereed: Yes
URI: http://kups.ub.uni-koeln.de/id/eprint/9985

Downloads

Downloads per month over past year

Export

Actions (login required)

View Item View Item