Schwalb, Marcel (2019). Häufige Mustererkennung in sequenziellen Phasendatenbanken. Data-Mining und Prognoseerstellung am Beispiel von Bausparkollektiven. PhD thesis, Universität zu Köln.
|
PDF
Dissertation_Veroeffentlichung.pdf - Submitted Version Bereitstellung unter der CC-Lizenz: Creative Commons Attribution No Derivatives. Download (4MB) | Preview |
Abstract
Die vorliegende Arbeit beschäftigt sich ausgiebig mit der häufigen Musterkennung in Bausparkollektiven und darauf aufbauend mit dem Entwurf und der Verbesserung von Prognoseverfahren zur Vorhersage des Verhaltens von Bausparern. Die häufige Mustererkennung in Sequenzen ist ein klassisches Data-Mining-Gebiet. Ausgehend von einer Datenbank an endlichen, linear geordneten Sequenzen von Produkten oder Ereignissen werden alle häufigen Teilsequenzen dieser Menge gesucht, die eine Mindestanzahl von Supersequenzen in der Menge besitzen. Anhand dieser häufigen Teilsequenzen können grundlegende Charakteristika der Datenbank ermittelt werden. Weiterhin lassen sich Assoziationsregeln der Form: "Kunden die Verhalten X gezeigt haben, zeigen später auch Verhalten Y" formulieren, die mit Wahrscheinlichkeiten versehen werden können. Die Dissertation erweitert das bestehende Standardmodell der Suche nach häufigen Teilsequenzen in Sequenzen um ein Phasenmodell, in dem Sequenzelemente in Phasen eingeteilt werden können. Diese Phasen müssen von allen Sequenzen in einer festen Reihenfolge durchlaufen werden, wenn auch beliebige Phasen übersprungen werden können. Zusätzlich wird das neue Phasenmodell um den Umgang mit multidimensionalen, zeitunabhängigen Attributen und multistufigen Sequenzen erweitert. Hierbei werden Eigenschaften der Modelle durchleuchtet und effiziente Unterteilungsstrategien diskutiert. Es werden insgesamt 5 neue Algorithmen für die Suche nach häufigen Teilsequenzen in sequenziellen Phasendatenbanken und 5 neue Algorithmen für die Suche in komplexeren Modellen vorgestellt. In dieser Arbeit inkludierte Testergebnisse zeigen, dass einige dieser Algorithmen die bisherigen Standardalgorithmen im Falle von Phasendatenbanken um ein Vielfaches in der Geschwindigkeit übertreffen können. Erstmalig werden in dieser Arbeit die theoretischen Ergebnisse auf die Daten von Bausparkollektiven angewandt. Hierzu wird ebenso erstmalig ein vollumfänglicher Kundenansatz statt des bisher üblichen Vertragsansatzes zur Modellierung von Bausparkollektiven genutzt. In dieser Arbeit konnte gezeigt werden, dass das Vorliegen von zusätzlichen Daten auf Kundenebene signifikanten Einfluss auf die Verhaltensweisen und Entscheidungen der Bausparer offenlegt. Die Ergebnisse dieser Arbeit können zukünftig genutzt werden, um ein tieferes Verständnis für die Struktur und Dynamik in Bausparkollektiven zu gewinnen. Aufbauend auf den vorgestellten Ansätzen können neue Formen der Kollektivprognose und der Vorhersage von Individualverhalten konstruiert werden.
Item Type: | Thesis (PhD thesis) | ||||||||
Creators: |
|
||||||||
URN: | urn:nbn:de:hbz:38-99850 | ||||||||
Date: | 11 September 2019 | ||||||||
Language: | German | ||||||||
Faculty: | Faculty of Mathematics and Natural Sciences | ||||||||
Divisions: | Faculty of Mathematics and Natural Sciences > Department of Mathematics and Computer Science > Institute of Computer Science | ||||||||
Subjects: | Data processing Computer science General statistics Economics Mathematics |
||||||||
Uncontrolled Keywords: |
|
||||||||
Date of oral exam: | 15 October 2018 | ||||||||
Referee: |
|
||||||||
Refereed: | Yes | ||||||||
URI: | http://kups.ub.uni-koeln.de/id/eprint/9985 |
Downloads
Downloads per month over past year
Export
Actions (login required)
View Item |