Schwiebert, Stephan (2012). Tesla - ein virtuelles Labor für experimentelle Computer- und Korpuslinguistik. PhD thesis, Universität zu Köln.
|
PDF
DissertationSchwiebert.pdf - Published Version Bereitstellung unter der CC-Lizenz: Creative Commons Attribution Non-commercial No Derivatives. Download (6MB) |
Abstract
Linguistisch motivierte Komponentensysteme bieten die Möglichkeit, Prozessketten zur maschinellen Annotation natürlichsprachlicher Daten zu definieren und auszuführen. Bisherige Ansätze unterliegen dabei verschiedenen Einschränkungen: So werden i.d.R. datenorientierte Austauschformate verwendet, die eine Abbildung generierter Daten auf proprietäre Metaformate erfordern, wodurch die Flexibilität bei der Implementation neuer Komponenten reduziert wird. Zudem wird der Reproduzierbarkeit von Ergebnissen nur eine niedrige Priorität eingeräumt, was die Nachvollziehbarkeit und Adaption neuer Verfahren erschwert. In dieser Arbeit wird mit Tesla (Text Engineering Software Laboratory) ein alternatives Komponentensystem vorgestellt, das die skizzierten Kritikpunkte ebenso wie weitere Nachteile und Einschränkungen derartiger Systeme vermeidet. Anhand eines Verfahrens zur automatischen Extraktion syntaktischer Strukturen, das auf die distributionelle Analyse nach Harris zurückgeführt werden kann, werden zunächst die Anforderungen, denen ein computerlinguistisches Komponentensystem genügen muss, konkretisiert und diskutiert. Im Anschluss daran werden verschiedene Frameworks hinsichtlich dieser Anforderungen evaluiert, um schließlich Konzept, Design und Implementation von Tesla vorzustellen und dadurch zu verdeutlichen, dass das beschriebene Strukturierungsverfahren in Form verschiedener experimenteller Versuchsaufbauten analysiert, erweitert und auf neue Untersuchungsgegenstände angewendet wird.
Item Type: | Thesis (PhD thesis) | ||||||||
Creators: |
|
||||||||
URN: | urn:nbn:de:hbz:38-45716 | ||||||||
Date: | 2012 | ||||||||
Language: | German | ||||||||
Faculty: | Faculty of Arts and Humanities | ||||||||
Divisions: | Ehemalige Fakultäten, Institute, Seminare > Faculty of Arts and Humanities > Sprachliche Informationsverarbeitung | ||||||||
Subjects: | Language, Linguistics | ||||||||
Uncontrolled Keywords: |
|
||||||||
Date of oral exam: | 18 January 2012 | ||||||||
Referee: |
|
||||||||
Refereed: | Yes | ||||||||
URI: | http://kups.ub.uni-koeln.de/id/eprint/4571 |
Downloads
Downloads per month over past year
Export
Actions (login required)
View Item |