Schwiebert, Stephan (2012). Tesla - ein virtuelles Labor für experimentelle Computer- und Korpuslinguistik. PhD thesis, Universität zu Köln.

[img]
Preview
PDF
DissertationSchwiebert.pdf - Published Version
Available under License Creative Commons Attribution Non-commercial No Derivatives.

Download (6MB)

Abstract

Linguistisch motivierte Komponentensysteme bieten die Möglichkeit, Prozessketten zur maschinellen Annotation natürlichsprachlicher Daten zu definieren und auszuführen. Bisherige Ansätze unterliegen dabei verschiedenen Einschränkungen: So werden i.d.R. datenorientierte Austauschformate verwendet, die eine Abbildung generierter Daten auf proprietäre Metaformate erfordern, wodurch die Flexibilität bei der Implementation neuer Komponenten reduziert wird. Zudem wird der Reproduzierbarkeit von Ergebnissen nur eine niedrige Priorität eingeräumt, was die Nachvollziehbarkeit und Adaption neuer Verfahren erschwert. In dieser Arbeit wird mit Tesla (Text Engineering Software Laboratory) ein alternatives Komponentensystem vorgestellt, das die skizzierten Kritikpunkte ebenso wie weitere Nachteile und Einschränkungen derartiger Systeme vermeidet. Anhand eines Verfahrens zur automatischen Extraktion syntaktischer Strukturen, das auf die distributionelle Analyse nach Harris zurückgeführt werden kann, werden zunächst die Anforderungen, denen ein computerlinguistisches Komponentensystem genügen muss, konkretisiert und diskutiert. Im Anschluss daran werden verschiedene Frameworks hinsichtlich dieser Anforderungen evaluiert, um schließlich Konzept, Design und Implementation von Tesla vorzustellen und dadurch zu verdeutlichen, dass das beschriebene Strukturierungsverfahren in Form verschiedener experimenteller Versuchsaufbauten analysiert, erweitert und auf neue Untersuchungsgegenstände angewendet wird.

Item Type: Thesis (PhD thesis)
Creators:
CreatorsEmailORCID
Schwiebert, Stephanschwiebert@spinfo.uni-koeln.deUNSPECIFIED
URN: urn:nbn:de:hbz:38-45716
Subjects: Language, Linguistics
Uncontrolled Keywords:
KeywordsLanguage
Text Engineering Software Laboratory, Computerlinguistik, Korpuslinguistik, Komponentensysteme, SoftwareentwicklungGerman
Faculty: Faculty of Arts and Humanities
Divisions: Faculty of Arts and Humanities > Sprachliche Informationsverarbeitung
Language: German
Date: 2012
Date of oral exam: 18 January 2012
Referee:
NameAcademic Title
Rolshoven, JürgenProf. Dr.
Thaller, ManfredProf. Dr.
Full Text Status: Public
Date Deposited: 09 Mar 2012 10:22
URI: http://kups.ub.uni-koeln.de/id/eprint/4571

Downloads

Downloads per month over past year

Export

Actions (login required)

View Item View Item