Schwiebert, Stephan (2012). Tesla - ein virtuelles Labor für experimentelle Computer- und Korpuslinguistik. PhD thesis, Universität zu Köln.

[img]
Preview
PDF
DissertationSchwiebert.pdf - Published Version
Bereitstellung unter der CC-Lizenz: Creative Commons Attribution Non-commercial No Derivatives.

Download (6MB)

Abstract

Linguistisch motivierte Komponentensysteme bieten die Möglichkeit, Prozessketten zur maschinellen Annotation natürlichsprachlicher Daten zu definieren und auszuführen. Bisherige Ansätze unterliegen dabei verschiedenen Einschränkungen: So werden i.d.R. datenorientierte Austauschformate verwendet, die eine Abbildung generierter Daten auf proprietäre Metaformate erfordern, wodurch die Flexibilität bei der Implementation neuer Komponenten reduziert wird. Zudem wird der Reproduzierbarkeit von Ergebnissen nur eine niedrige Priorität eingeräumt, was die Nachvollziehbarkeit und Adaption neuer Verfahren erschwert. In dieser Arbeit wird mit Tesla (Text Engineering Software Laboratory) ein alternatives Komponentensystem vorgestellt, das die skizzierten Kritikpunkte ebenso wie weitere Nachteile und Einschränkungen derartiger Systeme vermeidet. Anhand eines Verfahrens zur automatischen Extraktion syntaktischer Strukturen, das auf die distributionelle Analyse nach Harris zurückgeführt werden kann, werden zunächst die Anforderungen, denen ein computerlinguistisches Komponentensystem genügen muss, konkretisiert und diskutiert. Im Anschluss daran werden verschiedene Frameworks hinsichtlich dieser Anforderungen evaluiert, um schließlich Konzept, Design und Implementation von Tesla vorzustellen und dadurch zu verdeutlichen, dass das beschriebene Strukturierungsverfahren in Form verschiedener experimenteller Versuchsaufbauten analysiert, erweitert und auf neue Untersuchungsgegenstände angewendet wird.

Item Type: Thesis (PhD thesis)
Creators:
CreatorsEmailORCIDORCID Put Code
Schwiebert, Stephanschwiebert@spinfo.uni-koeln.deUNSPECIFIEDUNSPECIFIED
URN: urn:nbn:de:hbz:38-45716
Date: 2012
Language: German
Faculty: Faculty of Arts and Humanities
Divisions: Ehemalige Fakultäten, Institute, Seminare > Faculty of Arts and Humanities > Sprachliche Informationsverarbeitung
Subjects: Language, Linguistics
Uncontrolled Keywords:
KeywordsLanguage
Text Engineering Software Laboratory, Computerlinguistik, Korpuslinguistik, Komponentensysteme, SoftwareentwicklungGerman
Date of oral exam: 18 January 2012
Referee:
NameAcademic Title
Rolshoven, JürgenProf. Dr.
Thaller, ManfredProf. Dr.
Refereed: Yes
URI: http://kups.ub.uni-koeln.de/id/eprint/4571

Downloads

Downloads per month over past year

Export

Actions (login required)

View Item View Item