Universität zu Köln

Tesla - ein virtuelles Labor für experimentelle Computer- und Korpuslinguistik

Schwiebert, Stephan (2012) Tesla - ein virtuelles Labor für experimentelle Computer- und Korpuslinguistik. PhD thesis, Universität zu Köln.

[img]
Preview
PDF - Published Version
Available under License Creative Commons Attribution Non-commercial No Derivatives.

Download (6Mb) | Preview

    Abstract

    Linguistisch motivierte Komponentensysteme bieten die Möglichkeit, Prozessketten zur maschinellen Annotation natürlichsprachlicher Daten zu definieren und auszuführen. Bisherige Ansätze unterliegen dabei verschiedenen Einschränkungen: So werden i.d.R. datenorientierte Austauschformate verwendet, die eine Abbildung generierter Daten auf proprietäre Metaformate erfordern, wodurch die Flexibilität bei der Implementation neuer Komponenten reduziert wird. Zudem wird der Reproduzierbarkeit von Ergebnissen nur eine niedrige Priorität eingeräumt, was die Nachvollziehbarkeit und Adaption neuer Verfahren erschwert. In dieser Arbeit wird mit Tesla (Text Engineering Software Laboratory) ein alternatives Komponentensystem vorgestellt, das die skizzierten Kritikpunkte ebenso wie weitere Nachteile und Einschränkungen derartiger Systeme vermeidet. Anhand eines Verfahrens zur automatischen Extraktion syntaktischer Strukturen, das auf die distributionelle Analyse nach Harris zurückgeführt werden kann, werden zunächst die Anforderungen, denen ein computerlinguistisches Komponentensystem genügen muss, konkretisiert und diskutiert. Im Anschluss daran werden verschiedene Frameworks hinsichtlich dieser Anforderungen evaluiert, um schließlich Konzept, Design und Implementation von Tesla vorzustellen und dadurch zu verdeutlichen, dass das beschriebene Strukturierungsverfahren in Form verschiedener experimenteller Versuchsaufbauten analysiert, erweitert und auf neue Untersuchungsgegenstände angewendet wird.

    Item Type: Thesis (PhD thesis)
    Creators:
    CreatorsEmail
    Schwiebert, Stephanschwiebert@spinfo.uni-koeln.de
    URN: urn:nbn:de:hbz:38-45716
    Subjects: Language, Linguistics
    Uncontrolled Keywords:
    KeywordsLanguage
    Text Engineering Software Laboratory, Computerlinguistik, Korpuslinguistik, Komponentensysteme, SoftwareentwicklungGerman
    Faculty: Philosophische Fakultät
    Divisions: Philosophische Fakultät > Sprachliche Informationsverarbeitung
    Language: German
    Date: 2012
    Date Type: Publication
    Date of oral exam: 18 January 2012
    Full Text Status: Public
    Date Deposited: 09 Mar 2012 11:22:47
    Referee
    NameAcademic Title
    Rolshoven, JürgenProf. Dr.
    Thaller, ManfredProf. Dr.
    URI: http://kups.ub.uni-koeln.de/id/eprint/4571

    Actions (login required)

    View Item