Nester, Judith ORCID: 0000-0001-9249-2644 (2021). Rassistische Sprache mit BERT erkennen - Eine Untersuchung am Beispiel deutscher Plenarprotokolle. Masters thesis, Universität zu Köln.
|
PDF
NesterJudith_Masterarbeit_Rassismus_mit_BERT_erkennen_shorthead_github.pdf - Updated Version Download (1MB) | Preview |
Abstract
Immer wieder kommt es vor, dass in Plenardebatten des Deutschen Bundestages rassistische Sprache verwendet wird. Gerade vor dem Hintergrund der Black-Lives-Matter-Demonstrationen, des rechtsextremistischen Terroranschlags von Hanau und der islamistischen Terroranschläge in Frankreich und Deutschland im turbulenten Jahr 2020 zeigt sich daher verstärkt die Notwendigkeit einer Auseinandersetzung mit rassistischer politischer Sprache. Plenarsitzungen sind meist sehr lang und unübersichtlich. Kaum jemand verfolgt alle Debatten und Reden. Diese zu überblicken und rassistische Sprache zeitnah zu identifizieren und zu kritisieren, erscheint in Anbetracht der großen Menge an Textdaten in Plenarprotokollen geradezu unmöglich. Es benötigt dementsprechend ein Tool, das den Text in Plenarprotokollen verarbeitet, versteht und automatisch rassistische Sprache erkennt. Eine Möglichkeit für ein solches Tool birgt das Transformer-basierte BERT. Es stellt derzeit den State-of-the-Art im NLP dar. In dieser Arbeit soll evaluiert werden, ob und wie BERT für eine erfolgreiche binäre Textklassifikation zur Identifikation von rassistischer Sprache in Plenarprotokollen eingesetzt werden kann. Dazu erfolgt zunächst eine Auseinandersetzung mit Rassismus und rassistischer politischer Sprache, um jeweils Arbeitsdefinitionen entwickeln zu können. Nach einer Vertiefung in die theoretischen Grundlagen neuronaler Netze über verschiedene Netzarchitekturen wie RNN, LSTM und Transformer hinweg; wird näher auf die Funktionsweisen von BERT eingegangen. Im praktischen Teil der Arbeit werden schließlich auf Basis der festgelegten Arbeitsdefinitionen von Rassismus und rassistischer Sprache zwei möglichst differenzierte Textkorpora erstellt. Mit diesen Korpora werden fünf Experimente durchgeführt, die Aufschluss über die Forschungsfragen geben sollen. Die Resultate zeigen, dass durchaus Potential für ein BERT-Model besteht, das rassistische Sprache in deutschen Plenarprotokollen identifiziert. Dennoch gibt es noch viele Möglichkeiten das Model zu verbessern. Diese sollten vor einem tatsächlichen Einsatz in der Politik auch genutzt werden.
Item Type: | Thesis (Masters thesis) | ||||||||
Translated title: |
|
||||||||
Translated abstract: |
|
||||||||
Creators: |
|
||||||||
URN: | urn:nbn:de:hbz:38-543011 | ||||||||
Date: | 2021 | ||||||||
Place of Publication: | Köln | ||||||||
Language: | German | ||||||||
Faculty: | Faculty of Arts and Humanities | ||||||||
Divisions: | Faculty of Arts and Humanities > Fächergruppe 1: Kunstgeschichte, Musikwissenschaft, Medienkultur und Theater, Linguistik, IDH > Institut für Digital Humanities (IDH) | ||||||||
Subjects: | Generalities, Science Data processing Computer science Language, Linguistics |
||||||||
Uncontrolled Keywords: |
|
||||||||
Date of oral exam: | 2021 | ||||||||
Referee: |
|
||||||||
Refereed: | Yes | ||||||||
URI: | http://kups.ub.uni-koeln.de/id/eprint/54301 |
Downloads
Downloads per month over past year
Export
Actions (login required)
View Item |