Seite teilen

Rassismus in Plenardebatten

Deep Learning zur Erkennung von Rassismus in Plenardebatten - eine Machbarkeitsstudie

Die Studie befasst sich mit der Frage, was die methodischen, technischen und konzeptionellen Voraussetzungen sind, um rassistische Äußerungen und die diskursiven Grundlagen von Rassismus mit Textanalyse-Verfahren zu erfassen. Im Fokus steht die automatisierte Erkennung rassistischer Äußerungen in Plenardebatten. Die Studie erkundet so, ob automatisierte textanalytische Verfahren zur Weiterentwicklung der Rassismusforschung beitragen können.

Schlagworte

Politik
Medien
Methoden

Autor*innen

Andreas Blätte
Laura Dinnebier
Simon Gelhar
Emilia Blank
Silvia Mommertz

 

 

Ergebnisse

Ein wesentliches konzeptionelles Zwischenergebnis des Projekts ist ein Kategoriensystem. Es subsummiert Kernmerkmale einer Rassismus-Definition sowie rassistische Topoi aus der Literatur in drei Hauptkategorien, auf deren Grundlage wir potenziell rassistische Sätze erfasst haben: 1) Rassifizierung/Essenzialisierung/Naturalisierung; 2) Inferiorität; 3) Devianz und Bedrohlichkeit. Auf der Grundlage dieses Kategoriensystems generierten wir einen Trainingsdatensatz mit über 20.000 annotierten Textstellen, der insgesamt über 1.500 als rassistisch klassifizierte Textstellen umfasst.

Erste Einschätzungen der manuellen Kodierungen deuten darauf hin, dass insbesondere Abgeordnete, die rechtsextremen oder sogenannten rechtspopulistischen Fraktionen angehören, sich rassistisch äußern. Weiterhin lässt sich ein stetiger Anstieg rassistischer Äußerungen in den deutschen Landesparlamenten insbesondere nach 2015 beobachten.

Überraschende Einsichten

Unser Ergebnis, dass sich vor allem rechtsextreme und rechtspopulistische Parlamentarier*innen rassistisch äußern, widerspricht der Annahme, rassistische Diskurse würden sich zunehmend normalisieren. Allerdings benötigten wir, um den Klassifikationsalgorithmus zu trainieren, der rassistische Aussagen automatisch erkennen soll, eine Vielzahl an Trainingsdaten, die rassistische und nicht-rassistische Äußerungen gleichermaßen enthalten. Aus diesem Grund basiert das Sampling auf word embeddings. Deshalb enthält es schwerpunktmäßig explizitere rassistische Aussagen und kaum subtilere Formen.

Bedeutung für die Praxis

Das Projekt liefert die technische und methodische Expertise zur (Re-)Evaluierung von Rassismus über lange Zeiträume hinweg. Zudem stellen wir unsere Forschungsdaten (Programmcodes, manuelle Annotationen) über die im PolMine-Projekt erprobten Netzwerke und Disseminationskanäle (Open Science-Repositorium Zenodo, GitHub) anderen Forschenden zur Verfügung – im Rahmen bestehender lizenzrechtlicher Vereinbarungen. So haben wir den Workflow zur Ausgabe der Annotationsdaten in einem geeigneten Format als R-Paket (annotask) aufbereitet und machen ihn für andere Forschende zeitnah auf dem PolMine-GitHub zugänglich. Ebenfalls bereitgestellt wird der annotierte Trainingsdatensatz.