Seite teilen

Rassismus in Plenardebatten

Deep Learning zur Erkennung von Rassismus in Plenardebatten - eine Machbarkeitsstudie (RaMoDeep)

Die Studie befasst sich mit der Frage, was die methodischen, technischen und konzeptionellen Voraussetzungen sind, um rassistische Äußerungen und die diskursiven Grundlagen von (institutionellem) Rassismus mit Verfahren der maschinellen Textanalyse zu erfassen. Im Fokus steht die automatisierte Erkennung sprachlicher Muster rassistischer Äußerungsformen in parlamentarischen Diskursen. Das Vorhaben erkundet so den möglichen Beitrag automatisierter textanalytischer Verfahren zur Weiterentwicklung der Rassismusforschung. 

Schlagworte

Politik
Medien
Methoden

Mitarbeitende

Andreas Blätte
Laura Dinnebier
Simon Gelhar

Erste Ergebnisse

Voraussetzung für das einzusetzende Deep-Learning-Verfahren sind Trainingsdaten, die aus einer theoretisch fundierten Annotation von Textpassagen potenziell rassistischer Sätze resultieren. Ein Kategoriensystem, das zentrale Kernmerkmale einer Definition von Rassismus sowie rassistische Topoi in drei Hauptkategorien 1) Rassifizierung, Essenzialisierung und Naturalisierung, 2) Inferiorität sowie 3) Devianz und Bedrohlichkeit subsumiert, stellt ein wesentliches Zwischenergebnis dar. Auf dieser Grundlage wurden 10.000 potenziell rassistische Sätze annotiert. Erste Einschätzungen deuten darauf hin, dass als rassistisch klassifizierte Äußerungen insbesondere von Abgeordneten getroffen werden, die rechtsextremen oder rechtspopulistischen Fraktionen angehören.

Überraschende Einsichten

Die Randverteilung rassistischer Äußerungen widerspricht einer Annahme der zunehmenden Normalisierung rassistischer Diskurse. Im Projekt war jedoch von Beginn an das Bewusstsein leitend, dass die Generierung eines Samples, das „ausreichend“ viele rassistische Sätze enthält, eine Herausforderung darstellt. Für das Training des Klassifikationsalgorithmus zur automatischen Erkennung rassistischer Aussagen wird eine Vielzahl an Trainingsdaten benötigt, die rassistische und nichtrassistische Äußerungen gleichermaßen enthalten. Aus diesem Grund basiert das Sampling auf Word Embeddings und enthält somit weniger rassistische Aussagen, die sich durch eine „subtilere“ Form, vielmehr jedoch durch eine gewisse Explizität auszeichnen.

Weitere Fragen?

Für weitere Informationen zu dem Projekt können Sie uns per E-Mail kontaktieren: info(at)rassismusmonitor.de