Kontakt

SPARTA: KI-gestützte Analyse von Twitter-Echtzeitdaten

SPARTA steht für “Society, Politics and Risk with Twitter Analysis”.

In diesem Projekt arbeitet ein Team aus dem Innovationszentrum der IABG gemeinsam mit Experten der Professur für Politikwissenschaft an der Universität der Bundeswehr München an einer Plattform und verschiedenen Verfahren zur Analyse von Social-Media-Daten. Exemplarisch werden hierzu die Anwendungsfälle „Wahlen“ und „Gewaltsame Ausschreitungen“ (Riots) betrachtet.

Dieses interdisziplinäre Team aus den Bereichen Politikwissenschaften und Informatik hat eine hochmoderne Infrastruktur für das Nowcasting und Ex-Post-Analysen von Twitter-Daten aufgebaut. Hierzu wurden Verfahren für Netzwerk- und statistische Analysen als auch im Bereich der natürlichen Sprachverarbeitung wie beispielsweise zur sogenannten „Stance Detection“ integriert und fortentwickelt.

Die Kooperation im Projekt SPARTA bietet die einmalige Möglichkeit, innovative datengetriebene Ansätze für gesellschaftliche und politikwissenschaftliche Fragestellungen anwendbar zu machen. Es verfolgt das übergeordnete Ziel, diese Ansätze als Teil eines offenen Baukastens auch kleineren Unternehmen und Forschenden ohne informatische Ressourcen mithilfe einer No-/Low-Code-Modellierungsmöglichkeit zugänglich zu machen.

 

Anwendungsfall Wahlen

Bisher wurden im Rahmen des Anwendungsfalls Wahlen die Bundestagswahl 2021 sowie die Landtagswahl in NRW 2022 durch Social-Media-Analysen begleitet. Als Nächstes steht die Landtagswahl in Bayern im Oktober 2023 an.

Das Nowcasting gibt in den Wochen vor den Wahlen Einblick in den digitalen Wahlkampf. Dafür wurden verschiedene Stufen für eine Nowcasting-Pipeline entwickelt, um in Echtzeit beispielsweise benannte Entitäten in einem Tweet zu erkennen (Named Entity Recognition) oder den Tweet in verschiedene Textstücke zu unterteilen (Chunking). Eine wesentliche Verarbeitungsstufe war die Beobachtung der Haltung/Stimmung der Twitter-User gegenüber den Parteien und deren Spitzenkandidierenden (Stance Detection). Zudem wird mit weiteren Stufen das Ausmaß der Aktivität sowie die am häufigsten erwähnten Themen und Hashtags rund um den Wahlkampf statistisch analysiert.

Neben diesen Analyseverfahren wurden Methoden implementiert, um mithilfe eines Sprachmodells Toxizität in Tweets zu klassifizieren (Toxicity Classification) und basierend auf einem Lexikon-Ansatz Hassreden zu erkennen (Hate Speech Detection). Zudem wurden diverse Netzwerkanalysen beruhend auf Retweets, Hashtags sowie auf Grundlage der Bedeutung des Inhalts der Tweets umgesetzt.

Generell verlaufen Wahlkämpfe emotionalisiert und personalisiert. Auf sozialen Medien wird dies noch einmal verstärkt, was sich auch für die Bundestagswahl sowie die NRW-Landtagswahl auf Twitter beobachten ließ. Dies wurde unter anderem an der Vielzahl angreifender Hashtags sowie der eher negativen Haltung gegenüber PolitikerInnen und Parteien sichtbar.

Allgemein hat sich gezeigt, dass einzelne Parteien im digitalen Wahlkampf versierter sind als andere und soziale Plattformen entsprechend zielgerichtet nutzen.

Mehr Details zum Projekt, Auswertungen zur Bundestagswahl 2021 sowie zur Landtagswahl in NRW 2022 finden Sie auf der SPARTA Projektwebsite.

Anwendungsfall Riots

In einem weiteren Anwendungsfall werden gewaltsame Ausschreitungen (Riots) auf Basis historischer Twitter-Daten analysiert. Konkret wurden bislang die „Capitol Hill Riots“ in den USA Anfang Januar 2021 betrachtet.

Dafür wurden zuerst Hashtags ausgewählt, um die relevantesten Diskurse für den Zeitraum vor und nach dem Sturm auf das Kapitol (November 2020 – Januar 2021) zu finden. Aus der Sammlung von Hashtags wurden anschließend Hashtag-Netzwerke erstellt, um ideologische Gemeinschaften zu identifizieren. Des Weiteren fand eine deskriptive Analyse der Netzwerke statt, um beispielsweise den einflussreichsten Nutzer des Netzwerks und die Anzahl der Tweets über die Zeitperiode herauszufinden.

Anhand dieser Gemeinschaften wurden Sprachanalysen durchgeführt, um die spezifischen Themen, die für die jeweiligen Gruppierungen relevant sind, herauszuarbeiten. Zudem wurden die Tweets auf toxische Sprache analysiert. Man konnte erkennen, dass sich in der Woche nach den Ausschreitungen mehr toxische Tweets aus dem Umfeld der rechtsgerichteten Gemeinschaften fanden.

Neben der quantitativen Analyse steht auch die Klassifizierung zwischen Fakten und Meinungen im Fokus. Dies ist wichtig, da es zur Verbesserung der Stimmungsanalyse beitragen kann und zu einer besseren Darstellung von Online-Diskursen führt.