Wie Antworten auf Trump-Tweets und maschinelles Lernen bei der Bekämpfung von Social Media Spam helfen können
Eine aktuelle Studie, die Twitter-Antworten an US-Präsidentschaftskandidaten analysiert, weist auf eine neue Methode hin, mit der sich Posts über die Micro-Blogging-Plattform kategorisieren lassen.
In ihrem Bericht „A New, Novel Method For Clustering Tweets“ dokumentieren Andy Patel, Forscher beim Artificial Intelligence Center of Excellence von F-Secure, und Alexandros Kornilakis, Doktorand am FORTH-ICS Institut der Universität Kreta, die Experimente, mit denen sie die ihrer Meinung nach bislang ausgereifteste Methode für Tweet Clustering entwickelt haben.
Dazu Andy Patel: „Die Prävention des Missbrauchs von Plattformen wie Twitter ist deshalb so komplex, weil sie die Verarbeitung riesiger Mengen von Text erfordert. Immerhin werden jede Sekunde Tausende neuer Posts veröffentlicht.“
Die kontinuierliche Flut an Social-Media-Inhalten bietet böswilligen Akteuren verdeckt die Möglichkeit, Desinformation, Falschmeldungen, Lügen, Betrügereien und Fake News zu verbreiten. Weil die Websites künstlich erzeugte, bösartige oder ausbeuterische Verhaltensweisen nicht effektiv eindämmen können, entsteht ein Marktplatz für Likes, Besuche, Subskriptionen, Rezensionen und sogar gefälschte Konten, die alle mittels einer schnellen Websuche zum Kauf bereitstehen.
Da die Bedeutung von Social Media als Informationsquelle ständig zunimmt, suchen Wissenschaftler nach neuen Wegen, dieses Problem in den Griff zu bekommen. So entwickeln viele von ihnen aktuell Methoden zur Identifizierung und Kategorisierung von Verhaltenstypen in sozialen Medien, um mögliche Fälle von Missbrauch genau bestimmen zu können.
Was ist Clustering?
Beim Clustering wird ein Mechanismus maschinellen Lernens dazu verwendet, Sätze oder Abschnitte – in diesem Fall Twitter-Tweets – je nach Thema oder Inhalt in Containern zusammenzufassen.
Der von Andy Patel und Alexandros Kornilakis entwickelte Clustering-Mechanismus hat unerwartete und überraschende Ergebnisse gezeitigt sowie eine Vielseitigkeit an den Tag gelegt, die alle Methoden in den Schatten stellt, die die beiden zuvor ausprobiert hatten.
Trump im Visier toxischer Twitter-Tweets
Die Wissenschaftler haben ihre Methode anhand von 1 Million Antworten auf Tweets auf Twitter von führenden Präsidentschaftskandidaten der Demokraten sowie auf Konten der Kongressabgeordneten Alexandra Ocasio-Cortez, die eine riesige und sehr aktive Anhängerschaft hat, und des Amtsinhabers Donald Trump bei den US-Präsidentschaftswahlen 2020 getestet.
„Erwähnungen einflussreicher Politiker sind wie eine extreme Version von dem, womit der durchschnittliche Twitter-Nutzer täglich bombardiert wird. Sie erhalten unweigerlich extrem viele Reaktionen, die meist sehr positiv oder sehr negativ sind“, so Andy Patel. „Wir haben die Tweets nach Kennungen wie Subjekt-Verb-Objekt-Gruppen sowie der allgemeinen Einstellung eingeteilt.“
Wie die beiden Wissenschaftler im Anhang ihres Berichts erklären, konnten sie mithilfe der Methodologie einen Durchschnittswert für die allgemeine Einstellung ermitteln. So wurden Posts basierend auf den unterschiedlichen Kennungen als positiv (Übereinstimmung mit dem Verfasser des Ausgangs-Posts), negativ (Uneinigkeit mit dem Verfasser des Ausgangs-Posts) oder toxisch (solche Posts sind schärfer formuliert als die negativen und drücken Gefühle von Feindseligkeit oder gar Hass aus) eingestuft.
Mithilfe des Clusterings konnten die Wissenschaftler die häufigsten negativen Themen in den Antworten auf die Tweets demokratischer Präsidentschaftskandidaten ermitteln, darunter:
- Du bist ein Idiot/Schwachkopf/Lügner/Verräter (oder ähnlich)
- Du wirst niemals Präsident
- Trump wird die nächste Wahl gewinnen
Zu den positiven Themen gehörten:
- Wir lieben dich
- Das schaffst du schon
- Meine Stimme hast du
Dazu Andy Patel weiter: „Die Ergebnisse sind nur so gut wie die zur Analyse verwendete Liste der Einstellungen. Allerdings zeigen sie sich über beide untersuchten Datensätze hinweg konsistent. „Was die Prozentsätze betrifft, hat @AndrewYang die meisten positiven Antworten erhalten und @AOC sowie @SenWarren den größten Anteil an toxischen Antwort-Tweets.“
Keines der Konten der Präsidentschaftskandidaten der Demokraten löste jedoch so viel Toxizität aus wie der amtierende US-Präsident. Hier die Ergebnisse:
Zu den negativsten Themen in den Antworten auf Trumps Tweets gehörten:
- Du bist ein Idiot/Lügner/Schandfleck/Verbrecher/#impotus (Potus ist die Abkürzung des offiziellen Titels des US-Präsidenten; impotus ist ein Wortspiel mit potent/impotent)
- Du bist nicht unser Präsident
- Du hast keine Ahnung / weißt nichts
- Du solltest deine Klappe halten
- Du kannst nicht aufhören zu lügen
- Verweise auf Vladimir Putin
Zu den positiven Themen gehörten:
- Gott schütze Sie, Mr. President
- Wir lieben dich
- Du bist der allerbeste Präsident
Eine clevere Methode zur Bekämpfung von Spam
„Ein überraschendes Ergebnis unserer Experimente war, dass die Methode nachweislich in der Lage ist, Sätze mit ähnlichen Themen, aber unterschiedlichen Formulierungen zu identifizieren und zu gruppieren“, sagt Andy Patel. „So wurden beispielsweise Sätze mit Variationen von ‚Wer im Glashaus sitzt, sollte nicht mit Steinen werfen‘, darunter ‚Das Glashaus bricht, Steine zerstören‘, ‚Stein trifft Glashaus‘ sowie ‚Die Sache mit den Steinen und dem Glashaus‘, alle im gleichen Cluster eingeordnet. Wir haben bei unseren Experimenten verschiedene ähnliche Beispiele für diese Verhaltensweise gefunden.“
Die Methode ermöglicht außerdem eine effektive Erkennung von dem, was die meisten Menschen als Spam bezeichnen würden.
„Die Experimente haben darüber hinaus gezeigt, dass sich die von uns entwickelte Methodologie bei der Identifizierung fast identischer Twitter-Tweets, die meist mit Antwort-Spam, Kontoautomatisierung und koordinierten Desinformationskampagnen assoziiert werden, als höchst effizient erwiesen hat.“
Was können wir von diesen Clustern lernen?
Die Studie wurde im Rahmen der „EU Horizon 2020“-Projekte PROTASIS und SHERPA sowie dem F-Secure-Projekt Blackfin durchgeführt. Das Interesse von F-Secure am Experimentieren mit hochmodernen NLP-Techniken (Natural Language Processing) erstreckt sich auf verschiedene Domänen, darunter Spam-Erkennung, Klassifizierung von Online-Inhalten und automatisierte Analyse komplexer Befehlszeilen bei sogenannten Adversarial Attacks (optische Täuschungen).
Andy Patel hofft allerdings, dass diese Methode auch dabei helfen kann, den Missbrauch von Social Media zu bekämpfen, etwa Tweets aus koordinierten Desinformationskampagnen, Spammer, die Antwort-Tweets von Konten mit einer großen Zahl an Abonnenten ausbeuten, sowie Bots oder andere Automatisierungstypen.
„So konnten wir mit unserer Methodologie automatische Tweets identifizieren und gruppieren, mit denen die Falschmeldung verbreitet wurde, dass die Buschfeuer in Australien auf Brandstiftung zurückzuführen seien.“
Die Möglichkeit, Fehlinformationen in Notsituationen zu identifizieren und zu bekämpfen, kann positive Auswirkungen auf die Arbeit von Such- und Rettungsdiensten haben oder zumindest deren Beeinträchtigung durch solche Falschmeldungen vermeiden helfen.
„Es sind in jedem Fall weitere Forschungsarbeiten nötig, aber mit zusätzlichen Entwicklungen ist eine ganze Reihe potenzieller Anwendungen denkbar. Diese Methodologie könnte für die automatische Filterung oder Entfernung von Spam, Desinformation sowie anderer toxischer Inhalte eingesetzt werden. Dies lässt sich mit Qualität-Scores für Konten erzielen, die auf der Häufigkeit von Posts mit toxischen Inhalten oder Attacken gegen andere Nutzer basieren.“
Andy Patel meint sogar, dass dieser Mechanismus die Art, wie Menschen Tweets nutzen, verändern könnte.
„Dadurch, dass wir Twitter-Tweets umgehend identifizieren und klassifizieren können, wird es möglich, sie in ähnlicher Weise zu bereinigen, wie dies schon seit Langem mit E-Mail-Posteingängen und einer effizienten Spam-Filterung geschieht.“
Basierend auf ihrer Studie haben Alexandros Kornilakis und Andy Patel eine interaktive Website entwickelt, die jedermann zum Ausprobieren frei zugänglich ist. Zudem haben sie ihre Forschungsergebnisse, inklusive des Codes, auf Github veröffentlicht.
Kategorien