Am häufigsten ist Online-Hatespeech in Diskussionsforen zu finden, so eine Studie von Utopia Analytics im Auftrag des finnischen Justizministeriums. Dem Bericht zufolge tauchten 97 % der identifizierten Hassbotschaften in Diskussionsforen auf. Die nächstgrößeren Plattformen sind Twitter mit 2,5 % und Instagram mit 0,2 % der Nachrichten. Auf Blogs, Nachrichtenkommentare und öffentliche Nachrichten auf Facebook entfallen weniger als 0,02 % aller identifizierten Hassreden. In dem Datensatz wurden private Diskussionen wie beispielsweise Gruppen oder Accounts auf Facebook nicht berücksichtigt.

Das im Rahmen des vom Justizministerium aufgelegten Programms Fakten gegen Hass durchgeführte Projekt testete die Fähigkeit künstlicher Intelligenz, Hatespeech im Netz zu erkennen. Der Ansatz verband die Einschätzung von Menschen mit maschinellem Lernen. Im Wesentlichen sollte ermittelt werden, auf welchen Kanälen Hatespeech hauptsächlich zu finden ist und inwiefern sich Hatespeech von Plattform zu Plattform unterscheidet.

Die Definition von Hatespeech basierte auf akademischer Forschung in den Sozialwissenschaften. Dazu wurden Kategorien für Hatespeech erstellt, anhand derer manuell Beispiele für Hatespeech in einem Datensatz von Online-Nachrichten identifiziert wurden. Diese Annotationen wurden dann als Trainingsdaten für den Utopia AI Moderator verwendet, ein sprachunabhängiges Tool, das mit Textanalyse und maschinellem Lernen arbeitet. Der Datensatz bestand aus 12 Millionen finnischen Kommentaren und Posts von September bis Oktober 2020.

Das Resultat war, dass jeden Monat rund 150.000 Nachrichten, die Hassreden enthalten, auf öffentlich zugänglichen finnischen Social-Media-Plattformen erscheinen. Das sind etwa 1,8 % aller Nachrichten.

Von den öffentlichen internationalen Social-Media-Plattformen scheint Twitter mit 7.450 als Hatespeech identifizierten Nachrichten bzw. 0,14 % aller Tweets besonders herauszuragen. Retweets spielen eine bedeutende Rolle bei der Verbreitung dieser Botschaften: 39 % aller Hatespeech-Tweets sind Duplikate.

„Obwohl der Datensatz hauptsächlich aus finnischen Nachrichten bestand“, so Dr. Mari-Sanna Paukkeri, CEO von Utopia, „wären die Ergebnisse in anderen Sprachen sehr ähnlich. Beispielsweise ist Ylilauta, die wichtigste Plattform für finnische Hassreden, das Pendant des allgemein bekannten 4chan. Überdies können wir in nur zwei Wochen ein ähnliches KI-Modell erstellen, um Hatespeech in jeder Sprache zu erkennen. Dazu benötigen wir lediglich eine sachkundige Person, die sagt, wie Hatespeech in der entsprechenden Kultur und Sprache definiert werden sollte, und wir brauchen die zu analysierenden Daten.“

