Data and Tasks

Data

You find all manually labeled data from the shared task 2018, i.e. both training and test files, in the following GIT-repository:
https://github.com/uds-lsv/GermEval-2018-Data
That repository also includes the annotation guidelines of the shared task.
Data from 2019 is available at:

https://projects.fzai.h-da.de/iggsa/data-2019

Tasks

We have 3 subtasks described below. Participants to this years’ shared task either choose to participate in one, two or all of the subtasks.

Subtask I — Binary classification

The task is to decide whether a tweet includes a) some form of offensive language or b) or not.

  1. OFFENSE:

Juhu, das morgige Wetter passt zum Tag SCHEIßWETTER

@KarlLagerfeld ist in meinen Augen strunzdumm wie ein Knäckebrot.

Für mich ist die #katholische #Kirche nur ein Sammelbecken von #Verbrechern #Kinderschändern und #Kriminellen #Lokalzeit

  1. OTHER:

@Sakoelabo @Padit1337 @SawsanChebli Nicht alle Staatssekretäre kann man ernst nehmen.

Endlich hat Kurz einen Verbündeten aus Frankreich, der auch die |LBR| ungesetzliche Einwanderung von jungen Afrikanern unterbinden will.

Die Türkei führt einen Angriffskrieg und die @spdde inkl. @sigmargabriel rüstet noch ihre Panzer auf.

Subtask II — Fine-grained classification

In addition to detecting abusive language tweets, we distinguish between 3 subcategories:

  1. PROFANITY: usage of profane words, however, the tweet clearly does not want to insult anyone.

Juhu, das morgige Wetter passt zum Tag SCHEIßWETTER

@TiffanyAngelx zu anbeissen ,dein geiler Arsch

Als SPD wäre ich jetzt maximal angepisst.

  1. INSULT: unlike PROFANITY the tweet clearly wants to offend someone.

ein #Tatort mit der Presswurst #Saalfeld geht gar nicht #ARD

@KarlLagerfeld ist in meinen Augen strunzdumm wie ein Knäckebrot.

Wo ist #Kubicki heute? Ist er schon besoffen im Puff?

  1. ABUSE: unlike INSULT, the tweet does not just insult a person but represents the stronger form of abusive language. (For a concise definition, please consult the above annotation guidelines).

was mich stört ist wenn am frühen Morgen im #Morgenmagazin schon strunzdumme #Migranten moderieren

ich würde auch nicht mit einer schwarzen #Schwuchtel zusammenarbeiten #Tatort

Ich persönlich scheisse auf die grüne Kinderfickerpartei

  • OTHER: same as in Subtask I

Subtask III — Classification of explicit and implicit offensive language

In addition to detecting offensive language tweets, we distinguish between 2 subcategories:

  1. EXPLICIT: an offensive tweet which directly expresses hate, condemnation, superiority towards an explicitly or implicitly given target.

SPD verseuchtes Nazipack heisst jetzt ANTIFA

  1. IMPLICIT: an offensive tweet where the expression of hate, condemnation, superiority etc. as directed towards an explicitly or implicitly given target has to be inferred from the ascription of (hypothesized) target properties that are insulting, degrading, offending, humiliating etc.

Dem Kommentar entnehme ich das auch ihre Schaukel als Kind zu nahe an der Wand gestanden hat.

Flüchtlinge fliehen nach Deutschland parallel dazu lassen sie ihre Familien in der Heimat sterben sehr ehrenhaft ....

Subtask III is cast as a two-way classification task where a tweet either is explicit offensive (EXPLICIT) or implicit offensive (IMPLICIT).