Diversitäts-Korpus (DisKo)
DisKo

DisKo – Das Diversitäts-Korpus

Hier ging es bisher hauptsächlich um die automatische Erkennung und Analyse von Gender-Stereotypen. Das soll sich nun ändern! Denn wir wollen mit Methoden des maschinellen Lernens einen Classifier trainieren, der nicht nur weibliche, männliche und neutrale Rollen erkennen kann (wie unser bisheriger Classifier), sondern auch weniger binäre Genderzuschreibungen. Damit wir ein Tool lernen lassen können, was nicht-binäre Genderzuschreibungen sind, brauchen wir aber erst einmal Texte, in denen diese vorkommen. und zwar eine ganze Menge von Texten. Darum bauen wir ein Diversitäts-Korpus auf und möchten dich dafür heute um deine Mithilfe bitten!

DisKo – Was genau ist das eigentlich?

DisKo heißt unser neues Projekt zum Aufbau eines Diversitäts-Korpus. Dieses Projekt führen wir in Kooperation mit der Deutschen Nationalbibliothek in Frankfurt durch, die uns im Rahmen ihres DH-Calls Mittel zur Digitalisierung dafür bewilligt haben (mehr dazu in unserem letzten Blogpost). In dieser riesigen Bibliothek liegen buchstäblich hunderttausende zeitgenössische Texte, in denen vermutlich etliche Beispiele für nicht-binäre Genderdarstellungen verborgen sind. Um unseren Classifier zu trainieren, möchten wir eine kritische Menge von rund 100 Romanen ausfindig machen, die sich möglichst gleichmäßig über das letzte Jahrhundert verteilen. Das heißt wir suchen ab ca. 1922 (nach Erscheinungsdatum) pro Jahr einen Roman, in dem nicht nur Männer-, Frauen- und neutrale Rollen vorkommen, sondern auch Beschreibungen nicht-binärer Charaktere. Diese 100 Romane dienen dann als Trainingsmaterial für unser Tool, das daraus lernen kann, was nicht-binäre Genderbeschreibungen sind. Wenn diese dann auch in Texten erkannt werden können, die nicht zum Trainingskorpus gehörten, haben wir unser Ziel erreicht. Denn dann können wir auch andere Texte darauf prüfen, ob vielleicht nicht-binäre Figurenbezeichnungen vorkommen. Und – wer weiß – vielleicht finden wir viel mehr nicht-binäre Figurenbezeichnungen in literarischen Texten als wir bisher ahnen.

Warum brauchen wir deine Hilfe?

Das Prinzip ist ganz einfach: zwei Personen kennen mehr Romane als eine, drei mehr als zwei, vier mehr als drei… du siehst schon, worauf wir hinaus wollen. Wir wollen eine möglichst große Anzahl an Texten finden, in denen nicht-binäre Genderzuschreibungen vorkommen. Aber das ist nicht der einzige Grund; wir wollen durch deine Mithilfe noch mehr erreichen. Wir haben natürlich unseren eigenen Geschmack, wählen Romane auf unsere eigene Art aus und bringen so viele versteckte Vorannahmen in unser Korpus mit ein, die wir uns selbst gar nicht bewusst machen können. Je diverser also die Leute, die an der Gestaltung des Korpus beteiligt sind, desto diverser sind am Ende auch die Texte und die versteckten Vorannahmen gleichen sich zumindest ein wenig aus. Ein Ausgleich, den wir allein nicht schaffen können.

Wie kannst du beim Aufbau des Diversitäts-Korpus mitmachen?

Es ist ganz einfach! Wir haben ein Umfrage-Formular gestaltet, in das du deine Roman-Vorschläge eintragen kannst. Um die oben erwähnten versteckten Vorannahmen ein bisschen im Blick zu behalten und bewusst zu machen, haben wir darin auch ein paar Fragen zu deiner Person mit aufgeführt. Diese persönlichen Fragen musst du nicht beantworten: Sie sind komplett optional. Wir freuen uns natürlich, wenn du bereit bist, diese Fragen – oder auch nur ein oder zwei davon – zu beantworten, weil das unser Vorhaben transparenter macht. Wir kommen aber auch ohne Antworten auf diese Fragen zurecht. Das Wichtige ist, dass du uns deine Titelvorschläge auflistest. Und das kannst du gleich hier machen:

Wie kannst du up-to-date bleiben?

Wenn du dich dafür interessierst, wie das Diversitäts-Korpus anwächst, kannst du gerne von Zeit zu Zeit diese Seite besuchen, auf der wir neue Vorschläge veröffentlichen werden. Du kannst außerdem diesen Blog über einen Newsletter abonnieren:

Wir halten deine Daten privat und teilen sie nur mit Dritten, die diesen Dienst ermöglichen. Lies unsere Datenschutzerklärung. Wenn du dich für ein Abo von m*w entscheidest, informieren wir dich monatlich über neue Beiträge.

Schließlich kannst du uns auf unserem Twitter-Account folgen und uns dort auch einfach direkt anschreiben. Wir freuen uns über Zusammenarbeit jeglicher Art!

Eine Antwort schreiben

Deine E-Mail-Adresse wird nicht veröffentlicht.