Emotionsinformationen anlaysieren mit Hilfe von digitaler Annotation - die derzeit gründlichste digitale Methodik zur Sentiment Analysis von Erzähltexten. #Literaturwissenschaft #Bildung #DigitalHumanities
Emotionsanalyse

Emotionsinformationen analysieren: 2. Warum digital und warum CATMA?

An einigen Stellen des ersten Blogbeitrags war von sog. Tagsets und Annotationen die Rede. Beide Begrifflichkeiten spielen für unser Analyseverfahren eine tragende Rolle. Die Analyse des Deutschen Novellenschatzes führen wir mithilfe des Textanalysetools CATMA (Computer Assisted Text Markup and Analysis) durch. Das Tool unterstützt die digitale manuelle Annotation und Analyse von Texten. Bei der Annotation der Texte ist die Arbeit mit sog. Tagsets essentiell. Tagsets sind eine Sammlung deskriptiver Bezeichnungen, anhand derer die Annotation der entsprechenden Phänomene im Text durchgeführt wird. Ein Tagset beinhaltet mehrere Tags, die wiederum Subtags enthalten können. Ähnlich der linguistischen Unterscheidung zwischen Type und Token stellen Tags deskriptive Kategorien dar. Annotationen sind die einzelnen von uns vorgenommenen Markierungen dieser Kategorien im Text. Jedem Tag lassen sich sog. Properties (Merkmale) und Values (Werte) zuordnen. Diese Analyseeinheiten ermöglichen eine detailliertere Beschreibung der Tags.​*​ Eine digitale Variante aller Novellen wird durch das Deutsche Textarchiv zur Verfügung gestellt. Im Rahmen unseres Projekts laden wir unser Teilkorpus in Form von TXT-Dateien in die digitale Textanalyselandschaft bei CATMA hoch und annotieren es auf Grundlage unterschiedlicher Emotions-Tagsets. Im Anschluss nutzen wir das „Analyze“-Modul, um die Annotationen statistisch auszuwerten und die Ergebnisse zu visualisieren. Wir gehen davon aus, dass unser Korpus eine große Bandbreite an Emotionsinformationen beinhaltet. Das liegt zum einen an der Textgattung: Die Spezifik literarischer Texte, die sie z. B. von pragmatischen Texten abhebt, bewirkt u. a., dass während der Lektüre seitens der Leser*innen Emotionen ausgelöst werden. Wenn durch die Lektüre Emotionen ausgelöst werden, müssen diese auf irgendeine Art und Weise im Text hinterlegt sein. Darüber hinaus ist aufgrund der Korpusgröße davon auszugehen, dass wir mannigfaltige Emotionsinformationen finden werden. Schließlich handelt es sich nicht um die Analyse eines einzelnen Textes, sondern um eine vergleichende Analyse mehrerer Novellen. Das Tool soll uns dabei unterstützen, bei der Analyse den Überblick zu bewahren und schlussendlich valide Aussagen über genderspezifische Emotionsvorkommen in unserem Korpus machen zu können. Außerdem nutzen wir die digitale Arbeitsumgebung in strukturbildender und orientierungsstiftender Funktion: Die Arbeit mit Tagsets unterstützt eine konsistente und präzise Arbeitsweise, indem jede Annotation eine Rückbesinnung auf die zugrundeliegende Taxonomie einfordert und ins Gedächtnis ruft. Sämtliche Arbeitsschritte sind transparent, sodass wir uns gegenseitig auf fehlerhafte oder fragwürdige Annotationen aufmerksam machen können und bei nicht deckungsgleichen Annotationen in die Diskussion gehen können. Gleichzeitig nutzen wir die Möglichkeit, Annotationsdaten mit CATMA statistisch auszuwerten und die Ergebnisse zu visualisieren. Die Option, die Verteilung bestimmter Textphänomene (Annotationen) über das gesamte Korpus darzustellen, bereichert in unserer Vorstellung dessen inhaltliche Erschließung und steht stellvertretend für den Verlauf eines explorativen Forschungsprojekts, welches uns gelehrt hat, dass sich oft erst durch den drohnenhaften Blick von oben auf eine krude Textmenge – oder eben einen Ausschnitt davon – eine Systematik ergibt, aus der sich schlussendlich weiterführende Erkenntnisse ableiten lassen. Leitend ist neben der Rekonstruktion von genderspezifischen Emotionen auch die Frage danach, mit welchem systematischen Vorgehen in Texten manifestierte Emotionsinformationen wieder aus dem Text herausgefiltert werden können und worin die Chancen und Herausforderungen einer digitalen Literaturwissenschaft liegen.

Die Grundlage der Textanalyse: Tagsets, Properties und Values

Auf Grundlage diverser strukturorientierter Ansätze haben wir unser erstes Tagset entworfen. Im Rahmen der Textanalyse wird der in der Textwelt referierte Emotionsprozess einer Emotionskategorien zugeordnet. Um an späterer Stelle zurückverfolgen zu können, ob eine Emotion im Zusammenhang mit einer weiblichen, einer männlichen oder einer diversen Figur auftaucht, erhält jeder Tag die Property „Gender” mit den drei Values männlich, weiblich oder divers (s. Abb. 1).

Abb. 1: Ausschnitt des Tagsets „Emotionen_ART“

Die aus der Fachliteratur als Problemfälle herausgearbeiteten Emotionen Mut, Eifersucht, Masochismus, Hassliebe, Aggression, Interesse, Erstaunen, Sadismus, Bedauern und Scham wurden als eigene Tags in das Tagset „PROBLEMFÄLLE“ einbezogen. Um einen möglichst undogmatischen Annotationsprozess zu ermöglichen, werden in dem Tagset „UNGEWISS“ außerdem diejenigen Emotionen gesammelt, die sich im Verlauf des Annotationsprozesses nicht eindeutig einer der Kategorien zuordnen lassen. Im Rahmen einer abschließenden Analyse lassen sich diese Annotationen entweder doch noch einer Kategorie zuordnen oder können als korpus- und genrespezifische Emotionsarten vertiefend untersucht werden. Um der Registrierung der zahlreichen unterschiedlichen Ausdrucksvarianten gerecht zu werden und diese detailliert beschreiben zu können, haben wir zwei weitere Tagsets entworfen.

Parameter: Wertigkeit, Intensität, Dauer

Emotionen lassen sich anhand der drei Parameter Intensität, Dauer und Wertigkeit / Qualität genauer beschreiben. Die drei Kenngrößen nehmen wir im Rahmen unserer Analyse genauer unter die Lupe. Für jeden Parameter haben wir ein Tagst entworfen (s. Abb. 2 und 3).

Wertigkeit

Wie bereits erläutert, stellt eine Gemeinsamkeit aller Kategorisierungsversuche von Emotionen die inhärente Merkmalsdichotomie positiv / negativ dar. Im Kern lassen sich zwei Typen von Emotionen unterscheiden: Emotionen, die sich als für den Menschen und sein Wohlbefinden sowie seine psychische Stabilität als angenehm erweisen, und Emotionen, die sich für den Menschen und sein Wohlbefinden sowie seine psychische Stabilität als unangenehm erweisen. Die Variablen Qualität / Wertigkeit beschreibt also die Eigenschaft einer Emotion, die dazu führt, dass Emotionen polar auf einer Positiv-Negativ Skala lokalisiert werden können. In unserem Fall nutzen wir die Wertigkeit von Emotionen (also die für das Individuum konstatierbare Unterscheidung zwischen angenehmen und unangenehmen Erlebniszuständen), um das evaluative Moment von Emotionen greifbar zu machen und hinsichtlich einer genderstereotypen Zugehörigkeit zu befragen. Im Kern steht z. B. die Frage danach, ob männliche, weibliche oder diverse Figuren ihre Einstellungen häufiger durch negative oder positive Emotionen vermitteln und ob ein positives oder ein negatives (emotionales) Wertsystem dominiert. Daran schließen rezeptionsästhetische Überlegungen an, die reflektieren, welche Bedeutung die Zuschreibung von geschlechtertypischen Emotionen für die Wahrnehmung der Geschlechter hat. 

Intensität

Der Aktiviertheitsgrad der Emotion – also deren Intensität – kann zwischen heftig-gemäßigt und erregt-beruhigt variieren. Die Annotation dieser Eigenschaft dient der näheren Beschreibung der kodierten Emotionen und genderspezifischen Formen von Emotivität im Deutschen Novellenschatz. Im Hintergrund steht die Frage danach, ob und auf welche Art und Weise bei der Darstellung von Gefühlsbetonung und Affekt hinsichtlich des Geschlechts ein Unterschied gemacht wird.

Dauer

Einen weiteren Beschreibungsparamter stellt die Dauer eines emotionalen Zustands dar. Der Verlauf emotionaler Prozesse ist variabel. Die Konstanz mit der bspw. Wut oder Trauer zutage treten, zeichnet eine Emotion entweder als permanent oder nicht-permanent im menschlichen Organismus verankert aus. Hieraus lässt sich ableiten, ob es sich um einen vorübergehenden Zustand (Zustandsemotion oder subjektive Ich-Bewertung: Ein Individuum wird sich eines bestimmten emotionalen Zustands bewusst und nimmt diesen als spezifisches Gefühl introspektiv wahr) oder ein Wesensmerkmal (Eigenschaftsemotion, tendenzielle Persönlichkeitsmerkmale: In der Persönlichkeit des Menschen verankerte emotionale Repräsentationen) handelt. Wir beziehen den Faktor Zeitlichkeit in die Analyse ein, um daraus genderspezifische Persönlichkeitsmerkmale der im Deutschen Novellenschatz enthaltenen Figuren abzuleiten.

Parameter: Repräsentationsformen

Die zuvor vorgestellten Tagsets zielen auf die Auslese der im Korpus enthaltenen Emotionstypen ab. Darüber hinaus haben wir drei Tagsets entworfen, die der näheren Beschreibung der im Deutschen Novellenschatz gefundenen Emotionen dienen. Für jede in der Textwelt als solche erkannte Emotion wird ermittelt, auf welche Art und Weise diese zutage tritt. Das Design unserer Tagsets beruht auf drei möglichen Repräsentationsformen von Emotionen, die in struktur- wie funktionsorientierten Klassifikationsansätzen eine wichtige Rolle spielen (s. Abb. 1 in dem Beitrag zum Forschungsüberblick).

Repräsentation durch körperliche Zustände

Bereits Charles Darwin stellte fest, dass Emotionen unterschiedliche Emotionsausdrücke verursachen und emotionale Reaktionssysteme (übrigens bei Menschen und bei Tieren ähnliche) unterschiedliche körperliche Veränderungen hervorrufen. Emotionen werden folglich in unterschiedlicher Art und Weise präsentiert. Zum einen können sie als reaktive, visuell wahrnehmbare körperliche Zustände offenkundig werden. Hierzu zählen die Reaktion der Augen (z. B. eine bei Aufregung in Angst oder Freude hervorgerufene Vergrößerung der Pupillen oder Zittern bei Furcht), auditive Veränderungen (z. B. das Heben und Senken der Stimme), die Reaktion der Haut (z. B. das Rot- und Blasswerden bei Scham oder Angst) oder das Ansteigen der Herzfrequenz.

Nonverbale Repräsentation von Emotionen

Zum anderen können Emotionen können nonverbal über die Mimik (Lachen, Weinen), die Gestik (Bewegungen der Extremitäten) oder die Pantomimik (Bewegung des ganzen Körpers) vermittelt werden. 

Verbale Repräsentation von Emotionen

Darüber hinaus können Emotionen auf vielfältige Art und Weise verbal vermittelt werden. Auf der Satzebene werden hierfür z. B. Exklamitvsätze, Vergleiche, (kreative und innovative) Metaphern, Steigerungen und Hyperbeln, Anaphern, Wiederholungen, Vergleiche, volitionale Einstellungen, evaluative Einstellungen oder Überspezifikationen verwendet. Auf der Lexemebene spricht die Verwendung von Interjektionen, die Verwendung von Lexemen mit pejorativer oder besonders positiver Konnotation, der Einsatz von Schimpfwörtern oder eine emotionsbezeichnende Semantik und die Nennung eines stark konnotierten Sachverhalts (wie z. B. Massenmord) für das Vorkommen von Emotionen im Text.

Abb. 2: Tagset Repräsentationsformen
Abb. 3: Verbale Repräsentationsformen

Zwischenfazit

Die Analyse der Texte wurde auf Basis unterschiedlicher Tagsets durchgeführt. Wir operieren vorrangig auf der Textproduktebene. Hierbei wird auf Basis einer strukturorientierten Emotionsdefinition (Leitfrage: Welche Emotion kommt zum Ausdruck?) die genderspezifische, personale Orientierung von Emotionen untersucht (Leitfrage: Wer empfindet eine Emotion). Die nähere Klassifizierung der im Deutschen Novellenschatz kodierten Emotionen wird anhand der drei Paramater Wertigkeit, Intensität und Dauer bestimmt (Leitfragen: Handelt es sich um eine positive oder negative Form der Emotion? Kommt die Emotion eher heftig-erregt oder gemäßigt-beruhigt zum Ausdruck? Handelt es sich bei der Emotion um eine Eigenschaftsemotion oder um eine Zustandsemotion?). Das dritte Tagset beinhaltet unterschiedliche Manifestationsformen von Emotionen. Hierbei werden die zuvor identifizierten Emotionen näher klassifiziert, indem zwischen nonverbal und körperlich vermittelten Emotionen unterschieden wird. Außerdem wird textinterne Emotivität – also verbal vermittelte Emotionen – auf Satz- und auf Lexemebene genauer beschrieben. Die verbalen Repräsentationsformen von Emotionen sind äußerst vielfältig. Deshalb ist v. a. für die hierfür erstellten Tagsets deren unabgeschlossener, offener Status hervorzuheben. Im Optimalfall entsteht am Ende der Untersuchung eine (gattungs- und epochenspezifische) Sammlung typischer emotiver sprachlicher Mittel, die hinsichtlich einer genderspezifischen Form der Bewertung durch Emotionen befragt werden kann. 

Die Tagsets (s. Abb. 4) enthalten eine Vielzahl – sicherlich bei weitem nicht alle – der erfassbaren textinternen Elemente, die Emotionen abbilden und werden systematisch auf das gesamte Korpus angewendet. Im dritten Blogbeitrag stellen wir die ersten Analyseergebnisse der ersten Novellen vor.

Abb. 4: Die drei Tagsets mit Tags, Subtags und Properties

  1. ​*​
    Weitere Informationen über die Funktionalitäten von CATMA findest du unter https://fortext.net/tools/tools/catma und https://catma.de
Diesen Artikel zitieren: Marie Flüh: "Emotionsinformationen analysieren: 2. Warum digital und warum CATMA?". In: m*w, Januar 5, 2020, https://msternchenw.de/emotionsinformationen-analysieren-2-warum-digital-und-warum-catma/, [zuletzt geprüft: Juli 4, 2020].

Referenzen

Mareike Schumacher (2019): „CATMA“. In: forTEXT. Literatur digital erforschen. URL: https://fortext.net/tools/tools/catma  [Zugriff: 03. Januar 2020].

Jan Christoph Meister, Jan Horstmann, Marco Petris, Janina Jacke, Christian Bruck, Mareike Schumacher & Marie Flüh (2019): CATMA 6.0.0 (Version 6.0.0). Zenodo. DOI: 10.5281/zenodo.3523228

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.