Als Off-the-Shelf-Diktionär wurde SentimentWortschatz(SentiWS, Remus et al., 2010) genutzt. Wir haben bewusst ein Off-the-Shelf-Diktionär ausgewählt und dieses zudem nicht weiter für den Untersuchungskontext angepasst (obwohl dies generell ratsam ist, s. Abschn. 2.2 im Paper), da der Fokus auf der Off-the-Shelf-Anwendung der verschiedenen AIA-Methoden liegen sollte. Das Diktionär enthält insgesamt ca. 1.650 positive und 1.800 negative Wörter. Um das Diktionär anwenden zu können, wurden die N = 197 Dokumente des Goldstandards in einzelne Wörter (sog. Tokens) zerlegt (N = 22.557 Tokens). Im Rahmen der Analyse wurde anschließend jedem Wort auf Basis des SentiWS-Diktionärs ein Wert zugewiesen und daraus für jeden Text eine Gesamttonalität berechnet, wobei Texte als positiv bzw. negativ codiert wurden, wenn ihre durchschnittliche Tonalität mindestens 20% über bzw. unter dem Median lag.
Berechnung der Dezile für die Kategorisierung der Sentiments.
15
Definition der Grenzen für neutrale Sentiments (zwischen 30% und 70% Dezil).
16
Umcodierung der kontinuierlichen Sentimentwerte zu einer dreistufigen Skala (-1, 0, 1).
17
Speicherung der Ergebnisse in einer CSV-Datei.
Ergebnisse
Schauen wir uns eine kleine Auswahl der Ergebnisse an. Wir setzen einen Seed, um die gleiche Auswahl an Texten zu bekommen wie bei den anderen Modellen.
# A tibble: 5 × 4
sentiment sentiment_gs textart text
<dbl> <dbl> <chr> <chr>
1 0 -1 Zeitungsartikel Online startseite panorama österreic…
2 0 1 Facebook-Post ein schöner abend beim eigerclu…
3 1 -1 Tweet mbinswanger natasjasommer judit…
4 1 1 Facebook-Post ich wurde heute vom parteivorst…
5 0 0 Tweet regierungsrat verabschiedet ein…
Literatur
Remus, R., Quasthoff, U., & Heyer, G. (2010). SentiWS - a Publicly Available German-Language Resource for Sentiment Analysis. In N. C. (Conference. Chair), K. Choukri, B. Maegaard, J. Mariani, J. Odijk, S. Piperidis, M. Rosner, & D. Tapias (Hrsg.), Proceedings of the Seventh International Conference on Language Resources and Evaluation (LREC’10). European Language Resources Association (ELRA).