Harry Potters Innenleben
Informatikerin lässt Persönlichkeitsmerkmale fiktiver Charaktere vorhersagen
24.01.2017 von Bettina Bastian
Die Informatikerin Lucie Flekova entwickelt Programme, die die Charaktereigenschaften von fiktiven Figuren wie Harry Potter, Yoda oder Frodo Beutlin analysieren. Die dabei gewonnenen Daten sollen beim automatischen Erstellen von Persönlichkeitsprofilen auch von echten Menschen helfen. Die Einsatzbereiche sind vielfältig.
Schon daran, wie viele Kommas man benutzt oder ob man Smileys mit oder ohne Nase tippt, kann erkennen, wie alt die Person ist, die einen Text verfasst hat. Und beim Alter hören die Informationen, die man beim Schreiben über sich verrät, nicht auf. „Es gibt eine enge Verbindung zwischen Sprache und Persönlichkeit“, sagt die Computerlinguistin Flekova. In ihrer Doktorarbeit „Leveraging Semantic Knowledge for Text Classification Tasks“ am Lucie Flekova am Ubiquitous Knowledge Processing Lab (UKP-Lab) ging es auch um das Thema Personality Profiling. Fachbereich Informatik der TU Darmstadt
Persönlichkeits-Profiling – also das Erstellen eines Charakterprofils etwa anhand von Texten, das ein modellhaftes Gesamtbild einer Person ergibt – ist für viele Anwendungsbereiche interessant. So könnte etwa früh erkannt werden, ob Personen depressiv oder aggressiv sind. Von Erpresserbriefen kann auf Charaktereigenschaften des Täters geschlossen werden. Besonders interessiert ist auch die Wirtschaft an solchen Daten: Je besser ein Unternehmen seine Zielgruppe kennt, desto gezielter kann es sie ansprechen.
Die psychologischen Grundlagen dieser Analyse sind schon lange bekannt. Der nächste Schritt, an dem auch die Informatikerin Flekova arbeitet, ist es, Programme zu entwickeln, die automatisiert von Texten auf die Persönlichkeitsmerkmale der Verfasser schließen. Damit Computer das lernen, brauchen sie viele Fälle, an denen sie üben können, sogenannte Big Data. Doch an solche Daten für das „machine learning“ zu gelangen, ist gar nicht so einfach. Es gibt zwar von Psychologen gesammelte Daten, aber deren Nutzung ist teuer, weil die Erhebung sehr aufwändig ist. Denkbar wäre es auch, Einträge aus den Sozialen Medien zu nutzen. „Dort sind allerdings Menschen mit einem hohen Mitteilungsbedürfnis überrepräsentiert“, erklärt Flekova. Und eine große Schwäche ist all diesen Quellen gemein: Ihrer Nutzung steht der Datenschutz entgegen, da es sich schließlich um sehr persönliche Angaben handelt.
Fiktive Charaktere als Lösung
Für dieses Problem hat Lucie Flekova eine Lösung gefunden: Sie lässt ihr Programm an Figuren aus Romanen und Filmen trainieren. Der große Vorteil: Es handelt sich nicht um sensible Daten. Und: Die erhobenen Daten könnten auch von Literaturwissenschaftlern genutzt werden, um beispielsweise den Stil verschiedener Autoren automatisiert zu erfassen und zu vergleichen.
Doch woher bekommt man Daten über fiktive Charaktere? Schnell stieß Lucie Flekova bei ihrer Recherche auf Internetforen, in denen Fans ihre Lieblinge aus Fantasybüchern, -Filmen und -Serien analysieren. So wurden Harry Potter, Frodo Beutlin, Anakin Skywalker und Co. zu Flekovas Untersuchungsobjekten. „In diesen Datenbanken haben Fans die Eigenschaften von Charakteren bereits in Skalen eingeschätzt. Dieses Material können wir nutzen“, sagt Computerlinguistin Flekova. Daneben erheben die Forscher auch eigene Daten und lassen Leserinnen und Leser anhand eines Persönlichkeitsfragebogens vorhersagen, wie sich zum Beispiel Ron Weasley, Harry Potters bester Freund, in bestimmten Situationen verhalten würde.
Denn damit das Programm lernen kann, wie Sprache mit Persönlichkeitseigenschaften korrespondiert, müssen die Charaktermerkmale bekannt sein. Zunächst sollte der Computer lernen zu analysieren, ob eine Figur introvertiert oder extrovertiert ist. Das Prinzip ist folgendes: Man füttert das System mit verschiedenen Texten, in denen zum Beispiel 200 von Fans als extrovertiert und introvertiert eingestufte Charaktere agieren, sprechen und beschrieben werden. Es analysiert nun, welche Sprachmodalitäten sie gemeinsam haben. In einem nächsten Schritt erhält das System die Informationen über eine Anzahl neuer Charaktere, die es noch nicht kennt, und muss mithilfe der vorher gesammelten Gesetzmäßigkeiten einschätzen, ob es sich um einen extrovertierten Charakter handelt.
Analysebefunde sind sehr oft übertragbar
Die automatischen Text-Untersuchungen haben zum Beispiel ergeben, dass extrovertierte Charaktere in Büchern mehr über andere sprechen als introvertierte, diese sind stiller und nachdenklicher. Diese Schlüsse lassen sich aus der Analyse der Texte ziehen, die die Charaktere beschreiben. Vergleicht man dies mit Ergebnissen von Untersuchungen mit echten Menschen, zeigt sich, dass die Befunde in den meisten Fällen übertragbar sind. Flekova nennt ein Beispiel: „Auch bei psychologischen Studien zeigte sich, dass Extrovertierte mehr interagieren und sich mehr bewegen als introvertierte Figuren.“ Doch es gibt auch Unterschiede: „Was wir zum Beispiel nicht bestätigen konnten, ist, dass Extrovertierte in Büchern generell mehr sprechen als Introvertierte.“
Damit Computerprogramme aus Texten auf Persönlichkeitsmerkmale schließen können, ist eine aufwändige Programmierung vonnöten. Denn was für einen menschlichen Leser leicht zu erfassen ist, ist für die Maschine sehr komplex. Bei den Sätzen „John und Mary standen da. Um die Ecke wurde geschossen. Die beiden sind weggelaufen.“ ist es für einen Computer zum Beispiel extrem schwer, zu erkennen, dass zwischen dem Schießen und dem Wegrennen eine kausale Beziehung besteht, da das Signalwort „deshalb“ fehlt. Gut sind Programme schon jetzt im Vorhersagen des Geschlechts und Alters einer Person – wer viele Kommas benutzt und wessen Smileys Nasen haben, ist zum Beispiel mit hoher Wahrscheinlichkeit älter als Personen, die lieber mal ein Komma und eine Nase weglassen.
Je besser automatisierte Systeme darin werden, Informationen auszuwerten und Rückschlüsse zu ziehen, desto größer wird auch das Thema Ethik. Während man zum Beispiel im Falle eines Einsatzes bei Erpresserbriefen möglichst viel über den Verfasser in Erfahrung bringen möchte, gilt das bei anderen Anwendungsgebieten nicht: Wenn etwa Computerprogramme Bewerbungsunterlagen auswerten, ist es im Sinne der Geschlechtergerechtigkeit von Vorteil, wenn sie nicht analysieren, ob die Person, die sich bewirbt, ein Mann oder eine Frau ist. Dieses Feld erfährt derzeit große Aufmerksamkeit: So entwickelt sich zum Beispiel gerade ein neues Forschungsgebiet, die Anti-Forensik. Dabei sollen die Techniken der Textanalyse dazu verwendet werden, die Texte automatisiert bedeutungserhaltend zu paraphrasieren, so dass man die Persönlichkeit dahinter nicht mehr analysieren kann, wenn dies nicht erwünscht ist.