graphomate zwitschert sich einen in Design Studio :)

Mit der Entstehung und dem Wachstum sozialer Netzwerke entscheiden sich Unternehmen zunehmend diese Medien als Werbeplattform zu nutzen. Die Inhalte sozialer Netzwerke werden allerdings nicht nur von Nutzern konsumiert, sondern auch von ihnen erstellt. Sie teilen ihr Leben mit anderen Nutzern und bewerten implizit sowie explizit Produkte und Dienstleistungen. Durch eine Analyse dieser Social-Media-Inhalte kann die öffentliche Meinung zu bestimmten Produkten oder Themen erschlossen werden.

Daher habe ich es mir zusammen mit dem Team von graphomate zur Aufgabe gemacht im Rahmen meiner Bachelor-Thesis das Thema „Meinungsanalyse von Social-Media-Inhalten“ zu bearbeiten. Mein Ziel war es prototypisch ein Meinungsanalyseverfahren von Twitter-Inhalten zu implementieren. Die Besonderheit: Realisiert wurde es in Form einer Datenquellenerweiterung für Design Studio.

Twitter-Inhalte sind häufig wertend und können über eine komfortable API abgerufen werden. Daher sind sie für viele Meinungsanalysen hervorragend geeignet. Das umgesetzte Verfahren untersucht die Bestandteile des Tweet-Textes mit Hilfe eines Lexikons. Darin sind englische Wörter und ihre Scores enthalten, die auf einer Skala von -5 bis +5 aussagen, ob ein Wort negativ oder positiv konnotiert ist. Der Gesamt-Score kann im einfachsten Fall als Summe der einzelnen Scores ermittelt werden: excited (+3) + fresh (+1) + interesting (+2) = +6.

zwitscher_screentwitter

Datenquellenerweiterungen sind Extensions, die in Design Studio eine Datenquelle abbilden und eine Anbindung an externe Ressourcen ermöglichen. Die Extension analysiert dazu Tweets auf die in ihnen enthaltene Meinung zu bestimmten Entitäten. Diese Entitäten können beispielsweise Produktnamen sein und werden aus einem Eingangsdatensatz extrahiert. Der Eingangsdatensatz kann von einer beliebigen anderen Datenquelle in Design Studio selektiert werden.

Zu jedem Produktnamen wird also eine Suche auf Twitter gestartet und die Konnotation der zurückerhaltenen Tweets analysiert. Mit den erschlossenen Scores reichert die Extension den Eingangsdatensatz an. Die angereicherten Daten stellt sie wiederum anderen Komponenten in Design Studio zur Verfügung.

zwitscher_ablauf

Der angereicherte Datensatz einer exemplarischen Datenquelle mit Filminformationen sieht folgendermaßen aus, wobei ein positiver Score auch eine positive Meinung abbildet:

zwitscher_anreicherung

Durch die Anreicherung werden bereits bekannte Daten in Zusammenhang mit Informationen über die öffentliche Meinung gebracht. So können Korrelationen erkannt und Ausreißer identifiziert werden. Dazu eignet sich unsere neueste Komponente, die graphomate bubbles. Mit ihr können bis zu 5 Datendimensionen in einem Bubble-Chart oder 2 Dimensionen in einem Scatterplot dargestellt werden.

Im folgenden Beispiel werden die graphomate bubbles verwendet, um die analysierte Meinung in Abhängigkeit vom Budget der Filme darzustellen. Was damit noch möglich ist, wird in einem unserer nächsten Blogbeiträge unter die Lupe genommen.

zwitscher_komponente

In diesem Beispiel ist eine Korrelation definitiv zu erkennen, da Filme mit höherem Budget anscheinend eine bessere Bewertung erhalten. Nun können auch Ausreißer identifiziert werden, die beispielsweise in einem Quadranten liegen, der ein hohes Budget und eine geringe Bewertung beschreibt und daher als wenig erfolgreich gilt.

In meiner Bachelor-Arbeit gehe ich neben der Dokumentation des Prototyps auf Besonderheiten des Design Studio SDK, die sozialen Netzwerke und diverse Meinungsanalyseverfahren ein. Außerdem ermittle ich Stärken und Schwächen des Konzepts, das durch diese Data Source Extension realisiert wird.

Abschließend möchte ich dem Team von graphomate dafür danken, dass ich bei ihnen dieses spannende Thema bearbeiten durfte. Es hat mir viel Spaß bereitet und ein Ergebnis hervorgebracht über das ich mich sehr freue.

Viele Grüße
Tim

_

ccbync
Dieser Beitrag bzw. Inhalt ist unter einer Creative Commons-Lizenz lizenziert.