Trendmonitor zur Analyse von diskutierten Themen im Zeitverlauf

Veröffentlicht am: in der Kategorie: HCI

In diesem Kapitel wird der Trendmonitor vorgestellt. Es handelt sich dabei um ein Analysewerkzeug, welches ermöglicht, die diskutierten Themen im Zeitverlauf zu vergleichen. Dabei können Bildungsbedarfe entdeckt werden. In nächsten Schritt kann man auf Basis dieser Information zeitnah Weiterbildungsangebote bereitstellen, die auch den aktuellen Bedürfnissen der Fachkräfte entsprechen würden.

Anforderungen an das Sifa-Portfolio wurden zum Teil auf Grundlage der Analyse von Ergebnissen ermittelt, die von dem Sifa-Community Trendmonitor erstellt wurden. Der Trendmonitor stellt ein speziell zum Zweck der Analyse der Community Posts entwickeltes, funktionelles Prototyp dar. Es handelt sich dabei um ein Text-Mining Werkzeug, mit Hilfe dessen die Forum Posts, unter Berücksichtigung der Zeitdimension, statistisch ausgewertet und visualisiert werden.

Der Trendmonitor basiert auf dem Ansatz von Bensberg (vgl. Bensberg 2012, S. 434), der mit Hilfe einer systematischen Stellenanzeigenanalyse den genauen Bildungsbedarf in der Lage ist zu ermitteln und im Sinne von Learn-Service-Engineering den Rahmenkonzept für die systematische Dienstleistungsentwicklung von Bullinger und Schreiner zu ergänzen (vgl. Bullinger 2006, S. 73). Innerhalb dieses Ansatzes werden Stellenausschreibungen mit Hilfe von Text Mining Werkzeugen analysiert, um den Bedarf an Fachexperten zu verschiedenen Themen zu ermitteln. Dieser Bedarf soll dann im Zuge der Bildungsmaßnahmen rechtzeitig gedeckt werden.

Mit Hilfe des Trendmonitors wurden die Community-Posts aus dem Zeitraum zwischen dem 01.12.2013 bis zum 30.06.2015 analysiert. Das zu analysierende Datenpool betrug 125.273 Datensätze und wurde aus 1127 Forum-Themen extrahiert. Jeder Datensatz beinhaltete den Begriff, das Datum der Veröffentlichung, den anonymisierten Namen des Autors, der Kategorie respektive dem Thema in dem es verfasst wurde.

Die Daten wurden nach dem Export aus der Sifa-Community in Excel bearbeitet und zur Visualisierung im Datenanalyse-Programm Tableau bereitgestellt.

Das Ziel bei der Konzeption des Trendmonitors war es, eine Analyse der einzelnen Themen zu ermöglichen, indem die Häufigkeit der Wörter, aus denen die Community-Beiträge bestehen, grafisch dargestellt wurde. Damit soll das Erkennen von saisonalen Trends, regelmäßigen Wiederholungen von Themen und der Intensität bzw. der Häufigkeit mit der die Themen diskutiert wurden, ermöglicht werden.

Zur Erstellung des Trendmonitors wurden Text-Mining Methoden verwendet, die es ermöglichen aus großen Datenmengen in Textformat kontextuelle Muster zu erkennen und die Zusammenhänge zu visualisieren. Diese Methodik ermöglicht es Visualisierungen zu erstellen, die über einen großen Informationsgehalt verfügen, der komprimiert dargestellt wird.

Für die Auswertungen wird ein rein statistischer respektive quantitativer Ansatz (Content) mit dem qualitativen Ansatz (Context) zusammengefügt. Durch diese Symbiose kann ein qualitativ hochwertigerer Informationsgehalt der quantitativen Daten bewirkt werden. Die Auswertungen die von dem Trendmonitor erzeugt werden, haben einen mannigfaltigen Charakter. Zum einen können rein statistische Informationen visualisiert werden, beispielsweise Anzahl der Posts pro Monat, Anzahl der publizierten Wörter pro Jahr oder wie viele Wörter ein Autor pro Zeiteinheit publiziert hat. Zum anderen beinhalten die Visualisierungen eine kontextuelle Komponente, die die Zeitdimension berücksichtigen und dadurch eine reichere Information erzeugen. Als Beispiel kann hier die Aktivität der einzelnen Autoren zu bestimmten Themen im Zeitverlauf visualisiert werden. Oder aber die Häufigkeit von diskutierten Themen in jedem Monat eines bestimmten Jahres sowie vergleichend über mehrere Jahre hinweg.

Innerhalb des Zeitraumes zwischen dem 01.12.2013 und dem 30.06.2015 wurden auf der Webseite der Sifa-Community im Forum 1127 Themen bzw. Fragen diskutiert. Im Folgenden wird eine Visualisierung vorgestellt, die die Häufigkeit der publizierten Wörter Wörter im Zeitverlauf adressiert. Um zuverlässige Aussagen abzuleiten ist zwar eine Datenmenge von mehreren Tausend Themen vorteilhafter, trotzdem ist es schon bei ca. tausend Themen bzw. diskutierten Fragen ein Muster erkennbar. Themen wie:

  • Mitarbeiter - in Monaten Dezember 2013 und Januar 2014 genau so häufig besprochen wurden wie ein Jahr später im Dezember 2014 und Januar 2015.
  • Community - wurde besonders intensiv im Juni und September 2014 aufgegriffen, als im Vergleich zu Monaten davor und danach.
  • Kosten - die Kostenthematik wurde vergleichsweise stark in Monaten Dezember 2014 und März 2015 besprochen.

ASR - die Abkürzung die im Kontext von „Technischen Regeln für Arbeitsstätten" steht wurde im Mai 2014 und im Februar 2015 wesentlich stärker diskutiert, als in anderen Monaten innerhalb des ausgewerteten Zeitraumes.

Innerhalb der Abbildung 15 wird eine weitere quantitative Information visualisiert. Die Anzahl der verfassten Wörter pro Autor. Es wurden 30 aktive Autoren gewählt, dessen Namen aus Datenschutz rechtlichen Gründen anonymisiert wurden.

In das obere Diagramm kann die Zeitdimension integriert werden, was die Aktivitäten bzw. die Anzahl der publizierten Wörter eines jeden Autors innerhalb des analysierten Zeitraumes veranschaulicht. Hieraus kann der Informationsbedarf der Autoren hergeleitet werden, was bei einer größeren Datenmenge noch prägnanter erkennbar wäre. Eine solche Visualisierung wird als nächstes abgebildet (Abbildung: 16).

Diese Art der Information kann den jeweiligen Autoren zur Verfügung gestellt werden, um die eigene Aktivität im Forum zu analysieren. Gleichzeitig soll von den Betreibern des Forums sorgfältig abgewogen werden, ob die Informationen über Aktivität eines Mitglieds im Forum, anderen Mitgliedern zugänglich gemacht werden soll. Einerseits kann Zugriff auf solche Inhalte helfen, Experten zu bestimmten Themen zu finden. Andererseits kann das als Verletzung der Privatsphäre angesehen werden, was zum Austritt aus dem Forum führen kann.

Sowohl für Mitglieder der Sifa-Community als auch für die Betreiber und Administratoren des Forums kann die Trendentwicklung für bestimmte Themen von großer Relevanz sein. Vor diesem Hintergrund wurde die obere Grafik erstellt. Sie visualisiert die Häufigkeit der einzelnen Wörter in einem festgelegten Zeitraum. Trotz des relativ geringen Datenbestandes hilft die Visualisierung zu erkennen, dass Thematiken wie Gefährdungsbeurteilung, Betrieb und Sifa einen leicht steigenden Trend aufweisen. Im Vergleich dazu werden Themen wie: Mitarbeiter, Community, Arbeitgeber in dem analysierten Zeitraum zunehmend weniger diskutiert werden.

Der Sifa-Trendmonitor wurde zwei Fachkräften für Arbeitssicherheit präsentiert, die in einem mittelständischen Betrieb im Raum Siegen-Wittgenstein für alle Belange der Betriebssicherheit verantwortlich sind. Die Sifas wurden gebeten während der Interaktion mit dem funktionellen Konzept, ihre Gedanken zu verbalisieren. Diese Methode zu Usability-Techniken und wird „Thinking aloud" genannt. Die mehrdimensionale Betrachtungsweise, sowie die Reziprozität der quantitativen „Content" Auswertung und der qualitativen „Context" Auswertung, wurden positiv aufgenommen. Aus dem Gespräch, der als ein Exploratory Usability Test bezeichnet werden kann (Rubin, Chisnell 2008, S. 28), wurde eine Liste mit Anforderungen erstellt, die der Trendmonitor aufweisen soll, damit dieser das Weiterbildungskonzept Sifa-Portfolio sinnvoll ergänzt.

Post author

Autor: Krzysztof