Hashtags: Auswertungen und Interpretation (Nicht-Nerdy)

Eines unserer wichtigsten Recherchetools sind und bleiben die Hashtagbeobachtungen auf Instagram. Hier erlebe ich immer wieder bei den vielen Gesprächen faszinierende Rückfragen zu allgemeinen Verständnis- und Interpretationsprobleme. Daher dieser Grundlagenartikel.

Am Beipiel der Themenwelt „Leipzig“ (hier: #leipzig) lässt sich das Monitoring so anstellen:

(1) Aufruf der App
(2) Suche nach dem Tag in der App
(3) Häufungszahl notieren
(4) Gehe zurück zu (1)

Über diesen (manuellen) Rechercheweg lassen sich nun Häufungsentwicklungszahlenreihen anlegen.

[Beispiel für #Leipzig]

Der Nicht-Nerd kann jetzt und nach Sichtung der Entwicklungen dieser Zahlen unfassbar spannende Fragen für sich und völlig unabhängig von diversen Socialmediaberater_innen und Influencermarketingagenturen beantworten:

(1) Wieviele neue Medien tauchen denn da zu den Tags / Themenwelten auf?
(2) Was gibt es denn sonst noch schönes zu der Hauptsuchphrase? (Siehe Screenshots, die Liste …)
(3) Wie entwickeln sich denn diese Nebenhashtags?
(4) Passt die Entwicklung (1-3) denn überhaupt auf die aktuelle Planung (hier: Contentmarketing, Zielgruppenerkenntnisse usw.)?

Diese Datenbankauffüllung und die Quasi-Forschung an den Hashtags lässt mich manchmal etwas lächeln, weil wir intern sehr viele Diskussionen rund um die Interpretationsvarianten der Zahlenveränderungen führen. Ich vertrete in manchen Situationen u.a. den Ansatz, dass die Differenz von Zahl (Z) zu Zahl (X) sagt: „Die Differenz entspricht punktgenau der Anzahl der Accounts, welche in dem Zeitraum aktiv sind“. Anne vertritt da einen anderen Ansatz und bemerkt immer mal wieder gern, dass auch eine Person 1000 Medien in einem kurzen Zeitabstand unter dem Tag #leipzig dort veröffentlicht. Ich denke, dass man zum finalen Kompromiss kommt, wenn man halt in der Betrachtung eine Fehlerquote einbaut und ich bevorzuge da – je nach Thema (!) – 33%-45%.

Zurück zur Datenerfassung.
Der beschriebene und manuelle Weg eignet sich natürlich für kleine Tagsammlungen und Projekte. Sucht man allerdings einen umfangreicheren Überblick, kommt man selbstverständlich nicht um die Anbindung an den Instagram-Endpoint umhin und hier dürfen die Leser_innen des Arbeitsblogs den eigentlichen Existenzgrund der Datenbanken finden. Sprich: niemand hat schlichtweg die Zeit, die Lust und die Ressourcen, um 1000-10.000 projektbezogene Tags jeden Tag zu suchen, die Zahlen aufzuschreiben und das Ganze auch auszuwerten.

So. Ich hoffe, dass meine Ausführungen zu den Hashtags etwas klarer geworden sind.

Fragen? Anregungen?

Das Erkennen und Ausnutzen von Themenwelten via Instagram-Hashtags

Mit Fertiggstellung des Komplexes „Hashtaganalyse“, ergaben sich einige interessante Diskussionen mit den Betatester_innen und Kund_innen über die konkrete Identifikation von „Themenwelten“.

Eine „Themenwelt“ wäre bspw. – ganz aktuell –

WEIHNACHTEN
Die Allgemeinbildung, Sozialisation und auch der „Menschenverstand“ sagt hier natürlich klar, dass diese „Themenwelt“ verschiedene Informationen oder „Subthemen“ beinhalten könnte. Diese wären unter anderem:
– tannenbaum
– gans
– geschenke, geschenk
– xmas, christmas
– feier, feiern, frohesfest, weihnachtsfest
– u.v.m.

Diese simplen Überlegungen führen allerdings letztendlich zu einem interessanten Problem: man kann ausgehend von den eigenen Gedankengängen zu den „Themenwelten“ niemals davon ausgehen, dass eine abholbare und ansprechbare Zielgruppe ähnliche Gedanken, Emotionen und Wahrnehmungen hat. Dieses Dilemma lässt sich über den folgenden Weg lösen.

(1) Download und Speichern der Posts mit Hilfe der Instagram-API

Endpoint: https://api.instagram.com/v1/tags/{tag-name}/media/recent?access_token=ACCESS-TOKEN

Interpretationsfähige Daten aus dem Endpoint:
(a) URL des Posts
(b) verwendete Hashtags
(c) Anzahl: Likes und Comments
(d) Beschreibung, Statement
(e) Autor-ID (für Influencer-Marketing)
(f) Location, Geo-Code

(2) Auswertungen

Die erfassten Hashtags werden nun in einer Liste dargestellt und nach der Eliminierung der Duplikate ergeben sich die folgenden Funktionen
(a) Durchzählen auf die Hashtagkombinationen aus den gespeicherten Datensätze und entsprechende Gewichtung
(b) Gegenprüfung auf die Hashtagkombinationen
Die erfassten Hashtagkombinationen lassen sich über diesen Ansatz ebenfalls aufsummieren und hierüber gewichten (… wurde xyz mal verwendet …).
(c) Einbeziehung der Häufungen UND der Häufungsentwicklungen in die Themenweltenanalyse

Diese Grobskizze zur Auswertung muss natürlich in einen konkreten Algorithmus einfliessen, der letztendlich zwecks Gegenprobe die Ergebnisse den jeweiligen Verantwortlichen vorlegen muss.

Ich werde in der letzten Zeit ständig gefragt, was man denn mit den Resultaten aus solchen Analyseprozeduren anstellen kann. Es ist eigentlich recht einfach:
(a) Die gewichteten Taggruppen geben Aufschluss darüber, ob die angedachten Kampagnen „Sinn machen“.
(b) Die gewichteten Taggruppen geben in Verbindung mit der Häufungsanalyse Aufschluss darüber, ob denn angedachte Kampagnen einen Trend ausnutzen. (Häufungsentwicklungen beachten!)
(c) Die gewichteten Taggruppen liefern einen ersten Anhaltspunkt über Tags, welche beim Contentmarketing genutzt werden können.
(d) Eher spekulativ: Die gewichteten Taggruppen können als Recherche für Textideen dienen.

Der Instagram-Recherche-Komplex wird noch in diesem Jahr um die Themenweltrecherche erweitert und die Betatester_innen / Kund_innen bekommen zeitnah entsprechende Infos.

[Updatenotiz] Instagrammonitoring, Recherchen und die Hashtags

Nach einigen Diskussionen rund um die Freigabefunktionen der Datensätze, sind wir intern endlich zu einem Resultat gekommen.

Die Monitoringanwendung wird um eine eMail-basierte Schnittstelle erweitert. Dies sieht so aus:

– Freigabe der „berechtigten“ Personen über deren Absender-Mailadresse via Datenbankeintrag im System
– eventuell: Einführung eines Quota-Systems (XYZ-Abfragen je Person …)
– Abfrageschema: Subject => Abfragebefehl, Body => Inhalte

Über die Aufbereitungen der Resultate werden wir intern und in Absprache mit den Kund_innen noch intensiv diskutieren.
Ich werde die Entwicklung der Abfrageschemata und die entsprechenden Befehle hier dokumentieren.

Updatenotiz – Instagramanalyse, Hashtags & Co.

Nach der Organisation der Datenbank – ich verwende übrigens „SQLite“ – haben wir uns intern zu einer Erweiterung des Analysesystems entschieden. Ein entsprechendes Update wird im Laufe der aktuellen Arbeitswoche ausgerollt und es umfasst dann:

(1) Instagram-Account-Beobachtung
– thematische Erfassung von Accounts mit schwachem Bezug zu „Influencermarketing“
– Erfassung der Grunddaten (Profil, Statement, Anzahl: Posts | Abos | Fans)
– EVENTUELL: komplettes Screening der Feeds inkl. der Beitragsauswertung nach Likes und Comments

(2) Reporting, Abfragen und das Gewinnen von Erkenntnissen aus den Datensätzen
– Orientierung an der alten Webversion
– Ausgabe: Themenwolken, je nach Abfragemodus (Wortbestandteil, genaues Wort, Zusammenhang mit bestimmten Häufungen)
– Diagramme => Häufungsentwicklungen
– Diagramme => Aufsummierung der erfassten Tags zu den Themen
– Diagramme => Accountentwicklungen auf basis der Grunddaten

Ich denke derzeit noch über ein geeignetes Modell der Abfrageübermittlung nach. Da das System hier auf einem lokalem Rechner mit Internetzugang läuft, werde ich mit hoher Wahrscheinlichkeit die Abfragen und Rückgaben der Ergebnisse via eMail einprogrammieren.

IG-Client, Tagrecherche(n)

Die „freie“ Tagrecherche wurde mit der Versionsnummer „0.5b“ entwickelt und bereit gestellt. Diese dockt am „tag-search“-API-Endpoint von Instagram an und fragt die verwandten Tags zzgl. deren Reichweite ab.

[Bedienung]

1.) Tagwahl
– Eingabe des zu analysierenden Tags
oder
– Auswahl des zu analysierenden Tags aus der hinterlegten Liste
Die Tagliste befindet sich in der Datei /projekte/tagsearch.txt und lässt sich hier modifizieren.

2.) Reichweitendaten abholen
– Abfrage des Tagsearch-Endpoints auf Basis des hinterlegten Schreibrechte-Token und des gewählten Tags

3.) Ergebnis sichten und bearbeiten
Hier erlaubt der Client die Begutachtung der ausgelesenen Taggruppe (Beispiel: „Leipzig“). Sollen hier die gefundenen Tags weiter verarbeitet und verwendet werden, erledigt man das via „Doppelklick“ auf die jeweilige Zeile der Tabelle. Hierüber werden die ausgewählten Hashtags in den den Reiter „Tagsammlung“ übernommen. Dieser erlaubt den Übertrag der Ergebnisse in die Datei „tagsearch.txt“, die Taganalyseprozeduren, den Liker und die Konvertierung in ein „Copy&Paste“-fähiges Format.

Wozu lassen sich die gewonnenen Datensätze verwenden?
(a) Verwertung in den hashtagfähigen Socialmedia (Instagram, Twitter usw.).
(b) Gezielte Trendrecherche auf Basis der Taggruppen (#leipzig => #leipzigerzoo, #leipzig => #leipzighbf).
(c) Tagidentifikation für die Promotion von Texten, Infos und Angebote.
(d) Daten- und Inspirationsquelle für die Textoptimierung (Achtung: auf die Reichweitenveränderungen achten!)

[Todo] API für die Analysedatenbanken (Hashtags & Co.)

Nach ca. 1Mio Datensätzen und vielen Gesprächen mit den Tester_innen entschied ich mich zu einem Aufbau einer geeigneten Zugriffs-API. Diese wird folgende Funktionen umfassen:

[Basis]
– Erfassen der Anzahl: Datensätze und hinterlegten Hashtags
– Erfassen der Prüfzeitpunkte: Datum

[Analyse, Datensätze]
– Abfrage der Taggruppen bezogen auf Datum und Datumsraum (Datum X – Datum Y)
– Abfrage einzelner Tags bezogen auf Datum und Datumsraum (Datun X – Datum Y)
– Vergleich von verschiedenen Tags hinsichtlich Reichweiten- und Abstandsveränderungen (Datum und Datumsraum)

[Textanalyse]
– Übergabe von Texten an die API und Rückgabe der gefundenen Tags zzgl. deren Reichweiten- und Abstandsmetriken
– Übergabe der Texte an die API und Rückgabe der Taggruppen oder (!) der reichweitenstarken Tags aus den Taggruppen

Die Resultate werden im JSON oder XML-Format gestaltet und da die API natürlich primär die Bedürfnisse der Wobus & Lehmann GbR und den zu betreuenden Kund_innen zu befriedigen hat, wird die API im „freien“ Modus stark eingeschränkt werden.

Update der Hashtagrecherchescripte auf Version 0.11B

Die neueste Version ist nun unter dem Link

http://bit.ly/1iwI3qG

erreichbar.

Ich habe hier die Zugriffe auf die einzelnen Recherchefunktionen unter dem Punkt „Abfrageformular“ zusammen gefasst. Die Bedienung gestaltet sich nun so, dass hier die gewünschten Tags oder Taggruppen KOMMAGETRENNT eingegeben werden müssen und per Druck auf „Senden“ werden die Links zu den jeweiligen Abfragefunktionen generiert. Diese sind nun:

[FT+T: Freitext mit Textausgabe, ohne Reichweitenauswertung]

Diese Funktion dient ausschließlich einem eventuellen „Copy & Paste“ oder der Weiterverwendung der Ergebnisse für bspw. AKtivitäten auf den „hashtag-tauglichen“ Sozialen Medien wie „Twitter“, „Tumblr“, „Pinterest“ oder eben „Instagram“. Die Ergebnisse generieren sich hier aus den Taggruppen.

[FT+RW+U: Freitext mit Reichweitenauswertung (ungenau – Schema %suchwort%)]
Diese Funktion liest die hinterlegten und erfassten Tags nach dem Schema %wort% aus und stellt diese absteigend nach der gefundenen Reichweite dar. Hierbei wird als „Bezugsgröße“ der Tag mit der höchsten Reichweite genommen und mit den nachfolgenden Tags verglichen. Die Vergleichsmetriken sind (a) Differenz zwischen den Tags innerhalb der Taggruppe und (b) der prozentuale Abstand zwischen den Tags innerhalb der Taggruppe.

[FT+RW+G: Freitext mit Reichweitenauswertung (genau – Schema suchwort%)]
Diese Funktion arbeitet wie „FT+RW+U“, mit dem Unterschied des Suchschemas „suchwort%“. Dieses legt fest, dass nur Ergebnisse in die Taggruppe einfließen, welche die Abfrage am Anfang der Zeichenkette haben.

[T+RW+G: Tagsuche mit Reichweitenauswertung (genau – Schema suchwort)]
Diese Funktion präsentiert Ergebnisse aus einer Abfrage, welche sich auf den genauen Ausdruck bezieht.

[T+RWA+G: Tagsuche mit Reichweitenauswertung (genau) auf Basis der erfassten Zeiträume]
Diese Recherchefunktion gibt Ergebnisse aus, wenn der genaue Ausdruck tatsächlich in der Datenbank hinterlegt wird und die Reichweitenauswertung bezieht sich hier auf die Entwicklungen je hinterlegtem Datum.

Die fortlaufende Datenbankentwicklung lässt sich nun unter dem Link
http://bit.ly/1O9Wadx nachvollziehen. Man sieht hier die Anzahl der Datenbankeinträge, die Anzahl der hinterlegten Tags und die letzten Prüfdaten.

Hashtags – Analyseprozeduren und Interpretationsansätze

Möchte ich eine Bestandsaufnahme über die aktuellen Hashtags aus – zum Beispiel – Google+ generieren, entscheide ich mich zuerst für die zu analysierende „Meta-Ebene“. Im aktuellen Beispiel habe ich das Feld „Urlaub“ gewählt. Hierzu übergebe ich diesen Begriff – „Urlaub“ – an die Googleplus-API mit Hilfe des APP-Code basierenden Authentifizierungsprozesses. Dieser liefert mir je nach Suchmodus (1. die letzten 20 Beiträge aus Gplus-global oder 2. die letzten 20 RELEVANTEN Beiträge aus Gplus-global) zurück. In unserem Fall wären die Ergebnisse der ersten Analyseebene die erste Spalte und erste Zeile der Urlaub-Tabelle (*.xlsx). Man sieht hier, welche Schlagworte in den Beiträgen NEBEN des Hashtags „Urlaub“ verwendet wurden und kann hier „Subtrends“ herauslesen: man schaut hier nach, wie häufig ein interessanter Begriff genannt wird. Je häufiger hier ein besonders spannender Begriff auftaucht / genannt wird, desto höher kann (!) der vermutete Bedarf an Informationen oder konkreten Produkten sein.

Der zweite Analyseschritt gestaltet sich etwas komplexer und man analysiert hierbei die „Nebenhashtags“ über die o.g. technische Umsetzung je Wort der ersten Ebene und ordnet die Ergebnisse in eine Wortmatrix ein. In unserem „Urlaubs“-Beispiel findet man die Resultate jeweils in den Spalten B bis AI. Hier schaut man sich nun die einzelnen Zellen an. Interessant im Urlaubsumfeld sind natürlich immer konkrete Länder oder Angebote. Möchte ich hier an konkrete usergenerierte Wortkombinationen gelangen, ziehe ich eine einfache Verbindung der anvisierten Zelle (U6) zur X- und Y-Achse und komme zu einer Variation, welche „Kreuzfahrten“ (U6) / „Traumreisen“ (U1) / „Privatunterkunft“ (B6) lautet. Andere interessante Beispiele sind:

  1. „berlin“ (E5) / „Tourismus“ (E1) / „Privatunterkunft“ (B6)
  2. „karawane“ (C23) / „urlaub“ (B23) / „reise“ (C1)
  3. „reisemagazin“ (E18) / „InselLaReunion“ (B18) / „Tourismus“ (E1)

Das Prüfen der Kombinationen ist natürlich nicht nur auf drei Elemente beschränkt und lässt sich auch auf 2-er Gruppen betreiben. Der Sinn der Auswertung liegt in der Natur der Hashtags, da diese ja bekanntlich nicht nur zum Setzen von Akzenten dienen, sondern auch andere potentiell interessierte Leser aufmerksam machen sollen. Darüber hinaus erhöhen sie selbstverständlich auch die Reichweiten der abgesetzten Posts.

Folgende Theorien ergeben sich aus der Analyseprozedur:

1. Verwendung von Hashtags lockt neue Leser an (verifiziert)
2. Verwendung von Hashtags erhöht die Reichweite (verifiziert)
3. Verwendung von Hashtags, welche auf die Inhalte der Posts abgestimmt sind, erhöht die Chance von Likes, Shares, Comments und Clicks (verfiziert)
4. 1-3 und Einbindung der Hashtags in Abstimmung mit den gewonnenen Ergebnissen aus der o.g. Analyseprozedur generiert die Ergebnisse aus 1-3 und neigt zur Unterstützung von Positionierungseffekten bei den SUMA, welche die Socials als Rankingkriterium nutzen (im Longtail- und Nischenbereich verfiziert, „harte“ Keys stehen aus)
5. recherchierte Tags sind „hilfreich“, wenn Diese bei WordPresskonstellationen verwendet werden (zum Teil verifiziert)

Download: Urlaub.xlsx (generiert über piXologisch Socialtracker)

[Updatelog Socialtracker 0.5b – 17.05.2014]

  1. Zusammenzählen der ersten und zweiten Analyseebene
  2. Excel- und HTML-Export

[Todo]

  1. weitere Datenquellen: Twitter und (Optional) Facebook / Instagram plus Abgleich untereinander
  2. Analyse / Log der konkreten Meldungen zzgl. Accounts
  3. Accountebene: Auslesen der Basisvariablen wie Anzahl Fans, Kreise etc. um „Influenzer“ zu identifizieren
  4. Trigger / Alertsystem: Popup, wenn Wort / Phrase „häufig“ vorkommt, ggf. automatischer Report

piXologisch Socialtracker und die Auswertung von Hashtags (GPlus)

Besagte Anwendung wurde um das Feature „Google+ / Hashtags“ erweitert. Diese erwartet die Eingabe eines „Metabegriffes“ und recherchiert sämtliche Begriffe, welche in den Meldungen rund um die „Metaebene“ verwendet wurden. Die Suchmodi / Recherchemodi sind

  1. „aktuelle“ => die letzten 20 Meldungen
  2. „best“ => die letzten relevantesten Meldungen

welche jeweils auswählbar sind.

Das Feature gliedert sich in die folgenden Recherchemodi:

  1. Recherche => Einzelkeyword
  2. Recherche => Keywordliste (Liste ausfüllen oder nach Schritt No.1 auf Button „Erg.=>Liste“ drücken)

Eine Abprüfung von verwendeten Tags zu einem bestimmten – vergangenen – Zeitraum ist (derzeit) nicht möglich und man müsste bei Bedarf (derzeit) entsprechende Dienstleister / Datenbanken bemühen.

Es ergeben sich folgende Einsatzszenarien:

  1. Recherche verwendeter Tags / Keywords zu einem Thema
  2. Recherche von Zielgruppen (gezeigt durch Tagsets) zu einem Thema und dessen Unterthemen
  3. Verwertung der identifizierten Tags zum Zwecke der gezielten Kommunikation und / oder Reichweitenerhöhung.

Für die fehlerfreie Bedienung der Funktion wird der entsprechende API-Key (zu finden im Google-Entwicklerzentrum) benötigt. Nach Recherchedurchlauf lassen sich die Ergebnisse via Hauptmenü=>Auswertung=>Export (CSV oder Excel) in eine externe Datei übertragen. Für die Excelfunktion muss natürlich eine jeweils aktuelle Version installiert und funktionsfähig sein.

Beispiel einer Keywordmatrix: urlaub (.xls).
Download: socialtracker_04b.zip

Diese Datei zeigt eine komplexere Hashtagmatrix zur Metaebene „Urlaub“. Die Inhalte sind unkommentiert und nicht gewichtet. Ein Interpretationsansatz ist hier in Zellen bzw. den Schnittpunkten der X- und Y-Achse zu suchen.

Bitte beachte auch hier:

Support und Einweisungen ist auf unsere interessierten Klienten und persönlich bekannte Betatester beschränkt. Die Anwendung befindet sich im Beta-Stadium und wurde nicht zu 100% auf Fehlerfreiheit geprüft.

[Todo]

  1. Anbindung der Datenquelle: „Twitter“
  2. fortlaufende Tagprüfung und Statistik über die Tagnutzung je Tag, Woche, Monat etc.
  3. Kombinationsgewichtungen aus den Ergebnissen (2er, 3er-Sets)
  4. Mitverfolgung der Accountebene => Wer Postet? Status der Postenden?
  5. Basisreichweitenanalyse
  6. PDF-Reports, eMail-Client
  7. Stapelabprüfung

piXologisch EasyPromo v.3.1 veröffentlicht

Die piXologisch EasyPromo wurde um folgende Funktionen erweitert:

  1. Tags zu Friendfeed und Ping.fm-Posting (vergl. Hashtags / Twitter)
  2. RSS-Feedscraper, RSS-Feeds werden aus den zu bewerbenden Seiten ausgelesen, in die internen Datenbanken eingetragen und bei RSS-Verzeichnissen / Pingdiensten angemeldet
  3. „Quickpublish“: Auswahl, Konfiguration des Publish / „Promo“-Vorganges an einer zentralen Stelle
  4. Reaktivierung der Pingfeatures: Anmelden der Projektfeeds, der Blogfeeds und der Feeds der Publishkanäle in RSS-Kataloge und „Ansprache“ der Pingdienste (beinhaltet derzeit: Friendfeed und Bit.ly)
  5. erstmalig: zentraler Überblick über die implementierten Publish-Kanäle / Accounts
  6. Basis-Backlinkchecker => „geht“ über die Domainsichtbarkeit (siehe: http://bit.ly/hCDWO2, „yourdomain.com“ durch eigene Domain austauschen) und beinhaltet eine Gegenprüfung (… „existiert der Link?“…)
  7. Basis-Reportfunktionen
  8. Quickindexing-Funktion, vergleichbar mit „Statblaster 7“