News: Zusammenlegung der Instagramprojekte

Per sofort wird der Support für das Projekt „Hashtag-DB“ / „Reichweitenanalysen v. Hashtags“ eingestellt und mit dem Themenkomplex „InstaLOC“ zusammen geführt.
Der Zugang zu den Datenbanken, generiert zwischen 2015/16 und 2018, ist für Externe ab dem heutigen Datum geschlossen.

Ausnahmen sind Geschäftspartner_innen und Kund_innen.

Link zum Archiv: https://www.pontipix.de/werkzeuge-tools/hashtag-projekt/

Hashtags: Auswertungen und Interpretation (Nicht-Nerdy)

Eines unserer wichtigsten Recherchetools sind und bleiben die Hashtagbeobachtungen auf Instagram. Hier erlebe ich immer wieder bei den vielen Gesprächen faszinierende Rückfragen zu allgemeinen Verständnis- und Interpretationsprobleme. Daher dieser Grundlagenartikel.

Am Beipiel der Themenwelt „Leipzig“ (hier: #leipzig) lässt sich das Monitoring so anstellen:

(1) Aufruf der App
(2) Suche nach dem Tag in der App
(3) Häufungszahl notieren
(4) Gehe zurück zu (1)

Über diesen (manuellen) Rechercheweg lassen sich nun Häufungsentwicklungszahlenreihen anlegen.

[Beispiel für #Leipzig]

Der Nicht-Nerd kann jetzt und nach Sichtung der Entwicklungen dieser Zahlen unfassbar spannende Fragen für sich und völlig unabhängig von diversen Socialmediaberater_innen und Influencermarketingagenturen beantworten:

(1) Wieviele neue Medien tauchen denn da zu den Tags / Themenwelten auf?
(2) Was gibt es denn sonst noch schönes zu der Hauptsuchphrase? (Siehe Screenshots, die Liste …)
(3) Wie entwickeln sich denn diese Nebenhashtags?
(4) Passt die Entwicklung (1-3) denn überhaupt auf die aktuelle Planung (hier: Contentmarketing, Zielgruppenerkenntnisse usw.)?

Diese Datenbankauffüllung und die Quasi-Forschung an den Hashtags lässt mich manchmal etwas lächeln, weil wir intern sehr viele Diskussionen rund um die Interpretationsvarianten der Zahlenveränderungen führen. Ich vertrete in manchen Situationen u.a. den Ansatz, dass die Differenz von Zahl (Z) zu Zahl (X) sagt: „Die Differenz entspricht punktgenau der Anzahl der Accounts, welche in dem Zeitraum aktiv sind“. Anne vertritt da einen anderen Ansatz und bemerkt immer mal wieder gern, dass auch eine Person 1000 Medien in einem kurzen Zeitabstand unter dem Tag #leipzig dort veröffentlicht. Ich denke, dass man zum finalen Kompromiss kommt, wenn man halt in der Betrachtung eine Fehlerquote einbaut und ich bevorzuge da – je nach Thema (!) – 33%-45%.

Zurück zur Datenerfassung.
Der beschriebene und manuelle Weg eignet sich natürlich für kleine Tagsammlungen und Projekte. Sucht man allerdings einen umfangreicheren Überblick, kommt man selbstverständlich nicht um die Anbindung an den Instagram-Endpoint umhin und hier dürfen die Leser_innen des Arbeitsblogs den eigentlichen Existenzgrund der Datenbanken finden. Sprich: niemand hat schlichtweg die Zeit, die Lust und die Ressourcen, um 1000-10.000 projektbezogene Tags jeden Tag zu suchen, die Zahlen aufzuschreiben und das Ganze auch auszuwerten.

So. Ich hoffe, dass meine Ausführungen zu den Hashtags etwas klarer geworden sind.

Fragen? Anregungen?

Hashtagdatenbanken: Änderungen an den Freigaben (Stand. 01.05.2018)

Im Zuge der API-Änderungen musste ich leider feststellen, dass das Datenbankpaket für 05-2018 fehlerhaft ist. Das hängt u.a. auch damit zusammen, dass besagte Änderungen eine längere API-Abfragefrequenz erforderte (spez. 20 Milisek. auf 100-150 Milisek.) und hierdurch enstanden Lücken in den Datensätzen, die eine Interpretation für 05-2018 massiv erschwert. Der 05-er Upload wird daher übersprungen und ich ändere die zukünftige Freigabe wiefolgt:

-> Upload im Wochenturnus (1. Upload 01.05 – 06.05, letzter Upload 28.05 – 31.05)
-> Vorgängerdatenbank wird mit Upload gelöscht.

Der Vorteil in dem Moduswechsel liegt darin, dass die stark verkleinerten Scraperdatenbanken schlichtweg einen schnelleren Datenerfassungsdurchlauf und deutlich mehr Abfragen erlauben. Die Recherche nach weiteren Themen, Queries / Tagwelten etc. läuft und die Ergebnisse werden kommenden Sonntag in die Prozedur eingepflegt.

Update: Hashtagrechercheclient -> v.0.9B

Mit Freigabe der aktuellen Dateninterpretationssoftware habe ich mich dazu entschieden, die Datenvisualisierungsfeatures auf „final“ zu stellen. Das bedeutet, dass die Diagramme, die konkrete Gestaltung etc. fertig gestellt sind und ich maximal einige kosmetische Dinge da einbauen werde. Diese sind:

-> Farbauswahlfeatures
-> Ausweitung der Taganalyse auf max. 10
-> div. sonstige Farbmanipulationen

[Screenshots zu den Diagrammen]

Die Beispieldiagramme offenbaren hier einige Datenlücken und diese lassen sich so erklären:
-> Ausfall / Fehler der API-Endpoints
-> Änderungen an den API-Zugriffsmodalitäten und Abfragequota
-> Bug, Fehler im Scraper

[Screenshots zu den Rohdaten]

Nach intensiven Diskussionen rund um diese Datenlücken – intern und extern – fällte ich die Entscheidung, diese bewusst offen zu lassen und immer zur Gegensichtung der Rohdaten (siehe Screenshots zu raten. Sicherlich ist dieser Weg nicht „kosmetisch schön“, jedoch halte ich eine Datenauffüllung durch den Vorgängerwert für wenig zielführend, da hierüber eventuell Logiklücken in der Dateninterpretation sichtbar werden könnten.

Update: Datenvisualisierungsfunktion(en) – Hashtagclient

Im Zuge der Datenvisualisierungsfunktionsentwicklungen wurde die Darstellung umgestellt. Diese erlaubt nun den direkten Vergleich von mind. 2 Hashtagentwicklungsdatensätzen und liefert den Zugang zu weiteren / tiefergehenden Interpretationen bzgl. dieser Fragestellungen:

– Existieren Schnittmengen zwischen den Kommunikationshäufungen innerhalb von Tag- / Themenwelten?
– An welchen Tagen „lohnt“ sich ein Engagement zu den analysierbaren Tag- / Themenwelten?
– Welche Zielgruppenbewegungen werden in welchen Zeiträumen zu den Tag- / Themenwelten sichtbar?

Darstellungen der absoluten Reichweitenveränderungen (Rohdaten)


Darstellungen der absoluten Reichweitenveränderungen im Verhältnis zum ersten Datensatz.

Darstellungen der Reichweitenveränderungen im Verhältnis zum vorhergehenden Datensatz. (Datum [z] zu Datum [y]).

Das gezeigte Schema findet bereits jetzt Eingang in die tägliche Promopraxis und ein aktueller Account erfreut sich folgendem Wachstum:

l6.03.2018 -> (Re)start -> 0 Follower
21.03.2018 -> ~30 Follower
22.03.2018 -> ~100 Follower mit durchschn. Interaktion zu 20 – 30 „Likes“ inkl. guter Durchklickrate auf die verlinkte Webseite.

Die Prognose läuft darauf hinaus, dass besagter Account zum Monatsende sich zwischen 150 – 200 Follower einpendeln wird. Bereits jetzt sind Wechselwirkungen zwischen dem Auftritt, Trafficströme UND (!) positiver Rankingeffekte sichtbar. Eine finale Verifikation steht aus und wird via Gegenprobe realisiert werden.

Fragen? Anregungen?
Ich freue mich auf Kommentare, Telefonate und eMails unter office[at]pontipix.de

SQLite: schnell die Datenbankeinträge zusammen zählen

Diverse Datenbankmonitoringprobleme erforderten das Aufzählen der Einträge. Hierfür nehme ich unter der SDK „Delphi“ folgenden Befehl:

select MAX(_ROWID_) from tags;

Unter Windows 10 und mit einem relativ modernen Computer verlangt diese Anweisung ca. 25 Sekunden bei Abfrage(n) aus der ca. 32GB großen Hashtagdatenbankdatei.

Hashtagdaten – aktueller Bestand inkl. Januar 2018

Der Datenbestand umfasst aktuell:

Unique Tags: 5.570.042
Unique Zeitpunkte: 343
Anzahl-DB-Einträge: 733.252.376

Die „Masterdatei“ hat aktuell ein Volumen i.H.v. 32GB und beinhaltet die Untersuchungszeiträume 11-2016 bis 01-2018 (fortlaufend). Ich bekomme hierzu regelmäßig Bezugs- und Erklärungsanfragen und nach einigen internen Gesprächen haben „wir“ uns zur folgenden Gangart entschieden.

Kund_innen der Wobus & Lehmann GbR
– Bezug ist und bleibt kostenfrei, da die erhobenen Datensätze auch Grundlage für Marketingstrategieentscheidungen sind

Geschäftsfreund_innen der Wobus & Lehmann GbR (Leipzig und enge persönliche Kontakte)
– Bezug ist und bleibt kostenfrei, es wird jedoch das Stellen der Speichermedien (USB-Stick, Speicherkarte, externe Festplatte etc.) erwartet
– Kommunikations- und Verhandlungskanal ist und bleibt offen bei konkreten Forschungsidee etc.

Student_innen mit Forschungsprojekten, Abschlussarbeiten etc.
– Bezug ist und bleibt kostenfrei, wenn:
(a) die Kosten für die Speichermedien inkl. deren Versand getragen werden
(b) die Forschungsidee und das Konzept hier vorgestellt wird
(c) die Betreuer_innen inkl. deren Kontaktmöglichkeiten (eMail, Telefonnummer) genannt werden
(d) die Datenbank, die Wobus & Lehmann GbR etc. analog zu den üblichen Regeln in den jeweiligen Arbeit(en) genannt werden

sonstige Personen und Gruppen
Der Bezug ist kostenpflichtig und bewegt sich im niedrigen bis hohem dreistelligen Bereich exkl. der Versand- und Speichermediengebühren. Konkreteres wird nach Anfrage und Verhandlung geklärt und im Rahmen des Erstkontaktes wird auch geprüft, ob die Interessent_innen zur erstgenannten Zielgruppe gezählt werden (können).

Kontaktmöglichkeiten für An- und Rückfragen:

Tel.: 0176-67472781 (kein Whatsapp!)
eMail: office[at]pontipix.de

Hashtaganalyseprojekt – Zukunft und Weiterführung

In Kürze werde ich das Dezember – 2017 Datenpaket hochladen.

Nach Sichtung der aktuell vorhandenen Speicherkapazitäten fällte ich folgenden Entschluss.

Die hochgeladenen Datenbanken zzgl. Dez. 2017 bleiben bis Ende Januar 2018 online und werden mit Upload vom Paket „01-2018“ aus der Google-Drive gelöscht und das Projekt wird dann mit dem Jahr 2018 entsprechend weiter geführt.