Datenfreigabe 3_3: Hashtagdatenbank (Quelle: Instagram – API)

URL: https://www.pontipix.de/datenbank_downloads/hashtagdb_main.zip 

(Hinweis: gepackt ca. 13GB, entpackt ca. 40GB)

Die DB-Tabelle beinhaltet folgende Spalten:

ID, Tag (Hashtag), Haeufung, Datum

Zur Erläuterung:

ID und Tag / Hashtag sind selbsterklärend. Die Häufung ist die ausgelesene Gesamtanzahl aller Postings unterhalb des Hashtags zum jeweiligen Datum. 

#1 Basisabfragen

(a) Abfrage -> Anzahl: Datensätze

select count(*) from tags;

Ergebnis: 949.781.647

(b) Abfrage -> Anzahl: Datensätze / 2016

select count(*) from tags where datum like ‚%.2016%‘;

Ergebnis: 33.876.572

(c) Abfrage -> Alle Zeitstempel

select distinct datum from tags;

Ergebnis: 423, verteilt auf 2016, 2017, 2018

#2 Inhaltliche Abfragen

(a) Substrings

select * from tags where tag like ‚%leipzig%‘;

(b) Strings

select * from tags where tag = ‚berlin‘;

Für das Auslesen u. ggf. Interpretieren benötigt man eine geeignete Software (SQLite-Studio, Knime etc.). Die Datensätze sind aus 2016 bis 2018 und dienten während der Erhebung für Contentmarketingrecherchen und andere Aufgaben.

InstaLOC: Freigabe der ersten Themendatenbank (Home&Living)

Gestern veranlasste ich die Freigabe der ersten Datenbank, welche den DACH-Raum und Teile der EU nach den Themenwelten der Sparte „Home & Living“ abbildet.

Die Grunddaten der SQLite-Datei sind:

Speicher: ca. 5GB
Beiträge: 8.532.446
User_innen: 2.495.311
Locations: 473.903
Medienzeitstempel: 4.863.183

Interessierte Leser_innen des Arbeitsblogs können sich zu der Datenbank unter den folgenden Auszügen weitergehende Eindrücke verschaffen:

(1) Locationliste + Sum(Postings), unverschlüsselt
https://drive.google.com/open?id=18rVNt2zTfKBmUl606O-L1mMsExvhI4iH
(2) Locationliste + Sum(Likes), unverschlüsselt
https://drive.google.com/open?id=1S3QMkwyo82w3SkH7YhrlZoixZRNlsSiI
(3) Medienpostzeitstempel, unverschlüsselt
https://drive.google.com/open?id=1EtRVSRuFhI5oyE9s6KHBcGKrDF_ARMRv
(4) Tagwolkenliste, unverschlüsselt
https://drive.google.com/open?id=14tXw59I3ky7_bbQ5znG_D4dSGo0rYfkw

Hinweise:
Hinter den CSV-Dateien stehen entsprechende SQL-Statements, die in diesem Blog dokumentiert wurden und dokumentiert werden. Die Datensätze sind unkategorisiert und nicht interpretiert: sie befinden sich quasi in einem Rohdatenzustand.

Supportanfragen, Interpretationsanfragen oder Anfragen zur Strategieableitung bitte an:
Anne Lehmann: office(at)pontipix.de (Wobus & Lehmann GbR), Preisliste unter: https://www.pontimania.de/
Dr. Klaus Holthausen: https://www.linkedin.com/in/dr-klaus-holthausen-1464b043/

Freigabe: „socialtracker v.0.12“

Die aktuelle Version wurde im „Freigabestatus“ in die Dropbox geladen. Diese ist eine fehlerbereinigte Version und beinhaltet die folgenden (neuen) Features:

[Bitly-Statistik (Basis)]
Ich ging in einem der letzten Beiträge auf Bitly, die Bitly-API und deren Potentiale ein. Hier habe ich die Anbindung der Schnittstelle an das Modul „Social-Signals“ fertig gestellt. Es ist im entsprechenden Auswahlmenü zu finden und ergänzt die Ergebnisse der Social-Signals-Analyse um die verkürzten URLs (sofern vorhanden) und die Clicks über Diese.

[GPlaces und das API-Management]
Die aktuelle Version erlaubt die Benutzung mehrerer Google-Accounts bzw. deren APIs. Das Recherchemodul „Google-Places“ lässt sich nun über das Hauptmenü oder über die Tastenkombination [Strg]+[G] aktivieren: es verlangt die Eingabe einer Branchenbezeichnung und das Einladen einer Ortliste.