URL: https://www.pontipix.de/datenbank_downloads/hashtagdb_main.zip
(Hinweis: gepackt ca. 13GB, entpackt ca. 40GB)
Die DB-Tabelle beinhaltet folgende Spalten:
ID, Tag (Hashtag), Haeufung, Datum
Zur Erläuterung:
ID und Tag / Hashtag sind selbsterklärend. Die Häufung ist die ausgelesene Gesamtanzahl aller Postings unterhalb des Hashtags zum jeweiligen Datum.
#1 Basisabfragen
(a) Abfrage -> Anzahl: Datensätze
select count(*) from tags;
Ergebnis: 949.781.647
(b) Abfrage -> Anzahl: Datensätze / 2016
select count(*) from tags where datum like ‚%.2016%‘;
Ergebnis: 33.876.572
(c) Abfrage -> Alle Zeitstempel
select distinct datum from tags;
Ergebnis: 423, verteilt auf 2016, 2017, 2018
#2 Inhaltliche Abfragen
(a) Substrings
select * from tags where tag like ‚%leipzig%‘;
(b) Strings
select * from tags where tag = ‚berlin‘;
Für das Auslesen u. ggf. Interpretieren benötigt man eine geeignete Software (SQLite-Studio, Knime etc.). Die Datensätze sind aus 2016 bis 2018 und dienten während der Erhebung für Contentmarketingrecherchen und andere Aufgaben.