Datenfreigabe 3_3: Hashtagdatenbank (Quelle: Instagram – API)


(Hinweis: gepackt ca. 13GB, entpackt ca. 40GB)

Die DB-Tabelle beinhaltet folgende Spalten:

ID, Tag (Hashtag), Haeufung, Datum

Zur Erläuterung:

ID und Tag / Hashtag sind selbsterklärend. Die Häufung ist die ausgelesene Gesamtanzahl aller Postings unterhalb des Hashtags zum jeweiligen Datum. 

#1 Basisabfragen

(a) Abfrage -> Anzahl: Datensätze

select count(*) from tags;

Ergebnis: 949.781.647

(b) Abfrage -> Anzahl: Datensätze / 2016

select count(*) from tags where datum like ‚%.2016%‘;

Ergebnis: 33.876.572

(c) Abfrage -> Alle Zeitstempel

select distinct datum from tags;

Ergebnis: 423, verteilt auf 2016, 2017, 2018

#2 Inhaltliche Abfragen

(a) Substrings

select * from tags where tag like ‚%leipzig%‘;

(b) Strings

select * from tags where tag = ‚berlin‘;

Für das Auslesen u. ggf. Interpretieren benötigt man eine geeignete Software (SQLite-Studio, Knime etc.). Die Datensätze sind aus 2016 bis 2018 und dienten während der Erhebung für Contentmarketingrecherchen und andere Aufgaben.

Datenfreigabe 2_3 (Quelle: Postingelemente aus Instagram in Verbindung mit Locations)


Hinweis (1): 

Die Datenbank ist gepackt 13GB und entpackt 41GB.

Sie umfasst nur einen Teil unseres Datenbestands und ich gab hier eine zufällig ausgewählte Datenmenge je erfassten Länder frei. Technisch wurde der Datenübertrag über einen Zufallsgenerator gelöst, wobei hier kein Themenschwerpunkt gesetzt wurde. 

Die Freigabe erfolgte unter der Bedingung: die Datenbank darf ausschließlich für Weiterbildung- u. Ausbildungszwecke genutzt werden und bei Publikation erwarte ich selbstverständlich eine Namensnennung inkl. Link auf

Hinweis (2):

Die Datenquelle ist Instagram via Instagram-API in der jeweils gültigen Fassung unter Beachtung der jeweils aktiven Richtlinien. 

Die DB-Tabelle beinhaltet folgende Spalten:

id, url, tags, likes, comments, erstellzeit, contentinfo, country, country_code, city, county, state_district, suburb, city_district, pub, cafe, hotel, college, town_hall, florist, arts_centre, public_building, hospital, sport_centre, swimming_pool, travel_agency, community_centre, playground, clinic, books, pedestrian, chemist, car_wash, fort, golf_course, theme_park, water, castle, picnic_site, pharmacy, fast_food, track, garden, locality, residental, adress29, wood, retail, town, industrial, cycleway, village, guest_house, artwork, bus_stop, bar, bakery, fuel, zoo, car, university, neigbourhood, viewpoint, bank, stadium, hairdresser, place_of_worship, beach, mall, school, memorial, attraction, supermarket, footway, restaurant, theatre, parking, clothes, hamlet, raceway, aerodome, library, museum, commercial, ruins, building, PLZ, road

#1 Abfragebeispiele -> Bezug auf Land / Stadt etc. 

select * from locations where country_code = ‚de‘; 

select * from locations where country_code = ‚de‘ and city = ‚Berlin‘; 

select * from locations where country_code = ‚de‘ and city = ‚München‘; 

select * from locations where country_code = ‚de‘ and state = ‚Sachsen‘; 

select distinct country_code from locations;

select distinct city from locations where country_code = ‚de‘;

#2 Abfagebeispiele -> Bezug auf Locationtypen

select * from locations where country_code = ‚de‘ and restaurant <> “; 

select * from locations where country_code = ‚fr‘ and restaurant <> “

select * from locations where country_code = ‚us‘ and school <> “; 

#3 Abfragebeispiele -> Bezug auf Inhalte

select * from locations where country_code = ‚de‘ and school <> “ and contentinfo like ‚%1 person%‘

select * from locations where country_code = ‚de‘ and contentinfo like ‚%1 person%‘

select distinct(contentinfo) from locations where country_code = ‚de‘;

select distinct(tags) from locations where country_code = ‚de‘ and city = ‚Leipzig‘;

Weitere Abfragevarianten ergeben sich aus der Tabellenstruktur, den Spalten und der konkreten Fragestellung. Denkbar sind Verbindungen zwischen Tags, Taggruppen, den Bildinhalten („Contentinfo“) und konkreten Ländern. 

Datenfreigabe 1_3 (Quelle: Instagram-Locations mit Openstreetmap)


Hinweis (1): 

Die Datenbank ist gepackt 338MB und entpackt 818MB.

Die Freigabe erfolgte unter der Bedingung: die Datenbank darf ausschließlich für Weiterbildung- u. Ausbildungszwecke genutzt werden und bei Publikation erwarte ich selbstverständlich eine Namensnennung inkl. Link auf

Hinweis (2):

Die Haupt-Datenquelle ist Instagram via Instagram-API in der jeweils gültigen Fassung unter Beachtung der jeweils aktiven Richtlinien. 

Die DB-Tabelle beinhaltet folgende Spalten:

id, locations, lat, long, country, country_code, city, county, state_district, suburb, city_district, pub, cafe, hotel, college, town_hall, florist, arts_centre, public_building, hospital, sport_centre, swimming_pool, travel_agency, community_centre, playground, clinic, books, pedestrian, chemist, car_wash, fort, golf_course, theme_park, water, castle, picnic_site, pharmacy, fast_food, track, garden, locality, residental, adress29, wood, retail, town, industrial, cycleway, village, guest_house, artwork, bus_stop, bar, bakery, fuel, zoo, car, university, neigbourhood, viewpoint, bank, stadium, hairdresser, place_of_worship, beach, mall, school, memorial, attraction, supermarket, footway, restaurant, theatre, parking, clothes, hamlet, raceway, aerodome, library, museum, commercial, ruins, building, PLZ, road

#1 Abfragebeispiele -> Bezug auf Land / Stadt etc. 

select * from locations where country_code = ‚de‘; 

select * from locations where country_code = ‚de‘ and city = ‚Berlin‘; 

select * from locations where country_code = ‚de‘ and city = ‚München‘; 

select * from locations where country_code = ‚de‘ and state = ‚Sachsen‘; 

select distinct country_code from locations;

select distinct city from locations where country_code = ‚de‘;

#2 Abfagebeispiele -> Bezug auf Locationtypen

select * from locations where country_code = ‚de‘ and restaurant <> “; 

select * from locations where country_code = ‚fr‘ and restaurant <> “

select * from locations where country_code = ‚us‘ and school <> “; 

Weitere Abfragevarianten ergeben sich aus der Tabellenstruktur, den Spalten und der konkreten Fragestellung.