Projekt „Instagram, Interaktionen“ – Basisaccountanalyse(n)

Die Auswertungsanwendung verfügt nun über zwei Basisanalyseprozeduren. Diese sind:
Ausgabe der erfassten Likes zu einem bestimmten Accounts:

(1) Ergebnisse inkl. Tagclouds, Posturls, Postzeitpunkt und (beherzter) Influenceraccount
tg_05
tg_04
liberal
tg_03
tg_02
tg_01

(2) Ergebnisse inkl. beherzter Influencername und Aufsummierungen der Likes JE erfassten / beherzten Influencer
ta_06
ta_05
ta_04
ta_03
ta_02
ta_01

Diese Funktionen dienen einer ersten und sehr groben Erkenntnisgewinnung. Zu einem späteren Zeitpunkt werden die Prozeduren so zusammen gefasst, dass sich aus der Analyse eines Influencer (oder: Einsteiger)-accounts Likemuster der Interagierenden sichtbar machen lassen. Mir schwebt hierbei eine Influencer und / oder Tagcloudauflistung inkl. Gewichtung via Aufsummierung vor und ich muss hierzu noch einige Inspirationen suchen.

Projekt „Instagram, Interaktionen“ – Tagcloudanalysen

Die Abfrage für die nachfolgenden Datensätze ist:
select tagcloud, length(tagcloud), count(distinct(uid)), count(distinct(inflname)), count(distinct(postid)) from interakt where tagcloud like ''%'+abfrage+'%'' group by tagcloud;

Die aktuellen Ergebnisse beinhalten folgende Angaben:

(1) Tagcloud (tagcloud) (als substring)
(2) Zeichenkettenlänge der Tagcloud (length(tagcloud))
(3) Anzahl der Interaktionen // Anzahl der Interagierenden Accounts (count(distinct(uid))
(4) Anzahl der Influencer-Accounts (count(distinct(inflname))
(5) Anzahl der Postings (count(distinct(postid))

Alle Angaben verstehen sich als „je UNIQUE Tagcloud“ und DIE Tagcloud beschreibt die Tagsammlungen.

Beispieldatensätze (Excel, Download)
[Politik]
Download: christianlindner
Download: bundestagswahl
Download: bundestag
Download: dielinke

[Wohnung, Home & Living]
Download: badezimmer
Download: wohnzimmer
Download: kinderzimmer

[Städte]
Download: leipzig
Download: berlin

[Sonstiges]
Download: geschenk
Download: stricken

[Urlaub]
Download: urlaub
Download: strand
Download: meer

[Hinweise und allgemeine (!) Erklärungen]
Die Angabe zur Zeichenkettenlänge der jeweiligen Tagwolken liefert in Verbindung mit den Zahlen aus (3), (4) und (5) eine Interpretationsgrundlage für die Beantwortung folgender Fragen:
Wieviele Tags machen je Posting Sinn?
Welche Taghäufungen im Sinne der reinen Anzahl provozier(t)en wieviele Likes?
Exkludiert man nun besagte Zeichenkettenlänge aus der Datenbegutachtung, ergeben sich in Verbindung mit den Zahlen aus (3), (4) und (5) die Möglichkeit(en) zur Beantwortung folgender Fragen:
Welche Themen in Form der Tags „kommen an“?
Welche Themen in Form der Tags werden von wieviel Accounts wahrgenommen UND honoriert?
Welche Themen in Form der Tags werden von wieviel Accounts veröffentlicht?
Die Datensätze liefern einen relativ groben Überblick zu den gesuchten Themen. Sie geben analog zur genannten Abfrage keinerlei Auskunft zu den Postingzeiträumen und den konkreten Interagierenden / Influencern, da hier diese Angaben nicht mitgeliefert werden. Hier ist eine entsprechende Tiefenprüfung via erweiterter DB-Abfrage natürlich obligatorisch.

Anfragen, Nachfragen und generelle Gesprächsangebote bitte an office(at)pontipix.de.

Update – Instagrambot, Screening der Medien auf Interaktionen

Nach einigen Überlegungen habe ich mich dazu entschieden, die ausgegliederte Instagramrechercheanwendung zu beenden und sämtliche Algorithmen in den bestehenden Bot zu überführen. Der „Bot“ kann also nicht mehr als typischer Bot begriffen werden, da diese Software nun auch über eine stabile Recherche- und Auswertungsfunktionssammlung verfügt.

[Analyse und Auswertungen der Interaktionen auf einen beliebigen (öffentlichen) Account]

Die Umsetzung der Funktionen basiert auf den Gedanken, die ich in diesem Blog unter dem Aspekt „Influencersuche“ bereits beschrieben hatte und die veröffentlichte Galerie zeigt einen Ausschnitt aus der Bedienung.
Die entwickelten Prozeduren gehen nach folgendem Muster vor:

[Datensammeln]
(a) Recherche der IDs des interessanten Accounts
(b) Download: Medienverzeichnis des interessanten Accounts
(c) Schritt-für-Schritt-Analyse der gecrawlten Medien auf die Endpoints „Likes“ und „Comments“ auf Basis der Media-ID und Erfassung der interagierenden Accounts (Username, User-ID etc.)

[Datenaufbereitung]
(a) Aufsummierung der Likes JE identifizierten Account
(b) Aufsummierung der Likesummen nach folgendem Beispielen:
– 1000 Accounts haben 1 x geliked
– 400 Accounts haben 100 x geliked
– 10 Accounts haben 300 x geliked

Datenbeispiele zu Instagramaccount aus dem Bereich „Politik“:
Hinweis:
Sämtliche sensible Daten sind in den nachfolgenden Beispieldateien selbstverständlich codiert.
Rohdaten: cl_rohdaten_codiert.xlsx
Summierte Daten: cl_sumlikeslikers_codiert.xlsx
Zusammenfassung: cl_zfg.xlsx

Die erhobenen und aufbereiteten Datensätze erlauben nun einen tieferen Blick auf die Accounts. Hierbei lassen sich Antworten auf folgende Fragen interpretieren:
(a) Existiert ein Ungleichgewicht zwischen der Followeranzahl und der Anzahl der Interagierenden?
(b) Sind die Interagierenden besonders aktiv, weniger aktiv oder selten aktiv?

Die grob beschriebene Funktion wird ab sofort in das Dienstleistungsspektrum der Wobus & Lehmann GbR eingegliedert.

Habt Ihr weitere faszinierende Ideen? Ich freue mich auf Kommentare, eMails und nette Telefonate.