Autor: Luca Hammer

  • Geschlechterverhältnis von Facebookkommentaren analysieren

    Geschlechterverhältnis von Facebookkommentaren analysieren

    Als Ingrid Brodnig und ich den ersten Digitalreport über die politische Debatte auf Facebook, in Wien präsentiert haben, gab es eine Frage, ob wir uns auch die Genderverteilung angeschaut haben. Also wie viele Frauen, Männer und andere Gender an der Diskussion beteiligt sind. Das haben wir nicht getan. Jedenfalls nicht quantitativ. Ich habe jedoch angekündigt, dass ich mich damit beschäftigen werde.

    Direkt zum Tool.

    Ein Problem ist der Datenzugriff. Während es schon lange nicht mehr möglich ist auf die Daten von einzelnen Personen zuzugreifen, sind inzwischen auch die Namen von Personen, die auf Pages kommentieren nicht mehr über die API abrufbar. Nur noch der Kommentarinhalt. Auch ist es sehr schwer geworden überhaupt Zugriff auf die API zu bekommen. Bei privaten Inhalten kann ich das gut nachvollziehen, bei Dingen, die Teil der öffentlichen Debatte sind, und das sind Kommentare auf Pages, halte ich es für falsch. Sowohl von Wissenschaft als auch Journalismus gibt es Beschwerden.

    Nicht ideal, aber eine Lösung

    Ich habe eine mittelmäßige Lösung im Nutzungsbedingungengraubereich gefunden. Facebook verbietet eine automatisierte Sammlung von Daten, wenn sie es nicht erlauben. Damit fallen Scraper weg, die sich einloggen und Daten sammeln. Aber wenn ich mich als Nutzer_in einlogge und Inhalte kopiere, sollte das nicht unter automatisiert fallen. Vor allem wenn es nicht massenhaft passieren kann, sondern auf einzelne Beiträge beschränkt ist. Statt hundert Mal ctrl+c, ctrl+v zu drücken, habe ich etwas JavaScript erstellt, das zugleich verhindert, dass man mehr Daten als nötig sammelt und die Arbeit erleichtert. Die Daten wirft man dann in ein Formular und bekommt eine Auswertung zurück. Für die Nutzung ist jede_r selbst verantwortlich.

    Inspiriert ist das Ganze von proporti.onl welches mithilfe eines ähnlichen Mechanismus Twitter-Follower und Followings auswertet.

    Bookmarklets und Microsite

    Tatsächlich sind es zwei Bookmarklets. Eines, das alle Kommentare ausklappt, und eines, das die Vornamen der Kommentierenden kopiert. Das Erste ist nicht von mir, aber ich weiß derzeit nicht mehr, wo ich es gefunden habe. Ich glaube in einem Github Gist.

    Die Microsite ist auf Glitch gehostet, weil es derzeit wahrscheinlich die einfachste und angenehmste Art ist, solche Mini-Projekte zu entwickeln und anderen zur Verfügung zu stellen. Sourcecode ist öffentlich und jede_r kann es mit einem Klick Duplizieren und verändern. Oder Remixen wie wir früher gesagt haben.

    Entweder per Get-Request als URL-Parameter (wenn es unter 100 sind) oder per copy&paste werden die Vornamen an die Microsite übergeben. Diese schaut dann für jeden Namen in einer Liste nach, ob er eher als weiblich, männlich oder unisex eingestuft wird. Oder ob er unbekannt ist. Das ganze passiert mithilfe des Node Packages Gender-Detection. Schließlich wird ein einfaches Diagramm ausgegeben, das Anzahl und Verhältnis der Namen nach Gender ausgibt.

    Aufgrund dieser Funktionsteilung, einmal Sammeln, einmal Auswerten, ist es auch möglich Namen aus jeglichen anderen Bereichen in das Tool zu werfen, um eine Auswertung zu bekommen.

    Ungenauigkeit

    Natürlich ist eine Auswertung auf Basis von Vornamen ungenau. Es wäre fatal eine solche Methode zu nutzen, um auf das Gender einer einzelnen Person zu schließen. Um ein grobes Verhältnis zu bekommen, wer bei unterschiedlichen Beiträgen kommentiert, funktioniert es. Auch beim manuellen Überprüfen der Zuordnungen im Testlauf hat sich gezeigt, dass es nur wenige Fehler gibt. Besser als auf Twitter, weil dort öfter und oder wildere Pseudonyme genutzt werden.

    Eine weitere Ungenauigkeit kommt von Facebook, das nicht immer alle Kommentare lädt, dafür aber oft einzelne Kommentare des nächsten Beitrags anzeigt. Auch das ändert am Gesamtverhältnis nur wenig, wenn ausreichend Kommentare analysiert werden.

    Anleitung

    Ihr findet Bookmarklets und Microsite unter genderratio.glitch.me.

    1. Zuerst zieht ihr einfach beide oder alle drei Bookmarklets in eure Browserbookmarks. Am Handy funktioniert das alles leider nicht.
    2. Dann ruft ihr einen beliebigen Facebookbeitrag auf. Möglicherweise müsst ihr ihn in einem neuen Tab öffnen.
    3. Zuerst mit dem Expand All Bookmarklet die Kommentare ausklappen
    4. Dann entweder mit dem CommGendRatio die Namen direkt an das Tool schicken, falls es unter etwa 100 sind, oder mit NamesToClipboard die Namen in die Zwischenablage kopieren und dann selbst in das Tool einfügen
    5. Fertig.

  • Das Gehalt sollte nicht vom Wohnort abhängig sein

    Lino hat auf Twitter nach einem guten Mindestgehalt gefragt. Viele der Replies haben über die Lebenserhaltungskosten argumentiert. Dort ist der einflussreichste Faktor die Miete. Eine Person, die in einer teuren Gegend wohnt, sollte mehr bekommen als die Person, die in einer günstigeren Gegend wohnt. Ich finde das unfair und versuche hier meine Gedanken zu ordnen warum ich es so empfinde und was man dagegen oder stattdessen machen könnte.

    Ich bin in einem kleinen Dorf (<2k Einwohner_innen) in Tirol (teure Mieten dank Berge und Tourismus) aufgewachsen. Dann habe ich einige Jahre in Wien gelebt. 2-3M EW. Hohe Lebensqualität und verglichen mit anderen Großstädten annehmbare Mieten. Jetzt lebe ich wieder in einem kleinen Dorf (<10k EW) mit sehr günstigen Mieten. Wenn man etwas findet. Hier wird nicht mehr in Wohnungsbau investiert. Die Menschen wandern ab. Häuser gibt es einige zu kaufen. Wohnungsmarkt quasi nicht existent. Ohne Auto ist die Bewegungsfreiheit stark eingeschränkt. Veranstaltungen beschränken sich auf die SMS-Vereine (Sport, Musik, Schützen). Derzeit bin ich selbständig. Die meisten meiner Kund_innen sitzen in Großstädten. Verglichen mit jemanden der in Hamburg oder München lebt, habe ich sehr niedrige Lebenserhaltungskosten. Aber auch weniger Möglichkeiten. Kino? Erstmal in die nächste Stadt fahren. Essen gehen? Hahahaha. Wir haben eine tolle Dönerbude. Und zwei Pizzerien. Also in die nächste Stadt fahren. Die nächste Stadt ist Paderborn. Nicht unbedingt das Zentrum der Welt („Mit Kirche, Fußball, Schützenfest sich Paderborn beschreiben lässt.“). Zwei bis drei Stunden weiter sind Hannover und Köln. Außer Reichweite an Arbeitstagen.

    Warum ich nicht einfach wegziehe? Weil mir die niedrigen Lebenserhaltungskosten ermöglichen mehr Zeit mit meiner Familie zu verbringen oder wenn ich das nicht tue, Geld zur Seite zu legen. Auch sind Luft- und Wasserqualität recht gut. Ich bin in fünf Minuten im Wald. Das Internet leistet mir Gesellschaft. Es gibt Kindergartenplätze.

    Ich nehme einen niedrigeren Lebensstandard in Kauf, um mehr Zeit/Geld zur Verfügung zu haben. Beeinflussen die Lebenserhaltungskosten das Gehalt, würde diese Entscheidung bestraft werden.

    Bei Buffer passiert genau das. Es gibt bis zu 15% weniger Gehalt, wenn man an einem Ort mit niedrigen Lebenserhaltungskosten lebt.

    Der Vorschlag den Lebensstandard mit-einzubeziehen würde dem entgegenwirken. Das halte ich jedoch für unrealistisch. Weil es zu viele Faktoren sind, für die es oft keine Datengrundlage gibt. Das Unternehmen würde darüber entscheiden, was den Lebensstandard beeinflusst. Bekomme ich mehr Geld, weil es kein Kino/Kindergarten/Theater/Fortbildungsmöglichkeit in meiner Umgebung gibt? Weil die Dinge teurer sind? Was wenn mich das alles nicht interessiert oder bewusst dagegen entschieden habe?

    Faktoren aus anderen Vorschlägen, kann ich mehr abgewinnen.

    Ich würde für 15% mehr Gehalt nicht in eine teure Gegend ziehen. Würde mich aber trotzdem ungerecht behandelt fühlen.

    Ich frage mich, ob individuelle Wohnkostenzuschüsse einen Unterschied machen würden. Aber auf welcher Basis? Ich möchte mein NYC Loft nicht aufgeben?

    Am Land bräuchte ich mehr Geld, um die gleichen Dinge zu machen, wie jemand in der Stadt. Stattdessen bekäme ich weniger.

    Die ganze Diskussion ist natürlich total abgehoben. Ich schreibe über remote-fähige Jobs für Personen, die ziemlich frei zwischen Selbständigen- und Angestelltenverhältnis wählen können. Entsprechend gibt es auch beim Gehalt ein Konkurrenzverhältnis zwischen den beiden.

    Ich befürworte ein Mindestgehalt, das sich an den Lebenserhaltungskosten (2x?) orientiert und entsprechend jährlich angehoben wird. Aber nicht für den spezifischen Wohnort der Arbeitnehmer_innen angepasst, sondern für alle gleich. Mit zusätzliche Unterstützung für abhängige Personen und Home-Office/Pendel/etc..

  • Podiumsdiskussion mit Nhi Le und Shahak Shapira zu Hass im Netz

    Podiumsdiskussion mit Nhi Le und Shahak Shapira zu Hass im Netz

    Am 5. März habe ich per Email eine Einladung zu einer Podiumsdiskussion im Rahmen der langen Nacht der ZEIT bekommen. Nach einem Telefonat und einigen Emails hat diese am 14. April 2018 in Hamburg stattgefunden.

    Ihr könnt die Aufzeichnung von „Was macht der Hass im Netz mit uns“ online nachschauen.

    Foto ©Felix Matthies

  • Unterschied: Meine Daten und Daten über mich

    Mark Zuckerberg, der CEO von Facebook, wurde vom US-Kongress zu Cambridge Analytica und verwandten Themen befragt (5 Stunden Video auf YouTube). Die Hälfte habe ich selbst geschaut, den Rest über Twitter verfolgt. Wie Zeynep zuvor schrieb, gab es wenig neue Informationen von Mark. Falls die USA sich zu einer Regulierung von Facebook entscheiden, gehe ich davon aus, dass sie weniger streng ausfallen wird als die GDPR/DSGVO in der EU. Ich möchte auf einen Teilaspekt der Diskussion eingehen, der mich bei der Befragung wieder beschäftigt hat.

    Der Kongress ist mehrmals auf die Nutzungsbedingungen eingegangen, dass sie nicht vollständig seien, dass es niemand versteht, dass es niemand liest. Mark hat zugestimmt und argumentiert, dass Facebook deshalb viele Privacy-Optionen direkt im Produkt hat, sodass man es nicht nur bei der Nutzung sieht sondern auch direkt anpassen kann. Und das stimmt auch. Man kann bei jedem Posting einstellen, für wen es sichtbar ist. Zusätzlich gibt es weitere Einstellungen, wo man ebenfalls Sichtbarkeit von Bereichen auf dem Profil oder auch welche Daten an Apps weitergegeben einstellen kann. Ich bin der Meinung, dass Facebook mir von allen Plattformen am meisten Kontrolle über MEINE Daten gibt. Ja, es ist im Detail komplex und es gibt Probleme, wenn die Optionen verändert werden, aber man hat viel Kontrolle, wenn man sich damit beschäftigt. Ich kann entscheiden, ob ich MEINE Daten auf Facebook stellen möchte und wer sie sehen darf.

    Für mich sind das Problem die Daten ÜBER MICH. Diese kommen auf unterschiedliche Weise zusammen und ich habe nahezu keine Kontrolle darüber. Diese Daten ÜBER MICH werden dazu genutzt Werbung zielgerichtet auszuspielen. Könnten aber auch missbraucht werden. Etwa durch einen Hackerangriff (bei Facebook unwahrscheinlich), Missbrauch durch Mitarbeiter_innen (auch unwahrscheinlich), Verkauf der Daten (dafür müsste Facebook kurz vor dem Konkurs stehen) oder durch eine staatliche Maßnahme (passiert öfters).

    Die Daten ÜBER MICH werden etwa von MEINEN Daten abgeleitet. Wenn ich über ein bestimmtes Thema einen Post schreibe oder eine Page like, geht Facebook davon aus, dass ich mich dafür interessiere und Werbetreibende können mir darauf basierend Werbung ausspielen. Bei den Privacy-Optionen von MEINEN DATEN habe ich aber gar keine Möglichkeit einzustellen, ob der Inhalt dafür genutzt werden darf. Selbst Beiträge, die ich nur für mich selbst poste können dafür herangezogen werden. Oder Nachrichten, die ich an Freunde schicke. Die Werbetreibenden bekommen MEINE Daten nicht direkt, lediglich die abgeleiteten Daten ÜBER MICH. Und auch dann können sie oft keinen direkten Rückschluss drauf ziehen aufgrund welchem Datum ÜBER MICH ich ihre Werbung geklickt habe.

    In die Daten ÜBER MICH fließen weitere Daten. Die Orte an denen ich mich aufhalte (Facebook versucht abzuleiten, wo ich wohne und wohin ich reise), die Websites, die ich besuche, die Apps, die ich nutze und DATEN ÜBER MICH, die Werbetreibende auf Facebook laden. Das kann Name, Mailadresse, Telefonnummer oder ähnliches sein. Oder auch die IP-Adresse, die Facebook direkt über den sogenannten Facebook-Pixel erfasst. Diese Daten werden dann mit mir gematcht, sodass Werbetreibende mich immer und immer wieder mit Werbung bespielen können. Als Custom Audience wird das bezeichnet.

    Facebook gibt mir ein bisschen Kontrolle bei den Daten ÜBER MICH. Sie sagen mir nicht welche einzelne Daten sie haben, sondern nur welche Interessen sie davon abgeleitet haben und geben mir die Möglichkeit diese zu entfernen. Das ist besser als viele andere Plattformen, aber reicht mir noch nicht. Man kann sich die abgeleiteten Interessen in den Ad Preferences anschauen. Dort kann man auch bestimmte Bereiche komplett ausschalten. Etwa dass man außerhalb von Facebook keine interessensbasierte Werbung bekommt oder dass der Beziehungsstatus nicht dafür genutzt werden darf. Auch die Interessen basierend auf den besuchten Websites lassen sich hier abdrehen. Bei mir basieren die meisten Interessen auf gelikten Pages und geklickten Ads. Es gibt aber auch Zuschreibungen, bei denen nicht erklärt wird, warum sie da sind. Bei mir etwa „Away from family“.

    Diese ganzen Optionen bei den Daten ÜBER MICH sind super. Aber leider erst im Nachhinein. Erstmal wird alles getrackt, ob man möchte oder nicht. Auf und abseits der Plattform. Und das Tracking hört auch nicht auf, wenn man alles abdreht. Komplett abdrehen ist auch nicht möglich, nur bestimmte Bereiche. Und das halte ich für ein Problem.

    Ich würde mich freuen, wenn in zukünftigen Diskussionen zwischen Daten, die man bewusst zur Verfügung stellt und Daten, die ungewollt über unser gesammelt werden unterschieden wird.

  • Interview für ARD Politikmagazin Kontraste zu rechten Aktivisten auf Twitter

    Am 19. Februar habe ich eine Email von einem ARD-Redakteur bekommen. Er bat um ein Telefonat zu meiner Auswertung zu den Twitteraktivitäten rund um den ARD Film Aufbruch ins Ungewisse. Die Analyse habe ich gemeinsam mit Laura Lucas für Übermedien gemacht. Das Telefonat fand am folgenden Tag statt, in dem ich erklärt habe, wie ich bei der Auswertung vorgegangen bin und was wird dabei herausgefunden haben. Am Ende wurde ich gefragt, ob ich die gleichen Dinge wie im Telefonat auch vor der Kamera sagen würde. Das konnte ich bejahen. Dann gab es noch den Hinweis, dass es nicht sicher sei, dass sie mich interviewen wollen, aber sie würden sich in Kürze nochmals melden. Nach dem Telefonat habe ich mich nochmals mit den Daten beschäftigt und dem Redaktuer ein vierseitiges PDF mit zusätzlichen Auswertungen geschickt, über die wir gesprochen haben. Etwa dass die 6% als Reconquista Germanica zugeordneten Accounts während der Ausstrahlung für 20% der Tweets und 30% der Retweets verantwortlich waren.

    BR Data hat sich alle Tatorte im Jahr 2016 angesehen. Im Schnitt hatten sie jeweils knapp 10 000
    Tweets. Ich bin mir nicht sicher, ob hier nur Tweets oder auch Retweets gezählt werden.
    Normalerweise wird beides zusammengezählt. Meiste Tweets an einem Abend: 20 557, am
    wenigsten: 2 870. http://web.br.de/interaktiv/tatort/

    Mit etwa 13 000 Tweets wäre #Aufbruch also ein durchschnittlicher Tatort.

    Zwei Stunden Dreh

    Am Nachmittag kam kam dann die Info, dass man schon am nächsten Tag bei mir vorbeikommen möchte. Ursprünglich als eine halbe Stunde angesetzt, hat es am Ende über zwei gedauert. Aufbau der Technik und Wiederholungen der einzelnen Aufnahmen. Im Gegensatz zu bisherigen Interviews wurde mehr Wert auf präzise und kompakte Aussagen gelegt. Ich tendiere dazu Hintegrundinformationen hinzuzufügen, sodass meine Antworten ausfranzen.

    Der grundsätzliche Inhalt für das Interview war durch das vorherige Telefonat schon klar. Während dem Interview wurde mir grob der Aufbau des Beitrags erklärt und es wurden zwei Möglichkeiten gefilmt, weil man noch nicht wusste, wie die restlichen Aufnahmen ablaufen würden. Dabei ging es nicht, um eine Beeinflussung des Inhalts. Dieser wurde durch die vorherige Recherche eingeschränkt. Bei dem Interview ging es darum, die recherchierten Informationen in ein passendes Format für das Publikum zu packen. Die eine Version ging davon aus, dass im Beitrag erst später auf Reconquista Germanica eingegangen wird, ich sprach also von einer kleinen Gruppe von Accounts. Bei der zweiten Version ist man davon ausgegangen, dass Reconquista Germanica schon zuvor gezeigt wurde. Ich nannte sie also beim Namen.

    Von dem vermutlich eine Stunde langem Material haben es 30 Sekunden in den siebenminütigen Beitrag geschafft.


    YouTube-Mirror

    Kritik am Beitrag

    Es ist immer schwierig komplexe Themen in einem kurzen Beitrag so zu vermitteln, sodass die Zuseher_innen, die noch nie etwas damit zu tun haben, sie verstehen und zugleich alles korrekt dargestellt wird. Insgesamt finde ich den Kontraste-Beitrag gelungen.

    Problematisch finde ich die Stelle, bei der man die Aussage von @darksideofkek, dass man gute Kontakte zu Russland pflegen würde, so stehen lässt und dann noch verstärkt indem man fragt, ob russische Stellen über Reconquista versucht haben den Wahlkampf zu beeinflussen und Anfragen dazu unbeantwortet blieben. Das Narrativ der „russischen Trolle“ verschiebt die Verantwortung ins ungewisse Fremde und erstellt einen Goliath, den es nicht gibt. Schaut man sich die Dynamiken auf dem Discord-Server sowie auf Twitter an, ist das eine Gruppe von Deutschen, die mehrere Fake-Accounts betreiben. Teilweise arbeitete man mit internationalen Rechten zusammen, was im Umfeld der Identitären nichts neues ist. Aktionen werden gegenseitig durch Tweets und Retweets verstärkt. Da braucht es keine verborgenen Fadenzieher.

    Mich interessiert, wie bewusst Rechten auf Twitter die Dynamiken sind. Dass viele Aktionen von einer kleinen Gruppe initiiert werden. AfD-Politiker_innen behaupten gerne, dass die stille Mehrheit hinter ihnen steht. Auf Twitter ist sie plötzlich laut und das gibt ihnen das Gefühl, dass da wirklich was dran ist. Und dann sind es doch nur Fake-Accounts. (Ich zweifle nicht daran, dass viele Menschen menschenverachtende Einstellungen haben und viele dies auf Twitter zum Ausdruck bringen. Aber es ist nicht die Mehrheit.)