captcha image

A password will be e-mailed to you.

Ostatnie dni przynoszą serię sensacyjnych wiadomości na temat brytyjskiej firmy Cambridge Analityca i wycieku danych 50 mln użytkowników Facebooka. Polityczna afera Big Data Gate zaczyna przybierać niemal rozmiary pamiętnej Watergate. Wszystko kręci się wokół niezwykle sprytnych algorytmów, które na podstawie like’ów i naszych postów są w stanie powiedzieć o nas więcej, niż nasi najbliżsi.

Zacznę nie od nauki, ale od polityki, bo to ona uruchomia całą lawinę zdarzeń. W ostatnią sobotę brytyjski The Observer/Guardian opublikował rezultaty dziennikarskiego śledztwa w sprawie wpływu firmy Cambridge Analytica (CA) na kampanię wyborczą obecnego prezydenta USA, Donalda Trumpa. Tym razem nie były to już spekulacje (o czym za chwilę), ale konkrety. Źródłem brytyjskich dziennikarek był bowiem whistleblower Chris Wylie, który był szefem działu badań w CA (i pracownikiem University of Cambridge, co – jak zobaczycie – również jest istotne).

Wylie powiedział gazecie, że CA już w 2014 roku weszła bezprawnie w posiadanie danych milionów użytkowników Facebooka. Na ich podstawie stworzyła system, który najprawdopodobniej umożliwił wolontariuszom Trumpa przekonanie niezdecydowanych Amerykanów do zagłosowania na tego właśnie polityka.

W poniedziałek kolejne rewelacje pokazała, współpracująca z gazetą przy tej sprawie, telewizja Channel 4. W 19 minutowym materiale możemy zobaczyć dziennikarza, udającego członka bardzo zamożnego rodu ze Sri Lanki, który chce wpłynąć na wynik wyborów w swoim kraju. Nie byłoby w tym może nic wielkiego, gdyby nie rozmówcy: prezes CA Alexandre Nix czy Marki Turnbull, szefujący powiązanej z CA firmie Political Global, którzy mówią o możliwości profilowania wyborców, preparowaniu fakenewsów, zbieraniu haków na przeciwników politycznych, wysyłaniu podstawionych prostytutek, pewnym projekcie w Europie Wschodniej itd.

Cambridge Analityca prosto z University of Cambridge

Dziś cała sprawa wygląda na wielką bombę, która wybuchła nagle, ale de facto o CA było głośno już wcześniej. W grudniu 2016 roku Michał Kosiński na łamach szwajcarskiego Das Magazin oskarżał CA o kradzież jego algorytmu, który na podstawie facebookowych like’ów tworzył pięcioelementowy model psychologii osobowości Big Five*.

Dr Michał Kosiński. Źródło: Facebook

Jak pisaliśmy o tych badaniach rok temu „algorytm był w stanie ocenić osobowość badanego człowieka z większą dokładnością, niż zrobił to kolega z pracy, na podstawie zaledwie 10 polubień. Po przeanalizowaniu 70 lajków komputer był bardziej trafny w ocenie niż przyjaciele i współlokatorzy, a rodziców i rodzeństwo pokonywał przy 150 lajkach. Najtrudniej było prześcignąć współmałżonka, ale i to się udawało przy 300 polubieniach” (tu pełny tekst, a w nim link do testu).

Dziś Kosiński pracuje na Uniwersytecie Stanforda w Stanach Zjednoczonych, ale w latach 2010-2014 był zastępcą dyrektora Centrum Psychometrycznego na University of Cambridge. To właśnie tam opracowywał swoje oprogramowanie i to z tego uniwersytetu swoich pracowników rekrutowała, założona w 2013 roku, Cambridge Analityca.

O zbieranie danych bez wiedzy użytkowników Facebooka, posądzał CA jeszcze wcześniej, bo w grudniu 2015 The Guardian. Do dziś w archiwum gazety znajdziemy kolejne artykuły opatrzone takim oto zastrzeżeniem: This article is the subject of a legal complaint on behalf of Cambridge AnalyticaLLC and SCL Elections Limited [Ten artykuł jest przedmiotem skargi prawnej w imieniu Cambridge AnalyticaLLC i SCL Elections Limited}

Narzędzia analityczne z University of Cambridge. Fot. University of Cambridge

Narzędzia analityczne z University of Cambridge. Fot. University of Cambridge

Mikrotargetowanie behawioralne

W ubiegłym roku Alexander Tayler (Chieff Data Officer w CA) powiedział magazynowi CHIP, że Cambridge Analityca, posługując się metodami psychometrycznymi i cyfrowymi narzędziami, pomogła w kampanii Donalda Trumpa. Firma wykorzystała w tym celu „modele profilu psychologicznego każdego dorosłego konsumenta w USA”. Tyler opowiedział wtedy (CHIP 5/2017) magazynowi, że dane 220 milionów dorosłych Amerykanów zostały zgromadzone przez firmy zajmujące się data miningiem i udostępnione na zasadzie licencji CA, która połączyła je z własnymi algorytmami i za pomocą uczenia maszynowego opracowała portrety psychologiczne każdego obywatela.

Jak podał Das Magazin (polecam lekturę całości tekstu), CA podzieliła Amerykanów na 32 typy osobowości i skupiła się tylko na 17 stanach, w których wynik wyborów nie był przesądzony. Mając dane na temat preferencji politycznych, ulubionych marek samochodu czy stanu psychicznego, wolontariusze pukający do drzwi przyszłych wyborców Trumpa dość dokładnie wiedzieli, kto im otworzy drzwi i jak z nim należy rozmawiać, by daną osobę przekonać do swoich racji.

Mikrotargetowanie behawioralne, bo tak nazywa się ta technika, na wielką skalę było też wykorzystane do wyświetlania bardzo precyzyjnie „wycelowanych”, sponosorowanych postów na Facebooku. Nie chodziło w nich bynajmniej o prawdę, ale o argumenty, które przekonają jednych, a zniechęcą drugich. Podczas trzeciej debaty prezydenckiej pomiędzy Trumpem a Hillary Clinton, zespół Trumpa miał przetestować 175 000 różnych wariantów swoich argumentów. Wszystko po to, by różnicując m.in. kolor, wielkość czcionki czy układ słów najlepiej dotrzeć do użytkowników Facebooka.

thisisyourdigitallife

Czy rzeczywiście CA ukradła algorytm Kosińskiego? Nie mnie to oceniać, ale – jak czytamy w Das Magazin – na początku 2014 r. do Kosińskiego zgłosił się młody asystent z wydziału psychologii, Aleksander Kogan i powiedział, że pewna firma jest zainteresowana jego pomysłem i chciałaby uzyskać dostęp do bazy danych MyPersonality (zobaczcie nasz artykuł!). Kogan ponoć nic więcej nie chciał powiedzieć Kosińskiemu. Naukowiec po tym spotkaniu zapamiętał jednak nazwę firmy, która wysłała Kogana na rozmowę. Była nią SCL (Strategic Communication Laboratories), z której w 2013 roku odłączyła się CA.

Według ostatnich doniesień Observera, dane amerykańskich wyborców pochodziły od mołdawskiego naukowca, który stworzył aplikację thisisyourdigitallife. Ten człowiek nazywał się… Alexander Kogan. W owym czasie był pracownikiem University of Cambridge i równocześnie był też stypendystą rosyjskiego rządu oraz pracownikiem Petersburskiego Uniwersytetu Państwowego.

Facebookowa aplikacja stworzona przez Kogana na zlecenie jego własnej firmy Global Science Research i CA była w istocie quizem „osobowości”, za którego rozwiązanie każdy z użytkowników otrzymał 2-5 dolarów. Na udział w tym naukowym eksperymencie zdecydowało się ponad 320 tysięcy użytkowników, którzy zgodzili się rozwiązać quiz i dać dostęp do danych zgromadzonych na swoim profilu. Celem badania było znalezienie w zgromadzonym materiale (quiz, like’i, posty) powtarzających się wzorców osobowości.

Cała procedura zbierania danych była przeprowadzona jak najbardziej legalnie i w porozumieniu z Facebookiem. Celem tego quizu były przecież badania. Jednak, jak informuje Guardian, te dane następnie zostały powiązane przez algorytmy z innymi danymi wyborców i utworzyły bazę danych kluczowych 2 milionów osób w 11 najważniejszych dla kampanii Trumpa stanach.

Chris Wylie, który ujawnił aferę. Fot. YouTube/Channel 4

Chris Wylie, który ujawnił aferę. Fot. YouTube/Guardian

Po artykule Guardiana z 2015 roku, kiedy to pojawiły się pierwsze wątpliwości, Facebook zażądał usunięcia pozyskanej przez Kogana bazy danych, bo udostępnione rekordy „zostały uzyskane i wykorzystane bez zezwolenia oraz ponieważ GSR nie było upoważnione do udostępniania lub sprzedaży tych danych”. Jak widać, było to mało skuteczne działanie – dziennikarze wykazali, że kopie tej bazy wciąż są dostępne.

Jest to tym bardziej przerażające, że mechanizm płatnego pozyskiwania profili 320 000 Amerykanów w warunkach umowy zawierał zgodę na dostęp do kont ich facebookowych znajomych. Tym samym Cambridge Analityca otrzymała dostęp do ok. 50 milionów profili.

Ta sprawa, choć dopiero się rozwija, już ma poważne reminiscencje. Akcje Facebooka spadły o 7 procent. Wiele mówi się o poważnych obostrzeniach, jakimi może zostać obłożony społecznościowy gigant. Ale afera może mieć znacznie poważniejsze konsekwencje prawne i międzynarodowe. A nam powinna dać do myślenia. Zastanówcie się, ile razy zalogowaliście się gdzieś profilem facebookowym, ile razy daliście do tych danych dostęp grom czy aplikacjom typu “do jakiego konia jestem podobny”.

*Albo też OCEAN od anglojęzycznych cech opisujących ludzką osobowość: Openness, Conscientiousness, Extraversion, Agreeableness, Neuroticism.

Nie ma więcej wpisów