Osaczeni przez liczby. O algorytmach, które kontrolują nasze życie. Od Facebooka i Googla po fake newsy i bańki filtrujące - David Sumpter - ebook

Osaczeni przez liczby. O algorytmach, które kontrolują nasze życie. Od Facebooka i Googla po fake newsy i bańki filtrujące ebook

David Sumpter

4,0

Opis

Czym była Cambridge Analytica i co zrobiła z naszymi danymi? Jak Facebook tworzy 100-wymiarowy obraz twojej osobowości? Czy algorytmy Google są rasistowskie i seksistowskie? Co czeka nas w przyszłości, jeśli będziemy pozwalać maszynom podejmować za nas decyzje?

Rozwój technologiczny, stale zwiększająca się zależność ludzi od komputerów i Internetu otworzyły przed matematykami i analitykami danych okno, przez które mogą wejrzeć w nasze życie. Wykorzystując stale zbierane dane o tym, dokąd podróżujemy, gdzie robimy zakupy, jakie są nasze poglądy, orientacja seksualna, czy preferencje polityczne, mogą zmieniać nasze przyzwyczajenia i coraz bardziej przenosić ciężar podejmowanych przez nas decyzji na…algorytmy. Afera Cambridge Analytica udowodniła, że algorytmy sterują nie tylko jednostkami, lecz całymi społeczeństwami.

David Sumpter sprawdza, czy i w jakim stopniu matematyka przekracza niebezpieczne granice, ingerując w podejmowane przez nas decyzje. Opisuje techniki statystyczne i dostarcza rzeczywiste przykłady ich działania.

Afera Cambridge Analytica. Facebook wybrał Amerykanom prezydenta. Czy nam też wybierze? - „Gazeta Wyborcza”

Podczas gdy miliony powoli uświadamiają sobie niebezpieczeństwo związane z przekazywaniem swoich danych cyfrowych, Sumpter rzuca nowe światło na to, jak alchemicy danych starają się przekonywać i przewidywać nas samych i czy ich algorytmy rzeczywiście są tak fantastyczne jak się uważa - „Financial Times”

Ebooka przeczytasz w aplikacjach Legimi na:

Androidzie
iOS
czytnikach certyfikowanych
przez Legimi
czytnikach Kindle™
(dla wybranych pakietów)
Windows
10
Windows
Phone

Liczba stron: 350

Odsłuch ebooka (TTS) dostepny w abonamencie „ebooki+audiobooki bez limitu” w aplikacjach Legimi na:

Androidzie
iOS
Oceny
4,0 (22 oceny)
5
12
4
1
0
Więcej informacji
Więcej informacji
Legimi nie weryfikuje, czy opinie pochodzą od konsumentów, którzy nabyli lub czytali/słuchali daną pozycję, ale usuwa fałszywe opinie, jeśli je wykryje.
Sortuj według:
opson

Dobrze spędzony czas

Fajna książka ale już trochę przestarzała jeśli chodzi o np wątki AI
00
AStrach

Nie oderwiesz się od lektury

Ciekawa i pełna spraw o których nie miałem pojęcia w zakresie matematyki. Polecam !
00

Popularność




© Copyright by Copernicus Center Press, 2019 © David Sumpter, 2018 together with the following acknowledgment: This translation of Outnumbered is published by Copernicus Center Press Sp. z o.o.by arrangement with Bloomsbury Publishing Plc and Macadamia Literary Agency, Warsaw.
Tytuł oryginalnyOutnumbered. From Facebook and Google to Fake News and Filter-bubbles – The Algorithms That Control Our Lives
Adiustacja i korektaMirosław Ruszkiewicz
Projekt okładkiBartłomiej Drążkiewicz
SkładMELES-DESIGN
ISBN 978-83-7886-458-5
Wydanie I
Kraków 2019
Copernicus Center Press Sp. z o.o. pl. Szczepański 8, 31-011 Kraków tel. (+48) 12 448 14 12, 500 839 467 e-mail: [email protected] Księgarnia internetowa: http://ccpress.pl
Konwersja: eLitera s.c.

Część pierwsza

Analiza

Rozdział pierwszy

Poszukiwanie Banksy’ego

W  marcu 2016 roku trzej badacze z Londynu wraz z kryminologiem z Teksasu opublikowali artykuł naukowy w periodyku „Journal of Spatial Science”. Zaprezentowane przez nich metody były skostniałe i naukowe, ale sam artykuł nie stanowił tylko abstrakcyjnego, akademickiego wywodu. W jego tytule wyraźnie wybrzmiewał cel: Lokalizowanie Banksy’ego: wykorzystanie profilowania geograficznego do badania tajemnicy sztuki współczesnej. Chodziło o zastosowanie matematyki do zlokalizowania najsłynniejszego na świecie artysty graffiti.

Badacze wykorzystali stronę internetową Banksy’ego do ustalenia położenia jego dzieł ulicznych. Następnie, wyposażeni w rejestrator GPS, systematycznie odwiedzali każdą z jego prac, zarówno w Londynie, jak i w Bristolu, z którego Banksy pochodzi. Po zebraniu danych stworzyli mapę cieplną, na której cieplejsze obszary wskazywały punkty, gdzie prawdopodobieństwo zamieszkania Banksy’ego było większe przy założeniu, że tworzył swoje prace w pobliżu miejsca zamieszkania.

Najgorętsze miejsce na mapie geoprofilowej Londynu znajdowało się jedynie 500 metrów od dawnego adresu dziewczyny jednej z osób, która kiedyś była podejrzewana o to, że jest Banksym. Na mapie Bristolu barwy były najcieplejsze w pobliżu domu, w którym żyła ta osoba, oraz w pobliżu boiska piłkarskiego drużyny, w której grała. W ten sposób sprofilowana osoba, według autorów artykułu, najprawdopodobniej była Banksym.

Czytając ten tekst, w pierwszej chwili odczuwałem mieszankę zainteresowania i zazdrości, którą czuje większość akademików, gdy ich koledzy zrobią coś sprytnego. Tutaj był to bardzo dobry wybór zastosowania. Była to dokładnie taka matematyka stosowana, jaką chciałbym uprawiać: dobre wykonanie z wisienką na torcie, która pobudza wyobraźnię. Żałowałem, że sam tego nie dokonałem.

Jednak czytając dalej, poczułem lekką irytację. Lubię Banksy’ego. Album z jego obrazami i cytatami leży nawet na moim stoliku w salonie. Łażę bocznymi uliczkami różnych miast, poszukując jego murali. Do śmiechu doprowadza mnie film, na którym jego cennych prac nie udaje się sprzedać na stoisku w nowojorskim Central Parku. Jego dzieła na Zachodnim Brzegu oraz w obozach migrantów w Calais przypominają mi o mojej własnej uprzywilejowanej pozycji w społeczeństwie. Nie chcę, żeby jacyś pozbawieni emocji badacze wykorzystywali swoje algorytmy do tego, by powiedzieć mi, kim jest Banksy. Przecież cały czar Banksy’ego polega na tym, że przemyka niezauważony pod osłoną nocy, aby w porannym świetle jego sztuka odkrywała przed nami hipokryzję naszego społeczeństwa.

Matematyka niszczy sztukę: chłodna, logiczna statystyka ścigająca zakapturzonych bojowników o wolność po bocznych uliczkach Londynu. To po prostu nie w porządku. To policja i tabloidy powinny poszukiwać Banksy’ego, a nie liberalni akademicy. Za kogo te gnojki się uważają?

Przeczytałem ten artykuł o Banksym na kilka tygodni przed datą publikacji mojej własnej książki Piłkomatyka. Pisząc książkę o piłce nożnej, chciałem zabrać czytelników w matematyczną podróż po tej wspaniałej grze. Chciałem wykazać, że struktura i wzory leżące u podstaw piłki nożnej były pełne matematyki.

Kiedy książka ukazała się na rynku, towarzyszyło jej spore zainteresowanie ze strony mediów i praktycznie codziennie pojawiały się nowe prośby o wywiad. W dużej mierze dziennikarze byli równie zafascynowani matematyczną piłką nożną jak ja, ale jedno niepokojące pytanie padało niemal za każdym razem. Pytanie, na które według dziennikarzy odpowiedź chcieliby poznać ich czytelnicy: „Czy uważa pan, że liczby odzierają grę z pasji?”.

„Oczywiście, że nie!” – odpowiadałem z oburzeniem. Każdemu tłumaczyłem, że w potężnej świątyni piłki nożnej jest miejsce zarówno na logiczną myśl, jak i na pasję.

Ale czy matematyczne odczarowywanie nie odarło sztuki Banksy’ego z części tajemniczości? Czy cynicznie nie robiłem tego samego z piłką nożną? Może robiłem fanom piłki nożnej dokładnie to samo, co statystycy przestrzenni czynili sztuce ulicznego graffiti?

Jeszcze w tym samym miesiącu zostałem zaproszony do londyńskiej siedziby głównej Google’a, aby opowiedzieć o Piłkomatyce. Wykład został zaaranżowany przez Rebeccę, publicystkę, i oboje mieliśmy nadzieję, że uda nam się rozejrzeć po dziale badawczym Google’a.

Nie rozczarowaliśmy się. Ich biuro znajdowało się pod dobrym adresem na Buckingham Palace Road, gdzie w lobby stały duże budowle z klocków Lego oraz lodówki wypełnione zdrowymi napojami i superjedzeniem. „Googlerzy”, jak na siebie mówili, wyraźnie byli bardzo dumni ze swojego otoczenia.

Zapytałem kilku googlerów, czym się teraz zajmuje ich firma. Usłyszałem o autonomicznych samochodach, Google Glass i soczewkach kontaktowych, dronach dostarczających paczki pod same drzwi oraz o pomyśle wszczepiania nanocząstek do naszych organizmów w celu wykrywania chorób, i chciałem poznać trochę plotek.

Jednak googlerzy byli nieufni. Po serii niepochlebnych artykułów o tym, jak ich firma staje się przesadnie kreatywnym hubem szalonych pomysłów, polityka Google’a nakazywała ograniczyć ilość informacji o planach firmy przekazywanych na zewnątrz. Dyrektorem zaawansowanych projektów technologicznych Google’a była w tym czasie Regina Dugan, która wcześniej to samo stanowisko zajmowała w Agencji Zaawansowanych Projektów Badawczych w Obszarze Obronności (DARPA) należącej do amerykańskiego rządu. Wdrożyła ona w Google’u zasady „koniecznej wiedzy” w zakresie dzielenia się informacjami. Dział badawczy składał się teraz z małych jednostek, z których każda pracowała nad swoim własnym projektem i dzieliła się pomysłami i danymi wewnątrz określonej grupy[1].

Po kilku dodatkowych pytaniach jeden z googlerów w końcu wspomniał o projekcie. „Słyszałem, że wykorzystujemy DeepMind do przyglądania się diagnostyce medycznej niewydolności nerek” – powiedział.

Plan obejmował zastosowanie nauczania maszynowego do poszukiwania w chorobie nerek schematów, których lekarze nie dostrzegali. DeepMind w tym przypadku to oddział Google’a, który zaprogramował komputer do tego, aby stał się najlepszym graczem w go na świecie i wyszkolił algorytm w grze w Space Invaders oraz kilku innych starych grach komputerowych. Teraz algorytm przeszukiwałby bazę danych pacjentów brytyjskiej służby zdrowia, poszukując w nich schematów pojawiania się chorób. DeepMind miałby się stać inteligentnym obliczeniowym asystentem lekarzy.

Tak samo jak wtedy, gdy po raz pierwszy czytałem artykuł o Banksym, poczułem ukłucie zazdrości, ale pełne podekscytowania, chęci znalezienia się wśród tych googlerów: aby także mieć szansę odkrywać choroby i naprawiać służbę zdrowia za pomocą algorytmów. Wyobraź sobie posiadanie zasobów finansowych i danych pozwalających na zrealizowanie takiego projektu i ratowanie życia dzięki matematyce.

Rebecca nie była aż tak zachwycona. „Jakoś nie chciałabym, aby Google miał dostęp do wszystkich moich danych medycznych – powiedziała. – Trochę niepokoi mnie to, jak można wykorzystać te informacje wraz z innymi danymi osobistymi”.

Jej reakcja sprawiła, że zastanowiłem się nad tym jeszcze raz. Kompleksowe bazy danych dotyczących zdrowia i stylu życia rozrastają się szybciej niż kiedykolwiek wcześniej. Choć Google przestrzegał surowych zasad ochrony danych, możliwości wciąż istniały. W przyszłości społeczeństwo może wymagać, żebyśmy połączyli nasze wyszukiwarki, media społecznościowe i dane o zdrowiu, by otrzymać pełen obraz tego, kim jesteśmy i dlaczego chorujemy.

Przed moją prezentacją nie mieliśmy zbyt dużo czasu na dyskusję o zaletach i wadach badań medycznych opartych na danych, a gdy już zacząłem mówić o piłce nożnej, szybko zapomniałem o całej sprawie. Googlerzy byli zafascynowani tematem i zasypali mnie mnóstwem pytań. Co ostatnio się dzieje w technologii najnowocześniejszych kamer śledzących ruch? Czy menedżerów piłkarskich można zastąpić technikami nauczania maszynowego, które stopniowo będą udoskonalały taktykę? Pojawiały się też pytania techniczne o zbieranie danych i piłkę nożną dla robotów.

Żaden z tych googlerów nie zapytał mnie, czy uważam, że wszystkie te dane odzierają grę z duszy. Zapewne z przyjemnością podłączyliby wszystkim zawodnikom urządzenia bezustannie monitorujące zdrowie i odżywianie, aby otrzymać pełen obraz ich poziomu sprawności. Im więcej danych, tym lepiej.

Mogę zrozumieć tych googlerów, tak jak i mogę zrozumieć statystyków od Banksy’ego. Świetnie byłoby mieć całą bazę danych pacjentów brytyjskiej służby zdrowia na komputerze albo mieć możliwość lokalizowania „przestępców” za pomocą statystyki przestrzennej. W Londynie i Berlinie, w Nowym Jorku i Kalifornii, w Szanghaju i Tokio fani matematyki tacy jak my zbierają i analizują dane. Tworzymy algorytmy do rozpoznawania twarzy, do rozumienia języka i do uczenia się naszych gustów muzycznych. Budujemy asystentów osobistych oraz chatboty, które mogą pomóc ci naprawić twój komputer. Przewidujemy wyniki wyborów i wydarzeń sportowych. Znajdujemy idealnych partnerów dla osób samotnych albo pomagamy im w przeglądaniu wszelkich dostępnych alternatyw. Staramy się dostarczyć ci wszystkie najodpowiedniejsze informacje na Facebooku i Twitterze. Dbamy o to, abyś dowiedział się o wszystkich najlepszych ofertach wakacyjnych i tanich lotach. Naszym celem jest wykorzystanie danych i algorytmów do czynienia dobra.

Ale czy to jest aż tak proste? Czy matematycy sprawiają, że świat jest lepszy? Moja reakcja na ujawnienie Banksy’ego, reakcja dziennikarzy piłkarskich na moje modele opisane w Piłkomatyce oraz reakcja Rebecki na wykorzystanie przez Google’a danych medycznych nie są nietypowe i nieuzasadnione. To są bardzo naturalne reakcje. Algorytmy wszędzie wykorzystywane są do tego, aby pomóc nam zrozumieć świat. Ale czy naprawdę chcemy zrozumieć lepiej świat, jeżeli oznacza to rozłożenie na czynniki rzeczy, które kochamy, oraz utratę naszej osobistej integralności? Czy opracowywane przez nas algorytmy robią to, co społeczeństwo chce zrobić, czy służą tylko interesom kilku geeków oraz międzynarodowych firm, które z nich korzystają? Czy w końcu istnieje ryzyko, że wraz z rozwojem coraz lepszej sztucznej inteligencji (AI) algorytmy zaczną zajmować nasze miejsce? Że matematyka zacznie podejmować decyzje za nas?

Sposób, w jaki rzeczywisty świat i matematyka ze sobą oddziałują, nigdy nie jest jednoznaczny. Wszyscy, w tym i ja, czasami wpadają w pułapkę postrzegania matematyki jako przekręcania wajchy w celu otrzymania wyników. Specjaliści od matematyki stosowanej są wyszkoleni w obserwowaniu świata pod kątem cyklu modelowania. Cykl zaczyna się, gdy konsumenci w świecie rzeczywistym przedstawiają nam problem, który chcą rozwiązać – czy to odnalezienie Banksy’ego, czy zaprojektowanie wyszukiwarki online. Bierzemy wtedy nasz zestaw narzędzi matematycznych, uruchamiamy nasze komputery, piszemy program i sprawdzamy, czy możemy otrzymać lepsze odpowiedzi. Implementujemy algorytm i dostarczamy go konsumentom, którzy o niego prosili. Oni dostarczają nam informacje zwrotne i tak cykl się powtarza.

To przekręcanie wajchy i kolejne cykle modelowania sprawiają, że matematycy są od wszystkiego oderwani. Biura Google’a i Facebooka pełne zabawek i wewnętrznych placów rozrywki dają ich supermądrym pracownikom iluzoryczne poczucie tego, że całkowicie panują nad problemami, które rozwiązują. Doskonała izolacja wydziałów uniwersyteckich oznacza, że nie musimy konfrontować naszych teorii z rzeczywistością. Tak nie powinno być. Świat rzeczywisty ma rzeczywiste problemy, a naszym zadaniem jest opracowywanie rzeczywistych rozwiązań. Żaden z problemów nie jest taki prosty, aby wystarczyło tylko wykonanie obliczeń.

W miesiącach, które nastąpiły po mojej wizycie w siedzibie Google’a w maju 2016 roku, zacząłem zauważać nowy typ opowieści matematycznej w gazetach. Po Europie i USA rozprzestrzeniała się niepewność. Wyszukiwarka Google’a zaczęła sugerować rasistowskie propozycje wyszukiwań; boty na Twitterze rozpowszechniały nieprawdziwe informacje; Stephen Hawking mówił o swoich obawach względem sztucznej inteligencji; silnie prawicowe grupy żyły w algorytmicznie stworzonych bańkach filtrujących; Facebook mierzył nasze osobowości i pomiary te wykorzystywane były do wpływania na głosujących. Jedno po drugim zaczęły pojawiać się zagrożenia związane z algorytmami. Zdolności matematyków do prognozowania podawane były w wątpliwość, modele statystyczne nie przewidziały bowiem przegłosowania brexitu ani zwycięstwa Trumpa.

Opowieści o matematyce piłki nożnej, miłości, ślubów, graffiti i innych ciekawych rzeczy nagle zastąpione zostały matematyką seksizmu, nienawiści, dystopii i zawstydzających błędów prognozowanych wyników wyborów.

Gdy ponownie przeczytałem artykuł naukowy dotyczący Banksy’ego, tym razem nieco dokładniej, okazało się, że nie odkryto zbyt wiele nowych informacji o jego tożsamości. Choć badacze stworzyli mapę precyzyjnych lokalizacji 140 dzieł sztuki, to przeanalizowali tylko adresy jednego podejrzanego. Tenże podejrzany został zidentyfikowany już osiem lat wcześniej przez „Daily Mail” jako prawdziwy Banksy[2]. Gazeta ustaliła, że pochodził on z podmiejskiej klasy średniej i nie był bohaterem klasy pracującej, jakiego się spodziewaliśmy.

Jeden ze współautorów tego artykułu naukowego, Steve Le Comber, szczerze przyznał w rozmowie z BBC, dlaczego badacze skupili się na podejrzanym wytypowanym przez „Daily Mail”. Powiedział: „Bardzo szybko okazało się, że jest tylko jeden istotny podejrzany, i każdy wie, kim on jest. Jeżeli wpiszemy w Google frazę »Banksy« oraz [nazwisko podejrzanego], otrzymamy jakieś 43 500 wyników”[3].

Na długo przed pojawieniem się matematyków Internet uważał, że zna prawdziwą tożsamość Banksy’ego. Badacze jedynie powiązali liczby z tą wiedzą, choć nie do końca wiadomo, co te liczby znaczą. Naukowcy przeanalizowali tylko jednego podejrzanego w jednej sprawie. Artykuł ilustrował metody, ale daleko mu było do wniosku, że owe metody faktycznie zadziałały.

Media nie były zbytnio zainteresowane ograniczeniami badań. Skandaliczna historia z „Daily Mail” stała się już teraz poważną informacją, o której pisał „The Guardian”, „The Economist” oraz BBC. Matematyka usankcjonowała plotkę. A badanie przyczyniło się do przekonania, że zadanie znajdowania „przestępców” można powierzyć algorytmom.

Zmieńmy miejsce akcji na salę sądową. Wyobraźmy sobie, że zamiast Banksy’ego oskarżonego o bawienie nas swoją odświeżającą sztuką uliczną mamy Banksy’ego muzułmanina oskarżonego o pokrywanie ścian budynków w Birmingham hasłami propagującymi Państwo Islamskie. Wyobraźmy sobie jeszcze, że policja przeanalizowała sytuację i odkryła, iż graffiti zaczęło pojawiać się, gdy ich „islamistyczny Banksy” przeprowadził się do Birmingham z Islamabadu. Policja nie może jednak tego wykorzystać w sądzie, nie ma bowiem żadnych dowodów. Więc co robi? Cóż, wzywa matematyków. Stosując opracowany przez nich algorytm, policyjni eksperci od statystyki ustalają z 65,2-procentową pewnością, że konkretny dom należy do islamistycznego Banksy’ego, i wzywają oddział antyterrorystyczny. Tydzień później, zgodnie z ustawą o zapobieganiu aktom terroru, islamistyczny Banksy umieszczony zostaje w areszcie domowym.

Scenariusz ten niewiele różni się od tego, jak Steve i jego współpracownicy wyobrażają sobie wykorzystanie wyników ich badań. W swoim artykule piszą, iż ujawnienie Banksy’ego „wspiera wcześniejsze sugestie, że analiza mniejszych aktów związanych z terroryzmem (np. graffiti) może być wykorzystana do lokalizowania baz terrorystów, jeszcze zanim dojdzie do poważniejszych incydentów”. Przy wsparciu matematycznym islamistyczny Banksy zostaje oskarżony i skazany. To, co wcześniej było słabą formą dowodów poszlakowych, staje się teraz dowodem statystycznym.

To dopiero początek. Po skutecznym zidentyfikowaniu islamistycznego Banksy’ego prywatne firmy zaczynają konkurować w walce o kontrakty na dostarczanie porad statystycznych siłom policji. Po otrzymaniu pierwszego kontraktu Google wprowadza wszystkie dane policji do DeepMind w celu identyfikacji potencjalnych terrorystów. Kilka lat później rząd wdraża wspierany przez społeczeństwo środek zaradczy oparty na „zdrowym rozsądku”, integrujący nasze dane z wyszukiwarek internetowych z bazą danych policyjnych Google’a. Skutkiem jest stworzenie „oficerów ze sztuczną inteligencją”, którzy mogą wykorzystać nasze wyszukiwania i dane o ruchu do wnioskowania o naszych motywach i przyszłych zachowaniach. Oficer AI zostaje włączony do specjalnej siły uderzeniowej w celu przeprowadzania nocnych nalotów na potencjalnych terrorystów. Mroczna matematyczna przyszłość nadciąga w zastraszającym tempie.

Za nami dopiero kilka pierwszych stron, a matematyka nie tylko psuje nam zabawę, ale już podważa naszą uczciwość osobistą, dostarcza podstaw do plotek, oskarża mieszkańców Birmingham o akty terroryzmu, zestawia ogromne ilości danych wewnątrz wielkich, niezliczonych korporacji i buduje supermózg do monitorowania naszego zachowania.

Jak poważne są to kwestie i jak realistyczne są te scenariusze? Postanowiłem dowiedzieć się tego w jedyny sposób, jaki znam: przyglądając się danym, obliczając dane statystyczne i stosując matematykę.

Zapraszamy do zakupu pełnej wersji książki

Przypisy

Rozdział 1. Poszukiwanie Banksy’ego

[1]www.fortune.com/2014/08/14/google-goes-darpa/

[2]www.dailymail.co.uk/femail/article-1034538/Graffiti-artist-Banksy-unmasked-public-schoolboy-middle-class-suburbia.html

[3]www.bbc.com/news/science-environment-35645371