captcha image

A password will be e-mailed to you.

Nieznajomość prawa nie jest usprawiedliwieniem” – głosi jedna z licznych prawniczych sentencji, a o jej prawdziwości wielu przekonało się bardzo boleśnie. Ja zaryzykuję tezę mówiącą, że brak wiedzy na temat big data nie zmienia gigantycznego wpływu, jaki wielkie zbiory danych mają na nasze życie. A że u podstaw nauki leży założenie, że lepiej wiedzieć, niż nie wiedzieć, to szczerze polecam dobrą okazję do uzupełnienia wiedzy. Chodzi o książkę „Big data” autorstwa Dawn E. Holmes, która ukazała się w serii „Krótkie wprowadzenie” wydawanej przez Wydawnictwo Uniwersytetu Łódzkiego. To polskie tłumaczenia cyklu znanego z Oxford University Press, tu pisałem o innej świetnej książce z tej serii.

Niemal wszystko co robimy już jest, lub wkrótce będzie, źródłem danych, które mogą zostać zebrane i przetworzone. Zanim napisałem poprzednie zdanie, porządnie się zastanowiłem. W pierwszej chwili wydawało mi się, że to zbyt daleko idąca teza, ale wówczas mój wzrok padł na smartwatcha, który noszę i uznałem, że jednak nie przesadzam. Bo ładowanie zmywarki i odgrzewanie obiadu to czynności, które  nikogo nie obchodzą i jako takie nie są warte rejestrowania i analizowania, prawda? No więc nieprawda. Faktycznie miski i patelnia jakiegoś tam Stanisławskiego niewiele znaczą, ale już na przykład obserwacja, że mieszkańcy mojego miasta zwykle odpalają zmywarki koło 17.00 może mieć całkiem duże znaczenie. Wpływa na zużycie prądu i wody, ale może też stać się okazją, by odpowiednio dopasować czasowo dostawy kostek do zmywarki. Albo stwierdzić, że to kiepska pora na odwiedziny akwizytora. I nie, to nie wymysły. Tak działa choćby Amazon, który przesyła do lokalnych magazynów produkty, których klienci jeszcze nie zamówili, ale prawdopodobnie wkrótce to zrobią.

Jednak by dojść do takich wniosków, trzeba przeanalizować ogromne ilości danych. Bo zmywających są tysiące, bo pory się zmieniają, bo wpływa na to pora roku, temperatura, pogoda i mnóstwo innych czynników. Jeśli je wszystkie zbierzemy, powstanie gigantyczny zbiór danych, w których… łatwo się pogubić. Człowiek nie jest w stanie tego przeanalizować, ale gdy zaprzęgniemy do tego szybkie komputery (może to być, choć nie musi, sztuczna inteligencja), wychodzą rzeczy niezwykle ciekawe, czasem dziwne, a czasem straszne. Napisano o tym sporo książek (szczególnie polecamy tę), ale większość z nich nie zajmuje się samymi podstawami wielkich zbiorów danych.

I tu właśnie wkracza, cała na niebiesko, „Big data”. Jej autorka tłumaczy wszystko od samego początku – zarówno historycznie (sięgając aż 37 000 lat wstecz), jak i merytorycznie. Systematyzuje to, jakie dane gromadzimy, jak to robimy, jak je analizujemy i jakie z tego możemy wyciągać wnioski. A także czym to grozi, co nam daje i czego możemy się spodziewać w przyszłości.

Założeniem serii „Krótkie wprowadzenie” jest uzupełnienie informacji w dziedzinach ważnych, ale na tyle trudnych, że przeciętny człowiek nie musi posiadać w nich dogłębnej wiedzy, choć powinien orientować się w temacie. I to właśnie świetnie robi „Big data”. Prawdę mówiąc miejscami idzie o krok dalej, bo niektóre rozdziały (na przykład dotyczące analityki czy przechowywania danych) po ogólnym wprowadzeniu skupiają się na szczegółach. Na szczęście nie przeszkadza to w lekturze – kto ma ochotę, może wejść głębiej, kto nie ma – może przeskoczyć fragmenty. Zgodnie z tradycją serii książka nie jest długa, ma około 150 stron. Dość, by wiele się dowiedzieć, ale nie znudzić się.

Przy okazji lektury naszła mnie ciekawa myśl. Otóż oryginalne wydanie pochodzi z 2017 roku. To raptem 4 lata temu. A tymczasem w dziedzinie big data pojawiło się mnóstwo nowych informacji czy przykładów. Chcę to jasno powiedzieć – ta książka nie zdezaktualizowała się, bo dotyczy podstaw całej dziedziny. Po prostu widać, jak szybko rozwija się przetwarzanie danych i jakiego znaczenia nabiera w naszym życiu. Każde skorzystanie z telefonu, komputera, karty płatniczej, samochodu, telewizora karmi systemy big data kolejnymi danymi. I naprawdę dobrze wiedzieć, jak to się dzieje.

Big data

Dawn E. Holmes

Wydawnictwo Uniwersytetu Łódzkiego

Nie ma więcej wpisów