Data – up, up and away! Czyli jak przechowywanie danych w chmurze wpływa na doświadczenia człowieka.

How It’s Made – zapewne wielu z nas widziało chociaż jeden odcinek programu Discovery, z którego mogliśmy się dowiedzieć, jak, element po elemencie i etap po etapie, powstają teleskopy, żyletki czy faszerowane oliwki. A co z produktami cyfrowymi, które otaczają nas na co dzień? Co poniedziałek uruchamiam na Spotify nową listę Discover Weekly, składającą się z kawałków, które trafiają w mój gust. Kilka razy w miesiącu Netflix podsuwa kolejne tytuły, które rzeczywiście wydają mi się interesujące. Na każdym kroku otrzymuję spersonalizowane reklamy, „kiedy tylko pomyślę”, że jakiś produkt mógłby mi się przydać. Jak to się dzieje, że marki podsuwają mi to, na co akurat mam ochotę?
Firmy i organizacje przewidują nasze potrzeby i kroki. Mit anonimowości w zdigitalizowanym świecie już dawno został obalony, a dopasowane przekazy podążają za każdym z nas. To, co możemy zrobić (zachowując, oczywiście, zdrowy rozsądek w kwestii dysponowania własnymi danymi) to zaakceptować sytuację, w której się znajdujemy.
Zwiększenie sprzedaży czy nagabywanie do podejmowania określonych decyzji to tylko jeden z segmentów big data – najbardziej
widoczny, dlatego też wzbudzający tyle kontrowersji. Dane jednak nie tylko napędzają konsumpcjonizm – dzięki nim otrzymujemy lepsze doświadczenia w kontakcie z marką, spersonalizowaną rozrywkę czy nawet, jako społeczeństwo, unikamy chorób czy skutków katastrof naturalnych.
How It’s Made, w dzisiejszym odcinku: big data w chmurze.
Dane w rozmiarze XXL – skąd moda na big data?
Każdy nasz ruch myszką, każde kliknięcie czy tapnięcie na smartfonie generuje dane.
Na świecie w ciągu jednej minuty:
wpisywanych jest 3,8 mln zapytań w wyszukiwarkę Google:
• 1 mln osób loguje się na Facebooka,
• odpalanych jest 4,5 mln filmów na YouTube,
• Netflix streamuje 700 tys. godzin wideo,
• wysłanych jest 188 mln maili.
Big data wchodzi do gry, kiedy danych jest zbyt dużo, by przechowywać i przetwarzać je przy użyciu tradycyjnych systemów bazodanowych. Obok „klasycznych” baz danych (databases) mamy hurtownie danych (data warehouses) –
stworzone w celu obróbki nie tylko
tera-, ale też peta- czy nawet eksabajtów. Hurtownie procesują duże zestawy danych kilkudziesięciokrotnie szybciej niż systemy bazodanowe. Dzięki temu platformy, takie jak Spotify czy Netflix, są w stanie serwować mi i milionom innych użytkowników materiał w ciągu ułamka sekundy, zamiast w ciągu minut czy godzin.
Big data umożliwia też wgląd w potrzeby użytkowników, pozyskiwanie informacji biznesowych i przewidywanie trendów. Obecnie firmy czy organizacje, które dbają o swojego
odbiorcę, nie poprzestają jedynie na serwowaniu materiału: analizują pozyskane dane i przygotowują rekomendacje dla użytkowników, umacniając tym samym relację z odbiorcą. W przypadku niektórych firm analiza danych, wyciąganie wniosków i planowanie strategii na podstawie liczb to kwestia być albo nie być. Te firmy kierują się również w stronę uczenia maszynowego, by jeszcze lepiej przewidywać zachowania i trendy.
A dlaczego w chmurze? Publiczne chmury obliczeniowe, takie jak Google Cloud Platform, Amazon Web Services czy Azure (by wymienić najpopularniejsze), należą do technologicznych gigantów. Zasoby w nich są niemal nieograniczone. Chmura to nie tylko przestrzeń serwerowa, ale też setki usług, za pomocą których można zbudować własną infrastrukturę, na przykład dopasowaną pod przetwarzanie pokładów danych. Chmura pozwala też niewielkim kosztem rozbudować analitykę o wspomniane uczenie maszynowe. Większość działań big data odbywa się w chmurze – to rozwiązanie jest bardziej opłacalne, skalowalne i stabilne niż w przypadku polegania na własnych maszynach (on-premise) lub chmurze prywatnej.
Zacumujmy na chwilę w tym potoku danych – tym razem my przeanalizujmy, co dzięki nim zyskujemy.
Dzięki Spotify poniedziałki są lepsze
Co poniedziałek Spotify przygotowuje dla mnie playlistę złożoną z kawałków, których jeszcze nie znam, a zdecydowanie powinnam. Spotify, w dużej mierze dzięki możliwościom analizy BigQuery (usługa hurtowni danych Google Cloud Platform), jest nie tylko platformą do streamingu, ale kompanem w tworzeniu osobistych muzycznych doświadczeń, które otrzymujemy w ułamku sekund.
O tym, jak ogromne jest morze muzyki, w którym możemy się zanurzyć razem ze Spotify, opowiedzą nam liczby:
• 286 mln użytkowników korzysta miesięcznie z platformy,
• mamy dostęp do 50 mln piosenek,
• możemy wysłuchać 700 tys. podcastów,
• stworzonych jest 2 mld playlist,
• codziennie dodawanych jest 40 tys. nowych piosenek.
Każdy użytkownik platformy otrzymuje propozycje spersonalizowanych playlist, które mogą zmienić się w ciągu godzin
– w zależności od słuchanych kawałków. Między piosenkami, albumami czy wykonawcami istnieje sieć połączeń: uruchamiając ulubiony kawałek, możemy szybko natrafić na dziesiątki innych, powiązanych, które skradną nasze serca. I uszy.
Filmowe wieczory z Netflixem
Oprócz mnie z Netflixa korzysta 193 mln zarejestrowanych użytkowników. Każdy z nas, poza bazą tysięcy filmów i seriali dostępnych od ręki, dostaje też spersonalizowane rekomendacje kolejnych tytułów. Skąd Netflix wie, co mi się podoba? Algorytm bierze pod uwagę moje oceny filmów (łapka w górę lub w dół) i historię wyszukiwania wewnątrz aplikacji. Zwraca też uwagę m.in. na moment, w którym zatrzymuję film, ile czasu mija, zanim powrócę do tytułu (czy są to minuty, czy może miesiące) oraz na to, czy ponownie oglądam dany film lub jego fragmenty. Twórcy platformy zakładają też, że w ciągu pierwszych 60 do 90 sekund decyduje, czy film mi się podoba, czy nie – jeśli zrezygnuję, algorytm uznaje, że tytuł nie trafił w mój gust.
Zalando zna mój styl od podszewki.
David Schneider, co-CEO Zalando, powiedział, że tylko nieliczne aplikacje mogą stać się częścią życia użytkowników tak, jak Spotify w kwestii muzyki czy Netflix w sferze filmów. Tym samym wyznaczył cel, by Zalando zostało towarzyszem pozwalającym spełnić wszystkie modowe potrzeby i zachcianki. Droga do tego celu usłana jest, oczywiście, danymi. Z platformy korzysta miesięcznie ponad 200 mln użytkowników, którzy buszują pośród 300 tys. unikalnych produktów. Każdy produkt może być w wielu wariantach kolorystycznym lub rozmiarach. Mój kompan zakupowy wie, że noszę rozmiar M, długość wkładki buta w moim przypadku to 23.7 cm, lubię sukienki za kolano, a połowę szafy mam w kolorze burgundowym (Zalando, masz wspaniałą pamięć!). Na tej podstawie, wykorzystując też możliwości uczenia maszynowego, przygotowuje dla mnie rekomendacje produktów i obserwuje, które propozycje przypadną mi do gustu.
Inną korzyścią dla użytkownika, jaka płynie z zaawansowanej analityki w Zalando, jest 100-dniowe prawo zwrotu. Gromadząc dane o zwrotach, na przykład terminie oddania produktu, platforma jeszcze lepiej poznaje indywidualny gust i rozmiar.
Globalna gra w Tetrisa w wykonaniu UPS
Firma kurierska UPS kolekcjonuje codziennie dane dotyczące setek tysięcy przesyłek – kształt, wymiary, wagę, lokalizację, miejsce docelowe (żeby wymienić kilka). Orion, system firmy UPS, wykorzystujący mechanizmy analizy danych oraz uczenia maszynowego Google Cloud Platform, jest w stanie bezbłędnie określić, jak załadować samochody dostawcze czy kontenery oraz jaką trasę wyznaczyć, by jak najbardziej zwiększyć efektywność przesyłek. System pozwala też przygotować się do okresów zwiększonego ruchu, na przykład w okolicach Świąt.
Juan Perez, Chief Information and Engineering Officer w UPS zapowiedział, że Orion ma rocznie skracać trasy kurierów o ponad 160 mln kilometrów i zmniejszać emisję dwutlenku węgla o 100 tys. ton metrycznych. Dla nas to też ważna informacja – oznacza szybsze przesyłki i wolniej postępujące globalne ocieplenie.
Zawsze chłodna i orzeźwiająca Coca-Cola
Coca-Cola to największy koncern napojów bezalkoholowych. Posiada ponad 500 rodzajów produktów w 200 krajach, a świat codziennie świat wypija 1,9 mld porcji napojów produkowanych przez markę.
Coca-Cola posiada własną „infrastrukturę” automatów z napojami. Wykorzystując możliwości internetu rzeczy, zbiera i przetwarza dane ze swoich maszyn. Firma może kontrolować m.in. temperaturę panującą w automatach, poziom zaopatrzenia czy popularność konkretnego napoju w danym regionie. Dane są też podstawą do wprowadzania zmian – na przykład podmienienia maszyny na większą lub dostawienia kolejnych w lokalizacji, w której Coca-Cola cieszy się dużą popularnością.
Koncern przeprowadził też akcję tworzenia nowych smaków w kooperacji z klientami. Na ulicach znalazły się tysiące automatów, które pozwalały robić własne miksy. Do wyboru było 100 kombinacji, które uwzględniały typ napoju (np. Sprite, Cola Light) oraz smak (np. wiśnia, mango). Jak można było się spodziewać, na początku automaty były oblegane przez dzieci, które rywalizowały o stworzenie najbardziej obrzydliwego napoju. Ale takie trunki powstawały z reguły tylko raz, a większą popularnością cieszyły się jednak smaczne autorskie miksy. Później, ze słodkiego gazowanego morza danych, analitycy mogli wyłowić rodzaje napojów, które były tworzone najczęściej w danych lokalizacjach. Dzięki temu możemy kupić Cherry Sprite czy Exotic Mango Diet Coke w puszce – w sklepie lub w sterowanym przez centralę automacie.
Nie tylko muzyka, filmy i zakupy
Wymienione przykłady świetnie obrazują, w jaki sposób dobrze wykorzystane dane uprzyjemniają naszą codzienność. Dzięki analizie big data wiemy też, czy brać ze sobą parasol, czy może okulary przeciwsłoneczne – prognozowanie pogody również opiera się o analizę danych. Podobnie jak przewidywanie katastrof naturalnych: nowoczesne systemy, we współpracy z naukowcami, są w stanie przewidzieć powodzie, susze czy trzęsienia ziemi z wyprzedzeniem tak dużym, by odpowiednio wcześnie przeprowadzić bezpieczną ewakuację ludności. Big data pozwala też analizować, jakie zmiany na giełdzie wywołają te katastrofy lub inne wydarzenia. Co też obecnie istotne i czego skutki odczuwamy, nawet nie zdając sobie z tego sprawy, analiza danych powstrzymuje lub spowalnia rozprzestrzenianie się chorób i wspiera leczenie.
Mam nadzieję, że niechęć związana z kolekcjonowaniem i analizowaniem danych będzie niknąć. Nie zawsze informacje o nas, naszych przyzwyczajeniach i potrzebach muszą być wykorzystywane przeciwko nam. W wielu przypadkach dobrze wykorzystane dane mogą uprzyjemnić codzienność, polepszyć sytuację społeczną czy nawet zapobiec negatywnym skutkom wydarzeń.