Dosłownie zobaczyć świat. Czyli sztuczna inteligencja rozwiązaniem dla niedowidzących.
Chciałem go minąć, spieszyłem się do biura, przez pasaż handlowy przechodziłem każdego dnia, bo wynajęliśmy tam kilka miejsc parkingowych i niejeden raz widziałem tam najrozmaitszych „oryginałów”, przy zachowaniach których mówienie do siebie było łagodną formą dziwactwa, ale tu coś przykuło mój wzrok, coś było inaczej niż zazwyczaj. Zwolniłem, by zrozumieć, na czym polegała różnica. Młodzieniec stojący przy ATM nie odbiegał wyglądem od innych osób w jego wieku: schludne młodzieżowe ubranie, przycięte krótko włosy, okulary i… biała laska, tak cienka, że na pewno nie służyła jako wsparcie – to prawdopodobnie przyciągnęło moją uwagę. Domyśliłem się po tych atrybutach i miejscu, że prawdopodobnie potrzebuje pomocy i przeleciała mi przez głowę przelotna myśl, by pobiec dalej w swój świat gdzieś tam za drzwiami, bo czekało na mnie coś pilnego – przecież tylu jest wokół ludzi, którzy mogą się tym zająć, więc dlaczego właśnie ja? Ale mimo wszystko podszedłem, a młodzian skierował twarz w moją stronę. Musiał chyba usłyszeć, że podchodzę, choć mi wydawało się to niemożliwe, i powiedział coś, z czego wyłowiłem tylko słowo „pomóc”. Spytałem, czy zechciałby powtórzyć, a wtedy, jakby z uczuciem ulgi, że ktoś go słucha, spełnił moją prośbę:
– Chciałem wypłacić pieniądze, czy zechciałby mi pan pomóc?
– Oczywiście – odpowiedziałem – ile chce pan wypłacić?
– Sto złotych.
Nie miał czarnych okularów, raczej takie bezdennie grube, wodził za mną wzrokiem, ale nie miałem pojęcia, czy przez te okulary coś widział, bo na pewno nie tyle, by obsłużyć bankomat. Wyciągnął do mnie rękę z kartą, więc może jednak nieco widział, a może kierował się słuchem? Wsunąłem plastikowy prostokącik w szczelinę i zapytałem o PIN. Miałem wrażenie, że się zawahał, a ja poczułem się tak niezręcznie, jak nigdy dotąd, bo wyobraziłem sobie, ile w jego głowie musi się miotać emocji: na pewno upokorzenie, bo musiał tak stać i prosić, jakby żebrał, a chciał przecież tylko wypłacić własne pieniądze; bez wątpienia wstyd, że nie może sobie sam poradzić i musi prosić o pomoc innych; strach, że musi to, co posiada najcenniejszego, powierzyć obcej osobie, zdecydować o tym, czy może jej zaufać. Tym razem trafił dobrze, oddałem mu pieniądze wraz z kartą i odszedłem tak szybko, jak mogłem, bo nie chciałem wysłuchiwać wylewnych podziękowań. Nie miał takiego zamiaru, może się domyślał, co czuję, bo usłyszałem zdawkowe „dziękuję”.
Opowiedziałem o moim spotkaniu w biurze, ale to mi nie wystarczyło, by zapomnieć, bo do takich sytuacji dochodzić musi każdego dnia naprawdę wiele razy. Zastanawialiśmy się już wspólnie, jak takim ludziom pomóc? Nie tylko jak w tym przypadku przy bankomacie, ale szerzej – by wspierać ich we wszystkich trudnych życiowych sytuacjach: by mogli wsiąść we właściwy autobus czy tramwaj, odnaleźć wśród mnogości witryn fryzjera czy kosmetyczkę, by szukając chleba nie wchodzili do sklepu z elektroniką, by będąc w restauracji mogli korzystać z menu. Może nawet przeczytać coś w gazecie?
Oczy można zastąpić tylko innymi oczami, na przykład przyjaciela czy psa przewodnika, ale to nie zawsze i nie u wszystkich jest możliwe. Sztucznych oczu jeszcze nie wymyślono, nie można ich włożyć w oczodół, jak wkłada się protezę biodrową w szkielet. Oko ludzkie to jedno z najbardziej czułych i skomplikowanych organów – wystarczy drobna usterka, a przestaje być doskonałe, zaczynamy widzieć nieostro, przestajemy dostrzegać barwy, rozjeżdżają się nam przedmioty, na które patrzymy. To czujnik przekazujący do mózgu sygnały, które są interpretowane i przetwarzane na tyle, że człowiek zdolny jest na ich podstawie podejmować decyzje czy budzić emocje. Oko to coś jak… kamera.
Działaliśmy od kilku lat w branży IT, a pierwszym pomysłem założycieli, Radosława Zdunka i Łukasza Łowiec-Wygońskiego, były aplikacje oparte na analizie obrazu, wirtualna i pogłębiona rzeczywistość, algorytmy pozwalające przekształcić obraz w przydatną w najróżniejszych procesach informację. Czy zatem nie byliśmy już dobrze przygotowani, by taki problem rozwiązać? Tak, urządzenia będącego okiem i mózgiem nie mogliśmy zbudować, ale przecież można stworzyć „protezę” takiego sprzężonego mechanizmu, która chociaż w jakimś stopniu go zastąpi.
Byłem i jestem ekonomistą, moim środowiskiem pracy są finanse, więc nie czuję się fachowcem, ale przez kilka lat wspólnej pracy widziałem, co nasi inżynierowie i programiści potrafią, a mimo to nie tylko ja miałem obawy, że może się nie udać, bo to nie było zwyczajne zadanie. Problemy do rozwiązania piętrzyły się nieustannie, a gdy rozwiązań było kilka, trzeba było wybrać najlepsze. To wymagało czasu, zaangażowania, kolejnych prób, a wynik i tak był nieprzewidywalny.
Pytania, na które należało odpowiedzieć, były proste – trudniejsze były odpowiedzi. Kamera musiała być nieduża, ale wystarczająco czuła, a to już samo w sobie stanowiło problem, bo pracować miała przecież w różnych warunkach, przy świetle sztucznym i dziennym. Gdzie ją umieścić, by była dyskretna i nie stygmatyzowała użytkownika? Sama kamera to jednak jeszcze nie wszystko, bo nie można było podłączyć jej bezpośrednio do mózgu, konieczne było urządzenie, które mogłoby go na tym etapie zastępować; urządzenie na tyle potężne, by przetwarzało wartki strumień informacji płynących z kamery: filtrowało go i wyłuskiwało z niego to, czego użytkownik chce się dowiedzieć. Jeśli byłoby tego za dużo, zalałby go potok niepotrzebnych informacji, jeśli za mało, rozwiązanie stałoby się nieużyteczne, a jeśli informacje byłyby niewłaściwe, urządzenie mogłoby stać się nawet niebezpieczne, bo na ich podstawie użytkownik podjąłby błędne decyzje (np. zamiast wina sięgnąłby po butelkę octu). Jak sprawić, by te prawidłowe wybory zostały zapamiętane, by urządzenie nabierało wiedzy o upodobaniach użytkownika, inaczej mówiąc: by było zdolne do uczenia się? A potem to urządzenie, od którego oczekiwaliśmy tak wiele, umieścić należałoby w pudełku tak małym, by mogło być noszone ze sobą i nie było uciążliwe. No i jak przekazać tę wiedzę użytkownikowi, skoro nie można jej wyświetlić? Może mu jedynie opowiedzieć, co widzi jego „sztuczne oko”, ale do tego potrzebny jest głośnik, który należy dodać do kamery… I jak zasilić ten cały energochłonny, przy stawianych mu wymaganiach, układ? Przecież użytkownik nie może nosi ze sobą motocyklowego akumulatora! Nie może też jednak nieustannie szukać gniazdka, by ładować mniejsze baterie.
Problemy narastały już podczas wstępnego projektowania, pytania się mnożyły, a nie na wszystkie można było udzielić odpowiedzi na tym etapie – potrzebne były godziny pracy, prób i testów, ślęczenia nad projektowaniem obudowy, płytki elektronicznej, baterii, pisaniem oprogramowania. Im dalej w las, tym więcej drzew i tym trudniej się było w tym odnaleźć.
Ale pomysł padł na podatny grunt, widać było tę pasję, błysk w oczach programistów i inżynierów, których ten pomysł zaczął wciągać jak czarna dziura. Problemy z elementami składowymi układu rozwiązać miały technologia i elektronika, które w niebywałym tempie zmieniały świat, a do selekcji informacji i nauki zaprząc należało sztuczną inteligencję. Tylko AI (Artificial Intelligence) mogła zamienić urządzenie z biernego rejestratora zdarzeń w doradcę i przyjaciela.
Aby jednak Toucan Eye (Oko Tukana) stało się nie tylko tematem do dyskusji, ale projektem, trzeba było znaleźć fundusze na jego realizację – mała, kilkudziesięcioosobowa spółka z kilkuletnim stażem nie była w stanie podołać temu samodzielnie. Projekt wymagał wyodrębnienia (lub zatrudnienia) zespołu, który miał nad nim pracować, niezbędnych urządzeń, materiałów, testerów, a to wszystko przekłada się zawsze na pieniądze. I tu z pomocą przyszedł Program Operacyjny Inteligentny Rozwój, którego funduszami dysponowało Narodowe Centrum Badań i Rozwoju. Dzięki ich sztandarowemu programowi o nazwie Szybka Ścieżka udało nam się uzyskać kilka milionów dofinansowania i przystąpić do realizacji.
Za nami kilka lat pracy, a dzięki rozpoczętej już na etapie projektowania współpracy z okręgiem pomorskim Polskiego Związku Niewidomych uzyskaliśmy nieocenioną wiedzę, bo któż może pomóc lepiej niż przyszły użytkownik? To tam zawsze konsultowaliśmy, co jest ważne, a co niepotrzebne (choć nam wydawało się ważne). Często te wskazówki bardzo nas zaskakiwały. Zawsze można zbudować coś interesującego z wykorzystaniem nowoczesnej technologii i nauki, pokazać na sympozjum czy wystawie, wzbudzając zachwyt zwiedzających i dziennikarzy, ale znacznie trudniej jest uczynić to naprawdę przydatnym i potrzebnym w codziennym życiu. To dzięki PZN dowiedzieliśmy się już na początku, że zdecydowana większość osób potrzebujących wsparcia i zrzeszonych w tej organizacji to nie osoby całkowicie niewidome, a z głębokim i znacznym niedowidzeniem. To oni noszą te grube okulary, które widziałem u młodzieńca, który dał początek całej tej historii. Widzą kształty, zarysy, światło, nie wpadną zatem na nieruchomy duży obiekt, potrafią dostrzec wyższe schody czy uliczne bramy, ale nie odczytają żadnego napisu i nie dostrzegą znaczenia żadnego znaku ikonograficznego. I to im przede wszystkim potrzebna jest pomoc, by mogli dostrzec więcej. Tak było też z alfabetem Braille’a: jak się okazało, posługuje się nim niewielki procent takich ludzi, bo staje się on przestarzały. Szczególnie wtedy, gdy urządzenia mogą odczytać głośno tekst umieszczony w internecie, a dzieła literatury odczytują aktorzy na dostępnych wszędzie audiobookach. Ta wiedza pozwoliła nam odrzucać rzeczy zbędne dla dokładniej zdefiniowanego użytkownika, dzięki czemu nasze „oko” uwolniliśmy od niepotrzebnych obciążeń, zgodnie z zasadą brzytwy Ockhama, który w swej filozofii głosił dążenia do prostoty – co niepotrzeb
ne, trzeba odciąć taką brzytwą, a stanie się lepsze.
Jesteśmy w fazie ostatnich testów, oczywiście wykonywanych przy uczestnictwie osób mających z tego urządzenia korzystać. Toucan Eye zgłoszony został do Urzędu Patentowego, jest niewielki, nosi się go wygodnie (wiem, bo również testowałem), to kamera przypominająca małą słuchawkę bluetooth, połączona bezprzewodowo z noszonym w kieszeni komputerem wielkości smartfona. Spełnia swoją funkcję, choć będziemy go udoskonalać tak długo, jak długo będzie używany, bo zawsze coś można ulepszyć. Zapewne niejedna osoba ogłosiłaby już sukces, ale w nas jest więcej pokory, wolimy z fanfarami jeszcze poczekać, bo to nie nam ma się podobać – ma zapewnić nieco łatwiejsze życie osobom niedowidzącym i to oni ostatecznie zadecydują o sukcesie. Dziś nauka i technologia pędzą tak, jak nigdy wcześniej w dziejach, a każde z nowych odkryć z pewnością wykorzystać można do wsparcia tych nieco słabszych, czy to z racji wieku, czy z racji niepełnosprawności. My potrafimy tylko pisać oprogramowanie, projektować układy elektroniczne, sterować systemami informatycznymi i multimediami, ale istnieje ogromna przestrzeń społeczna, gdzie takie umiejętności i pomysły mogą być przydatne: w medycynie, telekomunikacji, rozrywce czy edukacji, a spółki takie jak nasza zawsze będą gotowe do współpracy, niezależnie od tego, gdzie mają swoją siedzibę – odległość przestała mieć już jakiekolwiek znaczenie.
My staramy się o tym nie zapominać, obserwując i identyfikując problemy osób wykluczonych, a nasz zespół AI pracuje nad kolejnym projektem, współfinansowanym z funduszy europejskich – tym razem mającym wspierać osoby starsze i samotne. To jednak nie wszystko: w chwili pisania tego tekstu zespół Toucana przygotowuje się do panelu ekspertów, na którym zapadnie decyzja o losach kolejnego naszego prospołecznego projektu. I tacy prospołeczni, mam nadzieję, pozostaniemy, choć o zarabianiu pieniędzy też, oczywiście, nie zapominamy.