Co widzą maszyny?

Widzenie maszynowe – cyfrowe rozpoznawanie obiektów na obrazach, filmach i „w realu”. Z „widzącymi” maszynami spotykamy się na co dzień, choć często nie zdajemy sobie z tego sprawy. W najprostszej postaci znajdziemy je w każdym sklepie. W najbardziej skomplikowanej – choćby w internecie. Co „widzą” maszyny, od kiedy i co z tego wynika?

Kody kreskowe
Zaczęło się od 10 owocowych gum do żucia Wrigley, 26 czerwca 1974 r., w amerykańskim stanie Ohio. To wtedy po raz pierwszy skaner kodów kreskowych „zobaczył” produkt i podał jego cenę (67 centów). Lokalna prasa, fotoreporterzy i filmowcy uwiecznili historyczny moment, zestresowana swoim zadaniem kasjerka odetchnęła z ulgą. Pierwsza zeskanowana paczka gum trafiła do muzeum w Waszyngtonie, a kasjerka, Sharon Buchanan, jeszcze 35 lat później opowiadała dziennikarzowi „New York Timesa” o swoich „piętnastu minutach sławy”. Dziś, z pewnymi popisowo kreatywnymi wyjątkami, kiedy to paski kodu przechodzą w nawijane na widelec spaghetti, zebrę lub przejście dla pieszych, kody kreskowe wyglądają prawie tak samo jak w latach 70. I tylko my, klienci XXI w., coraz częściej skanujemy je już samodzielnie. Chyba że się pomylimy albo chcemy zrezygnować z jakiegoś produktu, a nowoczesny sklep nie przewidział takiej opcji (z życia wzięte). Wtedy wciąż – jak trwoga, to do kasjera.

Kody QR
Biało-czarne kwadraty z labiryntową mozaiką kojarzy już chyba każdy. Kojarzy, ale nie używa. Kody QR nie tylko u nas, ale i w całym „zachodnim świecie” okazały się (jak na razie?) niewypałem. Co jest nie tak w skanowaniu smartfonem obrazków, aby „dowiedzieć się więcej”? Być może po prostu nie chcemy tego czegoś więcej wiedzieć. Zresztą nie interesuje nas nie tylko strona internetowa reklamodawcy, ale i np. darmowy audiobook do pobrania w autobusie, nie wspominając już o płaceniu kodem za zakupy (choć w Polsce taką opcję umożliwia osiem banków). Opracowana w latach 90. w Japonii technologia doskonale przyjęła się za to w Azji. W Chinach płatności kodami QR przyjmują nawet uliczni sprzedawcy jedzenia i zbierający datki bezdomni. „Dziwne kwadraciki” zawędrowały tam też do ogłoszeń o pracę i na nagrobki, a niewielka chińska miejscowość na północy kraju reklamuje się przelatującym nad nią pasażerom samolotów największym na świecie kodem QR utworzonym ze 130 tysięcy odpowiednio przystrzyżonych krzewów jałowca.

Facebook: twarze
Grudzień 2010. Z Facebooka korzysta codziennie 0,5 miliarda ludzi na Ziemi. Publikują i oznaczają zdjęcia, każdego dnia produkując ponad 100 milionów oznaczeń. Pozostawić przyjaciela bez nametagu – najwyższa hańba. Zarząd Facebooka, aby ulżyć towarzyskim fotografom, wprowadza funkcję rozpoznawania twarzy. Najpierw w USA, a pół roku później na całym świecie „widzące” algorytmy podpowiadają, kogo sfotografowaliśmy. W Europie nowa funkcja wzbudza natychmiastowy sprzeciw. I nie chodzi o przypadki, w których algorytm myli twarz z kolanem, ale o te, gdy udaje mu się rozpoznać kogoś trafnie. Europejczycy, jak się okazuje, woleliby zachować swoją twarz dla siebie. Po licznych protestach, we wrześniu 2012 r. Facebook wyłącza funkcję na terenie Unii Europejskiej. Ale w kwietniu 2018 r. – dzień przed wejściem w życie ustawy RODO, mającej chronić prywatność Europejczyków – przywraca ją. Podobno właśnie w trosce o ochronę prywatności – rozpoznawanie twarzy ma zapobiegać wykorzystaniu naszych zdjęć przez nieznajomych, należących do grupy 1,5 miliarda już codziennie logujących się na Facebooka użytkowników z całego świata. Czy rzeczywiście dlatego? Funkcję możemy wyłączyć, owszem, ale zostaniemy wtedy bez oznaczenia, co byłoby przecież najwyższą hańbą.

Tajemnice
Grube mury, pajęczyny, ciemność, stęchlizna i wilgoć, a wszystko to spowite stroboskopowym światłem lasera. To nie scenografia halloweenowej imprezy techno, lecz warunki pracy konserwatorów zabytków w XXI w. Skanery 3D, ciskając wiązkami światła we wszystko, na co natrafią, rejestrują otoczenie z dokładnością nawet do dziesiętnych części milimetra. Mówiąc dokładniej – rejestrują oddalone od obiektywu punkty (nawet milion punktów na sekundę), łącząc je w „chmury”, z których potem powstają trójwymiarowe modele. Skaner 3D jak duch przenika przez ściany, niestraszne mu wnętrze urny z prochami ani napisy wyryte na krokwiach dachu przez średniowiecznych konstruktorów. W kilka minut, pod opieką jednego operatora, prześwietli wszystko to, do czego ludzie nie dotarliby całymi tygodniami. Kalifornijska organizacja CyArk („cyber archive”) od 2003 r. archiwizuje w ten sposób światowe dziedzictwo kulturalne – od piramidy schodkowej w Gwatemali przez osiemsetletni most nad Dunajem po kamienne głowy z Wyspy Wielkanocnej. Wszystko po to, by w razie jakiejś katastrofy precyzyjnie odtworzyć zabytkowe obiekty, tak jak miało to już miejsce w przypadku zeskanowanego w 2009 r. ugandyjskiego grobowca (rok później stanął w płomieniach). W Polsce inna grupa pasjonatów zeskanowała do tej pory m.in. klasztor w Lubiążu, kopalnię węgla w Zabrzu, jaskinię Diabla Dziura i pałac w Wonieściu (obecnie: szpital psychiatryczny). Duchów prawdopodobnie nie zarejestrowano.

Ilustracje: Szymon Szelc