Защо програма на "Амазон" отбеляза конгресмени в САЩ като заподозрени

Могат ли системите за лицево разпознаване да дискриминират? Изглежда отговорът все още е "да" - тази седмица инструмент, разработен от "Амазон" за лицево разпознаване, погрешно е идентифицирал 28 членове на американския конгрес като заподозрени от полицията.
Rekognition се използва от американски правоохранителни агенции, но тестове на американска правозащитна организация показаха, че в 39% от случаите, в които програмата използва изображения на цветнокожи конгресмени (20% от всички), тя прави грешки.
Американският съюз за граждански права сравни официални снимки на политиците с база данни на снимки от арести. Изследването, което съдържа списък на засегнатите представители и на двете камари на Конгреса,
бе критикувано от "Амазон", според която софтуерът е бил използван с грешни настройки. Технологичният гигант обаче не опроверга резултатите.
Според Джейкъб Сноу, адвокат по въпросите на технологиите и гражданските свободи към организацията, тестът показва, че подобни технологии не са подходящи за употреба от правителството и могат да се използват срещу "общности на цветнокожи, имигранти и активисти".
"Вградени" предразсъдъци
Ден по-късно представител на "Гугъл" коментира пред Би Би Си, без да се позовава на конкретния случай, че на технологията за лицево разпознаване все още ѝ липсва нужното "разнообразие" и тя има "вградени предразсъдъци". "Трябва да сме много внимателни как ще използваме този тип технологии," каза още тя.
Google Photos, y'all fucked up. My friend's not a gorilla. pic.twitter.com/SMkMCsNVX4
— jackyalciné is now bhilling in 🐶🏦 (@jackyalcine) June 29, 2015
"Гугъл" също има какво да разкаже по въпроса. Преди няколко години софтуерен инженер разказа, че алгоритмите на "Гугъл" класифицират негови чернокожи приятели като "горили". Тогава компанията се извини за случилото се и обеща да отстрани проблема. Изглежда обаче не го е направила - сп. Wired писа наскоро, че близо 3 г. след случката eдинственото прието "решение" е горилите да бъдат премахнати от всички алгоритми.
Част от проблема е, че лицевото разпознаване разчита на огромна база данни от изображения, с които съответният инструмент да бъде "захранван". В много случаи тази база или не е достатъчно голяма, или не е достатъчно разнообразна. Китай например ползва една от най-големите бази данни в света, тъй като неговите собствени технологични гиганти я предоставят на правителството. Тя обаче е по-скоро еднотипна, тъй като разчита на събрана информация основно от стотици милиони китайци, и възможностите за "обучение" на софтуер за лицево разпознаване се считат за по-скромни от тези на много западни компании, независимо от лесния достъп до информация, която в Европа и САЩ на теория е лична.