В социальных сетях переживают очередной бум видео, снятые с использованием приложений для распознавания лиц. Благодаря постоянно развивающимся алгоритмам с использованием искусственного интеллекта практически любой пользователь может отыскать в интернете ссылки на странички случайно сфотографированного на улице человека, выяснить его имя, место работы или жительства. «Лента.ру» выяснила, почему эксперты по безопасности бьют тревогу и сыграет ли развитие нейросетей на руку сталкерам.
Порно из прошлого
Шер Скарлетт — известный на Западе инженер-программист. В 19 лет она переехала в Нью-Йорк. Там она основала узкое движение #AppleToo — корпоративную вариацию запомнившегося всем #MeToo — флешмоба, в рамках которого женщины делились в социальных сетях своими историями о домогательствах и дискриминации.
Недавно Скарлетт загрузила свои фото на сайт сервиса для распознавания лиц PimEyes. Она с любопытством обнаружила, что система, сравнив ее снимки со своей базой данных, предположила, что на них изображена поп-звезда Бритни Спирс либо ее сестра — сыгравшая во многих молодежных сериалах Джейми Линн Спирс. Но остальная часть поисковой выдачи напомнила Скарлетт о годах, которые она старалась забыть. Еще в детстве она столкнулась с сексуальным насилием, затем бросала школы одну за другой и пристрастилась к наркотикам.
PimEyes показало ей несколько фотографий со сценами жесткого секса. Скарлетт всматривалась в снимки и не понимала, почему у девушки на фото — ее лицо, ее прическа и даже ее любимая бирюзовая футболка, которую она часто носила после переезда в Нью-Йорк, а еще — серебряное ожерелье на шее, единственная драгоценность, которая у нее была.
Сохранив один из снимков, Скарлетт провела поиск по нему. Она увидела сотни изображений, отсылающих к десяткам порнороликов с тегами «жестокое обращение», «удушение» и «пытки». Этот период своей жизни — несколько недель, когда ее насиловали после переезда в Нью-Йорк, — она почти сумела забыть, исключить из своей памяти, сначала наркотиками, затем — с помощью психотерапии. Но оказалось, что интернет и правда помнит все.
«Как будто есть одна часть моего мозга, которая что-то скрывает, еще одна, которая на что-то смотрит, и третья, знающая, что это на самом деле правда, и все они просто столкнулись друг с другом. Мол, привет, теперь ты готова вспомнить эту историю. Она больше не скрыта от тебя, — вспоминает Скарлетт. — Это навсегда останется в интернете, и теперь любой может использовать программное обеспечение для распознавания лиц и найти порноролики, в которых меня насилуют».
Самое неприятное для Скарлетт в этой истории то, что PimEyes — один из крупнейших в мире сервисов для поиска людей по фотографии. В его базе данных хранится 900 миллионов снимков, у него есть удобное приложение, а прямо сейчас он привлекает повышенное внимание в одной из самых популярных соцсетей мира — TikTok.
Распознавание лиц стало трендом в TikTok
В TikTok, как и в других социальных сетях, становятся все популярнее ролики, авторы которых фотографируют на улице случайных людей, а потом ищут их через приложения и сайты для распознавания лиц. Clearview AI, FindClone, PimEyes — вот лишь некоторые из них, наиболее популярные; видео с этими тегами собирают миллионы просмотров. Масштаб тренда настолько впечатляющий, что, например, в Австрии в 2022 году TikTok и PimEyes на пару получили награду «Большой брат следит за тобой» за наиболее небрежное отношение с персональными данными.
«Глобально такие приложения нарушают права на конфиденциальность и приватность пользователей, так как люди могут быть найдены без своего на то согласия. Сейчас подобных приложений и надстроек для поиска незнакомцев по их фото немало и в российском сегменте», — сказала в беседе с «Лентой.ру» руководитель отдела перспективных технологий компании Positive Technologies Александра Мурзина.
И хотя изначально целью таких приложений был поиск своих фото или фото своих «двойников», их быстро начали использовать для совершенно других целей. С их помощью можно собрать сведения о любом случайном человеке и узнать мрачные тайны из его прошлого, как это произошло с Шер Скарлетт. Правда, найти обычного человека с помощью таких платформ не всегда просто.
Действительно ли распознавание лиц поможет найти любого человека
Современные сервисы обещают достаточно высокий уровень распознавания, заявляя, что поиск окажется успешным с 70-процентной вероятностью. Но в 2021 году журналисты Daily Mail провели небольшое исследование, попытавшись как раз на примере PimEyes понять, насколько хорошо работают такие приложения.
Тогда выяснилось, что примерно с 75 процентами изображений у искусственного интеллекта возникли немалые затруднения. Все они оказались чуть повернуты или слегка размыты. Однако остальные 25 процентов догадок оказались в конце концов точными, правда, журналистам пришлось продираться к верным ответам сквозь десятки изображений с порносайтов. Тем не менее правильные догадки вели на персональные странички людей в Instagram или Facebook (запрещенные в России соцсети; принадлежат компании Meta, признанной экстремистской организацией и запрещенной в России), TikTok и Tumblr, а также на личные блоги.
Тот, кто хочет выследить кого-то с помощью PimEyes, действительно может найти свою цель, но перед этим ему придется просеять кучу порнографических изображений
«Поиск цифрового профиля с фотографией, похожей на референсную, действительно будет занимать все меньше времени — технологии делают поиск по фото все более быстрым и точным. Однако достоверно связать найденный цифровой профиль с конкретным лицом искусственный интеллект вряд ли сможет без помощи человека», — отметил в беседе с «Лентой.ру» консультант по кибербезопасности компании F.A.C.C.T. Сергей Золотухин.
При этом создатели PimEyes продолжают настаивать на том, что их программа предназначена исключительно для поиска своих фото в интернете. По словам представителя компании, нейросеть помогает людям «восстанавливать права на изображения и отслеживать собственное присутствие в интернете». Однако многие подозревают PimEyes в лукавстве как минимум из-за того, что фотографии для обучения искусственного интеллекта добываются нелегальным путем.
«С нынешним уровнем развития искусственного интеллекта, который все чаще становятся частью "гражданских" приложений, найти человека по фотографии не самого высокого качества не составит труда. Тем более что многие пользователи недооценивают важность приватности и прогресс технологий, продолжая выкладывать в социальные сети не только фото, но и множество другой личной информации», — констатировала в беседе с «Лентой.ру» специалист по информационной безопасности компании «Код безопасности» Мария Фесенко.
Все та же Шер Скарлетт, вдобавок к уже описанным бедам, столкнулась при использовании PimEyes еще с одной проблемой. Она искала там свои снимки, а нашла фото своих мертвых родственников — прапрапрабабушки, матери и совсем недавно скончавшейся сестры. С их помощью нейросеть обучалась распознаванию лиц. Никакого разрешения на использование этих снимков компания, конечно же, не получала. Судя по всему, изображения были украдены с одного из ресурсов, на котором можно создать цифровую копию своего генеалогического древа.
Кроме того, несмотря на все уверения PimEyes в том, что приложение нужно для поиска именно своих фотографий, ничего не мешает пользователям искать чужие снимки.
«К сожалению, в интернете не применяются какие-либо всеобъемлющие и общие для всех меры защиты конфиденциальности. Каждый сайт или платформа будет просить пользователей принять их условия. Это почти всегда объемный документ, в котором почти наверняка будет упоминаться право собственности на загруженные изображения», — констатировал в беседе с британскими журналистами специалист по безопасности компании Comparitech Брайан Хиггинс.
Через тернии подобных этических проблем, с которыми в последние годы сталкиваются на Западе, Россия продралась еще в середине прошлого десятилетия. Первая отечественная разработка в этой нише оказалась гораздо удачнее иностранных.
Первым лидером в распознавании лиц была Россия
В западных публикациях, обсуждая PimEyes, часто вспоминают о программе FindFace, которая покоряла мировые рынки, предварительно завоевав российский. Ее создали специалисты NTechLab, сервис помогал по фото найти профиль пользователя в социальной сети «ВКонтакте».
Сейчас приложения не существует в открытом доступе, в связи с чем иностранные медиа утверждают, что с помощью модифицированных вариантов FindFace в России ведут слежку за оппозиционерами и прочими носителями протестных настроений.
На самом же деле технологии NTechLab сейчас используются, например, в системах уличного видеонаблюдения Москвы. Они же применялись для обеспечения безопасности во время чемпионата мира по футболу в 2018 году, а также для отслеживания нарушителей ковидного режима самоизоляции в 2020-м.
Это, впрочем, не должно смущать: на Западе умные камеры, способные распознавать лица и сличать увиденное с массивами заранее приготовленных данных, также применяются давно. Причем не только на государственном уровне, но и на частном. Однажды такой системой воспользовалась певица Тейлор Свифт. На ее концерте в Лос-Анджелесе еще в 2018 году сделанные специальной камерой фотографии сопоставлялись с базой данных персональных сталкеров исполнительницы, коих насчитали несколько сотен человек.
Сервис FindFace стал первопроходцем в сфере распознавания лиц. Он признавался лучшим на технологических конкурсах в России и за ее пределами, в том числе на самых престижных, и получал отличные отзывы в прессе. Эффективность алгоритмов распознавания достигала 70 процентов, а разработчики FindFace не успевали отвечать на звонки зарубежных журналистов. Вскоре после запуска сервис собрал 500 тысяч зарегистрированных пользователей и обработал почти три миллиона поисковых запросов.
Как правило, для распознавания используют несколько нейронных сетей. Например, в разработках NTechLab одна сеть считывает лицо на фото или видео, другая — извлекает по десяткам контрольных точек на лице некий биометрический шаблон, а другие сети в это время обращают внимание на мелкие детали (половая принадлежность, возраст или наличие бороды). Уже после этого проходит поиск по базам данных.
«В целом распознавание лиц устроено так же, как мы узнаем родных, друзей, близких. При этом видеоряд состоит из кадров, а стоп-кадр из видеоряда состоит из массива пикселей. Если мы видим лицо в одном ракурсе, то система — сразу в нескольких. Специально созданный алгоритм способен определить положение головы и исправить визуальные искажения: например, развернуть лицо в положение анфас», — рассказал директор по продуктам NTechLab Денис Гришин.
«Три миллиона поисковых запросов в базе данных почти из миллиарда фотографий — это сотни триллионов сравнений, и все это — на четырех обычных серверах. С помощью этого алгоритма вы можете просмотреть миллиард фотографий менее чем за секунду с обычного компьютера», — рассказывал в интервью The Guardian сооснователь NTechLab Александр Кабаков в 2016 году.
«В поиске используется набор уникальных характеристик лица, который генерируется нейронной сетью. Также качество поиска зависит от способности алгоритма определить, какая именно область изображения является лицом. Большинство компаний на рынке использует для этого решения от сторонних производителей, однако мы разработали собственный детектор лиц на основе нейронной сети», — объяснял непосредственный разработчик FindFace и другой сооснователь NTechLab Артем Кухаренко вскоре после того, как точность поиска достигла 85 процентов.
Высокие технические показатели ожидаемо привели к сугубо социальным последствиям. В какой-то момент FindFace начали использовать совсем не с благими намерениями.
FindFace сразу же начали использовать для шантажа
Вскоре после релиза приложения петербургский фотограф Егор Цветков придумал творческий проект. Он фотографировал людей в метро и находил их страницы в интернете с помощью FindFace. Однако некоторые российские эксперты забили тревогу вскоре после запуска сервиса: они предполагали, что использовать приложение будут не всегда с безобидными целями. В итоге они оказались правы, потому что FindFace взяли на вооружение анонимы, которые решили искать в соцсетях аккаунты известных российских порноактрис.
«В результате травли несколько девушек удалили свои страницы "ВКонтакте" и аккаунты в Instagram. На скриншотах, выложенных пользователями "Двача", видно, что большинство жертв отрицают свою связь с порноиндустрией, а их друзья встают на их защиту, в том числе угрожая троллям расправой», — написали обратившие внимание на проблему исследователи «Лаборатории Касперского».
«На заре подобных приложений, около десяти лет назад, основной проблемой стал так называемый кибербуллинг. С помощью поиска по изображению находили интимные фото и видео девушек, а затем вымогали деньги, шантажируя тем, что об этом узнают друзья, родственники и так далее. Поскольку интернет помнит все, современные нейросети способны "откопать" самые разные фотографии, которые также могут стать причиной шантажа», — предупреждает Фесенко.
Список опасений экспертов насчет возможных последствий развития систем распознавания лиц за прошедшие шесть-семь лет только расширился. В странах Запада зачастую признают ценность технологии для государственных институтов, в первую очередь, — силовых структур. Хотя изредка в США раздаются призывы полностью отказаться от подобных систем, поскольку они могут быть использованы неонацистскими или расистскими группировками.
Уже в ближайшем будущем приложения принесут больше бед
На 4chan и других анонимных форумах подписчики с более широкими возможностями поиска, чем у простых пользователей PimEyes, регулярно создают темы, в которых предлагают найти любую фотографию и передать результаты. Поиск по ключевому слову выдает тысячи топиков, в которых упоминалось приложение для распознавания лиц. Почти на всех снимках — молодые девушки и женщины, чьи изображения были позаимствованы из их социальных сетей либо созданы скрытно — в общественном транспорте или просто на улицах.
Опрошенные «Лентой.ру» эксперты признают, что повышение эффективности нейросетей и лежащих в основе их обучения алгоритмов обусловлено в первую очередь увеличившейся вычислительной мощностью.
«Чем больше задач должна решать нейросеть, тем большее количество информации ей необходимо получить на первичном этапе. При этом благодаря современным технологиям в нейросети можно загрузить огромный объем данных, который они будут достаточно быстро обрабатывать. Соответственно, чем больше данных и больше вычислительной мощности, тем больше дата-центрам необходимо охлаждения», — объясняет Фесенко.
Обучение нейросетей проводят по двум моделям — с учителем и без него. В первом случае в нейросеть загружают данные с заранее известным правильным ответом, который будет считаться эталоном. Если потом загрузить необработанные данные, нейросеть будет искать правильный ответ, зная принцип выбора эталона, то есть руководствуясь уже известной логикой. При втором варианте — без учителя — нейросеть получает только сырые данные, с которыми учится работать подобно тому, как учится плавать брошенный в воду ребенок.
При этом не исключено, что помимо физической и цифровой безопасности жертвы сервисов для распознавания могут столкнуться с ощутимыми финансовыми потерями. Речь идет о случаях, когда технологию, которая сама по себе в целом безобидна, берут на вооружение преступники — реальные и цифровые.
«Злоумышленники могут сфотографировать человека, а затем устроить за ним слежку, чтобы узнать, когда он ходит работу, есть ли кто-то в это время дома. Этот сбор информации займет немного времени, и, узнав все, преступники банально ограбят квартиру», — рассказывает Фесенко.
«Мы наблюдаем появление все новых и новых сценариев, например, использование чужих биометрических данных в системах аутентификации, дипфейки, использование фото для шантажа и вымогательства. Нет сомнений, что количество сценариев будет расти, поэтому вместе с новыми технологиями должны появляться новые эффективные решения для защиты», — отметил Золотухин.
Другой сценарий — найти человека по фотографии, узнать о нем все, что удастся, а потом создать фейковый профиль с его снимками в любой социальной сети. С него кибермошенники могут рассылать знакомым и друзьям просьбы одолжить или просто срочно перевести крупные суммы денег.
Наконец, не в меньшей степени аналитики опасаются за судьбы политических активистов, лидеров профсоюзов или, например, пациентов, посещающих врачей по щепетильным причинам. Любой человек из этих категорий, по мнению специалистов, может стать мишенью для доксинга.
«Если технология распознавания лиц станет широко доступной для общественности, тактика доксинга окажется еще более эффективной. Приложение на любом телефоне сделает любое конфиденциальное действие — например, участие в собрании анонимных алкоголиков — полностью публичным», — предрек замглавы проекта по безопасности Центр демократии и технологий Джейк Лапрюк.
Важно установить правила использования таких инструментов, чтобы гарантировать соблюдение прав граждан на конфиденциальность и приватность
Исследователи говорят, что без общественного надзора или четкого регулирования со стороны государства приложения вроде PimEyes будут множиться, извлекая выгоду из огромного изобилия фотографий и видео в интернете, позволяя незнакомцам следить за личной жизнью других людей. Конечно же, платно. Базовая месячная подписка на PimEyes обойдется примерно в 3,7 тысячи рублей, расширенный план — в 9,8 тысячи, профессиональный — в 37 тысяч рублей. Разовый поиск — около 1,8 тысячи рублей. У их конкурентов ценовая политика примерно такая же.
«Люди, которые разместили эти фотографии в интернете — со своими детьми, родителями, другими своими близкими, которые могут быть легко уязвимы, — делали это не для того, чтобы наполнить базу данных, которую компании могли бы монетизировать, — полагает исследователь технологий Стефани Хэйр. — Как этому противостоять? Никак. Я могу оставить свой телефон дома, но я не могу оставить там свое лицо».
хранятся в базе данных PimEyes
Что любопытно, PimEyes в своем онлайн-манифесте декларирует, что поиск своих снимков в интернете должен быть основным правом человека, доступным для всех, а не только для корпораций и правительств. Поэтому свою работу в компании считают благом для конфиденциальности.
Как себя обезопасить
Хороших способов избежать нежеланной публичности практически не существует. Эксперты выделяют три тактики: не выкладывать фото в социальные сети вообще, следить за разрешениями приложений или применять передовые разработки.
Первый вариант — крайняя мера, которая вряд ли поможет тому, кто уже давно пользуется соцсетями. Почти наверняка он хоть раз куда-то загружал свои фотографии.
Второй способ — внимательно следить за приватностью аккаунтов на разных сайтах и за разрешениями, которые им выдаются — что в веб-версии, что в приложениях. Важно, чтобы там не было пункта о праве на использование ваших снимков.
«Единственная мера предосторожности, которая доступна частным лицам, — убедиться, что их профили в социальных сетях не являются общедоступными. Кроме того, нужно запомнить, что делиться данными можно только с доверенными сторонами», — добавил менеджер по продуктам немецкого разработчика программного обеспечения comforte AG Феликс Росбах.
Третье направление пока только развивается. Люди по всему миру пытаются придумать, как защитить лица от распознавания, и некоторые наработки уже есть.
«Разные исследователи думают над технологиями, которые могут помешать алгоритмам поиска находить персональные данные. Одно из таких направлений — патчи на фотографиях (adversarial patches), которые заставляют модель машинного обучения ошибаться», — констатировала Мурзина.
При этом пользователи мало что могут поделать с ситуациями, когда их фото публикуют другие люди. Принятый в Евросоюзе «Общий регламент защиты персональных данных» (General Data Protection Regulation, GDPR) позволяет гражданам сообщества требовать удаления своих личных данных из баз компаний или с их площадок. Однако проблемы с исполнением этой нормы уже возникали у PimEyes, и у их конкурентов из Clearview AI.
Та же Шер Скарлетт признавалась в многочисленных интервью, что тратит сотни и тысячи долларов, чтобы заставить сайты (и PimEyes — первый в списке) удалить любые ее фотографии или видеозаписи. Пока что дело движется не очень быстро.
Аналитики полагают, что по мере развития искусственного интеллекта проблема станет еще более острой. Не исключено, что в конце концов появятся еще более строгие принципы регулирования использования чужих снимков третьими сторонами. Либо же будет разработан механизм мгновенного удаления своих фото из баз данных. Но пока остается довольствоваться лишь первыми двумя советами: не загружать свои изображения в интернет или делать это строго в приватных профилях или сообществах.