Цифровой журнал «Компьютерра» № 81 - Коллектив Авторов
Шрифт:
Интервал:
Закладка:
Эти фотографии тут же передаются в центральную базу данных, где система распознавания лиц в реальном времени сравнивает их с содержимым большой базы данных об известных преступниках и людях, разыскиваемых полицией. Если при сравнении обнаруживается совпадение, то на маленьком экранчике, встроенном в очки, возле соответствующего лица загорается красный сигнал тревоги, предупреждающий полицейского о необходимости задержания или других подобающих ситуации действиях.
Такого рода техника уже проходит в Бразилии тестирование на спортивных матчах, концертах и других массовых зрелищах. Если всё пойдёт как задумано, то спецочки, устанавливающие личность человека по лицу, станут немаловажным инструментом полиции при обеспечении безопасности на следующем чемпионате мира по футболу.
Если оценивать данную технологию по существу, то ничего принципиально нового и прежде невиданного в ней, строго говоря, нет. Нечто подобное в США и других наиболее озабоченных технической безопасностью государствах пытались внедрять уже около десятка лет тому назад. Ничего путного, правда, из этого тогда не получилось — из-за общей незрелости технологии, несовершенства алгоритмов распознавания и, как следствие, гигантского количества ложных опознаний, делающих систему бесполезной в практическом применении.
Несмотря на первые неудачи, никто, впрочем, особо не сомневался, что с течением времени алгоритмы будут становиться всё лучше и лучше, производительность вычислительных ресурсов достигнет нужного уровня, а в целом метод непременно покажет свою мощь и эффективность. Так что теперь, насколько можно судить по происходящему, мы понемногу входим именно в эту эпоху.
Сейчас быстрое опознание человека по лицу становится реальностью не только для преступников (которые в общем-то давно уже к этому должны были привыкнуть), но и для совершенно обыкновенных людей, никаких проблем с законом не имеющих. Существенно, что мощные технологии распознавания лиц уже практически доступны не только правоохранительным органам, но и по сути дела всем желающим. Чем это всё грозит в ближайшем будущем, обществу ещё только предстоит разобраться.
Массу содержательной информации для размышлений на данную тему предоставляет исследовательский доклад "Лица из Фэйсбука", только что сделанный на хакерской конференции Black Hat USA в Лас-Вегасе. Авторы этого исследования — Алессандро Акуисти, Ральф Гросс и Фред Стацман, все из американского Университета Карнеги-Меллона — решили на практике проверить, а не могут ли такого рода «полицейские» технологии уже сегодня применяться вообще кем угодно. Иначе говоря, возможно ли быстро идентифицировать по лицу случайно выбранного в толпе или в сети человека, просто собирая о нём персональную информацию из общедоступных баз данных?
Для ответа на этот вопрос исследователи провели несколько экспериментов, опираясь на три популярных инфотехнологии. Одна из них, естественно, — это программа распознавания лиц, последнее время в технологическом отношении характеризующаяся очень заметным прогрессом. Кроме того, учёные использовали сервисы «облачных вычислений», предоставляющие массу дешёвых вычислительных мощностей. И, наконец, в качестве основного источника информации они использовали социальные сети вроде Facebook и LinkedIn, где большинство пользователей помещает свои реальные имена и собственные фотографии.
Лидер этого исследовательского проекта, Алессандро Акуисти, по основному образованию является экономистом, специализирующимся на поведенческой экономике приватности. По его словам, данное исследование стало естественным продолжением их предыдущей работы 2009 года. Тогда было продемонстрировано, что публично доступная информация из профилей пользователей в сети Facebook может быть использована злоумышленниками для точного вычисления их SSN, то есть номера социального страхования.
Тут стоит пояснить, что в условиях США уникальный номер SSN является главным идентификатором человека во всех базах данных, то есть аналогом номера паспорта для россиян. Одного лишь знания имени-фамилии и такого вот идентификатора мошенникам бывает достаточно для кражи личности с весьма тяжкими порой последствиями для обокраденных и подставленных.
Вслед за впечатляющими результатами предыдущего исследования, Акуисти и его коллеги решили расширить цель эксперимента и теперь посмотреть на то, как программа распознавания лиц, социальные сети и технологии статистической идентификации могут быть использованы для «дополнения реальности», то есть синтеза онлайновой и офлайновой информации на основе перекрёстных обращений в общедоступные хранилища данных (вроде социальных сетей). Упрощённо формулируя цель задачи, учёные решили посмотреть, а возможно ли просто от незнакомого лица, попавшегося на улице, прийти к номеру социального страхования этого человека?
Для ответа на этот и близко к нему относящиеся вопросы было придумано и проведено несколько экспериментов.
Эксперимент IВ первом из экспериментов этой серии исследователи воспользовались открыто доступными для всех фотографиями из Facebook для того, чтобы «переидентифицировать» анонимных, как правило, пользователей в других, более деликатных социальных сетях, таких, как сайты знакомств.
Для этого на одном из наиболее популярных в США сайте знакомств были отобраны около 6 000 фотографий из профилей тех людей, которые проживают в одном конкретном городе. Подавляющее большинство посетителей такого рода сайтов предпочитает использовать псевдонимы. Отобранные фотографии прогнали через общедоступную программу распознавания лиц, которая сравнивала их с базой из 280 000 снимков, автоматически найденных и собранных поисковой машиной, перед которой ставилась задача выявить на сайте Facebook профили тех людей, что проживают в том же самом городе.
Даже при таком, лобовом и совершенно примитивном, подходе исследователи тут же установили личности чуть более одной десятой среди тех людей, что посещают сайт знакомств. На первый взгляд, такая цифра не выглядит особо впечатляющей. Однако можно отметить, что это был чисто пассивный, без «выхода в офлайн», сбор информации из сетевых баз данных. Кроме того, можно уверенно прогнозировать, что число успехов в подобных изысканиях будет неуклонно расти по мере дальнейшего улучшения программ распознавания лиц и по мере того, как всё больше фотографий выкладывается людьми в сеть.
Эксперимент IIСуть второго эксперимента уже можно охарактеризовать как синтез онлайновой и офлайновой информации. Для начала исследователи отобрали (тем же автоматическим способом) около 25 000 фотографий с именами таких пользователей Facebook, которые согласно их страницам-профилям учатся в университете Карнеги-Меллона. Затем они установили в кампусе этого университета свой компьютер с веб-камерой, а всех желающих прохожих пригласили поучаствовать в качестве добровольных участников эксперимента.
Внешняя сторона этого эксперимента сводилась к тому, что студентов просили на минутку задержаться у компьютера и быстро ответить на вопросы краткой онлайновой анкеты. Менее же очевидная сторона опыта заключалась в том, что в то время, когда студенты заполняли анкету своими ответами, веб-камера делала снимок студента, соответствующая программа анализировала лицо и запускала процедуру его сравнения в реальном времени с уже имеющимися фотографиями из накопленной базы данных.
В таких условиях эксперимента веб-камерой были сделаны фотографии 93 студентов (с их согласия, ясное дело). В 29 случаях (то есть уже 31 процент исходов) программа распознавания лиц оказалась способна присовокупить к лицу и анкете соответствующее имя отвечавшего на вопросы. На каждый поиск-идентификацию при этом затрачивалось в среднем меньше трёх секунд.
Эксперимент IIIСуть этого эксперимента, развивающего результаты второго, можно охарактеризовать набирающим популярность термином Augmented Reality, или «дополненная реальность». Как показывает опыт, если незнакомого человека на улице становится возможным быстро идентифицировать по его лицу и данным из социальных сетей, то оказывается возможным и много большее — типа получения об этом человеке массы дополнительной, порой весьма чувствительной к компрометации информации в реальном времени.
В своём третьем эксперименте, в качестве подтверждения концепции, исследователям удавалось с высокой вероятностью предсказывать персональные интересы незнакомцев и их идентификационные номера SSN (в качестве «незнакомцев» выступали опознанные участники эксперимента II). Мгновенные познания о личных интересах, ясное дело, были позаимствованы с персональных страниц в Фэйсбуке, а предсказание SSN, как несложно догадаться, выводилось по уже отработанной технологии предыдущего исследования.