Нейронные сети научились распознавать размытые лица на фотографиях

Пикселизация многие годы служила своеобразным фиговым листком для персональных визуальных данных. Слова, лица и номерные знаки закрываются пикселями в новостях, документах и на сайтах. Это довольно простой способ, но, тем не менее он работает — из-за размытия люди не могут понять, что же изображено. Однако теперь не только люди умеют распознавать изображения. Компьютеры все лучше различают образы и уже начинают видеть то, что нам не под силу, сообщает rb.ru.

#Новости

4964

3 октября 2016

Исследователи из Техасского университета в Остине и магистратуры Cornell Tech утверждают, что смогли обучить машину обходить стандартные методы скрытия визуальной информации и распознавать пикселизированные и размытые изображения, будь то номер дома или чье-то лицо. Для этого им даже не понадобилось разрабатывать какие-то сложные механизмы распознавания образов. Команда ученых обнаружила, что для этого подойдут обычные методы машинного обучения.

Ученые использовали популярные методы машинного обучения, инструкцию к которым легко можно найти в интернете. Именно поэтому Шматков опасается, что их запросто могут применить злоумышленники для раскрытия частной информации. Кроме того, существуют и более эффективные техники распознавания лиц и объектов и они могут представлять еще большую угрозу для скрытия личной визуальной информации.

Нейронные сети научились распознавать размытые лица на фотографиях

В первой колонке находится оригинальное изображение, в следующих три его варианты
с увеличивающейся степенью пикселизации. В последних трех колонках находятся изображения,
подвергнутые трем уровням шифрования P3. Чем сильнее размытие, тем ниже шансы, что алгоритм распознает
оригинальное изображение. Но, как показывают исследования, компьютер по-прежнему
распознает размытое лицо или текст более, чем в 50% случаев.

Исследователи смогли обойти работу трех методов защиты информации начиная с функции размытия объектов от YouTube (YouTube позволяет авторам видео размывать объекты и лица на видео). Алгоритм справился и с пикселизацией (ее также называют мозаикой). Для эксперимента ученые пикселизировали изображения с помощью методов стандартных программ, вроде Photoshop. Исследователям даже удалось расшифровать данные, зашифрованные методом P3 (Privacy Preserving Photo Sharing), который используется для JPEG-изображений. Этот метод шифрует изображение таким образом, что люди не видят оригинальную картинку, но другие компоненты данных остаются неизменными, и компьютер может их обрабатывать (например, сжимать).

Чтобы обойти защиту, ученые обучили нейронные сети распознавать изображения. Для этого они предоставили компьютеру набор изображений для анализа. Чем больше слов, лиц или объектов «видела» нейронная сеть, тем лучше она их распознает. Как только алгоритм стал в 90% случаев распознавать необходимые объекты на представленных изображениях, ученые стали показывать нейронной сети новые версии этих картинок, зашифрованные с помощью трех различных методов. Они обучили ее распознавать объекты на размытых и пикселизированных снимках, основываясь на знаниях об оригиналах.

Наконец, ученые стали давать нейронным сетям размытые изображения, которые никогда не показывались. Алгоритм смог распознать объекты, лица, номера и рукописный текст с вероятностью в 80 и даже 90%. Если изображение было пикселизировано, то чем сильнее был уровень пикселизации, тем ниже были шансы успешной расшифровки. Но, тем не менее, они варьировались от 50 до 75%. Хуже всего машина смогла распознать лица, зашифрованные методом P3 — ей удалось это лишь в 17% случаев. По словам ученым, если бы алгоритм пытался распознать лица, объекты и цифры случайным образом, то вероятность успеха составила бы от 0,5 до 10%. Так что, хоть расшифровка с помощью машинного обучения иногда обладает небольшими шансами на успех, она работает эффективнее, чем простое угадывание.

Лоренс Сол, исследователь в области машинного обучения из Калифорнийского университета в Сан-Диего, считает, что подобная расшифровка все равно ставит под угрозу такие методы шифрования личной визуальной информации, как пикселизация и размытие.

Стоит заметить, что алгоритм не может полностью воссоздать исходное изображение человека и объекта. Он находит только то, что ищет — необязательно что-то конкретное, а просто вещь или лицо, которое он уже когда-то видел. Например, если взять видеозапись со станции метро, где размываются все лица прохожих, компьютер не сможет определить всех людей. Но если вы считаете, что на этой записи можно найти конкретного человека, то алгоритм распознает его лицо, даже если оно размыто. Сол считает, что стоит проверить, как нейронные сети будут распознавать размытые изображения реальных условий. Но, основываясь на текущих исследованиях, он полагает, что такому механизму расшифровки вряд ли найдется практическое применение.

Главная цель исследователей — предупредить всех, кто занимается безопасностью и конфиденциальностью данных, что методы машинного обучения совершенствуются, и их способности в распознавании изображений не стоит недооценивать. Сол утверждает, что у нас по-прежнему есть надежные методы скрытия изображения — например, закрытие черными квадратами. В отличие от пикселизации и размытия такой метод не оставляет никаких следов оригинального изображения. Перед тем как размывать то или иное изображение, лучше перекрыть его какой-нибудь случайной картинкой — так вам точно удастся сохранить конфиденциальность своих данных.

Если вы нашли ошибку, пожалуйста, выделите фрагмент текста и нажмите Ctrl+Enter.