Лицо и цифровая сетка
Лицо и цифровая сетка
Арина Михайлова Опубликована 03.10.2025 в 14:36

Лица без права на приватность: как фото людей превратили в сырьё для алгоритмов

Анубхав Джайн: перекос в распознавании лиц связан с проблемой обучающих данных

Искусственный интеллект, а особенно системы распознавания лиц, долгое время страдали от серьёзных перекосов. Ошибки чаще всего касались женщин и людей с тёмным цветом кожи, тогда как белые мужчины распознавались почти безупречно.

Последствия таких сбоев были реальными: блокировка телефонов, неправомерные аресты и рост недоверия к технологиям. Сегодня ситуация изменилась — точность лучших алгоритмов достигает 99,9%. Но вместе с прогрессом возникла новая дилемма: что ценнее — конфиденциальность или совершенство ИИ?

Почти безупречная точность — но какой ценой

"С близкого расстояния системы распознавания лиц почти совершенно точны", — сказал информатик Сяомин Лю из Мичиганского государственного университета.

Современные алгоритмы способны одинаково точно определять людей разных полов и расовых групп. Однако для обучения использовались миллионы фотографий, собранных в интернете без согласия владельцев. Это не только нарушает приватность, но и создаёт риск кражи личности.

Сравнение подходов к обучению

Метод Преимущества Недостатки
Реальные фотографии Высокая точность, разнообразие условий Нарушение конфиденциальности, перекосы
Синтетические лица Безопасность, баланс по демографии Ниже точность, "студийный" вид
Гибридный подход Комбинация преимуществ Сложность реализации

Как работает распознавание лиц

Прорыв произошёл в 2010-х с появлением свёрточных нейросетей (CNN). Они разбивают изображение на уровни признаков: от простых контуров до сложных черт лица. Результат кодируется в "шаблон" — набор чисел, уникальных для каждого человека.

Системы бывают двух типов:

  • "один к одному" (например, при разблокировке телефона),

  • "один ко многим" (поиск лица в базе данных).

Именно во втором случае в прошлом чаще всего возникали ошибки.

Ошибки прошлого

В 2018 году исследование выявило драматический перекос: тёмнокожих женщин некоторые системы путали с мужчинами.

В 2019 году NIST подтвердил проблему: алгоритмы ошибались в 10-100 раз чаще при идентификации азиатских и тёмнокожих лиц. В ряде случаев ошибки приводили к арестам невиновных.

"Перекос в моделях распознавания — это по сути проблема данных", — пояснил информатик Анубхав Джайн из Нью-Йоркского университета.

Советы шаг за шагом: как учат справедливые модели

  1. Балансировка наборов данных по полу, возрасту и цвету кожи.

  2. Применение функций потерь, которые заставляют алгоритмы одинаково точно учиться на всех группах.

  3. Проверка моделей на демографическом разнообразии.

  4. Использование синтетических изображений для восполнения пробелов.

  5. Тонкая настройка алгоритмов на реальных фото с согласия людей.

А что если…

Что если генерация синтетических лиц станет нормой? Тогда отпадёт необходимость собирать миллионы фото из интернета. Но при этом рискуем получить модели, слишком "идеализированные" и плохо справляющиеся с реальными, "грязными" условиями.

Примеры исследований

В 2023 году исследователи создали датасеты с 10 000 синтетических лиц. Алгоритм, обученный на них, показал меньшую точность, но и меньший перекос: разница между группами сократилась в три раза по сравнению с моделью, обученной на реальных данных.

Это означает, что синтетика может стать важным инструментом, но пока не заменяет реальность.

FAQ

Почему ИИ ошибался чаще с женщинами и людьми с тёмной кожей?
Потому что в обучающих наборах было больше фото белых мужчин.

Можно ли доверять распознаванию лиц в аэропортах?
Сегодня точность очень высока, но остаются риски как технических, так и человеческих ошибок.

Станет ли синтетика решением проблемы приватности?
Вероятно, да, но только при гибридном подходе с реальными фото.

Мифы и правда

  • Миф: распознавание лиц теперь идеально.
    Правда: в контролируемых условиях — да, но в реальной среде остаются сбои.

  • Миф: синтетические лица решают все проблемы.
    Правда: они снижают риск утечки данных, но пока уступают в точности.

  • Миф: алгоритмы больше не дискриминируют.
    Правда: перекосы уменьшились, но полностью не исчезли.

3 факта

• В базе Clearview AI, по оценкам, более 60 млрд изображений, собранных без согласия.
• IBM создала набор Diversity in Faces из миллиона фото, но тоже без разрешения владельцев.
• С 2018 года ошибка в алгоритмах снизилась более чем на 90%.

Исторический контекст

  1. 2010-е — внедрение CNN и массовый рост точности.

  2. 2018 — скандалы из-за дискриминации и исследований.

  3. 2023 — первые эксперименты с синтетическими лицами для обучения.

Баланс между точностью и правами

"Каждый человек, независимо от цвета кожи, пола или возраста, должен иметь равные шансы быть корректно распознанным", — сказал информатик Кетан Котвал из института Idiap.

Учёные согласны: лучше точный алгоритм, чем система, которая ошибается. Но они также признают, что вместе с ростом точности растёт и риск тотальной слежки.

Автор Арина Михайлова
Арина Михайлова — журналист, корреспондент МосТаймс

Читайте также

Удар из орбиты слышен даже в недрах Земли: сигналы пришли оттуда, где их не ждали вчера в 13:01

Учёные нашли способ отслеживать космический мусор прямо во время его падения на Землю. Сейсмодатчики помогают быстрее и точнее определять зоны риска.

Читать полностью »
Её помнили не как чью-то тень: находка в Помпеях заставила историю оправдываться вчера в 8:04

В Помпеях нашли гробницу с женской фигурой, указывающей на высокий статус и возможную религиозную роль. Находка меняет взгляд на власть женщин в Древнем Риме.

Читать полностью »
Спят десятилетиями, но не пусты внутри: спокойствие оказалось самой опасной иллюзией вчера в 5:12

Даже "спящие" вулканы могут хранить крупные запасы магмы под поверхностью. Новые данные меняют подход к оценке вулканических угроз.

Читать полностью »
Прошлое планеты уходит под воду: что скрывают ледяные цилиндры нового архива Земли вчера в 3:03

В Антарктиде создали первый ледяной архив, где хранят климатическую память планеты. Учёные спешат спасти данные, пока ледники не исчезли.

Читать полностью »
B-52 — это не коктейль, а день, когда Америка чуть не взорвала сама себя 01.02.2026 в 0:34

В 1961 году мир едва избежал ядерной катастрофы, когда американский бомбардировщик B-52G потерпел крушение, разбросав по территории США две ядерные бомбы, одна из которых находилась в шаге от взрыва.

Читать полностью »
Компьютерные модели выявили вклад Марса в ледниковые ритмы Земли 31.01.2026 в 22:39
Климат Земли сдвигается не сам по себе: найден космический триггер, скрывавшийся в орбите другой планеты

Компьютерные модели показали, что гравитация Марса могла влиять на орбитальные ритмы Земли и темп ледниковых периодов в глубокой истории планеты.

Читать полностью »
Лишайники ускорили выброс углекислого газа после дождей 31.01.2026 в 17:18
Лес реагирует на дождь как организм в стрессе: выбросы углерода взлетают, и причина этого не так очевидна

После летних ливней сибирские леса начинают активно выделять углекислый газ. Учёные выяснили, почему лишайники и мох по-разному влияют на этот процесс.

Читать полностью »
Восточный волк утратил большую часть ареала в Северной Америке 31.01.2026 в 11:52
Старая карта хищников треснула: в Северной Америке нашли волков, чья судьба драматичнее любой легенды

Восточный и рыжий волки Северной Америки остаются одними из самых уязвимых хищников континента, балансируя между исчезновением и сохранением.

Читать полностью »