Паника по телефону против здравого смысла: новые схемы с клонированными голосами и способ защиты

Мошенники просят срочный перевод клонированными голосами — полиция

Нас с детства учат: родную речь не перепутаешь ни с чем. Но цифровая эпоха подтащила к нашему порогу технологию, которая ломает это правило. Клонированные голоса уже звучат в трубках и аудиосообщениях так убедительно, что даже внимательный слушатель рискует ошибиться. Недавний эксперимент британских исследователей показал: распознать, где человек, а где синтез, становится всё труднее — особенно если ИИ обучили на конкретной живой речи. Истории обманутых родителей и подделанных заявлений политиков превращают проблему из абстрактной в бытовую.

Что показало исследование и почему это важно

Работа команды из лондонского Queen Mary под руководством Надин Лаван устроена просто: добровольцам давали послушать реальные и сгенерированные фрагменты речи, в том числе точные "клоны" конкретных людей. Результат тревожный: с "безличными" синтезированными голосами мы ещё как-то справляемся, а вот с персональными клонами — уже нет. Более того, даже настоящие записи пользователи путали с искусственными почти так же часто. Вывод один: полагаться на слух как на средство аутентификации больше нельзя.

Параллельно технологии стали доступнее. Чтобы создать копию голоса, уже достаточно нескольких минут записи — а их легко добыть из открытых соцсетей, интервью и сторис. Бюджет близок к нулю, программ много, интерфейсы несложные. В связке с массовыми мессенджерами, банковскими приложениям и голосовой биометрией это превращается в удобный инструмент для злоумышленников.

Реальные кейсы и новые риски

Типичный сценарий — "звонок от близкого" с просьбой срочно перевести деньги. Жертва узнаёт голос, слышит эмоции, действует на автомате. Уязвимы и "голосовые пароли" в службах поддержки и банках: спуфингу достаточно пройти порог похожести, а дальше срабатывает человеческая доверчивость. Дополнительный слой рисков — политика и репутация: фальшивые аудиокомментарии от лица публичных людей разлетаются быстрее опровержений и подрывают доверие к реальным заявлениям.

Таблица "Сравнение"

Критерий	Реальная запись	Синтез без клонирования	Клон голоса конкретного человека
Тембр и микродетали	Неровности, дыхание, "песок"	Ровно, "стерильно"	Очень близко к оригиналу
Интонации и паузы	Естественные колебания	Чуть "пластиковые" акценты	Уловимая "манера" исходника
Контекстные ошибки	Редки	Иногда не к месту эмоция	Иногда промах по факту, но звучит "правдоподобно"
Стоимость/доступность	Нужна живая запись	Дёшево, сервисов много	Дёшево/средне, нужен образец голоса
Риск для аутентификации	Низкий	Средний	Высокий

"Советы шаг за шагом"

Введите "секрет для голоса". Договоритесь в семье о кодовой фразе для экстренных звонков. Не пересылайте её текстом, храните в менеджере паролей (например, 1Password/Bitwarden).
Переходите на "что-то у вас + что-то у устройства". Включите 2FA в банках и почте (приложения-генераторы: Google Authenticator, Aegis; аппаратные ключи: YubiKey).
Для денег — "замок на калитке". Настройте лимиты и запрет операций без подтверждения в банковском приложении. Отдельная карта с низким лимитом для переводов — хорошая идея.
Проверяйте канал связи. Получили "голос" с просьбой о деньгах — перезвоните по сохранённому номеру или сверьте в другом канале (SMS, мессенджер, видеозвонок).
Запишите "цифровую аптечку". Сохраните контакты банка, полиции, оператора, а также горячих линий антифрода. Внесите их в "избранное".
Фильтруйте входящие. Подключите антиспам-идентификаторы (Truecaller, встроенные функции iOS/Android) и запрет на анонимные вызовы.
Оставляйте меньше "корма" ИИ. Ограничьте публичность сторис с голосом, удалите памятные голосовые из открытых профилей.
Для бизнеса — верификация "по второму контурy". Введите правило: любые платёжные поручения по звонку подтверждаются в корпоративном мессенджере с SSO (Slack/Teams) или через электронную подпись.

Блок "Ошибка → Последствие → Альтернатива"

Ошибка: доверились голосу и перевели деньги сразу. → Последствие: безвозвратный перевод. → Альтернатива: холд на крупные переводы + подтверждение через мобильный токен (SecureCode/3-D Secure) и обратный звонок по "белому" номеру.

Ошибка: используете голосовую биометрию как единственный фактор. → Последствие: обход аутентификации. → Альтернатива: комбинированная проверка (голос + OTP из приложения + поведенческая биометрия в банке).

Ошибка: публикуете длинные видео с чистым голосом. → Последствие: материал для клонирования. → Альтернатива: сокращайте длительность, накладывайте музыку, меняйте фон/ракурс или переводите важные сообщения в текст.

Ошибка: обсуждаете платёжные реквизиты в аудио. → Последствие: утечка данных. → Альтернатива: согласование только в зашифрованном текстовом канале (Signal/WhatsApp) + "правило двух сотрудников" для сумм выше лимита.

А что если…

Звонок пришёл ночью и вы проснулись от паники? Откройте заранее подготовленную заметку с "проверочными" вопросами (датa рождения, кличка питомца, семейная шутка). Не отвечают или путаются — завершайте разговор и перезванивайте по сохранённому контакту.

Голос звучит "слишком правильно"? Спросите "перекодирующие" вещи: попросите повторить фразу с редким словом, пропойте вместе детскую считалочку, предложите включить видео. ИИ чаще спотыкается на неожиданных или музыкальных паттернах.

Вам прислали голосовую в мессенджере? Прогоните через базовые детекторы артефактов (есть онлайн-сервисы), но принимайте результат как подсказку, а не доказательство; основная проверка — по независимому каналу.

Таблица "Плюсы и минусы"

Что оцениваем	Плюсы	Минусы
Голосовые помощники и синтез	Доступность контента, озвучка, инклюзия	Риск подделок, снижение доверия к аудио
Голосовая биометрия	Удобство, быстрое обслуживание	Уязвимость к спуфингу, нужны дополнительные факторы
Клонирование голоса для медиапроизводства	Экономия времени, дубляж, озвучка	Правовые и этические вопросы, возможность злоупотреблений

FAQ

Как выбрать безопасный метод подтверждения

Ищите схемы, где голос — не единственный фактор. Оптимум: токен в приложении + аппаратный ключ или одноразовый пароль, а голос — лишь дополнительная удобная ступень.

Сколько стоит "скопировать" голос

Для злоумышленника почти ничего: достаточно 2-4 минут чистой записи и доступного онлайн-сервиса. Поэтому главная защита — организационные правила и многофакторность.

Что лучше для семейной связи: звонок или мессенджер

Лучше "двухканальная" схема: звонок + проверка в зафиксированном чате, где заранее прописана кодовая фраза и список "безопасных" контактов.

"Мифы и правда"

Миф: "Я всегда узнаю голос близкого".
Правда: при клонировании на персональном образце ошибки распознавания у людей часты; эмоции и паника дополнительно снижают критичность.

Миф: "Банковская голосовая биометрия непобедима".
Правда: индустрия переводит голос в режим допфактора и усиливает антиспуфинг поведенческими метриками и рисковыми правилами.

Миф: "Deepfake-аудио легко вычислить на слух".
Правда: без тренировки и контрвопросов отличить синтез от оригинала сложно — особенно в коротких эмоциональных фразах.

Сон и психология

Недосып, стресс и "эффект срочности" ухудшают суждения. Ночью кортизол и усталость подталкивают к импульсивным решениям: мы быстрее соглашаемся и хуже проверяем факты. Простая профилактика — "правило паузы": пауза 30-60 секунд перед действием с деньгами, глоток воды, два контрольных вопроса.

Три интересных факта

Клонированный голос легче "держит" одно устойчивое настроение, чем быстро переключается между эмоциями.
На шумной улице синтез иногда звучит убедительнее — фон скрывает артефакты.
Детские рифмовки и скороговорки по-прежнему сложны для некоторых моделей ИИ — полезный "тест на спотыкач".

Исторический контекст

Эпоха автоответчиков: первые "роботы" были легко узнаваемы по металлическому тембру.
Появление голосовых ассистентов: Siri/Alexa нормализовали синтез в быту, но он оставался "нечеловечным".
Нейросети и персональный клон: несколько минут записи стали "топливом" для реалистичных копий, и граница между правдой и подделкой размывается.

Голосу больше нельзя доверять как "железному" доказательству. Но мы не бессильны: пара простых правил — второй канал связи, кодовая фраза, лимиты на переводы и многофакторная защита — резко снижают шанс стать жертвой. Важно не бороться с технологиями, а учиться жить рядом с ними и включать проверку фактов каждый раз, когда на кону — деньги и репутация.

Автор Дмитрий Корнеев

Дмитрий Корнеев — физик-исследователь и научный журналист, эксперт по науке и технологиям, обозреватель MosTimes.

Редактор Любовь Иванникова

Любовь Иванникова — журналист, корреспондент MosTimes