Учёный за компьютером и ИИ
Учёный за компьютером и ИИ
Кирилл Казаков Опубликована 06.09.2025 в 11:25

Шах и мат воображению? Идеи ИИ и людей оказались почти одинаковыми

Эксперты оценили: гипотезы, сгенерированные ИИ, почти сравнимы с идеями учёных

В мае стартап FutureHouse из Сан—Франциско сообщил о возможном лекарстве от потери зрения. Но заслуга принадлежала не только ученым: ключевые этапы исследования — от анализа литературы до формулировки гипотез — выполнял искусственный интеллект, созданный командой.

Как ИИ ускоряет науку

Во многих областях — от информатики до химии — ИИ заметно ускоряет научный процесс. Он за секунды обрабатывает огромные массивы публикаций и предлагает направления для будущих исследований. Но насколько жизнеспособны эти идеи?

Новое исследование, опубликованное в июне на arXiv, показало: гипотезы, созданные ИИ, пока что уступают человеческим при проверке на практике. Однако разрыв не так велик и со временем может сократиться.

"ИИ не так хорошо оценивает возможность проверки идей, которые он предлагает", — пояснил аспирант Ченглей Си, Стэнфорда и ведущий автор работы.

Сила и слабость гипотез ИИ

Учёные сосредоточились на области обработки естественного языка (NLP) — фундаменте больших языковых моделей. Они поручили Claude 3.5 Sonnet, разработанной компанией Anthropic, сгенерировать тысячи идей, опираясь на базу данных Semantic Scholar. Затем экспертам по NLP предложили составить конкурирующие гипотезы.

Результаты удивили: независимые специалисты в среднем оценили идеи ИИ выше, чем человеческие. Этот вывод привлёк внимание СМИ. Но когда дело дошло до практических тестов, оценки резко снизились. Средний балл новизны гипотез ИИ упал с 5,382 до 3,406, а у людей — с 4,596 до 3,968.

"На словах идеи ИИ могут звучать заманчиво, но при реализации часто оказываются лишь вариациями старых методов", — отметил Си.

Сложности оценки новизны

Специалисты признают: новизну научных идей трудно измерить объективно.

"Новизна — это ахиллесова пята рецензирования и одна из самых сложных задач при оценке исследований", — сказал эксперт по обработке данных Джевин Уэст, из Вашингтонского университета.

Дэн Уэлд, главный научный сотрудник Института искусственного интеллекта Аллена, считает исследование важным, но обращает внимание на его ограничения.

"Учёные использовали лишь одну языковую модель, хотя для объективности следовало бы привлекать разные ИИ-системы. Кроме того, единого мнения среди рецензентов всё равно не бывает — оценки новизны нередко расходятся", — сказал Дэн Уэлд.

Что дальше

Си признаёт, что проверка идей ИИ людьми занимает слишком много времени. Но он уверен, что большие языковые модели будут учиться на примерах прошлых успешных экспериментов и со временем улучшат способность отличать действительно новые гипотезы.

Несмотря на все ограничения, сам факт, что ИИ и человек показывают сопоставимые результаты, ещё несколько лет назад казался фантастикой.

Читайте также

Исследователи установили минимальное влияние плацебо — MJA сегодня в 13:30
Лекарство-пустышка спустили на землю: его эффект оказался слабее, чем принято считать

Австралийские исследователи проанализировали научные данные о плацебо и пришли к выводу, что его влияние значительно слабее, чем принято считать.

Читать полностью »
Найдены следы совместных переселений людей и собак — генетики из Китая сегодня в 12:29
Первые спутники, последние свидетели: как собаки переплели судьбу с человеком навсегда

Новое генетическое исследование раскрывает, как собаки на протяжении тысячелетий следовали за людьми по Евразии, отражая их миграции и культурные перемены.

Читать полностью »
Инновации ослепляют: за эффектными демо скрывается сбой, способный подорвать доверие к технологиям сегодня в 11:14
Инновации ослепляют: без проверки валидности технологии могут рушиться прямо в руках пользователей

Быстрое развитие технологий создаёт много шума. Валидность помогает отделить реальные достижения от громких обещаний.

Читать полностью »
Скорость удара гадюк составляет 4,5 м/с — Journal of Experimental Biology сегодня в 9:13
Клыки быстрее мигания: новые съёмки раскрыли скрытую механику смертельного удара змей

Учёные изучили сотни высокоскоростных видеозаписей, чтобы раскрыть скрытую механику укусов ядовитых змей.

Читать полностью »
Современные технологии облегчили уход за диабетиками — специалисты сегодня в 8:04
Диабет не приговор, а школа выносливости: как дисциплина превращает слабость в силу

История человека, который после диагноза «диабет» научился заново любить жизнь — без страха, с верой и внутренней силой.

Читать полностью »
Учёные зафиксировали рост глобальной температуры на 1,5 °C — The Conversation сегодня в 7:34
Климат стремительно подходит к скрытым рубежам: ледяные щиты и океаны подают тревожные сигналы

Учёные предупреждают: климатические системы Земли могут достигнуть переломных моментов, после которых изменения станут стремительными.

Читать полностью »
Отходы превратили в авиационное топливо — Университет Цинхуа сегодня в 6:56
Из пакета — в самолёт: как отходы становятся топливом для нового мира

Учёные предлагают неожиданный способ сократить выбросы самолётов — превращать бытовые отходы в экологичное авиационное топливо. Насколько это реально?

Читать полностью »
Электроды для добычи лития из морской воды разработала Чонг Лю сегодня в 5:17
Литий ждёт нас у берега: море может заменить рудники и перевернуть производство аккумуляторов

Учёные ищут экологичные способы добывать литий, и новый метод электрохимической интеркаляции может превратить морскую воду в устойчивый источник металла.

Читать полностью »