Искусственный интеллект и мозг
Искусственный интеллект и мозг
Кирилл Казаков Опубликована 18.09.2025 в 1:30

Давид и Голиаф по-новому: крошечный интеллект показал зубы и разгромил GPT в логике

Sapient: новый искусственный интеллект превзошёл GPT в тестах на логику

Мир искусственного интеллекта переживает неожиданный поворот. Там, где лидеры индустрии годами делали ставку на масштаб и миллиарды параметров, маленький стартап из Сингапура показал иной путь. Его модель HRM не просто соревнуется с системами вроде GPT-4, а в некоторых случаях даже превосходит их, используя при этом лишь крохи вычислительных ресурсов.

Архитектура, вдохновлённая мозгом

В основе успеха Sapient лежит принципиально новая схема обработки информации. Hierarchical Reasoning Model (HRM) построена по двухуровневой структуре: контроллер отвечает за общее планирование, а исполнитель — за детализированные расчёты. Эти два модуля взаимодействуют циклично, что позволяет системе совершенствовать свои решения в процессе. Такой подход ближе к тому, как работает человеческое мышление.

Почему это важно

Современные языковые модели полагаются на метод цепочки рассуждений (Chain-of-Thought). Он разбивает задачи на шаги, но требует гигантских объёмов данных и зачастую замедляет работу. HRM действует иначе: задача решается за один проход, что снижает задержки и делает систему устойчивее. На тесте ARC-AGI, где проверяется умение работать с абстрактными задачами, HRM показала 40,3% точности против 34,5% у OpenAI и всего 21,2% у Claude.

"Результаты впечатляют, но мы пока не знаем, что происходит внутри системы", — сказал исследователь ARC.

Сравнение

Модель Кол-во параметров Точность на ARC-AGI Объём данных для обучения
HRM (Sapient) 27 млн 40,3% 1000 примеров
o3-mini-high (OpenAI) ~30 млрд 34,5% массивные датасеты
Claude 3.7 (Anthropic) ~70 млрд 21,2% интернет-корпус
Deepseek R1 >100 млрд 15,8% интернет-корпус

Ошибка → Последствие → Альтернатива

  • Ошибка: слепо доверять только крупным моделям.

  • Последствие: рост расходов на инфраструктуру, задержки в работе.

  • Альтернатива: внедрение HRM или аналогичных лёгких моделей для отдельных сценариев.

  • Ошибка: ожидать от HRM универсальности GPT-4.

  • Последствие: неудовлетворённые ожидания в текстовой генерации.

  • Альтернатива: использовать HRM как дополнение, а не замену.

А что если…

Если гипотеза Sapient подтвердится, индустрия может повернуть от гонки "больше параметров — больше мощности" к поиску архитектурных решений. Тогда акцент сместится в сторону экологичных систем, которые потребляют меньше энергии и лучше решают задачи, требующие логики, а не памяти.

Плюсы и минусы HRM

Плюсы Минусы
Минимальные вычислительные ресурсы Нет открытой версии для тестов
Высокая точность в логических задачах Не прошла экспертную проверку
Более быстрые ответы Ограниченный функционал
Экономия на энергопотреблении Скепсис исследователей

FAQ

Как выбрать модель для бизнеса — HRM или GPT-4?
Для генерации текстов и диалогов лучше подойдут крупные LLM, для логических задач — HRM.

Сколько стоит использование HRM?
Точных данных пока нет, но теоретически расходы должны быть на порядок ниже из-за малых параметров.

Что лучше для стартапа — Claude или HRM?
Claude эффективнее в текстах, HRM — в логике. Всё зависит от типа задач.

Мифы и правда

  • Миф: чем больше параметров, тем умнее модель.
    Правда: HRM показала, что структура важнее масштаба.

  • Миф: маленькие модели не могут конкурировать с гигантами.
    Правда: HRM обошла GPT-4 в специализированном тесте.

  • Миф: будущее ИИ — только в росте мощности серверов.
    Правда: архитектурные инновации открывают новые горизонты.

3 интересных факта

  1. HRM обучили всего на 1000 примерах — это несравнимо меньше, чем у конкурентов.

  2. Модель работает без предварительной настройки и обучения с подкреплением.

  3. Логические задачи вроде судоку она решает почти безошибочно.

Исторический контекст

История искусственного интеллекта знает разные этапы. В 1950-х доминировали символические подходы. В 1980-х появились нейросети. В 2010-х — взрыв глубокого обучения и миллиардные модели. HRM может стать новым поворотом: возвратом к поиску принципиально новых архитектур, а не к простому масштабированию.

Читайте также

Опрос выявляет нейтральные ассоциации об акулах — Университет Южной Австралии сегодня в 8:02
Акулы теряют образ монстров — новое исследование показало неожиданную реакцию людей

Новое исследование показывает: люди думают об акулах не только через страх. В ответах участников появились любопытство, уважение и осознание важности этих морских хищников.

Читать полностью »
Аромат бекона меняет метаболические реакции будущих мышат — MPI сегодня в 7:14
Запах бекона меняет судьбу потомства — беременность реагирует так, что учёные не поверили глазам

Учёные выяснили, что запах жирной пищи во время беременности может менять метаболизм потомства: аромат бекона у беременных мышей запрограммировал склонность к набору веса у их детёнышей.

Читать полностью »
Костяной дом Межириха раскрывает краткость проживания охотников — Вэй Чу сегодня в 6:18
Кости мамонтов заговорили спустя 18 тысяч лет: ледниковый дом раскрыл тайну исчезнувшей деревни

Учёные переосмыслили костяные дома Межириха: новые датировки показывают, что внушительные сооружения из мамонтовых костей были не деревнями, а кратковременными лагерями охотников.

Читать полностью »
Динозавры прекращали заботу о молодняке после ранних этапов – Томас Хольц сегодня в 5:39
Детёныши динозавров жили сами по себе — родители делали то, что сегодня кажется немыслимым

Учёные переоценивают роль детёнышей динозавров: новые данные показывают, что маленькие особи жили иначе, чем взрослые, формируя уникальные экологические ниши.

Читать полностью »
Микробы превращают растительные молекулы в активные вещества – международная группа сегодня в 4:24
Растительная пища действует не на всех — микробы запускают скрытый механизм, который меняет результат

Учёные выяснили, что эффективность растительной диеты зависит от набора ферментов кишечных микробов: именно они превращают растительные вещества в активные формы.

Читать полностью »
Холод изменяет границы телесного восприятия и повышает чувствительность сегодня в 3:19
Температура кожи меняет самость — лёгкое тепло заставляет мозг делать то, что никто не ожидал

Учёные выяснили, что даже слабые сигналы температуры кожи могут менять ощущение себя, влиять на эмоции и формировать внутреннее равновесие.

Читать полностью »
Концентрация воды на суше вызвала истинное полярное блуждание – учёные Гарварда сегодня в 2:14
Плотины смещают Землю — вода заставила географический полюс уйти в неожиданную сторону

Учёные выяснили, что многотысячное строительство плотин за два века сместило географический полюс Земли более чем на метр. Как перемещение воды меняет планету?

Читать полностью »
Алгоритмы различают типы львиных вызовов с точностью 95% – Университет Оксфорда сегодня в 1:05
Львы разделили рев на два типа — исследование раскрыло деталь, от которой мурашки по коже

Учёные выяснили, что львы используют два разных типа рева и даже развивают региональные акценты. Новые данные раскрывают, как звук помогает хищникам общаться и защищать территорию.

Читать полностью »