Область Брока показала тайный порядок: мозг понимает речь почти как языковая модель

Учёные сравнили мозг и языковые модели и нашли общую временную иерархию

В момент, когда человек понимает услышанную речь, его мозг работает не хаотично, а поэтапно, шаг за шагом. Новое исследование показывает, что эта временная организация удивительно напоминает структуру современных больших языковых моделей, используемых в искусственном интеллекте. Речь идёт не о метафоре, а о прямом сопоставлении нейронной активности и внутренних слоёв LLM. Об этом сообщает научное издание со ссылкой на международную исследовательскую группу.

Как мозг и языковые модели оказались на одной шкале времени

В основе исследования лежат прямые записи активности мозга, сделанные в тот момент, когда участники слушали одну непрерывную историю продолжительностью около 30 минут. Учёные сопоставили эти данные с внутренними представлениями языковых моделей, включая GPT-2 и Llama 2. Такой подход позволил сравнивать не только результат обработки, но и сам процесс формирования смысла.

Анализ показал, что активность, возникающая позже во времени, сильнее всего совпадает с более глубокими слоями моделей. Именно в этих слоях языковые модели интегрируют контекст и формируют обобщённое значение. В мозге аналогичные пики активности наблюдались в языковых областях более высокого порядка, где ранее уже фиксировалась согласованность нейронов при совместной когнитивной нагрузке.

Какие области мозга участвовали в анализе

Работа была выполнена совместной группой учёных из Иерусалима, Принстона и промышленных исследовательских лабораторий. Основное внимание уделялось классическим языковым зонам мозга, включая область Брока и верхнюю височную извилину. Эти регионы давно известны своей ролью в синтаксисе, семантике и понимании связной речи.

Для регистрации сигналов использовалась электрокортикография — метод, при котором тонкие электроды временно размещаются непосредственно на поверхности коры головного мозга во время клинического мониторинга. Такая технология позволяет фиксировать быстрые изменения активности, связанные с локальным возбуждением нейронов, с точностью, недоступной неинвазивным методам.

Временное накопление смысла, а не резкий скачок

В области Брока исследователи обнаружили чёткую закономерность: чем глубже слой языковой модели, тем позже во времени наблюдается максимальное совпадение с нейронным сигналом. Между глубиной слоя и задержкой пика активности была зафиксирована корреляция 0,85, что указывает на устойчивую связь.

Эта картина говорит о том, что понимание речи формируется постепенно. Мозг не переходит мгновенно от звука к значению, а накапливает информацию, последовательно уточняя интерпретацию. Такой процесс хорошо согласуется с тем, как LLM шаг за шагом преобразуют входной текст от поверхностных признаков к абстрактным представлениям.

Что удивило самих исследователей

Руководителем работы стал доктор Ариэль Гольдштейн из Еврейского университета в Иерусалиме, специализирующийся на нейронных механизмах обработки естественного языка.

"Что нас больше всего удивило, так это то, насколько близко временное раскрытие смысла мозгом соответствует последовательности преобразований внутри больших языковых моделей", — отметил доктор Ариэль Гольдштейн.

"Несмотря на то, что эти системы построены очень по-разному, обе, похоже, сходятся на аналогичном, пошаговом наращивании к пониманию".

Где временная иерархия проявляется сильнее всего

Самая отчётливая временная прогрессия была зафиксирована не в ранней слуховой коре, а в языковых областях более высокого уровня. Это логично, поскольку именно эти регионы интегрируют контекст, накапливающийся в течение сотен миллисекунд.

Интересно, что слова, которые языковая модель заранее хорошо предсказывала, вызывали более раннее и сильное совпадение с активностью мозга. Подобные эффекты ожидания ранее проявлялись и в исследованиях, где анализировалось разделение внимания при разборе речи в сложной акустической среде.

Обработка времени вдоль языкового пути

В височном полюсе разница между самым ранним и самым поздним пиками активности, связанными с разными слоями модели, превышала 500 миллисекунд. Это говорит о том, что по мере продвижения информации по языковому пути увеличивается временное окно обработки.

Подобные результаты перекликаются с более ранними исследованиями временных восприимчивых окон — интервалов, в течение которых предыдущий вход влияет на текущую реакцию нейронов. Новые данные вновь подтверждают иерархию, в которой сенсорные области работают с короткими интервалами, а повествовательные и смысловые центры — с более длинными.

Контекст важнее формальных единиц

Классические символические признаки оказались слабыми предикторами временной структуры мозговой активности. Это касалось как фонем, так и морфем.

Зато контекстные вложения показали значительно более сильное совпадение. Такие представления кодируют значение слова с учётом окружающего контекста, подчёркивая роль распределённой семантики при естественном восприятии речи.

Ограничения и осторожность в выводах

Авторы подчёркивают, что сходство между мозгом и LLM не следует трактовать как прямую эквивалентность. Трансформеры обрабатывают длинные последовательности параллельно, тогда как корковые цепи действуют в условиях биологических ограничений и последовательного времени.

Дополнительное ограничение связано с выборкой: данные получены от девяти пациентов с эпилепсией, у которых электроды были установлены по клиническим показаниям. Это требует осторожности при обобщении результатов.

Почему эти данные важны для науки

Вместе со статьёй исследователи опубликовали открытый набор данных с прямыми нейронными записями, выровненными по каждому слову 30-минутного рассказа. Такой подход позволяет проверять теории понимания языка не абстрактно, а на уровне реальной нейронной динамики.