рейтинг блогов

Пропорции и соотношения

топ 100 блогов staerum12.12.2025
«Во всякой вещи скрыт узор, который есть часть Вселенной. В нём есть симметрия, элегантность и красота — качества, которые прежде всего схватывает всякий истинный художник, запечатлевающий мир. ... Мы пытаемся скопировать этот узор в нашей жизни и нашем обществе и потому любим ритм, песню, танец, различные радующие и утешающие нас формы» — Дюна

LLM часто называют «стохастическими попугаями», указывая на простоту их функции — генерацию следующего слова по предыдущему тексту. На это можно смотреть по-разному. Возможно, эта простота имеет отношение и к нам.

Сам ты попугай
Сам ты попугай

Если вы видели игры «угадай мелодию» или «100 к 1», то знаете как бывает приятно угадывать ответы. И это не случайно. Еще в 19-м веке Гельмгольц в своих работах по физиологии зрения (Helmholtz's Treatise on Physiological Optics) предположил, что мозг непрерывно старается достроить воспринимаемую картину до наиболее вероятной, заполняет лакуны предположениями. В конце 20-го века эти работы были развиты нейрофизиологической теорией прогнозирующего кодирования. А в 21-м легли в основу принципа свободной энергии Карла Фристона.

В этой концепции мозг моделируется как иерархическая предсказательная машина, которая постоянно генерирует модели мира, предсказывает сенсорные входы и минимизирует ошибку предсказания. Пытается угадать всякую мелодию и предсказать любой паттерн. Так что между нашим пониманием работы мозга и большими языковыми моделями есть кое-что принципиально объединяющее.

Базой для работы языковых моделей являются так называемые эмбеддинги (embedding). Эмбеддинги — это сжатое представления связи понятий в языке, многомерные (до многих тысяч измерений) карты, где слова и идеи связаны расположением по смыслу, как нейроны в коре головного мозга.

Обучение на океанах текстов учит модель размещать понятия в многомерном пространстве: "король" и "королева" — близко, а "яблоко" как фрукт и как компания — разделены, но связаны нюансами контекста. Причём расстояние и направление понятий "король" и "королева" будут на приблизительно том же расстоянии друг от друга и в том же направлении, что "мужчина" и "женщина". Эти свойства не случайны — они эмерджентны, рождены из минимизации "удивления", как у Фристона.

Условные проекции многомерного пространства эмбеддингов
Условные проекции многомерного пространства эмбеддингов

Это пространство полно свойств, напоминающих человеческое мышление: семантическая близость, где похожие идеи кластеризуются; векторная арифметика, где "король - мужчина + женщина = королева", раскрывающая скрытые симметрии.

В сердце LLM, лежит архитектура, где слои "внимания"  фокусируются на связях между словами. Слои формируют иерархию абстракций, где нижние слои ловят простые понятия, а верхние — сложные нарративы, подобно тому, как мозг строит связи от ощущений к концепциям.

В этом видео, например, вечно скептичная Сабина Хоссенфельдер говорит, что схема понимания у LLM и людей имеет много общего. Распознавание схем и экстраполяция поведения по схемам это то, что мы делаем. Или вот, про статью Natural speech reveals the semantic maps that tile human cortex (2016):

Human brains do something similar: Neuroscientists at UC Berkeley mapped how concepts tile across the cortex using fMRI scanning. They found that our brains create semantic maps with the same kind of geometric organization as AI systems¹⁰. Different people’s brains, and different AI models, converge on similar spatial arrangements for concepts. (c)
Человеческий мозг действует схожим образом: нейробиологи из Калифорнийского университета в Беркли с помощью фМРТ-сканирования составили карту распределения понятий по коре головного мозга. Они обнаружили, что наш мозг создает семантические карты с такой же геометрической организацией, как и системы искусственного интеллекта. Мозги разных людей и различные модели ИИ приходят к схожим пространственным структурам для понятий.
Многоꙮкое внимание языковой модели
Многоꙮкое внимание языковой модели

LLM, конечно, не копируют нас — базовые понятия у нас укоренены в физиологии тела, а у сеток опираются на связи между словами. Но схемы работы, выстраиваемые с  языкового уровня имеют уже довольно много общего. А в ритмах и узорах часто важнее пропорции, чем детали.

Оставить комментарий

Архив записей в блогах:
Ещё недавно человечество жило в пещерах, находя там защиту, уют, тепло. Но не прошло и 40 000 лет, как многие люди, избалованные цивилизацией, стали воспринимать пещеры иначе. Дескать, там сыро, местами грязно, а главное... страшно. Да, некоторые ...
Перевожу сразу на имперский За кусок гнилой колбасы ... Украинские гниды Сегодня в 16: 357354672 Не так страшны московские вши, как украинские гниды! (С) Кому война, а кому "мать родна" - это уже не смешно ни разу. Пока наши ребята воюют и погибают, в центре столицы воюющей ...
Умница Лилит пишет: "И когда ты читаешь какую-нибудь скобейду и думаешь о том, что хорошо бы взять ее за ноги да и ебануть об угол -- у тебя в этот момент точно такое же лицо, как и у нее." ...
Абсолютно все финские компании ушли с российского рынка, но это не дало никакого результата, заявил президент Финляндии Саули Ниинистё. «Мы одна из крайне немногих стран в этой ситуации. К сожалению, кажется, что этот механизм неэффективен», – подытожил президент страны. ...
Ответы на Анатонны. Задание 20 Угадали все три идиомы без подсказки: bellanca115 e_liza_vetka leha_sparrow barsik_seacat Поздравляю!!! Спасибо всем, кто участвовал! взять на пушку звёзд с неба не хватать ...