First principles framework: progress report на середину августа 2025

топ 100 блогов ailev13.08.2025 Меня сильно радует, что люди дают FPF в качестве файла, затем просят использовать его для работы над своими какими-то прикладными вопросами -- а если он отвечает на птичьем (а он таки отвечает на птичьем, типа "не путайте U.Method и U.MethodSpec, то есть не путайте метод и описание метода), то можно просто попросить отвечать как инженеру-менеджеру, и AI поймёт. Работает с большинством умных AI-ассистентов, чем там больше контекст и лучше местный RAG, тем работает лучше. Всё как у людей: следование одному и тому же регламенту у разных людей даёт немного разные результаты (зависит от того, кто этому регламенту следует), но результаты всё лучше, чем при игнорировании регламента.

В работу над First Principles Framework вмешался форс-мажор: смена версии o3 Pro на GPT-5 Pro. Эта версия очень неглупа, но пока работает нестабильно: страдает потерей памяти.Контекст у этой версии 400Ктокенов только в API, а в ChatGPT Pro версии это сразу 128Ктокенов, мои же загруженные тексты - это примерно 500Ктокенов (это мне Gemini 2.5 Pro посчитала в интерфейсе AI studio). Конечно, токены Gemini и токены GPT-5 - разные, но порядок величины должен быть понятен: FPF рабочий файл вырос до примерно 1Мзнака, а токен - это примерно 4 англоязычных знака. Такое впечатление, что контекст в GPT-5 Pro время от времени просто скидывается в ноль, и об этом не предупреждается, а модель вдруг не помнит предыдущей реплики и в ответ на запрос уходит в глубокие галлюцинации. Увы, Gemini 2.5 Pro не так талантлива, а Grok и вовсе другого (первого, не высшего) сорта модель. Grok на текущем этапе просто выбыл из игры. Он отлично ищет новости последних трёх дней, но вот с большими проектами у него очень тяжело идёт. Поэтому ждём, пока отладят GPT-5 Pro и радуемся, когда он полдня уже сегодня работает стабильно.

По содержанию работы -- разобрались как-то с "универсальной холоничностью" (системы и эпистемы разбираются на части и собираются из частей в целое), а сейчас существенно меняем концепцию ролей: они становятся контекстно-зависимые. Всё там довольно радикально по сравнению с текущим содержанием. Contextual Role-Binding (CRB) – это универсальный механизм в First Principles Framework (FPF) для связывания любого холона (U.Holon – будь то системный или эпистемический объект) с конкретной ролью (U.Role) в рамках определённого границы контекста (U.BoundedContext). Иначе говоря, CRB вводит специальный объект U.RoleBinding, который явно фиксирует триаду: носитель роли, роль и контекст. Контекст тут -- расширенное понимание bounded context из DDD (domain-driven design), "проектный контекст", это более узкое понятие, чем domain (предметная область). Связка Holder#Role:Context означает, что некоторый холон (например, конкретная система или знание) выполняет заданную роль в пределах чётко ограниченного контекста. Никакая роль не существует сама по себе, вне контекста. Роли получают смысл только внутри своего U.BoundedContext. Например, роль «инженер» имеет определённый набор обязанностей и полномочий лишь в контексте конкретного проекта (скажем, Project Phoenix), но не по всему миру вообще. Формально это достигается тем, что у каждой U.Role указывается, в каком контексте она определена и действует (глобальные “универсальные” роли запрещены). Каждая роль «привязана» к единственному контексту через поле context внутри U.RoleBinding, что делает значение роли локальным и однозначным. Это всё очень неоднозначно, но решает множество проблем. В частности, при таком подходе нет мереологии ролей (что всегда смущало), а ещё ввиду многозначности слова "функция" было решено от него избавиться (в том числе не U.FunctionalRole, а U.Role). Да, никаких больше "функциональных объектов", а терминология "функций" сдвигается куда-то в предметно-специфические языки (и там уж пусть разбираются как-нибудь, что оно означает в каждой предметной области, в каждом bounded context для этой предметной области). Вот прямо сейчас вставил паттерны для enactment ("осуществление"): U.Method и U.MethodSpec, U.Work, U.WorkPlan, и там ещё много чего интересного появилось (например, U.Service, U.Dynamics).

В любом случае, к концу августа FPF должен превратиться во что-то вменяемое. Уже сейчас там огромное количество чеклистов, которые в состоянии проверить топовый AI, эти чеклисты могут закрыть огромное количество ошибок мышления. Это уж точно работает не хуже ловли cognitive biases в рассуждениях, только тут ошибки другого сорта, а кроме ловли ошибок работает ещё и выдача подсказок. Попробуйте, всё работает и с недоделанным вариантом, удивительно.

Вот текущая версия, она каждый день обновляется: https://disk.yandex.ru/d/N2xaJZWo-hhFYw (там сейчас .md файл на 0.9M знаков).

Художник Альфонс Муха опять немного поменял стиль. С каждой новой AI-моделью его стиль меняется довольно отчётливо. И сразу понятно, почему все пользователи возопили о возвращении древней модели 4o: им от модели не нужны хорошие мозги, им от модели нужны хорошие картинки!

First principles framework: progress report на середину августа 2025 enactment

Оставить комментарий

Предыдущие записи блогера :
30.07.2025 lytdybr
Архив записей в блогах:
Я скопирую очень точную, на мой взгляд, цепочку твитов Тома Николса, в которой он описывает реакцию трампистов на доклад Мюллера. Эту же реакцию трампистов мы все могли и можем наблюдать в моем журнале. Но я сначала отдельно приведу один из твитов цепочки, в котором, как мне кажется, ...
...
Кроме шуток, но сей вопрос перманентно волнует практически всё прогрессивное человечество уже более 30 лет как. Мнения разнятся, и вариантов масса: идеалист-романтик, мудак, реформатор, предатель, гуманист, слабовольный мечтатель, сука и тварь, и т.д. и т.п. Тем временем, Михаил ...
Навеяно постом  и некоторыми комментариями к нему. Довольно часто в реале я слышу жалобы девушек на то, что их мужчина проводит время, играя в компьютерные игры.  Скажите, девушки, почему вдруг мужчина не может выбирать себе досуг по своему ...
Мне вот такие письма странно получать, но их мне все равно постоянно пишут. Вроде знают все, как я куриц не люблю, и все равно пишут. Видимо не считают себя курицами. Почему бы не писать в бесчисленные женские сообщества, где можно покудахтать с такими же как они? Как думаете, друзья? ...