Агенты


В 2025 году будут часто употреблять слово "агент" в сочетании с нейронками. Чтобы сразу избавить вас от bullshit, предлагаю запомнить, что под "агентом" подразумевается любой софт, подключенный к нейронке. Или нейронка, подключенная к некоему софту.
Агент - это чат, который смог в нечто большее, к примеру, открыть или создать файл. Не прочитать прикрепленный вами файл, а сам найти в допустимом пространстве нужный файл и залить его в нейронку для расширения ее кругозора в нужном вопросе.
По программистским агентам, которые уже вышли, это особенно заметно - Windsurf, Cursor, Cline. Они все заявили, что "агенты". По сути они умеют только
- сами создавать пачку файлов и папок
- удалять такое же
- исполнять команды в консоли
- читать вывод из консоли и делать шаги в зависимости от его вывода - к примеру, исправлять ошибки
- открывать браузер
Легендарные свойства агентов, о которых много будут трындеть
- "они будут делать работу целиком"
- "они не потребуют участия человека"
В программистских "агентах" эти свойства часто не выполняются.
Во-первых, любой кодовый проект через некоторое время
превращается для нейронки в непосильную задачу - чтобы работать с
ним, надо самому думать о том, какие кусочки предлагать машине,
чтобы она не поперхнулась и не вошла в мертвый цикл бесконечного
создания новых багов вместо правки старых.
Во-вторых, агенты часто работают под присмотром - они говорят -
"хочу создать такие-то файлы, открыть браузер, запустить команды в
консоли" - и ждут одобрения от человека. Есть вроде решения без
одобрения, но их рекомендуют запускать в виртуальных
песочницах.
update: OpenHands не ждет одобрения, это как раз пример
агента работающего в песочнице Docker. На скриншоте запредельно
простые просьбы, которые оскорбляют саму идею агентов. Особенно про
создание папки понравилось. Нет, команды для агента должны быть
такие
- создай мне проект для быстрой проверки гипотезы в фреймворке,
в котором я пока плохо разбираюсь.
Еще раз, как я отчетливо сейчас вижу, AI agent - это прежде всего
софт, который лежит между пользователем и нейронкой. Этот софт
может свободно менять нейронки, поэтому AI agent не означает
"нейронка, которая смогла", это софт смог обогатить промпт
пользователя, а вывод нейронки распарсить на команды.
Большой плюс AI agents в том, что они могут создавать и читать
файлы. В программистских агентах можно заказывать любые тексты -
потому что они подключены к обычным универсальным нейронкам. Это
чат, который всегда с тобой, чат, историю и результаты которого
можно хранить в файлах.
По моим ощущения, программистские агенты действительно удобны. Они
избавляют от копипасты между обычным чатом и автоматизируют
простейшие действия. К примеру, можно постоянно запускать через них
команду в консоли "проверь все типы" - и они будут исправлять
типизацию, если консоль выдаст ошибки, самостоятельно.
Программистские агенты сейчас, 1 декабря 2024 года, присутствуют в
таких продуктах
- Cursor
- Windsurf
- Cline
В ближайшее время режим агента появится в Github Copilot.
Это агенты, добавленные к редакторам кода, что удобно.
Также есть "чистые агенты", без возможностей IDE (редактора кода),
впрочем ничто не мешает запускать редактор кода параллельно. Эти
чистые агенты
- Aider, который кстати ведет свою таблицу рейтингов разных нейронок, на которую
уже все посматривают, когда хотят понять, как разные нейронки ведут
себя в задачах программирования .
Aider выглядит как говно инструмент для работы с командной
строкой.
- OpenHands, бывший OpenDevin, open source
альтернатива Devin от Microsoft. Он выглядит как чат, который умеет
создавать файлы, еще у него есть простенький редактор кода.
Агент - это софт, в первую очередь софт по работе с промптом
пользователя и выводом нейронки. Как это может работать, дают
намеки такие посты
- Chain
of Code
- Дерево мыслей, ToT (Tree of Thoughts)
Под капотом у агента
- свои системные промпты для нейронки
- свои стратегии для обработка промпта пользователя
- свои стратегии для парсинга вывода нейронки
- что-то для обогащения контекста беседы - в программистских
агентах это индексирование кодовой базы, оно было внедрено еще до
агентов, и помогало при автодополнении кода или просто в чате
- все, что пожелает создатель агента
Под каждую отрасль можно создать своего агента, и исходя из того,
что я вижу в программировании, в 2025 это будут не волшебные
джинны, которые моментально перенесут вас в столицу конечного
назначения, а скорее полуразумные джуны, которые будут брать вас за руку
и вести по пустыне.
Делайте выводы.
|
</> |