Большой обзор LLM for Code Generation

топ 100 блогов nponeccop28.06.2024 https://arxiv.org/abs/2406.00515

Там 285 референсов. Всё, что вы хотели знать про state of the art in LLM Code Generation, но боялись спросить.

Я тут смотрю поток видео на етубе в связи со всеобщим надрачиванием на Claude Sonnet 3.5. Не покидает ощущение какого-то наивняка и некомпетентности. Обзирающие все поголовно ведут себя как джуны, самостоятельно ничего сложнее пузырька не делавшие, и даже не смотревшие мультик про "мальчик квадратный ковер выбивает".

Ну то есть должно же быть очевидно, что все эти тесты "напиши мне тетрис за 1-шот" это полный бред, ни один человек с таким не справится, ну чтобы вот взять сесть писать текст и просто вот сверху вниз наебошить в редакторе на одном дыхании что-то размером с тетрис. Зачем вообще это тестировать? Ну то есть да, это такое представление о разработке софта после просмотра фильма Хакеры (я не смотрел). Бред в-общем. Классическое "все пидарасы, а я".

Причем что интересно, товарищи из AutoGPT и MetaGPT пытаются играть в ту же самую игру. А именно, исключить man-in-the-loop и сделать процесс разработки максимально непрозрачным и неконтролируемым, зато сделав ставку на полную автоматизацию процесса. Но потом получают по голове ровно тем же, что бы они получили, просто наняв команду мясных джунов и проверив их результаты через месяц -- что разработка зашла не в ту степь, причем с самого начала и совершенно на пустом месте.

Что нужно на мой взгляд -- так это история разработки проекта в гите, то есть с возможностью отката до любой точки и продолжения с этого места, а также процесс ручного утверждения и обратной связи на всех этапах. То есть никаких "циклов" из промптов быть не может. Должен быть инструмент типа коммандлайновой тулзы "develop step". Который дописывает в репу следующий шаг разработки с аудит-трейлом. (И это заодно избавляет нас от расходов на 100500 вызовов LLM API и от необходимости их кешировать).

Тут конечно нужен какой-то баланс между автоматизацией и контролем, но по факту автоматизация сейчас крайне хуевая (а ля автопилот в Тесле) и любителей автоматизировать овердохуя (см выше), так что нужна тулза для любителей контролировать.

Оставить комментарий

Архив записей в блогах:
Выставки работают! Счастье наступило! «Музей Самоизоляции» в музее Москвы. Для начала эпохальная заявка: КОВИД 19 84 ! А почему 1984?? А потому что у Оруэлла есть роман-утопия 1984, мрачное предсказание. Я не читала, только наслышана, и не могу сказать, велико ли совпадение, но интересное ...
Моя подборка фотографий Трента Парка. 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14. 15. 16. 17. 18. 19. 20. 21. 22. 23. 24. 25. 26. 27. 28. 29. 30. 31. 32. 33. 34. 35. 36. 37. 38. 39. 40. 41. 42. 43. 44. Trent Parke на Magnum Photos ...
однажды услышав эту пеню, не забуду ее никогда.. нашла ее и слушаю.. слушаю... правда в другом исполнении чем в первый раз..но это не имеет значения..  BLIND GUARDIAN - ...
19 января, в большой православный праздник Крещения Господня, президент России Владимир Путин встретился с представителями Европейского еврейского конгресса. В ходе данной встречи, президент Путин пригласил всех бегущих из Европы евреев переезжать жить в Россию. Теперь понятно, зачем нам ...
Все просвещенное и даже просто грамотное население планеты давно привыкло к тому, что такие исторические фигуры, как Махатма Ганди и Мать Тереза есть образцы гуманизма, самоотдачи, бессребренничества…, в общем, практически эталоны. И если о ...