О тестах

топ 100 блогов kvisaz14.12.2023 На Реддите жалуются и не раз, что
- новые текстовые нейронки часто откровенно заточены под тесты - и одного такого умельца, обошедшего всех на поворотах, просто выпилили вместе с его нейронками из хранилища Hugging Face
- люди сфокусировались на нейронках, а не на приложениях

нейронка сама по себе, как набор весов, это довольно малопригодное к жизни изделие, его надо настроить и запустить. Настроить - в смысле подобрать параметры запуска. На Реддите отмечают, что некоторые модели дают очень хорошие результаты при некоторых неочевидных комбинациях параметров.... но почему этим занимаются любители, а не профессионалы? В смысле, сами разработчики?

Ряд нейронок не запускается через удобные и привычные программы, вроде OoobaBooga, только через свой самописный скрипт на Питон.

Чтобы запустить скрипт на Питон, есть три пути - водка, рейвы и айти. Шутка. Надо как-то решить проблему с зависимостями, которые надо выкачать и поставить без конфликта. Для этого есть решения, а питонисты сейчас придут скажут - а что страшного?

Страшно то, что Питон в принципе был создан не для билда финальных продуктов, а для билда быстрых решений в кастомных условиях. Это круто для ученых и экспериментаторов, это привело к развитию массы крутых решений и dependency hell. Я ставил нейронки через Докер. Докер на персональном компьютере обычного пользователя - говно, которое можно намазывать на хлеб только от безысходности.

И это все работает на факт
- простому человеку не видать нормальных приложений с нейронками на своем компьютере. Только сервисы.

Получаем
- нейронки - сырой продукт, которые надо готовить и оборачивать
- компании сфокусированы на выпуске базовых моделей, а не продуктов, потому что на это можно быстрее выцыганить инвестирование, а прибыль с финального продукта, который легко ставится - попробуй-ка еще получи
- компании по той же причине сфокусированы на побитии тестов, а люди на Реддите, поматерившись с новыми обертками и скриптами, запускают и обалдевают от того, что перехайпленный продукт хуже старой доброй модели, выпущенной пару месяцев назад
- тем не менее хорошие нейронки есть
- но им нужен финальный продукт - нечто, что спрячет под капот возню с настройкой лучших параметров, обеспечит доступ к базе данных или документу

Вот один пример
- Microsoft рассказывает, что есть технология промпта, которую если применить на GPT4, она покажет невероятные интеллектуальные результаты и побьет специализированную нейронку, которую учили на медицинских статьях. Окей, Сатья, а где этот продукт хотя бы в финальном виде для GPT 4? А вариант применения промпта для обычных нейронок?



(сама технология выглядит как многоступенчатое улучшение промпта с добавление новых и новых деталей и примеров, и теоретически может быть применена вручную, просто поэтапно писать промпт с новыми и новыми деталями, но вручную только кошки хорошо плодятся.... )

ну вот эта технология, применяйте, пользователи! Что, не выходит каменный цветок?

О тестах

Я пользуюсь сейчас некоторыми плагинами с нейронками для кодирования, встроенными прямо в редактор кода. Вот это - продукт. Для ряда вопросов мне не нужно ходить в чат, я порой просто набираю название функции и автокомплит полностью ее пишет, ориентируясь на название. Тем не менее и эти плагины - сырые, унылые, непропеченные.

Мы с нейронками как с персональными компьютерами в 80х, с карманными ПК - в нулевых. Да и то в те времена софт был куда лучше, чем то, что мы сейчас имеем с нейронками.

Проблема последней мили - она актуальна и в софтостроении. Проще прокричать - "у нас золотой кабель" - и получить инвестиции, чем тянуть этот золотой кабель до конечного пользователя.

Извините, эмоционально. Просто личные впечатления.

Оставить комментарий

Архив записей в блогах:
Найдено на просторах сети. Ну милота же! И с хорошим добрым юмором. #осеньвкармане ...
«За уроками. (Маша в школьной форме.)»1962г. Автор: Серов Владимир Александрович.влиятельный представитель соцреалистической школы сталинского периода, педагог. Израиль сильно отстает от развитых стран по уровню базовой грамотности населения. В Израиле опрос проводился на иврите и ...
Если ехать по М-10 - Москва-Питер - то невооруженным глазом можно заметить, как все величие России очерчивается ровно по фарватеру Волги. Движение времени назад по тайм-лайну строго градировано. Москва - двадцать первый век. Тверь - еще туда-сюда. Вторая половина двадцатого. Все, что з ...
Политологи отмечают, что Путин все чаще стал употреблять термин Новороссия.  Можно полагать, что имеются в виду только недавно присоединенные к РФ регионы 4 областей Украины. ...
Глядя на облизывание Путина… "К тому же мне претило это целование рук (а иные так прямо падали в ноги и изо всех сил стремились облобызать мои сапоги). Здесь сказывалось вовсе не движение признательного сердца, а просто омерзительная привычка, привитая веками рабства и насилия". (А. ...