LORA

LORA

Для большой и «делающей всё одинаково плохо» базовой модели, требования и к железу, и к качеству обучающего датасета при fine tuning дообучении заметно ниже, чем при полноценной тренировке. Настолько, что это уже вполне осуществимо на очень продвинутом пользовательском компьютере. Но всё равно ресурсов нужно много, даже для обучения только одного слоя языковой модели. Плюс, на выходе получается полноценная изменённая копия модели, в смысле размера: гигабайты весов.

А можно обучать совсем «на минималках»? Меньше, чем слой? Можно. Для этого придумали концепцию LORA — "Низкоранговая адаптация больших языковых моделей".

Идея заключается в том, чтобы тренировать не сами веса модели, а изменения весов. Мы не трогаем параметры. Вместо этого, для каждого слоя мы добавляем небольшую матрицу произвольной (но небольшой) размерности, которая описывает только изменения. По сути, патч. И тренируем только эти дополнительные параметры при обучении. Оказывается, этого более чем достаточно для полноценной адаптации базовой модели к задаче.

Плюсов море. Это очень экономный способ тренировки. «Дообучение для бедных». Снижает требования к видеопамяти в несколько раз по сравнению с полноценным обучением. Настолько, что достаточно уже самой обычной пользовательской видеокарты. На выходе получается небольшая по размерам заплатка (несколько десятков мегабайт для модели размером в сотни гигабайт) которую легко хранить в памяти и на диске. Применение LORA обратимо: изменения весов можно применять и отменять прямо в процессе работы модели, гибко подстраивая модель под задачу.

Интересно, что триумф концепции «базовая модель» + «точная настройка» явно демонстрирует пока не столько семейство GPT моделей (на слуху пока один ChatGPT, результат натаскивания базовой модели на диалог), сколько «пущенная в народ» Stable Diffusion. Вот там просто буйство адаптаций основы (которая умеет рисовать всё, но плохо) под узкие задачи. Никто не будет мучить «ванильную» SD и заставлять её хорошо рисовать в аниме стиле. Вместо этого загрузят дообученную модель под нужный стиль аниме рисунка, а сверху добавят LORA для отображения конкретного персонажа. И никаких лишних пальцев.

ÐÐ½Ð¸Ð¼Ðµ ÑÑÐ°Ð»Ð¸Ð½, Ð¿ÑÐ¾ÑÑÐ¾ Ð¿ÐµÑÐ²ÑÐ¹ Ð¿Ð¾Ð¿Ð°Ð²ÑÐ¸Ð¹ÑÑ Ð² Ð³ÐµÐ½ÐµÑÐ°ÑÐ¸Ð¸.

Аниме сталин, просто первый попавшийся в генерации.

Ð ÑÑÐ¾ 10 Ð¼Ð¸Ð½ÑÑ ÑÐ°Ð±Ð¾ÑÑ. ÐÑÑÑÐ½ÑÐµÑÑÑ, ÑÑÐ¾

А это 10 минут работы. Выясняется, что "трубку" модель не знает. Это поправимо, но лень.

Это тем интереснее, что концепция LORA изначально придумывалась и обкатывалась именно на GPT, и в SD применяется (если не ошибаюсь) именно к «трансформерной» части сети — слоям внимания.

Я к чему: не стоит переживать, что ChatGPT сейчас плохо сочиняет анекдоты про Штирлица. Как раньше переживали, что у SD Гитлер выходит не похожий на себя. Стоит подождать полноценной утечки весов хорошей GPT модели «в народ» (уже, если не ошибаюсь) и через каких пол года всё будет по другому: пользователь будет загружать дообученную «под генерацию юмора» модель и сверху ставить LORA на «короткие анекдоты про Штирлица» (которую, если энтузиаст, сам же и обучил на прошлой неделе). Вот тогда и посмотрим, как у трансформеров с юмором на самом деле.

Предыдущие записи блогера :

26.03.2023 — Важность базы

25.03.2023 — Мой комментарий к записи «***» от ivanov_petrov

Архив записей в блогах:

Смерть чиновников и бизнесменов народ будет отмечать праздничными гуляньями

Обсуждение вопроса, кто достоин человеческого отношения к себе, а кто нет, — это всё же несколько продуктивнее, чем смиренное осознание себя сырым материалом, сырьем для становления «русского капитализма». Он, этот капитализм, встанет, ...

Золотое древо

Как вы думаете, что это? А это физалис в физалисовом варенье! Ну, не красота ли? ...

Письма президенту - Окружили, гады - Александр Минкин...

Московский Комсомолец № 25524 от 14 декабря 2010 г. Источник....... Г-н президент, извините, что цитирую вам вас. Вы в своем блоге про субботние беспорядки написали: “И последнее на сегодня. По Манежной. В стране и в Москве — всё под контролем. Со ...

Студент амстерлдамский. Глава сорок четвертая

Глава сорок четвертая ( Помпео Джиролано Батони. Автопортрет. Похоже, темное всегда было униформой творческих людей ) Прошка проснулся утром от тишины. Вроде бы Пасха, а нет колокольного звона. Не принято у протестантов.П одумал: - Ну ладно, от папы Римского не хотели зависеть. ...

Гражданин Алиев избил гражданина Гусейнова, выкрикивая "Россия для русских!"

Из журнала ЛиваСправа В Калининграде судят двух юношей-националистов, обвиняемых в убийстве своего единомышленника. Как сообщили сегодня, 19 ноября, корреспонденту ИА REGNUM Новости в региональном управлении Следственного комитета, 19-летний ...

LORA

Оставить комментарий

Популярные посты: