БЯМ

топ 100 блогов thesz16.12.2023 (читая всякое разное)

Работая в Яндексе, создавал я ЯМНМНК - языковые модели на матрицах с неотрицательными коэффициентами. SNMLM.

ЯМНМНК довольно простая штука - мы собираем контексты разного вида, со статистикой для них, а потом определяем веса моделей разных контекстов по отдельному корпусу для обучения. После чего, в процессе применения, мы набираем все контексты, что присутствуют в данный момент в тексте и смешиваем их статистику (вероятности символов) с учётом выученных весов. Веса в каждый момент времени пересчитываются, чтобы сумма была равна 1.

все t-ые контексты(wконтекстpсимволконтекст]
Pсимвол(t)= ------------------------------------
            [Σвсе t-ые контекстыwконтекст]


Контексты у меня были длиной до 6 индексов слов, что ли, что вместе со ссылкой на статистику составляло около 32-х байтов. Статистика была тройкой (индекс слова, счётчик, ссылка на следующее слово). Всё это было в аренах, поэтому лежало плотно.

У рабочей машины было 256 гигов памяти, я неоднократно получал переполнение памяти, то есть, я использовал всю память. Из этого получается, что у меня только контекстов могло накопиться около 3 с лишним миллиардов. А если учесть, что типический контекст предсказывал около трёх-четырёх слов, в среднем, то количество коэффициентов приближается к пяти-шести миллиардам. ;)

BERT, на то время, в большом варианте, содержал 340 миллионов параметров. ;)

Получается, что я работал с большой языковой моделью до того, как они стали хоть сколько-то известны. ;)

Да, ЯМНМНК обучалась менее, чем за рабочий день, а предсказательная сила у неё была много выше n-грамных моделей. С нейронными сетями я не сравнивал, они не были легко для меня доступны.

И в упакованном виде, готовом к работе, ЯМНМНК занимала много меньше 256 гигов.

Оставить комментарий

Предыдущие записи блогера :
08.12.2023 150 кг
Архив записей в блогах:
Ух, а какой закат вчера был по дороге... Просто невроятный. Небо горело золотом. По-моему, его даже не испортил факт того, что я фотографировала его из машины через стекло. ...
В почти совсем уходящем году до меня снизошёл козырный Ростелеком. Его сотрудник по телефону предлагал кучу льгот и скидок вплоть до половины оплаты, объясняя полным обновлением оборудования... Но лишь до тех пор, пока не прозвучал мой ответ на вопрос "Вы в каком регионе живёте?". Я ...
Ну вот и весна!!! Уже третий день как... Но весеннее обострение уже наступило! По Москве бегают тетки с отрезанными детскими головами а полицаи насилу повязав ее теперь решают что им выгоднее объявить ее сумасшедей или исламисткой за что им меньше достанется! кто т о уже вертит дырочки д ...
1 июня в Торезе Донецкой области неизвестные подорвали местное управление Службы безопасности Украины. Как передает сайт Новости Донбасса, по зданию СБУ был произведен выстрел, предположительно, из ручного гранатомета РПГ ”Муха”. Жертв и пострадавших нет. Жаль,что никого из чинов службы ...
Я долго не спала -  ждала заключительной пресс-конференции в Минске. Не дождалась. Днем всматривалась в лицо Путина на его первой встрече с журналистами. Усталое, но не удрученное. Это сразу успокоило. Значит не все пропало. В течение дня, по мере поступления все новых и нов ...