Ограниченность памяти у небольших нейронок


Тут я хотел написать о других решениях, которые используют обычную память (квантизация и запуск на процессоре), качать из хаба https://huggingface.co/TheBloke/ , запускаются через программу OobaBooga (под Windows в СНГ встало нормально, open-source)
Но есть вещь поважнее. В 15 гигабайт, как ни крути, а невозможно запихать полноценное универсальное знание. Поэтому что с них требовать.
Поэтому наиболее здравым подходом сейчас является использование узко обученных "семибиток" или подключение к ним баз документов (подход RAG).
Когда мы спрашиваем что-то у локальной нейронки, в первую очередь надо смотреть на то, как она понимает диалог, инструкции, как пытается рассуждать. Другими словами, перед нами умный студент или глупый (то, что они оба не смогли поместить в своей памяти все учебники, это очевидно, см. выше).
Будущее - за связками "нейронка" + "база данных".
|
</> |