Данных еще море
kvisaz — 04.12.2023 Есть мнение, что данные скоро закончатся и прогресс нейронок остановится.У меня другое мнение - то, что сейчас суют в нейронки, это не лучшие данные. Это просто скрап со всех форумов, где часто обычные люди обсуждают на своем уровне. Примеры таких данных иногда прорываются при глюках нейронки, см. - https://vadim-proskurin.livejournal.com/1450862.html
Почитайте там, изумитесь, что дают цифровым детям.
Так вот, мнение заключается в том, что резерв по даже естественным данным - огромен как раз в силу этого фактора, что сейчас суют все тексты подряд. Нет, это в целом полезно, чтобы нейронка научилась понимать на любом уровне и любые намеки. Мне нравится, что я не обязан писать точные инструкции, а иногда просто кидаю несколько ключевых слов, и она по контексту правильно выбирает ответ.
Но ради улучшения ответов - данные можно ранжировать, чтобы статья академика о своем ценилась выше рассуждений Афони из деревни под Таганрогом.
Как я понимаю, в этом отчасти и кроется прогресс небольших опенсорсных нейронок - за счет тщательного перебора и улучшения наборов для обучения.
Но это гипотеза. Доказывать не буду, просто так пахнет с просторов
PS: мой личный фаворит из потока цифрового подсознания - "сверхтяжелое электрическое одеяло". Попахивает тесла-панком.
|
</> |