Данных еще море

топ 100 блогов kvisaz04.12.2023 Есть мнение, что данные скоро закончатся и прогресс нейронок остановится.

У меня другое мнение - то, что сейчас суют в нейронки, это не лучшие данные. Это просто скрап со всех форумов, где часто обычные люди обсуждают на своем уровне. Примеры таких данных иногда прорываются при глюках нейронки, см. - https://vadim-proskurin.livejournal.com/1450862.html

Почитайте там, изумитесь, что дают цифровым детям.

Так вот, мнение заключается в том, что резерв по даже естественным данным - огромен как раз в силу этого фактора, что сейчас суют все тексты подряд. Нет, это в целом полезно, чтобы нейронка научилась понимать на любом уровне и любые намеки. Мне нравится, что я не обязан писать точные инструкции, а иногда просто кидаю несколько ключевых слов, и она по контексту правильно выбирает ответ.

Но ради улучшения ответов - данные можно ранжировать, чтобы статья академика о своем ценилась выше рассуждений Афони из деревни под Таганрогом.

Как я понимаю, в этом отчасти и кроется прогресс небольших опенсорсных нейронок - за счет тщательного перебора и улучшения наборов для обучения.

Но это гипотеза. Доказывать не буду, просто так пахнет с просторов

PS: мой личный фаворит из потока цифрового подсознания - "сверхтяжелое электрическое одеяло". Попахивает тесла-панком.

Оставить комментарий

Архив записей в блогах:
Истина — игра по правилам. Играя с математикой, приходится смириться с тем, что 2 х 2 = 4. Играя с природой, нужно находить ее законы, так чтобы эксперименты давали предсказанные результаты, а гаджеты работали. Играя со своим телом, нужно его слушаться и заботиться о нем. Играя со ...
Ах, да, вы ж не знаете - у нас теперь два рыжих кота дома. Видимо, наша семейная традиция - брать осенью домой по рыжему котенку:) Разговры о том, что наше маленькое рыжее говно нуждается в друге по игрищам, шли давно - и вот, зазомбированая этой ...
В связи с пандемией, власти нашей страны под шумок решили в очередной раз закрутить гайки. Дабы ни один не спрятался, не скрылся со своей личной жизнью и скелетами в шкафах. Пришло время их вынимать! И ГД решила принять для этого очередной ужасный закон под названием «О едином ...
Оригинал взят у magister_ в Как сделать так, чтобы блокировки работали («Расширенная версия» доклада на RIW-2016. Расширение заключается в основном в добавлении критики Роскомнадзора: на конференции я выступал как представитель АЗАПИ и это была бы «официальная» позиция, а ...
министр энергетики РФ Новак: Соглашение о строительстве "Турецкого потока" уже завтра может быть подписано в Стамбуле в присутствии Путина и Эрдогана. если так - то это сенсация, ...