Из жизни открытого сообщества

топ 100 блогов kvisaz22.04.2024 На Reddit стал свидетелем забавной истории. Цукерберг выпустил в открытый мир нейронку Llama 3 - специально обученную на огромном объеме высококачественных текстов. Но с некоторой цензурой, которую с трудом но можно отменить через хитрый промпт.

Сторонники освобождения нейронок от цензуры тут же взяли Llama 3 и как давай ее обучать на нецензурном наборе Dolphin dataset, а потом выпускают с гордостью и говорят
- Глядите, мы освободили Llama 3

Люди пробуют
- Что-то какая-то лажа получилась, по всем тестам просадка.

Оказалось, Dolphin dataset - это нецензурный, но тупой набор синтетических данных с огромной долей ответов от GPT 3.5

То есть создатели оригинала пыхтят-пыхтят, чтобы как-то догнать и перегнать GPT4, а файнтюнеры Дельфина не глядя херачат в обучающий процесс набор данных от устаревшей тупой нейронки.

Я даже хотел запретить им заниматься этим (я не могу запретить, но хочу, примерно как любой человек периодически хочет что-то запретить, но не имеет никакой власти), но потом зарефреймил себе так

- Ошибки и их вскрытие важный элемент улучшения. Проблема начнется не тогда, когда кто-то начнет делать откровенную ерунду, учить современные нейронки на датасетах 1914 года от калькулятора Однера, а когда в открытом сообществе возникнет массовая тенденция - "нельзя критиковать, ибо это дезавуирует наше движение, дискредитирует хороших людей, мы теряем авторитет"

Авторитет для меня теряется на этапе, когда исчезает обратная связь - тут уже ясно, что авторитет так обосрался, что боится даже замечаний, потому что по ночами он теперь будет рыдать в подушку, его никто не будет уважать и тд. Короче, когда авторитет времен обезьян и их статуса.

Поэтому пускай их, делают ошибки. Главное чтобы на Реддите всегда можно было прочитать
- Боже, да вы же обосрались! Кому из вас пришла в голову засунуть обучающий датасет от Железного Феликса в новейшую Иришу?

Оставить комментарий

Популярные посты:
Архив записей в блогах:
Один из вечных вопросов, которым в России задаются интеллигенты и пролетарии, крестьяне и рабочие, старожилы и туристы - почему у нас в стране на улицах насрано? Почему у нас по дорогам говно течет рекой, а за границей не течет? Асфальт сам по себе не пачкается. Автомобили у нас ...
(с) Сергей Варшавчик Тверской бульвар, наши дни. +16°...+20°, , временами ...
В июне 1959 года Дом моды Диор привез в Москву 12 манекенщиц для показа коллекции Ив Сен Лорана. Перед нами полупостановочная фотосессия, на которой модели гуляют по центру Москвы – Красной площади, ГУМу, общаются с советскими людьми. В этом году в СССР впервые был официально разрешен ...
У блогерши Сары Салсабилы из Индонезии, известной в соцсетях как Сара Кейл, 340 тысяч подписчиков в "Инстаграме". Девушка активно демонстрирует свою красивую жизнь: кадры из путешествий, брендовые вещи, дорогие машины. Однако недавно она придумала кое-что поинтереснее. Инста-дива ...
Японская компания Clark Project запустила сайт Bistro Animeshi ,на котором выкладываются пошаговые руководства к готовке определенных блюд из любимых анимешек. В общем можно попробовать себе что-то приготовить, благо гугльпереводчика и фотографий может и ...