Параметры интеллекта

топ 100 блогов kvisaz24.04.2024 Параметры интеллекта 2024-04-24-instruction-test-3-out.png

 На Реддите один человек выложил результаты тестов разных нейронок по разным вопросам. Я сделал скрины с транслейтом, но названия нейронок угадываются.

Тут самое важное что - Llama 3 70b - это модель, которую со скрипом, но можно запускать на домашнем компьютере (и без скрипа на нормальном оборудовании, если вы компания и можете купить небольшой сервер со 128 гигабайтами видеопамяти - я сознательно не говорю о квантизации и запуске без видеокарт, это и есть тот самый "скрип").

Джемма - Gemma 7b - она англоязычная и без скрипа летает на топовом домашнем.

То есть мы видим, что рубеж "домашняя Open GPT 3.5" по этим тестам еще не взят. Но это в универсальном опросе, а в отдельных задачах - надо посмотреть. По отдельным параметрам этот рубеж взят, но нужны ли вам задачи этого класса?

Я лично выбором таких задач недоволен, и считаю что с такими тестами  могли бы справиться и обычные дореволюционные скрипты в одну строчку. Извлечение первой буквы.... Ну что это такое? Зачем это нужно  в нейронке.

Тестировать надо было
- поиск решения в таких-то областях
- синтез текста на разные темы в разном жанре
- способность обложить тестами на таком-то языке
- отыгрыш роли

Но видимо человек как раз и тестировал простые задачки для программистов, потому что у него уже был набор готовых автоматических тестов. А синтезированный текст оценивать - это надо такую толпу людей собрать, да еще две группы для слепого тестирования, что и не каждый институт себе может позволить.



Параметры интеллекта
Параметры интеллекта


Параметры интеллекта
Параметры интеллекта





Параметры интеллекта
Параметры интеллекта


Параметры интеллекта
Параметры интеллекта





Описания категорий

Параметры интеллекта
Параметры интеллекта
Параметры интеллекта
Параметры интеллекта


Параметры интеллекта
Параметры интеллекта


Параметры интеллекта
Параметры интеллекта
Параметры интеллекта

Параметры интеллекта
Параметры интеллекта


Параметры интеллекта
Параметры интеллекта

Оставить комментарий

Архив записей в блогах:
В кино вы могли видеть, как человека, наступившего на мину, резко стягивают с нее при помощи веревки и транспортного средства. Такой прием принято называть «маневром Шумана», но давайте разберемся, имеет ли маневр место быть в реальных обстоятельствах или это очередная выдумка ...
Впервые Сергей Тихонов появился на экранах в роли Вождя краснокожих Джонни Дорсета в киноальманахе Леонида Гайдая «Деловые люди». До встречи с Серёжей Леонид Иович предполагал, что неугомонного мальчишку в его фильме сыграет миниатюрная актриса Надежда Румянцева, но на пробах был ...
В 453 году до н.э. в Риме случился эпический голод. Тит Ливий в книге III пишет, что поля опустели, животных охватил голодный мор, все в край обнищали, ослабли и стали болеть. От голода и сопутствующих болезней померли авгур, консул, фламин и четыре народных трибуна. Остальных померло в ...
Тот самый человек , желающий продаться в другую контору, ходит по собеседованиям. И вот в запарке бежит на очередное, и вдруг понимает, что бежит он - на Почту России. И в голове моментально вспыхивает огненный шар: "Господи, что я делаю? Куда я иду? Это же клеймо! Меня же потом никуда ...
Догадаетесь, кто намалевал это странное творение, что за него заплатили такие огромные деньжищи?! А может, хотя бы сообщите, что этот «талантливый» человек изобразил — посмотрите на рисунок, скажите, догадались?! Я — нет, когда первый раз его увидел. А вот покупатель говорит, что ему всё ...