Фундаментальные ограничения современных LLMs

Интересное интервью Ильи Суцкевера (бывшего главного инженера OpenAI, а ныне основателя Safe Superintelligence). Это его первое публичное выступление с декабря 2024, но учитывая, что он является архитектором современного ядра LLM, его взгляд ценен.

Идеи Ильи практически полностью пересекаются с моими концепциями, высказанными в нескольких циклах материалов по ИИ в этом году, поэтому перескажу, по сути, собственные идеи словами Ильи, но с более научным обрамлением.

Главный тезис Ильи заключается в том, что период с 2012 по 2020 годы был «эпохой исследований», которая сменилась «эпохой масштабирования» (2020–2025), когда доминировал простой рецепт: больше данных + больше вычислений = лучше результат.

Дополню от себя: это выражается в экспоненциальном росте капитальных расходов, достигающих 400 млрд в 2025 среди бигтехов США и зеркалировании выручки у производителей оборудования для развертывания ИИ.

• Предел данных: предварительное обучение (pre-training) упирается в конечность доступных данных. Простое увеличение масштаба модели больше не дает прежнего качественного скачка.

• Смена парадигмы: если раньше вопрос «на каких данных учить?» не стоял (ответ был «на всех»), то теперь, особенно в RL (обучении с подкреплением), отбор данных и создание среды становятся критическими задачами.

• Возврат к исследованиям: индустрия снова входит в фазу, где прогресс зависит не столько от размера кластера, сколько от новых идей и алгоритмов.

Чрезвычайно неэффективное использование вычислительных мощностей:

Предыдущие записи блогера :

26.11.2025 — Цена исключительности - экономика против технологий

23.11.2025 — В чем заключается исключительность Nvidia?

Архив записей в блогах:

Для и ради...

Я часто читаю статьи про Германию и Францию. Про Германию, потому что интересуюсь немецким языком и немецкой культурой. Про Францию, потому что очень романтизирую эту страну. Мои родители говорили и на немецком, и на французском языках. И в Германии, и во Франции у меня есть родственники. ...

Профилактика КОВИД-19

Клинический случай: С пожара по скорой поступают трое. Двоих привезли в одной машине, отца и дочь и третьего позже. В деревне для зашиты от короновируса семья стала окуривать дом кадилами с травами. Вскоре начался пожар. Мгновенно воспламенились текстиль, ковры, белье, мебель, деревянные ...

Первые серьезные DX на 20м, это VK3EY (Австралия) и M0IQD

Первые серьезные DX на 20м, это VK3EY (Австралия) и M0IQD (Британия). У обоих практически одинаковый аппарат, 400 ватт и антенна HEXBEAM , направленная в мою сторону, но первый слышен очень хорошо, а второй едва на 5 баллов. Чуть позже сработал телеграфом AH6 (Гаваи), тоже очень ...

Операция «Фортуна»: Искусство побеждать

Операция «Фортуна»: Искусство побеждать / Operation Fortune: Ruse de guerre / 2023 Элитный разведчик Орсон Форчун получил новое задание: остановить продажу и распространение смертельного оружия. Но в одиночку ему эту миссию не потянуть. Он вынужден объединиться с лучшими ...

Собачка

Собачка ...

Фундаментальные ограничения современных LLMs

Фундаментальные ограничения современных LLMs

Оставить комментарий

Популярные посты: