Фундаментальные ограничения современных LLMs

топ 100 блогов spydell01.12.2025

Интересное интервью Ильи Суцкевера (бывшего главного инженера OpenAI, а ныне основателя Safe Superintelligence). Это его первое публичное выступление с декабря 2024, но учитывая, что он является архитектором современного ядра LLM, его взгляд ценен.

Идеи Ильи практически полностью пересекаются с моими концепциями, высказанными в нескольких циклах материалов по ИИ в этом году, поэтому перескажу, по сути, собственные идеи словами Ильи, но с более научным обрамлением.

Главный тезис Ильи заключается в том, что период с 2012 по 2020 годы был «эпохой исследований», которая сменилась «эпохой масштабирования» (2020–2025), когда доминировал простой рецепт: больше данных + больше вычислений = лучше результат.

Дополню от себя: это выражается в экспоненциальном росте капитальных расходов, достигающих 400 млрд в 2025 среди бигтехов США и зеркалировании выручки у производителей оборудования для развертывания ИИ.

•  Предел данных: предварительное обучение (pre-training) упирается в конечность доступных данных. Простое увеличение масштаба модели больше не дает прежнего качественного скачка.

•  Смена парадигмы: если раньше вопрос «на каких данных учить?» не стоял (ответ был «на всех»), то теперь, особенно в RL (обучении с подкреплением), отбор данных и создание среды становятся критическими задачами.

•  Возврат к исследованиям: индустрия снова входит в фазу, где прогресс зависит не столько от размера кластера, сколько от новых идей и алгоритмов.

Чрезвычайно неэффективное использование вычислительных мощностей:

Оставить комментарий

Архив записей в блогах:
Я часто читаю статьи про Германию и Францию. Про Германию, потому что интересуюсь немецким языком и немецкой культурой. Про Францию, потому что очень романтизирую эту страну. Мои родители говорили и на немецком, и на французском языках. И в Германии, и во Франции у меня есть родственники. ...
Клинический случай: С пожара по скорой поступают трое. Двоих привезли в одной машине, отца и дочь и третьего позже. В деревне для зашиты от короновируса семья стала окуривать дом кадилами с травами. Вскоре начался пожар. Мгновенно воспламенились текстиль, ковры, белье, мебель, деревянные ...
Первые серьезные DX на 20м, это VK3EY (Австралия) и M0IQD (Британия). У обоих практически одинаковый аппарат, 400 ватт и антенна HEXBEAM , направленная в мою сторону, но первый слышен очень хорошо, а второй едва на 5 баллов. Чуть позже сработал телеграфом AH6 (Гаваи), тоже очень ...
Операция «Фортуна»: Искусство побеждать / Operation Fortune: Ruse de guerre / 2023 Элитный разведчик Орсон Форчун получил новое задание: остановить продажу и распространение смертельного оружия. Но в одиночку ему эту миссию не потянуть. Он вынужден объединиться с лучшими ...
Собачка ...