О скоростях

топ 100 блогов lex_kravetski22.09.2024 Друг тут на днях решил тоже попробовать генерацию картинок с помощью ИИ. Зашёл на некий сайт, где как бы предполагался Flux в качестве работающей модели (не самим этим сайтом, а каким-то другим, где на него ссылались), написал пропмт, получил картинку, показал мне. Я смотрю — ну точно не Flux. Не, что-то разобрать на картинке, конечно, можно, и при этом нельзя даже сказать, что она совсем днище. Похоже на мыльную фотку с артефактами. Посмотрел на самом сайте, нет ли там информации, что они используют. Ну точно, они говорят, что у них Stable Diffusion 1.5.

Пишу другу: «у них там очень старая модель». И когда я это пишу, оно прямо так внутренне и ощущается: прямо очень старая. Тогда ещё наверно мамонты не вымерли, когда эта модель была. Я, вон, сам всё это начал пробовать у себя на компе уже после того, как эта версия была актуальна.

Однако, если посмотреть, то эта очень старая модель была выпущена меньше двух лет назад. При том, что четыре года назад не было вообще ничего подобного.

Видел, вон, передачу трёхлетней давности, где специалисты по спецэффектам ради развлечения играются с какой-то из совсем древних моделей — DALL-E 1 или типа того. Всё кривое, косое. Не то, что пальцев на руках не пять, а просто руки из произвольных мест в произвольных количествах торчат, глаза по всему лицу рассыпаны и друг на друга наползают. Адище. Но люди в восторге. Люди прутся, поскольку в эти стародавние времена — три года назад — сама мысль, что компьютер может по тексту что-то нарисовать, была столь неправдоподобной, что сам факт наблюдения сего у себя на экране казался чем-то типа телепортации в полунаучный фантастический фильм. А теперь на это смотришь и думаешь: «да блин, как такая фигня вообще может радовать-то?». Ну, по прошествии нескольких эпох. Теперь. Два–три года спустя.

Стремительный прогресс второй половины девятнадцатого и первых трёх четвертей двадцатого века когда-то затмил прогресс всех предыдущих веков своей скоростью: за десятилетия изобреталось и воплощалось то, на что раньше уходили века. Лет за тридцать железные дороги вытеснили лошадей в дальних перевозках. Ещё за тридцать лет их почти окончательно во всех перевозках вытеснили автомобили. На смену свечам и керосиновым лампам стремительно — за пару десятилетий — пришло газовое освещение, а его столь же стремительно вытеснило электрическое. Фотография в своё время внедрялась лет сто минимум, пока стала мэйнстримом, но вот между идеей кино на плёнке и бытовым телевизором прошло уже максимум лет пятьдесят.

Потом в какой-то момент компы и связанные с ними технологии стали развиваться столь стремительно, что множественное число из «десятилетий» пришлось убрать. Поскольку «десятилетие» — это глобальная смена эпох в компьютерной индустрии. В лучшем случае. А так-то, быть может, лет пять и, упс, у нас теперь новая парадигма, которая меняет даже не то, как мы играем в эту игру, а сами правила этой игры. И так практически во всём: на графику компьютерных игр из, например, 2005-го без слёз не взглянешь. Спецэффекты для кино, над которыми тогда могла полгода сидеть целая студия, теперь может на дому повторить школьник за утренним кофе. Самый дешёвый смартфон теперь производительнее, чем тогда были все компьютеры в доме вместе взятые. Постойте, а бывало ли тогда, что в доме больше одного компьютера? Я уже и не помню.

Даже если брать детали — высокие разрешения, красивые интерфейсы, дизайн языков программирования, сайты… Всё так поменялось с начала века. Вы помните те времена, когда в программах типа Фотошопа, включая его самого, ещё не было даже слоёв? Помните, как надо было для отделения объекта от фона обводить его кривой по точкам вручную? Помните тогдашний инженерный софт, который на фоне нынешнего был устроен так, будто бы в нём просто повторили черчение на бумаге с командой undo?

Но оказалось, что и это была черепашья скорость. ИИ — вот как можно. Эпохи меняются уже не за десятилетие, а за месяцы. Четыре года назад — практически по нулям, а сейчас у тебя на компе запускается программа, которая может по тексту за минуту нарисовать на уровне лучшего художника. Причём предыдущий вариант, который был выпущен полгода назад и про который казалось, что он уже на уровне лучшего художника рисует, теперь выглядит «ну, ничо так, жить можно, но, конечно, не фонтан».

Огромным прорывом трёхлетней давности казалось уже то, что ИИ может связно отвечать на любые вопросы. Пусть с ошибками, но хотя бы связно. И с пониманием, что у него спросили, а не путём подбора среди заранее подготовленных вариантов ответа, наиболее близкого к вопросу, при помощи сравнения с заранее же подготовленными шаблонами, из-за чего 90% диалога напоминают фразу про бузину и дядьку. Куча людей просто не верила, что оно правда отвечает «само» — искали какие-то хитро запрятанные в глубинах шаблоны ответов и шаблоны вопросов, написанные законспирированными программистами, которые скрывают Правду.

Через год люди жаловались на то, что эта штука не на все вопросы отвечает правильно. Прикиньте — не помнит наизусть абсолютно точно все энциклопедии и учебники. Только 80% помнит. Или даже 50. И стихи пишет хуже Байрона. Ну, как «хуже» — выданный ею с первой попытки за три секунды стих хуже, чем лучшие у Байрона, в общем.

Через два года главной проблемой казалось уже то, что текущая модель сама по себе не рассуждает «в долгую». Ну, так, чтобы обстоятельно подумать, отрефлексировать, проанализировать, перечитать свои рассуждения, всё проверить и потом уже дать ответ. Так-то да, она себя перечитывает и даже может поправлять себя, но надо в явном виде ей что-то написать, чтобы такое запустилось. Большая проблема. Если, конечно, забыть о том, что за два года до того способность внятно отвечать не по шаблонам уже казалась фантастикой.

И вот через три года выкатывается версия, которая в долгую уже может, причём «долгая» это у неё минута–две. И за эти две минуты она может написать диссертацию. Но вот, блин — диссертацию всё ещё придётся проверять. Какая неприятность. Вот бы она ещё и не ошибалась никогда. И сама умела эксперименты ставить. Ну, в реальном мире эксперименты, а не только запускать код и смотреть, как он сработал, про что ещё полгода назад многим казалось, что так сделать невозможно. Экспериментов же в реальном мире наверно придётся ждать ещё полгода. А то и год. Или, страшно подумать, даже два.

То есть три года назад эксперты уверенно сообщали, что это всё — иллюзия и просто «продвинутый T9», который только и умеет, что готовое из некой мистической базы данных доставать, а теперь люди бегают с вытаращенными глазами, рассказывая СМИ про «вы даже не представляете, что у них там есть в загашнике».

А теперь прикиньте, с какой скоростью пойдут такие процессы, когда к этому подключаться ещё и искусственные интеллекты.

Картину портит только то, что в системе образования и в политике всё до сих пор так, будто бы на дворе так и осталась середина двадцатого века.



doc-файл

Оставить комментарий

Архив записей в блогах:
Демократия это всегда проблема выбора массой из нескольких тщательно подготовленных кандидатур. Однако выбор-выбору рознь. Бродский был не прав, предлагая выбор  между ворюгой и кровопийцей. Это детский выбор. Предлагаю более современный демократический выбор эпохи политического ...
КЛЕЁНКА Здесь на фото маленький кусочек клеёнки с кухонного стола, на котором чередуются квадратики трёх цветов: синего, голубого и белого: Если взять не метр такой клеёнки (как я покупаю обычно), а, скажем, километр - какую долю площади (в процентах) будут составлять синие квадраты, ...
Правда, не всем. Теперь, однако, ясно, к чему нужно стремиться, чтобы упорхать на пенсию как в благословенные времена, ведь министр труда своим сияющим перстом указал нам путь! В общем, повышение пенсионного возраста вас не коснется (предположительно), если вы: 1. Мать пятерых детей. ...
Ходила в поликлинику, потому что я на больничном. Моя врач, какое счастье, ушла в отпуск. Поэтому мне досталась очень милая врач-участковая. С интересом прослушала легкие, заглянула в горло. Сказала - срочно на анализы. Моей участковой обычно все фиолетово настолько, что даже как-то ...
История о невероятной глупости. В нашем программисте Ване неудачно сочетаются тяга к новейшим топовым смартфонам и способность невероятно быстро лишаться этих дорогих игрушек. Один из таких модных аппаратов был посеян на вилле, тщательные ...