Распознавание изображений

топ 100 блогов ploughlike_elk31.10.2025

Вот еще интересная иллюстрация работы искуственного псевдо-интеллекта. С распознаванием изображений у него все весьма и весьма неплохо. Даю ему вводную картинку и прошу перечислить ВСЕ предметы видимые на картинке. Он справляется с этим лучше чем моя жена (и лучше чем другие языковые модели, но поскольку я сравниваю уровень платного ChatGPT с бесплатным других моделей это нечестное сравнение)


Распознавание изображений




Main Items on the Table

  1. Laptop computer (displaying the translit.ru website).
  2. Wireless keyboard (black, slim profile).
  3. Wireless mouse (black, near right side).
  4. Eyeglass case, black (hard shell, cylindrical).
  5. Eyeglass case, wooden / light brown (rectangular, smooth edges).
  6. Transparent eyeglass lens or lens cover (small, near the mouse).

    [Это просто пятно на столе осталось от горячей чашки. Действительно похоже на какую-то круглую линзу, только почему-то с отрезанным краем. Тут наполовину фейл.]

Visible Fragments / Partial Objects

  1. Blue notebook or folder edge (barely visible at the upper left corner behind the laptop screen).

    [Это поставка под телефон, но этот предмет действительно невозможно распознать если заранее не знать что это]
  2. Paper or white sheet (partially visible beneath or behind the blue notebook).
  3. Cables or dark cords (barely visible behind the laptop, likely power or peripheral cables).

    [На самом деле кабель едва виден с левой стороны от ноутбука, ибо не попал в фокус. Тут за кабель ИИ принял краешек обложки тетради. Это тоже простительная ошибка]
  1. Chair or upholstered backrest (visible in the background, upper right and left).

Other Notable Details

  1. Wooden tabletop surface (medium brown, textured).
  2. Laptop power indicator lights and keyboard reflection (visible on the screen’s lower bezel).
  3. Multiple browser tabs open in the laptop’s top bar (part of screen detail).

Would you like me to make a labeled diagram marking each item’s position (1–13) on the photo?



Но вот обратный процесс ему не удается вовсе. ИИ сам предлагает поставить номерки на картинке согласно списку предметов и обратите внимание - он не просто использует исходное изображение, а генерирует собственное. Но правильно присвоить названия тому что нарисовал не может, вот что характерно и уже далеко не в первый раз вижу.



Распознавание изображений



На самом деле это очень досадно, потому как правильное иллюстрирование концепций описываемых языковой моделью было бы исключительно уместно для внедрения псевдо-ИИ в самые разные сферы деятельности (например, динамическая генерация иллюстраций к любым текстам, что особенно полезно со всякими мануалами, обучающими материалами и т.п. - аналог "ты мне пальцем покажи, а не рассказывай!"



P.S. Интересно еще что режим Deep Research на который модель потратила аж 20 минут (!) с задачей распознавания справился гораздо хуже. Тоже не в первый раз замечаю что запрос языковой модели что-то еще более улучшить приводит к ухудшению начального результата. 

Оставить комментарий

Предыдущие записи блогера :
Архив записей в блогах:
сегодня в Грузии начался новый учебный год. Мой сын пошел в первый класс, увиделся со своими одноклассниками, с которыми проучился год в подготовительном.. не все правда перешли в следующий класс. Заказал пару книг за счет накопленных баллов в ...
В Пензенской области в кафе у одного из мигрантов началась ссора с местным парнем, который является сиротой. В ходе потасовки приезжий получил по лицу. Иностранный специалист такого поворота событий не ожидал и позвал на помощь "братьев". Толпа напала на молодого человека и жестоко ...
«Получила наследство от отца, но мать требует вернуть ей отцовский долг по алиментам: она меня растила на свои и считает, что папаша должен ей, а не мне!» – жалуется Арина — …Да я отца почти не знала, ни в детстве, ни потом, они развелись с матерью, когда мне четыре года было, – ...
Надо показать вам примеры того, что я делаю с питерцами, пока гастролирую здесь. Пока я нахожусь в Питере, время питерских съемок, которые были еще зимой. На этот раз вот фотосъемка из интересной локации. Мы были в строящемся доме моей модели, и кстати это чудесная возможность воспользоват ...
Устами младенца не только глаголет истина, но и произносятся вещи, о которых взрослые не говорят. Или говорят, но не при посторонних. Малыши — просто мастера вгонять родителей в краску одним словом или жестом, хотя потом мамы, папы и старшие братья-сестры вспоминают о подобных проделках со ...