Распознавание изображений

топ 100 блогов ploughlike_elk31.10.2025

Вот еще интересная иллюстрация работы искуственного псевдо-интеллекта. С распознаванием изображений у него все весьма и весьма неплохо. Даю ему вводную картинку и прошу перечислить ВСЕ предметы видимые на картинке. Он справляется с этим лучше чем моя жена (и лучше чем другие языковые модели, но поскольку я сравниваю уровень платного ChatGPT с бесплатным других моделей это нечестное сравнение)


Распознавание изображений




Main Items on the Table

  1. Laptop computer (displaying the translit.ru website).
  2. Wireless keyboard (black, slim profile).
  3. Wireless mouse (black, near right side).
  4. Eyeglass case, black (hard shell, cylindrical).
  5. Eyeglass case, wooden / light brown (rectangular, smooth edges).
  6. Transparent eyeglass lens or lens cover (small, near the mouse).

    [Это просто пятно на столе осталось от горячей чашки. Действительно похоже на какую-то круглую линзу, только почему-то с отрезанным краем. Тут наполовину фейл.]

Visible Fragments / Partial Objects

  1. Blue notebook or folder edge (barely visible at the upper left corner behind the laptop screen).

    [Это поставка под телефон, но этот предмет действительно невозможно распознать если заранее не знать что это]
  2. Paper or white sheet (partially visible beneath or behind the blue notebook).
  3. Cables or dark cords (barely visible behind the laptop, likely power or peripheral cables).

    [На самом деле кабель едва виден с левой стороны от ноутбука, ибо не попал в фокус. Тут за кабель ИИ принял краешек обложки тетради. Это тоже простительная ошибка]
  1. Chair or upholstered backrest (visible in the background, upper right and left).

Other Notable Details

  1. Wooden tabletop surface (medium brown, textured).
  2. Laptop power indicator lights and keyboard reflection (visible on the screen’s lower bezel).
  3. Multiple browser tabs open in the laptop’s top bar (part of screen detail).

Would you like me to make a labeled diagram marking each item’s position (1–13) on the photo?



Но вот обратный процесс ему не удается вовсе. ИИ сам предлагает поставить номерки на картинке согласно списку предметов и обратите внимание - он не просто использует исходное изображение, а генерирует собственное. Но правильно присвоить названия тому что нарисовал не может, вот что характерно и уже далеко не в первый раз вижу.



Распознавание изображений



На самом деле это очень досадно, потому как правильное иллюстрирование концепций описываемых языковой моделью было бы исключительно уместно для внедрения псевдо-ИИ в самые разные сферы деятельности (например, динамическая генерация иллюстраций к любым текстам, что особенно полезно со всякими мануалами, обучающими материалами и т.п. - аналог "ты мне пальцем покажи, а не рассказывай!"



P.S. Интересно еще что режим Deep Research на который модель потратила аж 20 минут (!) с задачей распознавания справился гораздо хуже. Тоже не в первый раз замечаю что запрос языковой модели что-то еще более улучшить приводит к ухудшению начального результата. 

Оставить комментарий

Предыдущие записи блогера :
Архив записей в блогах:
...
Так как мы в большинстве - неучи, буду показывать на пальцах. Аналогия, грубый пример. У нас есть магнит, мощный, скажем N45, который в прошлом году  сломал мне мизинец, сука... Киллер, а не магнит. Подвешивает холодильник, причём забитый пивом. Представим, что поле его - ...
...
Goblin отправлено 08.11.13 20:53 | ответить | цитировать # 28 Кому: Faria, #27 > > А почему на тупичке все говорят (пытаются) как хозяин сайта? а почему на дегенеративных ресурсах все говорят как дегенераты? ...
И после этого Польша называет себя демократической страной? Хороша демократия, когда за другое мнение тебя незамедлительно увольняют с работы. Сообственно, ничего другого я от них и не ожидал...А дело вот в чем, на днях в Польше по случаю памяти жертв Холокоста в бывшем нацистком концлегер ...