Как DeepSeek и другие решают задачу для первокурсников

Говорят, что "свиные/говяжьи крылышки" — это блюдо такое, кулинарный
термин, из-за чего нейросети ничтоже сумняшися выдали рецепт
(правда забыв уточнить, что речь о курице или коротких ребрышках:
"возьмите полкило свиных крылышек, промойте их...")
Но шутки-шутками, а как у ИИ с логикой? Если предложить незнакомый
им материал?

На старт выходят DeepSeek (Китай), GPT (OpenAI), Gemini (Google) и Сopilot (Мicrosoft).
Когда-то считалось, что в ЖЖ хотя бы посты хорошо индексируются. Как я ошибалась.
Задача отсюда:
известна в самых разных формулировках «дракон и гномы», «бал и шляпы», «волк и пионеры», чего только не придумывали, а у меня «Хамсинезия» =)
Ни один из состязающихся не нашел соответствия, «размышляют» сами, что и требовалось:
Джимини несет ахинею и сходит с дистанции :

Что вообще вразрез с условиями задачи, где в условии четко
оговаривается регламент, раз, два — как первой в колонне невесте
поможет информация о чужом женихе в конце колонны?
И дальше — какая еще информация «спереди», джин не дурак, опрашивал начиная с задних рядов:

Череда замечаний и уточнений ни к чему не привела ИИ зациклился и стал повторяться.
Копилот играет в угадайку, и если бы у задачи не было корректного решения, то его подход не полностью лишен смысла. Но хотя бы пургу не гонит.

Джипити отвечает «в общем», так же как комментаторы в блоге :

Верной дорогой идет товарищ, додумавшись до проверки на четность, осталось обобщить «четность» на произвольное число,

но участник сбивается с пути, свернув в сторону теории вероятностей

Зацикливается и начинает повторяться (было еще несколько аналогичных итераций, пока мне не надоело), подсказываю троешнику (с большим минусом)


Так-то и «кожаные» могли решить, с прямыми указаниями — «найди пособие по теории вычетов и спиши оттуда»
Хотя исходя из гематрии, карточных игр или вязания тоже можно допетрить, я решала по аналогии с «раппортами» в трикотажных узорах (нагуглить тогда еще негде было).
Чат не допер, ни до каких аналогий, хотя в теории именно это
считается сильной стороной ИИ, дескать у него информация из тысяч
разных отраслей, он сопоставит что угодно, с чем угодно и решит то,
что человеку с ограниченной оперативной не под силу.
Пока что фиг там.
А что с фаворитом минувшей недели DeepSeek?
Начал как и GPT с четности, но сходу, без посторонних уверток:

Подсказка:

Догадался!
И пошел шпарить формулами

На закуску совсем уж простенькая логика для первоклашек (с фигурками или фишками сообразит и достаточно мотивированный дошколенок), отсюда —
Только переформулировала «сад и деревья» в «лес и ёлочки», цифры менять не стала.
Джипити лихо нагуглил ответ в режиме поиска

источники тут же в сайд-баре. «Елочки» соотнести с «деревьями» не затруднился. Хотя на диаграмме изобразил треугольник, а не звезду.
DeepSeek нагуглил в режиме рассуждений, с чертежом
заморачиваться не стал:

Копилот: слыша звон, но сам не понял, что сказал

и нарисовал крестик, уверяя, что это пять рядов
Джимини честно решал сам и запутался в трех соснах:


Но когда теряется в вопросе, начинает повторять одно и тоже
слово в слово.
(GPT делает тоже самое, когда не справляется, признает ошибку и тут
же повторяет снова)
По итогам — китаец более-менее опережает в вопросах приближенных к цифровым технологиям, но в целом GPT где-то рядом. Гугловский продукт на последнем месте.
|
</> |