AI в помощь языкознанию... или нет

топ 100 блогов bitsofinfo25.02.2025

Все больше вижу постов и видео о том, как замечательно, что теперь есть искусственный интеллект, который можно напрягать, задавая вопросы, не напрягаясь поиском самому. И даже серьезно показывают, как можно использовать этот самый AI для обучения.

И все было бы хорошо, не будь все так плохо. Нет, это не очередной пост про то, что компьютеры никогда не будут также сильны (умственно) как люди. Будут. Но не сейчас. И не с текущей парадигмой создания ИИ-шек.

Как их создают? Ну, это вопрос нудно-математический, нам особо не интересный. А вот как их тренируют - вот это да. Это нам надо. Потому что тренируют их на больших объемах данных. Часто с интернета. Часто то, что легко доступно и открыто (никто не хочет ввязываться в иски за использование коммерческого контента).

А какой вывод? А вывод простой — эти AI обладают ровно той информацией, которую люди накорябали в интернетах. Притом, люди могут ошибаться. И ошибаются. А открытые источники имеют тенденцию быть поверхностными. И они часто — поверхностные.

Проще говоря, AI может дать то же, что дает простое гугленье или лазанье по интернету. Верхушки. Без верификации — правда это или нет. И в этом, лично для меня, есть вопрос — нафига тогда мне этот AI нужен? Если бы он искал какие-то серьезные вещи — цены бы ему не было! Я-то человек ленивый. Но, не ищет он. А статью уровня википедии я и сам поглядеть могу.

Но, может все не так плохо? Может стоить попробовать позадавать какие-нибудь не базовые вопросы, вдруг справятся?

Ну, возьмем DeepSeek и Yandex GPT-5. Опять же, примитив я спрашивать не буду. Примитив я или знаю, или могу в один клик найти. Спросим что-то посложнее, где мне как раз пригодилась бы помощь умного человека... или AI. Потому что да, я человек не самый умный, я хочу, чтоб мне разжевали и в рот положили.

Итак, пройдемся по.. я не знаю. По фонетике. Спрашивать буду по-английски, т.к. часть терминов в русском либо мне не известна, либо особо не устоялась. А двусмысленности я не хочу.


Спросим у обоих: Is pharyngeal constriction reqiured for pronouncing American English r ? (Нужно ли «глоточное сужение» для произнесения 'r' из американского английского? )

Яндекс: нет. не нужно. в английском оно не используется

DeepSeek: то же самое

Правильный ответ: да, нужно. и это является активно изучаемой штукой в плане помощи иностранцам, изучающим английский


Ладно, возьмем что-нибудь попроще. Допустим: What is a true-voice language? (Что такое язык «true-voice»? )

Яндекс: удивил. ответил коротко, но правильно

DeepSeek: понес какую-то чушь о самовыражении и культуре

Правильный ответ: бла-бла-бла различие согласных (особенно стопов) по аспирации, а не звонкости (спросите у Яндекса, он в теме)


Еще проще может стоить взять? Плюс, что-нибудь из практического. Ну ок.

What is the pitch accent of 卵? (Какое тональное ударение у слова «тамаго» (яйцо))

Яндекс: атамадака (спад, после первого слога)

DeepSeek: то же самое

... вот тут я был удивлен. Если честно, ожидал, что ни оба справятся. Это же банальная справочная информация, легко индексируемая. Да и слово высокочастотное. Плюс тот факт, что и китаец и русский дали одинаковые (и своеобразные) ответы — наводит на мысли...

Правильный ответ: спад после второго или вообще без спада... ну блин, тут варианты даже были, и оба AI умудрились не попасть. Могут попробовать оправдаться тем, что использовали не-стандартный диалект (вроде, в Киото как раз атамадака)


Ладно. Еще проще, и еще практичнее. Я, вот, допустим, английский изучаю. Узнал про этот «flap t», будь он не ладен, но еще не освоился — где и когда его применять. Спрашиваем:

Is the word 'mistake' pronounced with a flap t ? (Произносится-ли слово mistake (ошибка) с flap t ?)

Яндекс: да, конечно

DeepSeek: да, конечно

Правильный ответ: хер там. Еще веселее, что DeepSeek утверждал, что -ta- в слове mistake безударный... Ага. А что-ж там ударное? Mis ?


Кстати, навело на мысли... спросим про классику:

Is the word 'militaristic' pronounced with a flap t ? (Произносится-ли слово militaristic (милитаристский) с flap t ?)

Яндекс: да, конечно

DeepSeek: да, конечно

...а ?

Может неправильно поняли? Корректируем


Is the the first 't' in the word 'militaristic' pronounced with a flap t ? (Произносится-ли первая 't' в слове militaristic (милитаристский) с flap t ?)

Яндекс: да, конечно

DeepSeek: да, конечно

Правильный ответ: ...вы что издеваетесь? Ну это то уже классика. Пример militaristic vs capitalistic все учебники, все форумы обошел. В этот раз отличился Яндекс, загнув, что /t/ в слове окружено согласной /r/ (шта?) и гласной /i/. Не выдержал, поправил беднягу.


Блин, ребята. Ну хорошо, начали с глубоко уровня (хотя именно его и хотелось), но закончил-то я уже базой? Простые типовые вопросы, которые может задать изучающий.

Может совсем у них туго с фонетикой и произношением?

Ну ладно. Вспомним музыкалку. Что там из базы... А, вот:

Why harmonic minor is called harmonic ? (Почему гармонический минор называется гармоническим?)

Яндекс: несет пургу

DeepSeek: несет пургу

Это уже не глубокий уровень. Это, вам, не анализ произведения по Шонбергу. Это первый класс музыкалки, простите. И да, их ответ я узнал. Это популярная фраза, которая одно время кочевала по YouTube в роликах людей, далеких от музыки. И фраза эта — неправильная.


Минивывод:

Из пяти вопросов... ну ладно, из шести, если добавить спонтанный музыкальный, правильный ответ был только на один вопрос. Победитель — Яндекс Гэ-Пэ-Тэ. Один из пяти или один из шести — это очень хреновая, не побоюсь этого слова, статистика.

И ведь вначале, я собирался гонять их по более глубоким и техничным вопросом. Даже начал с разминки про 'r'. Я не ожидал, что мне придется снижать уровень вопросов... которые они все равно не вывезли.

Это тот редкий случай, когда победитель чешет в затылке в недоумении. То есть да, разумеется, я знал о слабости текущих AI. И, разумеется, был готов доказать это... или убедиться в обратном. Но то, что все будет настолько плохо для меня было неожиданностью.


Вывод: использовать AI как игрушку — в целом можно. Но задавать серьезные вопросы без проверки — опасно. Ни один из AI не признался, что не знает ответа, и не намекнул, что галлюцинирует или приводит недостоверные данные. Иными словами, если вы планируете использовать AI для самообразования, готовьтесь к тому, что выучите... ложную информацию.

«А что если все сказанное ими проверять?» — может прозвучать вопрос.

«А нафига тогда они нужны, если мне один фиг то же самое искать придется?» — это мой ответ.

Оставить комментарий

Архив записей в блогах:
Встал, проводил Егора Ильича в школу, супругу с дочкой и Федором на дачу. Надо бы поехать - поработать с Яндекс-Такси , но чего то тянет еще немного полежать. Пойду, пожалуй в диван на полчасика - часик. А потом уже поеду. С выходными вас, друзья! ...
По состоянию на утро 24 января число заболевших вирусом нового типа в КНР достигло 835 человек, 25 скончались.  Для полуторамиллиардного Китая это вроде бы совсем не много, но беспокоит вот что... Город Ухань, который на минуточку, по численности населения равен Москве, ...
Из истории болезни: "Отмечается улучшенное состояние больного - он самостоятельно протягивает ноги." Если вы помните, я недавно была с мужем в театре. Отчет скинула, про пьесу рассказала, д оказательств а фотографии представила, новую жилетку с ...
Во Флоренцию невозможно не влюбиться. С первого шага, с первого взгляда... И забыть этот город уже невозможно. И вернуться в него хочется всякий раз, как только прилетаешь в Италию. Хоть на день, даже на час... Но во Флоренцию надо ехать на длительный срок... Флоренция — город, который ...
Принято считать, что ревность – это негативное отношение к общению партнера с противоположным полом. На деле же, яркие негативные эмоции могут возникать практически ко всему – к людям, к работе, к увлечениям и привычкам. Психология ...