AI в помощь языкознанию... или нет

Все больше вижу постов и видео о том, как замечательно, что теперь есть искусственный интеллект, который можно напрягать, задавая вопросы, не напрягаясь поиском самому. И даже серьезно показывают, как можно использовать этот самый AI для обучения.
И все было бы хорошо, не будь все так плохо. Нет, это не очередной пост про то, что компьютеры никогда не будут также сильны (умственно) как люди. Будут. Но не сейчас. И не с текущей парадигмой создания ИИ-шек.
Как их создают? Ну, это вопрос нудно-математический, нам особо не интересный. А вот как их тренируют - вот это да. Это нам надо. Потому что тренируют их на больших объемах данных. Часто с интернета. Часто то, что легко доступно и открыто (никто не хочет ввязываться в иски за использование коммерческого контента).
А какой вывод? А вывод простой — эти AI обладают ровно той информацией, которую люди накорябали в интернетах. Притом, люди могут ошибаться. И ошибаются. А открытые источники имеют тенденцию быть поверхностными. И они часто — поверхностные.
Проще говоря, AI может дать то же, что дает простое гугленье или лазанье по интернету. Верхушки. Без верификации — правда это или нет. И в этом, лично для меня, есть вопрос — нафига тогда мне этот AI нужен? Если бы он искал какие-то серьезные вещи — цены бы ему не было! Я-то человек ленивый. Но, не ищет он. А статью уровня википедии я и сам поглядеть могу.
Но, может все не так плохо? Может стоить попробовать позадавать какие-нибудь не базовые вопросы, вдруг справятся?
Ну, возьмем DeepSeek и Yandex GPT-5. Опять же, примитив я спрашивать не буду. Примитив я или знаю, или могу в один клик найти. Спросим что-то посложнее, где мне как раз пригодилась бы помощь умного человека... или AI. Потому что да, я человек не самый умный, я хочу, чтоб мне разжевали и в рот положили.
Итак, пройдемся по.. я не знаю. По фонетике. Спрашивать буду по-английски, т.к. часть терминов в русском либо мне не известна, либо особо не устоялась. А двусмысленности я не хочу.
Спросим у обоих: Is pharyngeal constriction reqiured for pronouncing American English r ? (Нужно ли «глоточное сужение» для произнесения 'r' из американского английского? )
Яндекс: нет. не нужно. в английском оно не используется
DeepSeek: то же самое
Правильный ответ: да, нужно. и это является активно изучаемой штукой в плане помощи иностранцам, изучающим английский
Ладно, возьмем что-нибудь попроще. Допустим: What is a true-voice language? (Что такое язык «true-voice»? )
Яндекс: удивил. ответил коротко, но правильно
DeepSeek: понес какую-то чушь о самовыражении и культуре
Правильный ответ: бла-бла-бла различие согласных (особенно стопов) по аспирации, а не звонкости (спросите у Яндекса, он в теме)
Еще проще может стоить взять? Плюс, что-нибудь из практического. Ну ок.
What is the pitch accent of 卵? (Какое тональное ударение у слова «тамаго» (яйцо))
Яндекс: атамадака (спад, после первого слога)
DeepSeek: то же самое
... вот тут я был удивлен. Если честно, ожидал, что ни оба справятся. Это же банальная справочная информация, легко индексируемая. Да и слово высокочастотное. Плюс тот факт, что и китаец и русский дали одинаковые (и своеобразные) ответы — наводит на мысли...
Правильный ответ: спад после второго или вообще без спада... ну блин, тут варианты даже были, и оба AI умудрились не попасть. Могут попробовать оправдаться тем, что использовали не-стандартный диалект (вроде, в Киото как раз атамадака)
Ладно. Еще проще, и еще практичнее. Я, вот, допустим, английский изучаю. Узнал про этот «flap t», будь он не ладен, но еще не освоился — где и когда его применять. Спрашиваем:
Is the word 'mistake' pronounced with a flap t ? (Произносится-ли слово mistake (ошибка) с flap t ?)
Яндекс: да, конечно
DeepSeek: да, конечно
Правильный ответ: хер там. Еще веселее, что DeepSeek утверждал, что -ta- в слове mistake безударный... Ага. А что-ж там ударное? Mis ?
Кстати, навело на мысли... спросим про классику:
Is the word 'militaristic' pronounced with a flap t ? (Произносится-ли слово militaristic (милитаристский) с flap t ?)
Яндекс: да, конечно
DeepSeek: да, конечно
...а ?
Может неправильно поняли? Корректируем
Is the the first 't' in the word 'militaristic' pronounced with a flap t ? (Произносится-ли первая 't' в слове militaristic (милитаристский) с flap t ?)
Яндекс: да, конечно
DeepSeek: да, конечно
Правильный ответ: ...вы что издеваетесь? Ну это то уже классика. Пример militaristic vs capitalistic все учебники, все форумы обошел. В этот раз отличился Яндекс, загнув, что /t/ в слове окружено согласной /r/ (шта?) и гласной /i/. Не выдержал, поправил беднягу.
Блин, ребята. Ну хорошо, начали с глубоко уровня (хотя именно его и хотелось), но закончил-то я уже базой? Простые типовые вопросы, которые может задать изучающий.
Может совсем у них туго с фонетикой и произношением?
Ну ладно. Вспомним музыкалку. Что там из базы... А, вот:
Why harmonic minor is called harmonic ? (Почему гармонический минор называется гармоническим?)
Яндекс: несет пургу
DeepSeek: несет пургу
Это уже не глубокий уровень. Это, вам, не анализ произведения по Шонбергу. Это первый класс музыкалки, простите. И да, их ответ я узнал. Это популярная фраза, которая одно время кочевала по YouTube в роликах людей, далеких от музыки. И фраза эта — неправильная.
Минивывод:
Из пяти вопросов... ну ладно, из шести, если добавить спонтанный музыкальный, правильный ответ был только на один вопрос. Победитель — Яндекс Гэ-Пэ-Тэ. Один из пяти или один из шести — это очень хреновая, не побоюсь этого слова, статистика.
И ведь вначале, я собирался гонять их по более глубоким и техничным вопросом. Даже начал с разминки про 'r'. Я не ожидал, что мне придется снижать уровень вопросов... которые они все равно не вывезли.
Это тот редкий случай, когда победитель чешет в затылке в недоумении. То есть да, разумеется, я знал о слабости текущих AI. И, разумеется, был готов доказать это... или убедиться в обратном. Но то, что все будет настолько плохо для меня было неожиданностью.
Вывод: использовать AI как игрушку — в целом можно. Но задавать серьезные вопросы без проверки — опасно. Ни один из AI не признался, что не знает ответа, и не намекнул, что галлюцинирует или приводит недостоверные данные. Иными словами, если вы планируете использовать AI для самообразования, готовьтесь к тому, что выучите... ложную информацию.
«А что если все сказанное ими проверять?» — может прозвучать вопрос.
«А нафига тогда они нужны, если мне один фиг то же самое искать придется?» — это мой ответ.
|
</> |