Об изучении языка

топ 100 блогов hardsign07.11.2024

Умный человек подкинул статью про крах компании ABBYY.

Букафф многа, открывается ссылка через раз, поэтому коротко своими словами.

Компания вложила огромное количество сил и средств в разработку Универсального Переводчика, основанного на Правилах. Он должен был преобразовывать тексты в Единую Семантическую Модель, а потом из Модели — в текст на другом языке в соответствии с грамматикой и семантикой оного.

Система распознавания текста FineReader давала достаточную прибыль, чтобы финансировать сотни дипломированных лингвистов, которые потратили миллионы человеко-часов на разработку Модели. К 2010 году компания добилась впечатляющих успехов и уже готова была покорить мир, но тут на сцене появился Google Translate.

В отличие от ABBYY, Google не встраивал в свой продукт никаких правил. Чистая статистика: вот текст на одном языке, вот его перевод на другой язык, на, машина, разбирайся, что во что превратилось. Никакой лингвистики. (Примечание: описание алгоритма о-очень упрощённое, но для пояснения основной мысли вполне достаточное).

Подход Google хорош ещё и тем, что для улучшения качества перевода не требует работы высококвалифицированных учёных — только машинное время, которого у Google в избытке. В общем-то, именно это и привело к краху ABBYY: поток денег от FineReader стал не таким полноводным, как в начале, а Большая Идея себя исчерпала. Вот и уволили всех разработчиков, оставив только немного продавцов да имя, покрытое потускневшей славой...

С одной стороны, обидно за фундаментальную науку. Жаль, что тупая железяка (хотя на самом деле не такая уж и «тупая») выдала практический результат лучшего качества.

Но с другой стороны, именно эта разница подходов и отличает знание родного языка от знания иностранных языков. Я, например, едва ли знаю десяток правил русского языка, и то они в основном относятся к пунктуации. Это, однако, не мешает мне сравнительно грамотно писать — исключительно на основании набранной бигдаты статистики. А иностранные языки — это правила, правила и правила. Конечно, так можно выучить язык гораздо быстрее, но полноценно освоить его не получится. Только статистика, только большие данные...

Оставить комментарий

Архив записей в блогах:
С представителем "израильской военщины" на границе с Ливаном. Израиль . 2008 год . Лёнька . О Лёньке - моем одногруппнике из музыкального училища -  я много рассказывала дочери. Он мне снился всю жизнь! Моя душа скучала по нему и очень его любила. Это была какая-то ...
Мы познакомились 31 декабря прошлого года. Мужчина стоял передо мной в очереди в кассу супермаркета. Одной рукой он толкал перед собой тележку, верхом набитую новогодними ...
Onet: Польша активно втягивается в конфликт на Украине. Польское специальное подразделение на Украине уже имеет боевые группы, эмблему и покровителя. Оно ориентируется на «Гусар смерти» 16 февраля издание Onet.pl проинформировало о начале формирования первого польского ...
Два за деяние и три за адвоката Оглашенное в здании Хамовнического суда заявление неформальной руководительницы дам, концертировавших 21.02 в Храме Христа Спасителя о том, что в выборе места для концерта была допущена «этическая ошибка», о чем ...
Очередной правильный Дилберт с переводом hemule ...