Об изучении языка

топ 100 блогов hardsign07.11.2024

Умный человек подкинул статью про крах компании ABBYY.

Букафф многа, открывается ссылка через раз, поэтому коротко своими словами.

Компания вложила огромное количество сил и средств в разработку Универсального Переводчика, основанного на Правилах. Он должен был преобразовывать тексты в Единую Семантическую Модель, а потом из Модели — в текст на другом языке в соответствии с грамматикой и семантикой оного.

Система распознавания текста FineReader давала достаточную прибыль, чтобы финансировать сотни дипломированных лингвистов, которые потратили миллионы человеко-часов на разработку Модели. К 2010 году компания добилась впечатляющих успехов и уже готова была покорить мир, но тут на сцене появился Google Translate.

В отличие от ABBYY, Google не встраивал в свой продукт никаких правил. Чистая статистика: вот текст на одном языке, вот его перевод на другой язык, на, машина, разбирайся, что во что превратилось. Никакой лингвистики. (Примечание: описание алгоритма о-очень упрощённое, но для пояснения основной мысли вполне достаточное).

Подход Google хорош ещё и тем, что для улучшения качества перевода не требует работы высококвалифицированных учёных — только машинное время, которого у Google в избытке. В общем-то, именно это и привело к краху ABBYY: поток денег от FineReader стал не таким полноводным, как в начале, а Большая Идея себя исчерпала. Вот и уволили всех разработчиков, оставив только немного продавцов да имя, покрытое потускневшей славой...

С одной стороны, обидно за фундаментальную науку. Жаль, что тупая железяка (хотя на самом деле не такая уж и «тупая») выдала практический результат лучшего качества.

Но с другой стороны, именно эта разница подходов и отличает знание родного языка от знания иностранных языков. Я, например, едва ли знаю десяток правил русского языка, и то они в основном относятся к пунктуации. Это, однако, не мешает мне сравнительно грамотно писать — исключительно на основании набранной бигдаты статистики. А иностранные языки — это правила, правила и правила. Конечно, так можно выучить язык гораздо быстрее, но полноценно освоить его не получится. Только статистика, только большие данные...

Оставить комментарий

Архив записей в блогах:
Но прорвало. Зрело давно на самом деле. Еще с момента эпичного "бана" Википедии. Вопрос на самом деле простой. И серьезный. Очень попрошу без иронии и прочих сарказмов. "Как лично Вас затронули запреты, ограничения и прочие кунштюки со стороны власти? Чем лично Вам стало хуже?" КДПВ ...
Не секрет, что наши СМИ сами себя боятся. Как бы чего такого не ляпнуть, чтобы не закрыли их, не уволили, не лишили возможности работать ртом там, где всё-таки нужно использовать всю голову целиком, включая мозг. Страх этот -- генетический, тем более такие панические настроения журналисто ...
https://politobzor.net/uploads/posts/2020-10/1604153922_skrinshot-31-10-2020-171654.jpg Показано и обосновано, вследствие каких материальных, политических и идеологических ...
У нас иногда на сдачу дают монетки соседних государств, которые в свою очередь попадают в оборот потому что похожи на американские квотеры (25с), никели (5с) или пенни (1с). Практически нет монет по размеру с даймы (10с) - они очень мелкие, нестадартные. Чаще всего попадаются канадские ...
26 февраля. ......................8 6................ Он красный и внутри) Он никого не оставляет равнодушным- его либо любят, либо ненавидят. Я его трепетно люблю) Узнала его от демократов- в перестройку они его проклинали, яростно так. Обзывали соловьем Генштаба. Ну, дураки , не ...