рейтинг блогов

Измерить словарный запас

топ 100 блогов fritzmorgen20.05.2010 Измерить словарный запас

Сейчас внезапно наткнулся на одном закрытом форуме на очень любопытный факт: оказывается, в японском языке содержится меньше двух тысяч общеупотребительных иероглифов.

То есть, если вы потратите немного времени и выучите эти две тысячи символов, то вы сможете спокойно читать, например, японские газеты. Так как японские верстальщики не используют не входящие в этот список иероглифы.

(Update: тут с мест мне подсказывают, что выучить 2000 иероглифов будет недостаточно. Что же, пусть так. Сути поста это не меняет).

Перейдём теперь к более традиционным в наших широтах языкам. В русском языке приблизительно полмиллиона слов, в английском — около одного миллиона. А общеупотребительных слов в каждом из этих языков... ровно те же самые две-три тысячи.

Проще говоря, если вы знаете две тысячи английских слов, их будет достаточно, чтобы свободно читать и говорить без словарей. Или, точнее, овладев минимальным словарным запасом вы сможете вместо англо-русского словаря использовать толковый словарь.

Следующая ступень — словарный запас великих писателей, таких как Шекспир и Пушкин. Учёные подсчитали, что Шекспир использовал в своих пьесах 25 тысяч слов, Пушкин — 20 с хвостиком. При этом, как вы помните, Пушкин любил блеснуть каким-нибудь редким словцом, типа "цевница" или "аматёр".

Кстати, забавный факт. У нас очень силён миф о недоразвитости ругательств в английском языке. Дескать, известная школьникам пара четырёхбуквенных слов — это всё, чем могут похвастаться разносчики демократии.

На самом деле, конечно, если что англичане делать и умеют, так это материться. Например только для слова "гей" в английском языке есть не меньше нескольких десятков синонимов (пруфлинк). Как говорил Уинстон Черчилль, "плеть, ром и содомия — вот славные традиции Королевского Флота!".

Так вот. Какая у меня появилась идея по измерению словарного запаса.

1. Берём какой-нибудь большой толковый словарь типа вот этого (ссылка), на 180 тысяч слов.
2. Берём дополнительно какой-нибудь словарь среднего размера, на 18 тысяч слов, и в довесок, маленький словарь, на 1800 слов.
3. Делаем сайт с тестированием посетителей. По нажатию кнопки "измерить мой словарный запас" испытуемому выдаётся список из двадцати, скажем, слов, с вариантами значений. Типа вот такого:

Лайба — это
  (а) беспалубная парусная лодка;
  (б) плоский круг, вращающийся на оси;
  (в) лежачее толстое дерево;
  (г) цвет или краска.

4. Когда посетитель поотгадывает задачу, выдаём диагноз: "Вы знаете 20% редких слов, 70% малоиспользуемых слов, 100% общеупотребительных слов".


По трудозатратам, думаю, вряд ли создание такого сервиса займёт у программиста больше недели. А вещь будет весьма популярной. Особенно, полагаю, большим спросом будет пользоваться определение словарного запаса даже не в русском, а в английском, немецком и так далее языках.

Оставить комментарий

Архив записей в блогах:
В аэропорту Внуково живет уникальный самолет-тигр. По приглашению аэропорта и авиакомпании «Россия» я поснимал этот самолет. ( Read more ... ...
Я люблю путешествовать по России. И с удовольствием это делаю. Объехала множество городов, не раз была на Кольском полуострове и в Карелии. Но отпуск, не меньше месяца, мы с мужем предпочитаем проводить за границей нашей Родины. Сейчас объясню почему. В России почти все города ...
Невозможно описать словами то, что произошло в Нидерландах во время собрания в ...
... Иисус, зная помышления их, сказал им: всякое царство,  разделившееся само в себе, опустеет; и всякий город или дом, разделившийся сам в себе, не устоит. (Матф.12:25) Постепенно у меня сформировался образ современного неофита-пилигрима. Он ...
«Цветная война», проведенная в дни Хануки сетью молодежных клубов «SeeTheLight», завершилась безоговорочной победой команды «Северо-запад», разгромившей ...