Измерить словарный запас
fritzmorgen — 20.05.2010Сейчас внезапно наткнулся на одном закрытом форуме на очень любопытный факт: оказывается, в японском языке содержится меньше двух тысяч общеупотребительных иероглифов.
То есть, если вы потратите немного времени и выучите эти две тысячи символов, то вы сможете спокойно читать, например, японские газеты. Так как японские верстальщики не используют не входящие в этот список иероглифы.
(Update: тут с мест мне подсказывают, что выучить 2000 иероглифов будет недостаточно. Что же, пусть так. Сути поста это не меняет).
Перейдём теперь к более традиционным в наших широтах языкам. В русском языке приблизительно полмиллиона слов, в английском — около одного миллиона. А общеупотребительных слов в каждом из этих языков... ровно те же самые две-три тысячи.
Проще говоря, если вы знаете две тысячи английских слов, их будет достаточно, чтобы свободно читать и говорить без словарей. Или, точнее, овладев минимальным словарным запасом вы сможете вместо англо-русского словаря использовать толковый словарь.
Следующая ступень — словарный запас великих писателей, таких как Шекспир и Пушкин. Учёные подсчитали, что Шекспир использовал в своих пьесах 25 тысяч слов, Пушкин — 20 с хвостиком. При этом, как вы помните, Пушкин любил блеснуть каким-нибудь редким словцом, типа "цевница" или "аматёр".
Кстати, забавный факт. У нас очень силён миф о недоразвитости ругательств в английском языке. Дескать, известная школьникам пара четырёхбуквенных слов — это всё, чем могут похвастаться разносчики демократии.
На самом деле, конечно, если что англичане делать и умеют, так это материться. Например только для слова "гей" в английском языке есть не меньше нескольких десятков синонимов (пруфлинк). Как говорил Уинстон Черчилль, "плеть, ром и содомия — вот славные традиции Королевского Флота!".
Так вот. Какая у меня появилась идея по измерению словарного запаса.
1. Берём какой-нибудь большой толковый словарь типа вот этого (ссылка), на 180 тысяч слов.
2. Берём дополнительно какой-нибудь словарь среднего размера, на 18 тысяч слов, и в довесок, маленький словарь, на 1800 слов.
3. Делаем сайт с тестированием посетителей. По нажатию кнопки "измерить мой словарный запас" испытуемому выдаётся список из двадцати, скажем, слов, с вариантами значений. Типа вот такого:
Лайба — это
(а) беспалубная парусная лодка;
(б) плоский круг, вращающийся на оси;
(в) лежачее толстое дерево;
(г) цвет или краска.
4. Когда посетитель поотгадывает задачу, выдаём диагноз: "Вы знаете 20% редких слов, 70% малоиспользуемых слов, 100% общеупотребительных слов".
По трудозатратам, думаю, вряд ли создание такого сервиса займёт у программиста больше недели. А вещь будет весьма популярной. Особенно, полагаю, большим спросом будет пользоваться определение словарного запаса даже не в русском, а в английском, немецком и так далее языках.
|
</> |