Самые распространенные языки мира
sevabashirov — 24.07.2019Казалось бы, зачем этот пост? Рейтинг самых популярных языков мира - вообще не секрет, гуглится за секунду. Но дело в том, что гуглится сразу несколько рейтингов, которые друг другу противоречат, и все из-за нечеткости двух определений: "владение языком" и собственно сам "язык". Будем разбираться.
Во-первых, сразу нужно отделить носителей языка (нейтивы, другим словом) - те, для кого он родной, с той условностью, что для еще не говорящих детей во младенчестве он номинально определяется по языку родителей - от вообще владеющих языком, включая выучивших его впоследствии. В социолингвистике для первых и вторых используются термины L1 и L2. При этом L2 - понятие крайне неточное, определить уровень владения неродным языком - та еще проблема. И где проходит граница, что этот уровень уже учитывается, а тот еще нет - очень спорный вопрос. К тому же изучают люди в основном литературные языки, а разговаривают - представьте себе - на разговорных. И эти множества в целом сильно не совпадают.
Поэтому рассмотрим только носителей-нейтивов, L1. Причем оставим за скобками билингвизм (когда для человека являются родными два языка) - в целях упрощения в лингвостатистике такого обычно не допускают, кое-как разделяя. И дальше возникает знаменитая проблема "язык или диалект". Понятие языка из чисто научного давно стало социальным, а впоследствии еще и политическим. Сложная история взаимоотношений стран, изменений их государственных границ, формирования наций из этносов, использования языков разными этносами и нациями привела к большой неразберихе. Нередки случаи, когда два языка считаются отдельными в одной стране и диалектами в другой.
И это даже не самое страшное - всюду разная дробность. В одних случаях для самоопределения носителями своего языка как самостоятельного достаточно минимальных отличий, обычно подкрепленных политическим статусом территории его распространения. В других - жители огромной территории идентифицируют себя как носителей одного и того же языка, но разных наречий - при том, что носители этих наречий с очень большим трудом понимают друг друга.
Для отделения мух от котлет в данном вопросе лингвисты используют термины "диалектный континуум" и "языковой кластер". Как для диалектов и наречий, так и для близкородственных языков с определенными условностями можно определить степень их сходства - обычно для этого в компаративистике (сравнительно-исторической лингвистике) берется показатель лексического расстояния (см. список Сводеша) - чем больше понятий обозначаются одинаковыми или хотя бы однокоренными словами, тем ближе. Если сравнить с наиболее знакомой нам генеалогической классификацией языков на примере индоевропейской семьи, то:
1) Диалектам одного языка, иногда имеющим статус разных языков соответствует лексическое расстояние более 95% (например, московские и поморско-архангельские говоры, румынский и молдавско-румынский);
2) Языкам одной подгруппы (иногда считающихся диалектами крупного языка) - более 85% (примерно таково расстояние, допустим, между русским языком Ярославля и украинским Винницы, либо португальским Порту и испано-каталанским "суржиком" Валенсии);
3) Языкам одной группы разных подгрупп - более 70% (русский и польский, английский и немецкий, испанский и французский и т.д.)
Если сравнить родные европейские языки с другими, откроется много интересного, для кого-то неожиданного. Арабский язык в вариациях от Марокко до Ирака - это фактическая подгруппа семитских языков, понимание между отдельными разговорными вариантами несколько затруднено (хотя литературные нормы сближены). Китайский язык - это даже не подгруппа, а группа: коренные жители Пекина, Шанхая и Гуанчжоу поймут друг друга ощутимо плохо, как испанец с французом и итальянцем. Спасает литературный язык (путунхуа) на основе пекинского наречия, который в обязательном порядке изучают в школах Китая, и письменность - они используют одни и те же иероглифы для одинаковых слов, хотя произносят их по-разному. В китайском макроязыке выделяется основной язык - мандарин (или северокитайский), на котором говорят 3/4 от всех китайцев, но и это в наших терминах не язык, а целая подгруппа. Еще можно привести пример хиндустани - общего названия для множества вариаций индоарийских языков, главные из которых - хинди (само по себе неоднородное понятие) и урду. По лексическим отличиям это также подгруппа в европейском понимании.
Воспользовавшись данными Ethnologue на 2019 год, параллельно сравнивая с некоторыми другими, составил три таблицы - соответственно топ-13 и два топ-11 языковых кластеров / диалектных континуумов: 70% (пример - славянский), 85% (восточнославянский), 95% (русский), естественно с округлениями - более точные данные получить затруднительно. Четыре крупнейших группы раскрашены для наглядности:
|
|
|
Главный неожиданный вывод - на уровне языков в привычном нам понимании крупнейшим оказывается не какой-либо из вариантов китайского, а испанский, на котором говорит 2/5 обеих Америк. Затем - английский и только потом юго-западный вариант мандаринского, крупнейший среди всех. Арабский, пенджабский, огузский (турецко-азербайджанский), центрально-германский (немецко-нидерландский) 85%-континуумы распадаются на части, к каждой из которых относится менее 100 млн человек. То же касается зондского (малайско-яванского), банту (куча языков южной трети Африки) и некоторых других 70%-континуумов. Вьетский (с основной частью в виде вьетнамского языка) подбирается к этой планке.
Русский занимает восьмую строчку как и в википедийном списке, но отличия в том, что здесь его обгоняют две разновидности китайского, зато без арабского, даже египетская версия которого сильно не дотягивает до попадания в число крупнейших языков мира.
Тема поста может быть интересна acer120, massimoling_ru, nikola_rus, pachem, oleg_lisowski и другим.
Также, если кто не видел, порекомендую материалы по теме языкознания - Смещение языковых полюсов, 15 самых важных языков мира.
|
</> |