Латиница-26 для казахского языка

топ 100 блогов sevabashirov07.12.2019 #ASCIIzation

Уже третий год не утихает тема перехода казахского языка (точнее, казахского языка в Казахстане) на латиницу. При этом изначально планировалась латиница-26, буквы с диакритикой не допускались, а взамен их предполагался частокол из апострофов o'zbek-style. Потом все-таки Назарбаев допустил диакритику, и апострофы переехали на полпозиции влево, превратившись в акуты (á). Но суть не изменилась: стоит пару минут поизучать принятый вариант, как становится понятно, что он - самый дурной из десятка когда-либо существовавших официозных и чуть ли не среди всех возможных, включая предлагаемые любителями. А все почему?


Потому что дебилы, бл**ь основным руководящим принципом была выбрана лень - максимально механизированный транслит нынешней кириллицы, бессмысленной и беспощадной, являющейся комбинацией чисто казахского алфавита, вполне себе фонетичного, и первоначального русского - причем комбинацией в свою очередь тоже чисто механической, из-за чего получилось 42 буквы с кучей фонетических дублей и избыточности. Весьма похоже на 43-буквенный старославянский, кстати, где исходная "гречица" присутствовала полностью, со всеми ксями, псями и фитами, которые славянскому языку даром не сдались.

А стоило хоть чуточку подумать и понять, что конкретно для казахского языка проще простого сделать даже латиницу-26, причем без апострофов (!), уж не говоря о диакритике. В последнем случае - даже думать не о чем: берем 34-буквенный "общий тюркский алфавит", от которого придется отойти, но только в сторону уменьшения - в казахском языке фонем существенно меньше! Настолько меньше, что попробуем решить чуть более сложную задачу и построить латиницу-26 с нуля. Как в прошлом посте рубрики - сначала отдельно по гласным и согласным.

Гласных фонем в казахском всего 9. В том числе 4 твердых /аоұы/ и 5 мягких /әеөүі/, образующих пары (у фонемы /а/ при этом фактическое "двоеженство", помимо /ә/ наподобие русской нейотированной "я" ей парна и на первый взгляд одинокая /е/, причем даже чаще). Дифтонги раскладываются на отдельные звуки (гласные и полугласные), на них можно не обращать внимания. Буква "е" произносится двояко - /е/ либо /йе/, "у" - /w/ либо /ұw/, "и" - /і/ либо /ій/.

При этом существует закон сингармонизма - внутри слова все гласные либо мягкие, либо твердые, так что у всяких суффиксов и окончаний есть по две формы на разные случаи (или даже больше двух). Но, увы, он безупречно действует далеко не всегда - слова с несколькими корнями, заимствования, имена собственные то и дело содержат и мягкие, и твердые гласные. То есть не получится сыграть на этом, обозначая мягкость лишь один раз на все слово - ну и ладно.

Логично отобразить парность на письме, для этого как нельзя лучше подходит немецкий принцип замены умляутов на суррогаты с -e. То есть: твердые a, o, u, i, мягкие e, ae, oe, ue, ie. Коллизий не возникает, поскольку в словах с буквами "ае" подряд вторая гласная йотируется. Saebiz, ага, вернее saebiez. Пара "ы - і" не передана как "y - i", потому что игрек нам еще пригодится. Альтернативный вариант - взять в качестве модификатора мягкости букву h: e, ah, oh, uh, ih. Sahbihz.

Согласные. В отличие от общетюркского набора из 25 согласных, здесь многие не нужны. Во-первых, г/к - это не отдельные фонемы, а аллофоны /ғқ/ перед мягкими гласными. То есть нет никакого смысла использовать 4 знака вместо двух для обозначения заднеязычных. Заодно Q освободилась. Далее, звуки букв "вфхч" - заимствованные из русского вместе с русской же лексикой (и в том числе интернациональной, проникшей через русский). Но первые три можно и не убирать (все-таки таких заимствований довольно много), а вот "ч" спокойно раскладывается на "тш", параллельно звонкой паре "дж". Как в белорусском. Заодно и "ц" = "тс", если вдруг что.

Кстати, помимо "х" в казахской кириллице есть и "һ" - не особо понятно, зачем, поскольку оба звука для казахского не родные и малоупотребимые. Об этом, впрочем, подумали и разработчики актуальной официальной латиницы и объединили их. В латинице-26 их можно объединить в букву x (икс), освободив h под "мягкий знак" (см. выше). Alkogolh, допустим.

Что осталось? Ряд сонорных - понятно, lmnr, полугласные wy (вот он, игрек, он же звук /й/), а вот для заднеязычной /ң/ как раз пригодится буква q. Диграф ng не катит, есть такое сочетание звуков. Далее стандартные пары bp, vf (пара заимствованных звуков, но все равно), gk (см. выше про заднеязычные), dt, zs.

А вот для пары /ж/ - /ш/ отлично подходят буквы "j" и "c". В некоторых языках они, к слову, обозначают пару "дж" - "ч", а в казахском при заимствовании этих звуков они как раз традиционно теряют свои начальные смычные составляющие. Шымкент и Кокшетау по таким правилам радуют глаз привыкших к старым советским названиям: Cimkent, Koekcetaw или Kohkcetaw. А буква "j", в европейских языках соответствующая то "й", то "ж", то "дж", то даже "х", в случае ее применения для казахской фонемы /ж/ отлично подчеркивает особенность языка - "жоканье". В других тюркских языках казахскому "ж" как раз соответствуют "й" и "дж", например слово "нет" - ("йоқ", "джоқ"), "жоқ" - jok.

Всех пристроили, никого не обделили. Итоговая таблица:

/a/ - a
/ә/ - ae/ah
/е/ - e
/о/ - o
/ө/ - oe/oh
/ұ/ - u
/ү/ - ue/uh
/ы/ - i
/і/ - ie/ih
"мягкий знак" (опционально) - h
/й/ - y
/w/ - w
/л/ - l
/м/ - m
/н/ - n
/ң/ - q
/р/ - r
/x/, /h/ - x
/б/ - b
/п/ - p
/в/ - v
/ф/ - f
/ғг/ - g
/қк/ - k
/д/ - d
/т/ - t
/ж/ - j
/ш/ - c
/з/ - z
/с/ - s
/ч/ = /тш/ - tc (или мягко, tch)
/щ/ = /ш/ - c (или мягко, ch)

Пожалуйста, черновой вариант на коленке. Даже так выглядит логично и лишь слегка устрашающе из-за обилия диграфов для мягких гласных. Но на то он и транслит-26. Обточить его и превратить в полноценную латиницу - уже другой разговор.

Оставить комментарий

Архив записей в блогах:
Админу - ничего, если я это помещу без комментариев? А каску у гроба немецкого солдата воровать нехорошо. ...
\begin{пятиминутка_ненависти} Мне вот интересно, какие процессы происходят в голове того человека, который принимает решение в обновлённой прошивке телефона убрать возможность выбора диапазона WiFi при создании точки доступа (был выбор 2.45/5 ГГц, сейчас принудительно 5 ГГц). За этим ведь ...
Сегодняшний пост про расстрел американских студентов вполне ожидаемо вызвал кипучее бурление говн, число комментов уже перевалило за две сотни. Ранее подобные дристалища всегда приводили к нескольким банам за тупое хамство в сочетании с полной неадекватностью и беспробудной матерщиной. ...
Помятуя о своём детском разочаровании в возрасте пяти лет, когда дочка приглашённых гостей тоном, не терпящим возражений, поведала мне о том, что "Деда Мороза не существует", я всеми силами старалась сохранить веру в Чудо у собственного ребёнка, как можно дольше. Просто глубоко убежд ...
Команда ученых залила заброшенный, во всяком случае по их заявлению, муравейник цементом. Лили 3 дня, ушло около 10 тонн цемента. Потом подождали пока все это дело засохло. Откапывали несколько недель ииииии откопали. Получилось впечатляющее ...