Кто считает, что UCS-4 решает все проблемы

топ 100 блогов lionet15.02.2012 ... с многобайтовыми кодировками, тот пусть попытается представить букву «д́» (с диакритикой) одним Unicode код-поинтом.

Я уже замучался говорить народу, что ничего нет лучше UTF-8. Для представления человекочитаемого символа что в UTF-16, что в UCS-4 ("UTF-32"), что в UTF-8 может потребоваться несколько комбинаций байт (8 и больше байт в UCS-4!). Это родовая болезнь Unicode, которая делает использование UTF-8 гораздо более правильным и привлекательным, чем все остальные кодировки.

Никогда с юникодом не будет $str[n]="A" правильно работать (заменять произвольный символ на «A») за гарантированную (не amortized) константу времени. Но все пытаются эти грабли непременно пошевелить.

Оставить комментарий

Предыдущие записи блогера :
Архив записей в блогах:
Хороший какой снимок Фото 1962 г. Ю. Абрамочкина. Старший-то, кстати, налегке идёт:) ...
Вчера был у меня один интересный разговор. Если долго не вдаваться в подробности, один мой знакомый сказал, что писателем мне никогда не стать. Творчество, дескать, дело мужское. - Ну подумай сама, нормальная женщина писателем быть не может. - Ну да, как же! - Я не про то что женщины надел ...
Лучшие посты в сообществе picturehistory за 2 февраля: День победы в Сталинградской битве в 1943 году. Штурман бомбардировщика, уничтожившего Хиросиму: «Сбросил бы я атомную бомбу еще раз? Конечно, да!» Сталинградская битва. 244 ФОТО. Харрисон Форман в Москве / ...
Прав был брат skruber, когда писал: "Однажды получившие свободу слова из рук тщательно ненавидимых ими "либералов и демекратов", они плюют в протянутые ладони, используя свободу слова чтобы в очередной раз очернить помоями по-настоящему ...
Этот пост был опубликован 6 лет назад! А  в  2022 году вчера было 40, сегодня в 5  утра было 30 в Лондоне, у нас 24, спасибо, море близко, бриза дарит чуточку.  Вчера заметила, что все 10 машин, которые я увидела по дороге в аптеку, свернули к морю.  Обычно одна ...