Внезапно, вопрос:

топ 100 блогов trilirium20.09.2023 Вопрос касается реализации алгоритмов простого/оптимизированного поиска в строках.

Предположим, что у нас есть текст, закодированный в UTF8 -- и контекстная строка, также закодированная в UTF8.
Есть средства поиска, самые примитивные (типа strstr в C) -- позволяют найти произвольную последовательность байтов в другой, более длинной последовательности байтов (и гарантированно не знающие ничего про UTF8/Unicode/etc.)

Вопрос такой: можно ли быть уверенным, что поиск гарантированно будет работать корректно?
Т.е. понятно, что все вхождения искомой строки -- найдутся. Есть ли ненулевая вероятность, что кроме них найдётся что-нибудь ещё??

Оставить комментарий

Архив записей в блогах:
Ну, ещё тыковки и маршмэллоу для разнообразия!
Только-только начали летать на Кубу регулярные рейсы из Майами, после 55летнего игнора и снова вот опять... Ну да, Обама же злой был, а Трамп ведь наш! Тем не менее политика Белого дома в отношении Кубы кардинально меняется. "Я отменяю полностью одностороннюю сделку прежней ...
Только что я отправил нежное послание представителям "наших западных партнеров" на территории Ex-USSR, под простым и понятным для них заголовком: Ну почему все русофобы такие тупые? Однако по результатам публикации заметки Обама жжёт... хотелось бы сказать "пару ласковых слов" и друг ...
Читаю сегодня вот такую новость. Минский завод «Горизонт» после «белорусских ноутбуков», локализация которых составляет около 30%, представил новую разработку — прозрачный телевизор. Гендиректор предприятия Юрий Предко назвал его «технологией послезавтрашнего времени». От слова ...
Сегодня был грустный день: похоронили Александра Петровича Дьяченко (1951—2024), нашего легендарного доцента... Вроде и не старый ещё, ещё в августе был бодр и весел, а сгорел буквально за четыре месяца... Увы, довольно агрессивная аденокарцинома, метастазы в кости, полиорганная ...