Внезапно, вопрос:
trilirium — 20.09.2023
Вопрос касается реализации алгоритмов простого/оптимизированного
поиска в строках.Предположим, что у нас есть текст, закодированный в UTF8 -- и контекстная строка, также закодированная в UTF8.
Есть средства поиска, самые примитивные (типа strstr в C) -- позволяют найти произвольную последовательность байтов в другой, более длинной последовательности байтов (и гарантированно не знающие ничего про UTF8/Unicode/etc.)
Вопрос такой: можно ли быть уверенным, что поиск гарантированно будет работать корректно?
Т.е. понятно, что все вхождения искомой строки -- найдутся. Есть ли ненулевая вероятность, что кроме них найдётся что-нибудь ещё??
|
|
</> |
Unity Ads для арбитража: все об in-app трафике, настройке и работе с high-risk вертикалями 
