@0xd34df00d:
0xd34df00d — 18.06.2010 Жуйк, такой вопрос. Есть читалка RSS. Есть желание добавить возможность автоматического выковыривания статей из всяких вордпрессов/membrana.ru/habrahabr, которые в RSS кладут только тизер. Есть желание разделить это на некое рабочее ядро что ли и кучу правил к нему, по правилу на сайтец/движок/етц. Внимание, вопрос. Как бы ты реализовал правила, с учетом наиболее легкого написания/поддержки/етц?Я вижу, например, регекспы и микроскрипты на ECMAScript. Но регекспами парсить странички неохота, а ECMAScript... Ну, регекспы там тоже есть, чо, API для доступа к DOM-дереву страницы тоже есть.
|
</> |