Ковыряем Яшин кэш.

масштаба. Среди новостей было сообщение, что некий весельчаг приобрел-таки доменное имя ЖЖ
нашей доброй и очень многими любимой подруги - Лисенка. Пусть этот поступок будет на его/ее
совести, насколько я понял - Лисенок особо не в печали - есть новый блог, который процветает.
Она всех помнит, любит и приглашает в гости.
В комментариях к тому посту я обронил фразу, что сохраняю страницы ее ЖЖ из кэша Яндекса к себе
на компьютер (уже сохранил). Ольга задала вопрос о том как я это делаю. Вопрос понятен, отвечаю.
Захожу на Яшу (адрес никому не скажу, ибо это тайна тайн и секрет секретов), ввожу в строке:
"host:somedmoainname.com" (без кавычек есссно)
Внимание! somdomainname.com - меняется на адрес нужного ресурса, выполненного в таком же виде.
Далее нажимаем кнопку "Поиск". И в полученных результатах закрываем глаза на все, кроме мелкой
надписи "копия", выполненной сереньким цветом (обычно) и расположенной под каждым результатом.
Эта надпись является ссылкой, не простой ссылкой, а адресом страницы, живущей в недрах кэша Яши.
Ее так же можно открыть любым нормальным броузером. (кстати, ссылки, которые находятся в этих
копиях - и есть ссылки, проиндексированный ПС Яша). Можно эти страницы и сохранить себе, что бы
потом любоваться в оффлайне или разместить на другом сервере.
Да, при наличии большого количества страниц - сохранение каждой задалбывает в сиську. Поэтому
сейчас работаю над скриптом, сохраняющим страницы кэша в зип-архив, который потом просто можно
будет скачать. Правда Яша после нескольких запросов заблокировал мой IP и велел пройти капчу.
Думаю как обойти эту фичу.
- Хотя конечно некоторым лучше сперва поучить основные команды windows, а уж потом лезть в дебри.
|
</> |