Отчёрт
ibigdan — 11.03.2010 Итак, как я съездил, чего видел и слышал.Конференция Яндекса проходила в Бизнес-Центре "Парус", очень впечатляющем здании (посмотреть фото и координаты можно на Мапии). Жаль, всё действо проходило на 3-м этаже и поснимать виды с вершины не удалось. В самом конференц-зале я не снимал - проектор, экран и докладчик, такое все сто раз видели :) Лучше расскажу суть докладов.
80% конференции было посвящено сервису Яндекс.Новости и связанным с ним темам. Соответственно было много представителей онлайн и оффлайн-СМИ, которые внимали. Я не СМИ, сервис Яндекс.Новости не индексирует блоги, так что отмечу только интересное описание задач, стоящих перед программистами, например автоматическое разделение новостей для украинской и русской аудитории. Там ведь нельзя просто взять и поделить по ключевым словам: если упоминается Россия, то посетителю с украинским IP новость не показывать, и наоборот. Нет, ряд российских событий (каких? как отлавливать?) интересуют и украинцев, а ряд украинских - россиян. Сложно так же создавать обобщённые заголовки, например заходит россиянин в Яндекс, а вверху новости дня: "Парламентский кризис". Шоке, валидол, звонить родственникам, а оказывается это в Украине парламентский кризис и для россиянина надо "в Украине" дописывать в заголовок. И это только одна проблема из сотен.
Далее рассказали о виджетах - инфоблоках, которые каждое СМИ (и не только) может сделать и предлагать своим читателям встраивать в главную страницу Яндекса. Что-то вроде вашего RSS-фида, встроенного в поисковик. Штука очень полезная, но долго расписывать не буду, т.к. я не СМИ, кому надо - создавать свои HTML-виджеты можно здесь. Не путайте с виджетами самого Яндекса, которые встраиваются к вам на рабочий стол или ещё куда.
Поиск по блогам оставили на конец, поэтому получилось как-то "по-быренькому" и без активности со стороны слушателей. Но я несколько интересных фактов расскажу:
1. Яндекс индексирует не только блогсервисы, типа ЖЖ, но и стендалон-блоги. Раньше основным признаком "блога" было наличие RSS, содержимое которого соответствовало постам. Но со временем RSS стал очень популярен и сегодня присутствует на большинстве сайтов, поэтому бот Яндекса может ошибаться, добавляя в рейтинг блогов посторонние сайты, как это было на днях с неизвестно откуда взявшимся в топ-10 ЧасКор.ру. Блоги на стандартных движках (типа WordPress'а) добавляются автоматически, нестандартный блог можно подключить, написав в службу поддержки.
2. Яндекс определяет пол блоггера (м/ж) не только по профайлу (проиндексировано 42 миллиона профайлов, но не все блоггеры указывают свой пол), но и по записям, анализируя глаголы в прошлом времени "я посмотрел/я посмотрела".
3. Посты из блогов индексируются очень быстро: 1-5 минут после написания, и программисты работают над тем, чтобы сократить время до секунд. Данные не переиндексируются каждый раз заново, а накапливаются в "архив блогосферы", именно поэтому даже если вы удалите пост, он останется в базе Яндекса - ведь RSS вашего блога не сообщает об удалении. Кстати, saboy, это ответ и на твой вопрос: записи "задним числом" не попадают в RSS, именно поэтому они не попадают в базу Яндекса. У Гугля механизм явно другой.
4. Яндекс успешно отлавливает спам-блоги (созданные под SEO-задачи, например) и не индексирует их. На данный момент около 9% записей в 17 млн. блогов являются спамом (с другой стороны это те, которые нашёл Яндекс, а сколько ещё не нашёл?).
5. Рейтинг блогов Яндекса рассчитывается на основании даных о ссылках между блогами за последние полгода. Вскоре рейтинг планируют сильно переделать - будут учитывать количество комментов, будут занижать стоимость повторных ссылок и т.д. - всё это для того, чтобы он был пообъективнее. Но я уже писал и ещё раз повторю: Яндекс пытается дать ответ на вопрос: "кто круче, музыкант или художник?" и как бы программеры не перекраивали алгоритмы, ответ всё равно будет неправильным. Например, тупой вопрос или провокация вызывают кучу комментов, вряд ли это можно назвать авторитетностью. Ещё, в ЖЖ ежедневно проходит куча акций "обмена ссылками", это СЕОшники себе рейтинги накручивают. Правила там всегда одинаковые: хочешь участвовать в акции - отправь в свой блог запись об участии (со ссылкой) и пришли в комменты ссылку на свой пост. 200 участников = 200 ссылок + 200 комментов к посту инициатора акции (вот кто выигрывает на самом деле). Вот они-то и будут в топе нового рейтинга. Я ссылкообменом никогда не занимался, и что теперь - придётся?
Короче - всех скоро тряханёт, но мировая справедливость от этого не наступит :)
Яндекс утешает тем, что хотя "Я - стотысячный" звучит не круто, на самом деле 100,000-е место в рейтинге - это круче чем 98% блоггеров, коих миллионы.
По докладу собственно всё. В процессе кофепития познакомился с Унабомбером и супругой, очень симпатичная пара. Да-да, я в курсе о его ЖЖ, но у него стиль такой, как у Лебедева - хомячков разводит, Nothing Personal, Just Business. А в миру нормальный человек, КМК.
Разговаривал с другими ребятами. Приятно было слышать "дякую за блог, читаю" - в реальной жизни я такое редко слышу :) Спрашивали и о рекламе и о негативных отзывах в мою сторону. Ну опять повторюсь - я не обижаюсь, я благодаря ним становлюсь лучше, так что пусть ругают, если им так нужно.
По ходу общения было заключено два контракта (как-то внезапно), один очень необычный. Короче поездка окупилась четыре раза :) Не знаю, когда будет следующий BlogCamp CEE, точно поеду, неформальное общение лучше любых докладов.