
Жизнь и смерть ЖЖ в одном графике

После очередной волны упаднических настроений мне стало любопытно, действительно ли всё так плохо. Ориентироваться на собственную статистику смысла нет, особенно если учитывать, что я на месяц вообще на блог забил и цифры там мегагрустные. Потому было решено зайти с другой стороны, я ж айтишнег, так что пришло время заняться моей тайной страстью — Data mining.
Вы слова то не пугайтесь, звучит солидно и умно, некоторые любят козырнуть им в разговоре и в резюме, но по факту это всего лишь анализ общедоступных
На момент расследования у меня уже был список из 5 млн. активных пользователей ( и не спрашивайте зачем ), в архивах обнаружилась БД двухгодичной давности на 8 млн. записей и еще своими изысканиями поделился товарищ

Дальше всё совсем просто, группируем инфу о пользователях по месяцам и получаем его — график жизни и смерти ЖЖ.

Оранжевая линия это количество регистраций, синяя — количество журналов, которые последний раз обновлялись в данном месяце и больше ничего не писавших. Проще говоря, синее - это количество авторов забивших на ЖЖ.
Итак, что же по всему этому можно сказать?
— Выборка делалась по пользователям, которые написали за всё время более 10 постов. Делать сводку по аккаунтам пустышкам не было смысла, мне были интересны пишущие пользователи. Кстати таких журналов оказалось ~4.2млн, т.е. хоть что-то написали чуть больше половины, остальные пустышки.
— Синяя линия, уходящая практически вертикально вверх это количество аккаунтов, которые продолжают писать. Вы не обращайте внимания на январь, на самом деле крайняя точка справа это март 2016, просто Excel сурово зарубил подсказку. Если говорить цифрами, то активных журналов всего 122 тысячи, т.е. примерно 1.5% от общего числа. Чукча не писатель — чукча читатель.
—
— Количество новых регистраций стремительно падает. Это факт. Есть небольшие пики, только они практически повторяются на графике умерших журналов, так что думаю это просто всплески активности ботов.
Вот такие пироги ребята. Для чистоты эксперимента неплохо было бы сделать статистику по постам и количеству комментов, но этих данных в публичном доступе нет. А чтобы заполучить самостоятельно список записей для 7.5 млн журналов надо сделать порядка 200-300 млн. запросов к ЖЖ. И это нифига не быстро, потому пока я эту мысль отложил.
На этом у меня всё, спасибо за внимание
upd. Меньшов решил, что на моём графике нихрена непонятно и потому

з.ы. Ссылка на XLS файл с данными для любителей покопаться в цифрах.
з.ы.ы.





|
</> |