Эксперимент с новой формулой рейтинга спортивного ЧГК

Версия 1.0 (ноябрь 1998) для каждого турнира устанавливала (субъективно) бонус победителя в зависимости от уровня и представительности, а бонусы остальных мест линейно уменьшались с шагом 5 или 10. При этом в итоговые релизы помещались только места, но не сами рейтинги.
Версия 2.0 (январь 2001) использовала экспоненциальную модель бонусов на турнире и методику расчёта, не позволяющую обсчитать один турнир вне связки с остальными турнирами межрелизного промежутка. Недостатками системы были возможность попадания на достаточно высокие места достаточно случайных команд, а также постоянный рост баллов на всех этажах рейтинговой таблицы.
Версия 3.0 (июль 2004) сделала рейтинг более наглядным, рассчитывая его как сумму бонусов пяти лучших турниров за последние три года (для большинства команд – за последний год, поскольку старые бонусы учитывались с понижающим коэффициентом. Адекватность расчёта повысилась, темпы инфляции рейтингов оказались ниже, но она не была побеждена. Кроме того, формула давала слишком низкие бонусы на турнирах с небольшим количеством сильных команд.
Версия 3.1 (сентябрь 2007) модифицировала формулу, но в результате этого сильно возросли бонусы за победу на турнирах с относительно слабым составом, а инфляция усилилась.
Действующая на сегодня версия 4.0 (июнь 2010) основана на концепции расчёта бонуса за каждое место на турнире исходя из прогноза положения команд в нём. В ней стабилизирован бонус самых крупных турниров (2300), введён технический рейтинг сборных, но сохранена концепция пяти лучших турниров. Методика не справилась с взрывным ростом количества синхронов, что привело к уплотнению рейтингов в верхней части таблицы и нивелировке бонусов за призовые места на крупных турнирах (сейчас второе место может стоить уже 2299). Очевидно, что рейтинговая система, в которой нет проигрышей (а только выигрыши и ничьи), не может быть стабилизирована без изменения коренных принципов.
Версия 4.1 призвана:
– обеспечить адекватность ранжирования команд;
– стабилизировать не только максимальные бонусы турниров, но и рейтинги команд на верхних этажах таблицы;
– обеспечить более точный предсказательный эффект (в случае игры сборных или при сильных легионерах в слабых командах и т.п.);
– более адекватно рейтинговать новые, редко играющие и территориально удалённые от основных игровых центров команды.
2) Предлагается замена аддитивной модели прогнозно-разностной – все турниры, играемые командой, влияют на её рейтинг: к рейтингу предыдущего релиза суммируются очки (в том числе и отрицательные), заработанные командой на всех турнирах, завершившихся между релизами.
Список команд на турнире сортируется по рейтингу, по этому списку определяются прогнозируемое место, и прогнозируемый бонус Pb. Разность между реальным полученным бонусом Rb и прогнозируемым бонусом U=Rb-Pb. Другими словами: команда, занявшая место выше предсказанного, получает плюс (тем больший, чем выше взлёт относительно предсказания), а ниже предсказанного – минус.
Поскольку часть команд уходит из игры и уносит с собой рейтинг, для стабилизации рейтинговой массы отрицательные разности имеет смысл умножать на понижающий коэффициент W – наилучшие результаты получены при коэффициенте 0,25 (то есть отрицательные разности уменьшаются вчетверо).
Чисто разностная схема отлично работает на всех этажах рейтинга, кроме самого верхнего: команда, посеянная под первым номером, выиграв турнир, не может получить плюсовую разницу. Поэтому необходим довесок, стимулирующий лидеров рейтинга, но несущественный для прочих команд. Предлагается довесок D=d1*exp(-(2300-Rb)/d2). Здесь 2300 – константа, соответствующая максимальной стоимости турнира, d1 – коэффициент, устанавливающий максимальную цену довеска (например, 50 – менее 0,5% от типового рейтинга лидера), d2 – коэффициент крутизны (при d2=200 довесок становится нулевым при бонусе около 1500). Таким образом, очки за турнир складываются из разностной части U и экспоненциальной части D.
3) Для большей адекватности рейтинга желательно начать его расчёт с возможно раннего времени, чтобы обеспечить затухание всех переходных процессов. Мы можем начать пересчёт рейтинга с лета 1998 года – ранее этого времени таблицы мест сохранились всего для нескольких турниров. В качестве стартового предложен рейтинг, составленный по самому раннему релизу (1 ноября 1998 года) саранского рейтинга (210 команд, отсортированных по местам, но без очков), но сдвинутый на 1 июля 1998 года. Этот список мог быть любым (даже от случайного списка система сходится примерно к такому же состоянию примерно за 15 релизов), главное в нём – возможность сортировки в верхней части таблицы на почти всех турнирах. В стартовом релизе лидеру установлен рейтинг 11200. Чтобы 10 место имело рейтинг около 10000, использована геометрическая прогрессия к коэффициентом 0,99. Последнее 210 место получается с рейтингом 1370. Начальные условия – не принципиальны, но при начальных условиях, наиболее приближенных к желаемому результату, длительность переходных процессов минимальна.
Основной принцип стабилизации рейтинга состоит в том, что каждая команда часть турниров играет выше прогноза, а часть турниров ниже. Если сумма плюсов будет больше, чем сумма минусов, она на следующем релизе займёт более высокое место, но там ей будет уже сложнее расти дальше.
Несмотря на увеличение числа играющих и рейтингуемых команд, структура рейтинга с 1998 по 2013 год не меняется: в топе (15-20 команд) сохраняется достаточно высокий наклон тренда (обеспечиваемый экспоненциальным довеском), а наклон за пределами топа определяется числом команд в движении. Наиболее стабилен наклон тренда в пределах 10 топ-команд: отрыв первого места от десятого не менее 1000 баллов.
Теоретически рейтинг лидеров может расти до бесконечности, но в реальности проигрыши нивелируют эту возможность: рейтинги первого могут колебаться в пределах нескольких сотен.
Сохранены даты всех старых релизов, но добавлены новые – там, где между релизами был промежуток более 3 месяцев, а также на границах сезонов после перехода к учёту базовых составов.
В период до 1 июля 2003 года рейтингуются все присутствующие в базе турниры, для которых полностью известен список команд, а их число не менее 5, после этой даты – только те турниры, которые рейтинговались. В крупнейших уже завершённых многоэтапных турнирах (ОВСЧ и ББ) из рейтингового зачёта были исключены команды, пропустившие более одного тура.
Все команды, стартующие позже первого релиза, но до 1 сентября 2006 года, получают нулевой стартовый рейтинг. Если команда пропустила 4 межрелизных промежутка подряд (то есть год), её рейтинг обнуляется.
4) Для уточнения прогнозирования места для сборных команд, а также для команд, играющих с привлечением игроков существенно более сильных, чем игроки базового состава, вводится система индивидуальных рейтингов. Индивидуальный рейтинг, оцениваемый по команде, в базовый состав которой входит игрок, не может быть признан адекватным. Предлагается индивидуальный рейтинг, построенный по принципу, использовавшемуся с 2003 года для командного: сумма бонусов пяти лучших турниров (сыгранных за любые команды) за последние три года (но за предпоследний – с коэффициентом 2/3, а за предпредпоследний – с коэффициентом 1/3).
Линейная сумма индивидуальных рейтингов для расчёта командного также признана неадекватной, поскольку она слишком низко оценивает не полностью укомплектованные команды. Технический рейтинг команды (ТРК) рассчитывается как сумма индивидуальных рейтингов первых шести игроков, отсортированных по убыванию: И1, И2, И3, И4, И5, И6 с аликвотными коэффициентами (возможны и другие варианты: линейный 1, 5/6, 2/3, 1/2, 1/3, 1/6 или геометрическая прогрессия с коэффициентом 0,7), умноженная на нормирующий коэффициент Q.
Этот коэффициент вычисляется при релизе как среднее значение отношений рейтинга команды к ТРКБС (ТРК по базовому составу – по первым шести игрокам, отсортированных по убыванию; если в базовом составе менее 6 игроков, он дополняется виртуалами с рейтингом, равным среднему рейтингу остальных) для лучших 10 команд.
Замена текущего рейтинга команды техническим рейтингом имеет смысл тогда, когда у команды нет базового состава и при использовании легионеров, более высокорейтинговых, чем штатные игроки команды: если ТРК выше 1,1*ТРКБС и текущего рейтинга. В то же время коррекция рейтингов команд, играющих не в полном составе, и команд, в составе которых присутствуют низкорейтинговые легионеры, признана нецелесообразной: потому, что разница рейтингов в большинстве случаев не очень существенна. Кроме того, нет смысла мотивировать команды играть в ослабленном составе.
Релизы ИРИ выпускаются одновременно с релизами рейтинга команд. Корректное вычисление ИРИ возможно только с лета 2005 года (поскольку систематические данные о составах команд имеются только с осени 2004 года, но и до весны 2006 встречаются турниры без составов), но уместнее привязать начало выпуска релизов ИРИ к 2 сентября 2006 – к началу ввода базовых составов.
5) Предлагается введение стартовых рейтингов для более адекватного оценивания мест новых команд, исключающего как их недооценивание (при малом числе сыгранных турниров), так и переоценивание (при большом количестве сыгранных турниров команда, стартующая с нуля, может занять место существенно выше своей реальной силы). Стартовый рейтинг позволяет достаточно точно спрогнозировать исходную позицию команды, в которой вероятность выигрышей и проигрышей примерно равны. Стартовый рейтинг рассчитывается как технический рейтинг по базовому составу и записывается в предшествующий релиз: команда получает рейтинг, но не получает места.
Стартовый рейтинг – это аванс команде, заработанный её игроками за предшествующий год. Если этот рейтинг окажется завышенным, то команда передвинется на адекватное её место уже к следующему релизу.
6) Результаты эксперимента
http://ratingtest.chgk.info/teams.php
(нет турниров августа 2013), не исправлены ещё кое-какие ошибки - тестовая страница заведена только для обкатки
7) Пока ещё (на 3 сентября 2013) висит версия, в которой не использованы меры по борьбе с инфляцией. Предлагается зафиксировать оптимальное значение сумм топ-10 и ещё какой-нибудь группы команд, например, 11-20 или 1-100 и поддерживать его, изменяя коэффициенты. Если понемногу поднимать коэффициент учёта отрицательных разностей, то она будет нивелирована. Но придётся немного поднять и максимум экспоненциальн
Инфляция будет побеждена, но ПОКА на страничке висит упрощённая модель.
8) А для борьбы с перерегулированием (слишком резким взлётом команд с низких мест) предлагается выпускать релизы рейтинга ежемесячно.
Все эти дополнительные улучшения появятся на тестовой странице в ближайшее время.
|
</> |