Немного скуки на тему статистики (окончание)
trim_c — 25.09.2016
Рис.5 Графическое представление нормального распределения при разных значениях параметров
Как видно из рисунка, у гауссианы два параметра: μ и σ.
Мы видим, что графики нормальных распределений есть симметричные кривые с максимумом в центре и достаточно быстрым убыванием к краю.
Координата центра тяжести графика на горизонтальной оси Х есть среднее значение изображаемой случайной величины, у нормального распределения оно всегда совпадает с абсциссой максимального (наиболее часто встречающегося) значения случайной величины - его называют модой и еще матожиданием. Среднее значение случайной величины обычно обозначают греческой буквой μ (мю).
Кроме того видно, что бывают графики более узкие и высокие, они слабо отклоняются от своего среднего, а бывают более низкие и широкие, «размазанные» графики, для которых характерны большие отклонения от своего среднего значения μ. Такое различие между графиками определяется еще одним важным параметром распределения – так называемым стандартным отклонением σ (сигма), его квадрат σ² называется дисперсией.
Вот чем больше σ, тем чаще встречаются значительные отклонения от среднего значения μ. На приведенном графике красная линия (узкое и высокое распределение, сравнительно малый разброс наблюдаемых данных) отвечает малому значению стандартного отклонения σ = 0,45 , а вот синяя линия (низкое и широкое распределение, большой разброс наблюдаемых данных) отвечает сравнительно большому значению σ. Поскольку площадь у всех кривых распределения одна и та же и равная единице, то понятно, что чем кривая выше, тем она уже, и наоборот.
Параметр σ можно определить по графику нормального распределения: померяйте максимальную высоту графика, умножьте ее на 0,6 и на получившейся высоте проведите горизонтальную прямую - полуширина отрезка. который из этой прямой вырежет кривая распределения и будет неплохим приближением к значению σ. На рисунке я проделал такую операцию с зеленой кривой.
Отметим важный факт: если проделать такую процедуру с графиком Шпилькина, при этом пользуясь "правильной" кривой, мы увидим, что для этого эмпирического распределения σ равно примерно 7%.
У нормального распределения есть одно, принципиально важное для нас свойство: распределение средних значений большого числа независимых испытаний при росте числа таких испытаний будет стремиться к нормальному, независимо от того, как выглядит распределение самой случайной величины.
Этот факт называется в математике "центральной предельной теоремой" и именно из-за этого факта графики честных выборов будут похожи на гауссиану, сейчас объясним, почему.
Рис.2 Графическое представление результатов выборов по 163ОИК в Саратове
Конечно, достаточно картинки по 163 ОИК, чтобы вопросы по Саратову отпали: создать нечто настолько ненормальное - это здорово постараться надо.
А я тут понаписывал кучу слов про вероятность и статистику - я не уверен, что надо еще описывать, почему я все считал правильно и чем я руководствовался, заменяя нормальное распределение равномерным и демонстрируя, что это задача для второкурсника.
Если пубилку заинтересует и она откликнется - я это расскажу, потому что умение считать примитивно - одно из важнейших для физика, инженера, прикладного математика - и вообще человека, который не хочет, чтобы его водили за нос.
Во только не очень уверен, что публике это интересно