Тервер и флуктуации

Вот, допустим, я решил установить вероятность некоторого события, ставя большое количество опытов. Провожу сто опытов, получаю пять благоприятных исходов. "Эге! - говорю я себе. - Значит, у меня теперь есть первая оценка для искомой величины - пять процентов. Но сто опытов - это мало, надо тысячу!" Довожу число опытов до тысячи и получаю десять благоприятных исходов. "Ну что ж, - говорю я себе, - значит, у меня есть другая, более точная оценка - один процент, а что после первой сотни оказалось пять - статистическая флуктуация, эка невидаль!"
Но тут мне приходит в голову другая мысль: ведь если взять опыты со сто первого по тысячный, у меня получается пять благоприятных исходов на девятьсот опытов, то есть, округляя, 0,6 %!
Вроде бы тысяча больше, чем девятьсот, и закон больших чисел велит предпочесть тысячу опытов. Но эта тысяча включает в себя явную статистическую флуктуацию, которая, кажется, довольно сильно искажает результат.
Конечно, первый вопрос, который хочется задать - "Какого хрена?", но здесь ответ более или менее простой: просто тысяча - недостаточно большое число для такой маленькой вероятности.
Поэтому я задаю другой: "Чё делать?" Иными словами, какая оценка - по всему эксперименту (т.е. 1,0 %) или с исключением флуктуации (т.е. 0,6 %) окажется (разумеется, с наибольшим вероятием) ближе к истине?
Метрологические руководства рекомендуют флуктуации исключать, но там речь идёт о реальных измерениях. А мы представим себе, что поставили идеально случайный эксперимент, то есть такой, что подчиняется исключительно законам вероятностей и исказить результаты которого не может ни дунувший ветерок, ни пролетевшее нейтрино, ни мои собственные подслеповатые глаза. Как следует поступить в такой ситуации?
И здесь в моей голове возникает парадокс. Потому что с одной стороны, эксперимент полностью легитимен - тысяча опытов, десять благоприятных исходов, а уж как они распределены - это никого не интересует, мало ли что половина из них скучилась где-то в начале - на то она и случайность, чтобы быть случайной. А с другой стороны - если представить себе, что мы подбрасываем монету 20 раз и по какой-то прихоти случайностей получаем в первых десяти бросках десять орлов, то матожидание всего эксперимента сместится на 15 орлов и 5 решек, т.е. 75 % на 25 %; при этом очевидно, что оценка вероятности орла по второй десятке бросков (если только в ней не произойдёт чего-то столь же экстраординарного) окажется адекватнее, чем по всем двадцати.
Что скажут математики?
|
</> |