Старый 07.11.2009, 15:11   #14 (permalink)
Anathema
Энтузиаст
 
Аватар для Anathema
 
Регистрация: 03.03.2007
Адрес: Минск
Сообщений: 348
Я вобщем-то на кафедре ТВиМС учусь, так что в статистике разбираюсь.

Начнем с того, что наша турнирная доля (av. profit) и дисперсия игры в точности нам неизвестны, потому что они определяются чем-то Высшим (Богом, природой итп). То, что мы считаем есть лишь оценка этих параметров. Оценки , естественно, бывают разные, но нас интересуют те, которые при увеличении дистанции становятся все ближе к реальному неизвестному значению. Если рассмотреть случайную величину X - профит за 1 турнир конкретного типа, то относительно этой величины у нас есть выборка из N конкретных экспериментальных реализаций этой величины. Назовем их x1...xN. Тогда "хорошими", то есть обладающими некоторыми полезными для прогнозов свойствами, которые я опущу будут следующие оценки

Для среднего профита за игру X(est) = (x1+..+xN)/N , то есть банальное среднее арифметическое

Для дисперсии игры DX(est) = ([x1-X(est)]^2+..+[xN-X(est)]^2)/(N-1) - сумма квадратов отклонений реализаций случайной величины от среднего, деленная на N-1.

Для чего нам нужна дисперсия? Сама по себе она далекому от ТВ человеку не несет никакой информации, просто большое положительное число, однако я изложу некоторые результаты ТВ , которые помогут делать некоторые игровые прогнозы с помощью оценки дисперсии.

1. Каково бы не было распределение случайной величины Х , определенной выше , распределение суммы ее N независимых копий (иначе говоря - тотал профита за N игр) будет близко к нормальному распределению с параметрами X(est)*N и DX(est)*N
2. При этом распределение av. profita будет близко к нормальному с параметрами X(est) и DX(est)/N

Тогда если воспользоваться тем, что реализация нормальной случайной величины с вероятностью 98% попадет в промежуток <первый параметр>+-3*SQRT(<второй параметр>), то имея оценки среднего и дисперсии вы можете

-прогнозировать поведение гравика, то есть вы откатали 5000 турниров, получили X(est) = 1.5$ DX(est) = 1600$^2 , тогда вы можете утверждать , что с вероятностью 98% через 100 турниров ваш результат попадет в промежуток 150+-3*40 = [30..270]

Замечание : на практике дисперсия настолько большая, что такое прогнозирование не имеет смысла, т.к уж очень широкий получается промежуток , но можно регулировать его , снижая вероятность попадания, к примеру, в промежуток X(est)+-2*SQRT(DX(est)) реализация попадет лишь с 60% вероятностью. Зависимость коэффициента от вероятности определяетсяквантилью стандартного нормального распределения (если надо, в гугле найдете).

- также можно по такому же принципу строить доверительный интервал для своих оценок, указываем уровень значимости (АКА вероятность попадания), подбираем коэффициент и используем ту же формулу, что для прогноза по графикам, но учитывая параметры распределения. Это может оказаться и полезным.


По большому счету - весь этот статистический анализ при таких соотношениях МО и дисперсии , такой стоимости байина и такой длинной дистанции, которую надо откатать , чтобы сделать адекватные с формальной точки зрения выводы - большая дрочь. Я подробно расписал все это специально, чтобы не было у людей лишних иллюзий на этот счет.
Anathema вне форума