Merge pull request #3 from rustbas/dev

`stat-madness.md`
2024-11-16 08:06:46 +00:00
parent 87c033da3a 744f329f68
commit 719826c1a5
5 changed files with 201 additions and 0 deletions
--- a/docs/maths/assets/stat-madness/bootstrap.png
+++ b/docs/maths/assets/stat-madness/bootstrap.png
--- a/docs/maths/assets/stat-madness/conf_interval.png
+++ b/docs/maths/assets/stat-madness/conf_interval.png
--- a/docs/maths/assets/stat-madness/modeling.png
+++ b/docs/maths/assets/stat-madness/modeling.png
--- a/docs/maths/index.md
+++ b/docs/maths/index.md
@@ -6,3 +6,5 @@
 ## 2024-09-24 [Немного про Байесовскую статистику](baes.md)
 ## 2020-09-01 [Немного про проверку гипотез](stat-madness.md)
--- a/docs/maths/stat-madness.md
+++ b/docs/maths/stat-madness.md
@@ -0,0 +1,199 @@
 # Немного про проверку гипотез
 ## Введение
 Любые статистические испытания зиждятся на проверке гипотез, например:
 1. Проверка действия лекарств.
 2. Установление зависимости между явлениями.
 3. A/B тестирование и пр.
 В зависимости от вида данных, целей исследования и других факторов
 можно по-разному формулировать гипотезы и по-разному их проверять.
 Многое зависит от не только знаний и опыта исследователя, но и в целом
 от его подхода. В процессе работы можно все меньше уделять внимание 
 математической составляющей и все больше полагаться на компьютер и его
 вычислительные мощности.
 Здесь я хочу рассказать о стадиях, через которые проходит исследователь,
 в попытках упростить себе жизнь и ускорить процесс проверки гипотез.
 ## Небольшой ликбез
 В статистике, если упростить, проверку гипотезы можно описать так: 
 1. По данной выборке считается статистика (т.е. функция от выборки).
 2. Из распределения статистики находятся две области, где гипотеза отвергается и где нет. Исходя из этого, принимается решение.
 **N.B.** Проверяется гипотеза, модель постулируется.
 ## Стадия 1. Строгие доказательства
 На данной стадии ученый строго выводит распределения статистик, чтобы построить как можно более хорошие критерии. 
 $$\Large
 \sqrt{n}
 \frac
 {\overline{\mathbb{X}} - \mu}
 {S} =
 \sqrt{n}
 \frac
 {\overline{\mathbb{X}} - \mu}
 {\sigma} \cdot
 \frac{1}
 {\frac{S}{\sigma}} =
 $$
 $$\Large
 = \sqrt{n}
 \frac
 {\overline{\mathbb{X}} - \mu}
 {\sigma} \cdot
 \frac{1}
 {\sqrt{\frac{(n-1)S^2}{\sigma^2}\cdot
 \frac{1}{n-1}
 }}
 $$
 Получим:
 $$\Large
 \begin{matrix}
 &\sqrt{n}
 \frac{\overline{\mathbb{X}} - \mu}
 {\sigma} &\sim &N(0,1) \\
 &\frac{(n-1)S^2}{\sigma^2} &\sim &\chi^2(n-1)
 \end{matrix}
 $$
 Таким образом, по [определению](https://ru.wikipedia.org/wiki/Распределение_Стьюдента#Определение):
 $$\Large
 \sqrt{n}
 \frac
 {\overline{\mathbb{X}} - \mu}
 {S} \sim t(n-1).
 $$
 ## Небольшой пример (критерий Стьюдента)
 **Дано**: выборка Х объема 10
 $$\Large
 \mathbb{X} = \left( 
 \begin{matrix}
 3.175 \\
 4.042 \\
 2.127 \\
 3.841 \\
 1.699 \\
 2.223 \\
 3.211 \\
 3.33  \\
 2.447 \\
 2.904 
 \end{matrix}
 \right)
 $$
 **Модель**: $N(\mu, \theta_2)$
 **Нулевая гипотеза**: $\mu = 3$
 **Решение**:
 Статистика критерия:
 $$\Large
 T(\mathbb{X}) =
 \sqrt{n}
 \frac
 {\overline{\mathbb{X}} - \mu}
 {S} 
 \sim
 t(n-1)
 $$
 Статистика равна:
 $$\Large
 T(\mathbb{X}) = -1.9066
 $$
 Пусть уровень значимости $\alpha = 0.05$.
 Область, где не отвергается нулевая гипотеза: $(g_1, g_2) = (-2.262, 2.262)$, т.е. это область, которую принимает значение статистики при условии верности нулевой гипотезы с вероятностью $1 - \alpha = 0.95$. $g_1$ в данном случае это $0.025$-квантиль, а $g_2$, соотвественно, 0.975-квантиль. 
 ![Доверительный интервал](assets/stat-madness/conf_interval.png)
 Красным обозначен интервал $(g_1, g_2)$
 Таким образом, нулевая гипотеза не отвергается, так как значение статистики лежит в данном интервале.
 > **Примечание**: можно было выбрать доверительный интервал иначе, 
 > но его стараются  выбрать так, чтобы минимизировать его длину.
 ## Стадия 2. Открытие моделирования
 Иногда (вернее, даже как правило) распределение статистики вывести
 невозможно. В таком случае пользуются моделированием. Идея в том, что
 нам известно распределение выборки в случае нулевой гипотезы. Таким
 образом, можно многократно генерировать выборки и считать статистику,
 таким образом получив ее распределение.
 ![Открытие моделирования](assets/stat-madness/modeling.png)
 В данном случае, моделирование выборки проводилось 
 в условиях $X \sim N(\mu, S^2)$.
 Можно увидеть некоторое расхождение. В этом, кстати, заключается интересный
 момент. Часто критикуются исследования построенные на моделировании, так как
 есть ненулевая (хоть и очень маленькая) вероятность, что выборки
 сгенерировались так, что полученное распределение статистики плохо отражает
 реальность.
 ## Стадия 3. Бутстрэп 
 Бывают случаи, когда распределение выборки неизвестно совсем 
 (или его сложно/нельзя в обычном смысле генерировать,
 [пример](https://stepik.org/lesson/40491/step/1?unit=24794)). В таком случае
 постулируют, что данная выборка хорошо отражает генеральную совокупность и в
 качестве функции распределения берут эмпирическую функцию распределения.
 $$\Large
 F_n(x) = \frac
 {\sum_{i=1}^{n} \mathbb{1}(x)}
 {n}
 $$
 где:
 $$\Large
 \mathbb{1}(x) =
 \begin{cases}
 1, x > X_i, \\
 0, \text{ иначе.}
 \end{cases}
 $$
 В итоге, получается, что для проверки гипотез не нужно ничего кроме выборки и выдуманной статистики (которая, вообще, может быть любой, от нее зависит только качество получаемого критерия).
 Основная идея заключается в том, чтобы генерировать выборки объемом как и данная выборка из следующего распределения:
 $$\Large
 \mathcal{F} =
 \begin{pmatrix}
 X_1         &X_2         &\cdots &X_n \\
 \frac{1}{n} &\frac{1}{n} &\cdots &\frac{1}{n} 
 \end{pmatrix}.
 $$
 ![Результат на выборке объема 10](assets/stat-madness/bootstrap.png)
 Таким образом, из расхождения графиков можно сделать следующие выводы:
 - применение бутстрэпа требует большой объема первоначальной выборки,
 - наблюдения в выборке должны быть независимыми.
 Несмотря на это, он часто применяется невпопад, так как не требует особых затрат на реализацию.
`@@ -6,3 +6,5 @@`

	`## 2024-09-24 [Немного про Байесовскую статистику](baes.md)`	`## 2024-09-24 [Немного про Байесовскую статистику](baes.md)`

		`## 2020-09-01 [Немного про проверку гипотез](stat-madness.md)`