Проверка статистических гипотез
Материал из Википедии — свободной энциклопедии
Проверки статистических гипотез - класс базовых задач в математической статистике.
Содержание |
[править] Статистические гипотезы
[править] Определения
Пусть дана выборка из неизвестного совместного распределения . Тогда любое утверждение, касающееся природы называется статистической гипотезой. Гипотезы различают по виду предположений, содержащихся в них:
- Статистическая гипотеза, однозначно определяющая распределение , то есть , где какой-то конкретный закон, называется простой.
- Статистическая гипотеза, утверждающая принадлежность распределения к некоторому семейству распределений, то есть вида , где - семейство распределений, называется сложной.
На практике обычно требуется проверить какую-то конкретную и как правило простую гипотезу H0. Такую гипотезу принято называть нулевой. При этом параллельно рассматривается противоречащая ей гипотеза H1, называемая конкурирующей или альтернативной.
Выдвинутая гипотеза нуждается в проверке, которая осуществляется статистическими методами, поэтому гипотезу называют статистической. Для проверки гипотезы используют критерии, позволяющие принять или опровергнуть гипотезу. Статистической гипотезой называется любое предположение о виде неизвестного распределения или о параметрах известного распределения.
[править] Пример
Пусть дана независимая выборка из нормального распределения, где μ — неизвестный параметр. Тогда , где μ0 — фиксированная константа, является простой гипотезой, а конкурирующая с ней — сложной.
[править] Этапы проверки статистических гипотез
- Формулировка основной гипотезы H0 и конкурирующей гипотезы H1. Гипотезы должны быть чётко формализованы в математических терминах.
- Задание вероятности α, называемой уровнем значимости и отвечающей ошибкам первого рода, на котором в дальнейшем и будет сделан вывод о правдивости гипотезы.
- Расчёт статистики φ критерия такой, что:
- её величина зависит от исходной выборки ;
- по её значению можно делать выводы об истинности гипотезы H0;
- сама статистика φ должна подчиняться какому-то известному закону распределения, т.к. сама φ является случайной в силу случайности .
- Построение критической области. Из области значений φ выделяется подмножество таких значений, по которым можно судить о существенных расхождениях с предположением. Его размер выбирается таким образом, чтобы выполнялось равенство . Это множество и называется критической областью.
- Вывод об истинности гипотезы. Наблюдаемые значения выборки подставляются в статистику φ и по попаданию (или непопаданию) в критическую область выносится решение об отвержении (или принятии) выдвинутой гипотезы H0.
[править] Виды критической области
Выделяют три вида критических областей:
- Двусторонняя критическая область определяется двумя интервалами , где x1 − α / n,xα / n находят из условий .
- Левосторонняя критическая область определяется интервалом , где xα находят из условия P(φ < xα) = α.
- Правосторонняя критическая область определяется интервалом , где xα находят из условия P(φ > xα) = α.
[править] Ссылки
[править] См. также
Статистические критерии: Ниже для помощи в навигации приведён список статистических критериев. (список далеко не полный и не все из перечисленных статей существуют на данный момент; вы можете помочь проекту, создав статью из списка или добавив новую) |
F-критерий | Q-критерий Розенбаума | t-критерий Стьюдента | U-критерий Манна-Уитни | Z-критерий | Критерий Бартлетта | Критерий Колмогорова | Критерий Кохрена | Критерий отношения правдоподобия | Критерий Пирсона | Критерий Уилкоксона | Критерий Фридмана