Мощность критерия проверки гипотезы как найти

Мощность критерия при проверке гипотезы о значении генеральной средней

Если известна
генеральная дисперсия
,
то при проверке гипотезыиспользуется нормальное распределение.
Для вычисления мощности критерия при
односторонней конкурирующей гипотезе
применяется формула

,
(11)

где
находится из уравнения.

Если генеральная
дисперсия неизвестна, то мощность
критерия определяется по формулам:

(12)

где
.

Мощность критерия при проверке гипотезы о значении генеральной дисперсии

При проверке
гипотезы
,
то мощность критерия вычисляется с
использованием распределения Пирсона.

Если критическая
область левосторонняя, то

(13)

Если критическая
область правосторонняя, то

.
(14)

Пример 2.
По данным 12 рейсов установлено, что в
среднем машина затрачивает на поездку
до хлебоприёмного пункта

минуты. Допустив,
что время поездки есть нормальная
случайная величина, на уровне значимости
0,05 проверить гипотезу
мин:

а) при конкурирующей
гипотезе
мин, если известно, чтомин;

б) при конкурирующей
гипотезе
мин, если выборочное среднее квадратическое
отклонение равномин;

в) для условий а)
и б) вычислить мощность критерия.

Решение:

а) Для проверки
гипотезы
мин, при
мин, выбирают
левостороннюю критическую область
,
тогда
из уравнения

находим
.

Рассчитаем
наблюдаемое значение статистики
критерия:

Так как
— то нулевая гипотеза отвергается с
вероятностью ошибки.

б) Для проверки
нулевой гипотезы, если
неизвестно, амин,
наблюдаемое значение статистики критерия
рассчитывают по формуле:

Границу критической
области находим по таблице Стьюдента:

Поскольку
,
гипотезане отвергается, т.е.мин не противоречит наблюдениям.

в) Мощность критерия
для случая а) рассчитаем по формуле
(11):

Мощность критерия
в случае б) вычислим по формуле (12):

Пример 3.
По результатам 7 независимых измерений
диаметра поршня одним и тем же прибором
в предположении, что ошибки измерения
имеют нормальное распределение, была
проверена на уровне значимости 0,05
гипотеза
мм2
при конкурирующей гипотезе
мм2.
Гипотеза
не отвергнута. Вычислить мощность
критерия.

Решение:
Согласно
строится правосторонняя критическая
область.

По таблице

распределения на уровне значимостии при числе степеней свободыопределяем критическую границу.

Вычисляем в формуле
(14)

По таблице

распределения находим

.

Лекция 4 Гипотезы о виде закона распределения генеральной совокупности

Одной из важнейших
задач математической статистики является
установление теоретического закона
распределения случайной величины по
её эмпирическому распределению,
представляющему вариационный ряд.

Для этого на основе
анализа опытных данных, общих теоретических
предпосылок и особенностей известных
распределений подбирают среди них такой
закон, который лучше других отражает
опытное распределение случайной
величины.

Существенную
помощь при выборе закона распределения
могут оказать кривые распределения и
сравнение их с графическим изображением
опытного распределения.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

  • #
  • #
  • #
  • #
  • #
  • #
  • #
  • #
  • #
  • #
  • #

Материал из MachineLearning.

Перейти к: навигация, поиск

Содержание

  • 1 Методика проверки статистических гипотез
  • 2 Альтернативная методика на основе достигаемого уровня значимости
  • 3 Типы критической области
  • 4 Ошибки первого и второго рода
  • 5 Свойства статистических критериев
  • 6 Типы статистических гипотез
  • 7 Типы статистических критериев
    • 7.1 Критерии согласия
    • 7.2 Критерии сдвига
    • 7.3 Критерии нормальности
    • 7.4 Критерии однородности
    • 7.5 Критерии симметричности
    • 7.6 Критерии тренда, стационарности и случайности
    • 7.7 Критерии выбросов
    • 7.8 Критерии дисперсионного анализа
    • 7.9 Критерии корреляционного анализа
    • 7.10 Критерии регрессионного анализа
  • 8 Литература
  • 9 Ссылки

Статистическая гипотеза (statistical hypothesys) — это определённое предположение о распределении вероятностей, лежащем в основе наблюдаемой выборки данных.

Проверка статистической гипотезы (testing statistical hypotheses) — это процесс принятия решения о том, противоречит ли рассматриваемая статистическая гипотеза наблюдаемой выборке данных.

Статистический тест или статистический критерий — строгое математическое правило, по которому принимается или отвергается статистическая гипотеза.

Методика проверки статистических гипотез

Пусть задана случайная выборка x^m = (x_1,ldots,x_m) — последовательность m объектов из множества X.
Предполагается, что на множестве X существует некоторая неизвестная вероятностная мера mathbb{P}.

Методика состоит в следующем.

  1. Формулируется нулевая гипотеза H_0 о распределении вероятностей на множестве X. Гипотеза формулируется исходя из требований прикладной задачи. Чаще всего рассматриваются две гипотезы — основная или нулевая H_0 и альтернативная H_1. Иногда альтернатива не формулируется в явном виде; тогда предполагается, что H_1 означает «не H_0». Иногда рассматривается сразу несколько альтернатив. В математической статистике хорошо изучено несколько десятков «наиболее часто встречающихся» типов гипотез, и известны ещё сотни специальных вариантов и разновидностей. Примеры приводятся ниже.
  2. Задаётся некоторая статистика (функция выборки) T:: X^m to mathbb{R}, для которой в условиях справедливости гипотезы H_0 выводится функция распределения F(T) и/или плотность распределения p(T). Вопрос о том, какую статистику надо взять для проверки той или иной гипотезы, часто не имеет однозначного ответа. Есть целый ряд требований, которым должна удовлетворять «хорошая» статистика T. Вывод функции распределения F(T) при заданных H_0 и T является строгой математической задачей, которая решается методами теории вероятностей; в справочниках приводятся готовые формулы для F(T); в статистических пакетах имеются готовые вычислительные процедуры.
  3. Фиксируется уровень значимости — допустимая для данной задачи вероятность ошибки первого рода, то есть того, что гипотеза на самом деле верна, но будет отвергнута процедурой проверки. Это должно быть достаточно малое число alpha in [0,1]. На практике часто полагают alpha=0.05.
  4. На множестве допустимых значений статистики T выделяется критическое множество Omega_alpha наименее вероятных значений статистики T, такое, что mathbb{P}{TinOmega_alphaleft|H_0right.} = alpha. Вычисление границ критического множества как функции от уровня значимости alpha является строгой математической задачей, которая в большинстве практических случаев имеет готовое простое решение.
  5. Собственно статистический тест (статистический критерий) заключается в проверке условия:

Итак, статистический критерий определяется статистикой T
и критическим множеством Omega_alpha, которое зависит от уровня значимости alpha.

Замечание.
Если данные не противоречат нулевой гипотезе, это ещё не значит, что гипотеза верна.
Тому есть две причины.

Альтернативная методика на основе достигаемого уровня значимости

Широкое распространение методики фиксированного уровня значимости было вызвано сложностью вычисления многих статистических критериев в докомпьютерную эпоху. Чаще всего использовались таблицы, в которых для некоторых априорных уровней значимости были выписаны критические значения. В настоящее время результаты проверки гипотез чаще представляют с помощью достигаемого уровня значимости.

Достигаемый уровень значимости (пи-величина, англ. p-value) — это наименьшая величина уровня значимости,
при которой нулевая гипотеза отвергается для данного значения статистики критерия T:

p(T) = min { alpha:: TinOmega_alpha },

где
Omega_alpha — критическая область критерия.

Другая интерпретация:
достигаемый уровень значимости p(T) — это вероятность при справедливости нулевой гипотезы получить значение статистики, такое же или ещё более экстремальное, чем T.

Если достигаемый уровень значимости достаточно мал (близок к нулю), то нулевая гипотеза отвергается.
В частности, его можно сравнивать с фиксированным уровнем значимости;
тогда альтернативная методика будет эквивалентна классической.

Типы критической области

Обозначим через t_alpha значение, которое находится из уравнения F(t_alpha) = alpha, где F(t) = mathbb{P}left{ T<t right} — функция распределения статистики T.
Если функция распределения непрерывная строго монотонная,
то t_alpha есть обратная к ней функция:

t_alpha = F^{-1}(alpha).

Значение t_alpha называется также alphaквантилем распределения F(t).

На практике, как правило, используются статистики T с унимодальной (имеющей форму пика) плотностью распределения.
Критические области (наименее вероятные значения статистики) соответствуют «хвостам» этого распределения.
Поэтому чаще всего возникают критические области одного из трёх типов:

  • Левосторонняя критическая область:
определяется интервалом Omega_alpha = (-infty,, t_alpha).
пи-величина: p(T) = F(T).
  • Правосторонняя критическая область:
определяется интервалом Omega_alpha = (t_{1-alpha},,+infty).
пи-величина: p(T) = 1-F(T).
  • Двусторонняя критическая область:
определяется двумя интервалами Omega_alpha = (-infty,, t_{alpha/2}) cup (t_{1-alpha/2},,+infty);
пи-величина: p(T) = min left{ 2F(T),; 2(1-F(T)) right}.

Ошибки первого и второго рода

  • Ошибка первого рода или «ложная тревога» (англ. type I error, alpha error, false positive) — когда нулевая гипотеза отвергается, хотя на самом деле она верна. Вероятность ошибки первого рода:
alpha = mathbb{P}left{ TinOmega_alpha | H_0 right}.
  • Ошибка второго рода или «пропуск цели» (англ. type II error, beta error, false negative) — когда нулевая гипотеза принимается, хотя на самом деле она не верна. Вероятность ошибки второго рода:
beta(H_1) = mathbb{P}left{ TnotinOmega_alpha | H_1 right}.
  Верная гипотеза
 H_0   H_1 
Результат
 применения 
критерия
 H_0  H_0 верно принята H_0 неверно принята 
(Ошибка второго рода)
 H_1  H_0 неверно отвергнута 
(Ошибка первого рода)
H_0 верно отвергнута

Свойства статистических критериев

Мощность критерия:
1 - beta(H) = mathbb{P}left{ TinOmega_alpha | H right} — вероятность отклонить гипотезу H_0, если на самом деле верна альтернативная гипотеза H.
Мощность критерия является числовой функцией от альтернативной гипотезы H.

Несмещённый критерий:
1-beta(H) geq alpha
для всех альтернатив H
или, что то же самое,
mathbb{P}left{ TinOmega_alpha | H right} geq mathbb{P}left{ TinOmega_alpha | H_0 right}
для всех альтернатив H.

Состоятельный критерий:
beta(H) to 0 при mtoinfty для всех альтернатив H.

Равномерно более мощный критерий.
Говорят, что критерий с мощностью 1-beta(H) является равномерно более мощным, чем критерий с мощностью 1-beta'(H), если выполняются два условия:

  1. beta(H_0) = beta'(H_0);
  2. beta(H_1) leq beta'(H_1) для всех рассматриваемых альтернатив H_1neq H_0, причём хотя бы для одной альтернативы неравенство строгое.

Типы статистических гипотез

  • Простая гипотеза однозначно определяет функцию распределения на множестве X. Простые гипотезы имеют узкую область применения, ограниченную критериями согласия (см. ниже). Для простых гипотез известен общий вид равномерно более мощного критерия (Теорема Неймана-Пирсона).
  • Сложная гипотеза утверждает принадлежность распределения к некоторому множеству распределений на X. Для сложных гипотез вывести равномерно более мощный критерий удаётся лишь в некоторых специальных случаях.

Типы статистических критериев

В зависимости от проверяемой нулевой гипотезы статистические критерии делятся на группы, перечисленные ниже по разделам.

Наряду с нулевой гипотезой, которая принимается или отвергается по результату анализа выборки, статистические критерии могут опираться на дополнительные предположения, которые априори предпологаются выполненными.

  • Параметрические критерии предполагают, что выборка порождена распределением из заданного параметрического семейства. В частности, существует много критериев, предназначенных для анализа выборок из нормального распределения. Преимущество этих критериев в том, что они более мощные. Если выборка действительно удовлетворяет дополнительным предположениям, то параметрические критерии дают более точные результаты. Однако если выборка им не удовлетворяет, то вероятность ошибок (как I, так и II рода) может резко возрасти. Прежде чем применять такие критерии, необходимо убедиться, что выборка удовлетворяет дополнительным предположениям. Гипотезы о виде распределения проверяются с помощью критериев согласия.
  • Непараметрические критерии не опираются на дополнительные предположения о распределении. В частности, к этому типу критериев относится большинство ранговых критериев.

Критерии согласия

Критерии согласия проверяют, согласуется ли заданная выборка с заданным фиксированным распределением, с заданным параметрическим семейством распределений, или с другой выборкой.

  • Критерий Колмогорова-Смирнова
  • Критерий хи-квадрат (Пирсона)
  • Критерий омега-квадрат (фон Мизеса)

Критерии сдвига

Специальный случай двухвыборочных критериев согласия.
Проверяется гипотеза сдвига, согласно которой распределения двух выборок имеют одинаковую форму и отличаются только сдвигом на константу.

  • Критерий Стьюдента
  • Критерий Уилкоксона-Манна-Уитни

Критерии нормальности

Критерии нормальности — это выделенный частный случай критериев согласия.
Нормально распределённые величины часто встречаются в прикладных задачах, что обусловлено действием закона больших чисел.
Если про выборки заранее известно, что они подчиняются нормальному распределению, то к ним становится возможно применять более мощные параметрические критерии.
Проверка нормальность часто выполняется на первом шаге анализа выборки, чтобы решить, использовать далее параметрические методы или непараметрические.
В справочнике А. И. Кобзаря приведена сравнительная таблица мощности для 21 критерия нормальности.

  • Критерий Шапиро-Уилка
  • Критерий асимметрии и эксцесса

Критерии однородности

Критерии однородности предназначены для проверки нулевой гипотезы о том, что
две выборки (или несколько) взяты из одного распределения,
либо их распределения имеют одинаковые значения математического ожидания, дисперсии, или других параметров.

Критерии симметричности

Критерии симметричности позволяют проверить симметричность распределения.

  • Одновыборочный критерий Уилкоксона и его модификации: критерий Антилла-Кёрстинга-Цуккини, критерий Бхаттачария-Гаствирса-Райта
  • Критерий знаков
  • Коэффициент асимметрии

Критерии тренда, стационарности и случайности

Критерии тренда и случайности предназначены для проверки нулевой гипотезы об
отсутствии зависимости между выборочными данными и номером наблюдения в выборке.
Они часто применяются в анализе временных рядов, в частности, при анализе регрессионных остатков.

Критерии выбросов

Критерии дисперсионного анализа

Критерии корреляционного анализа

Критерии регрессионного анализа

Литература

  1. Вероятность и математическая статистика: Энциклопедия / Под ред. Ю.В.Прохорова. — М.: Большая российская энциклопедия, 2003. — 912 с.
  2. Кобзарь А. И. Прикладная математическая статистика. Справочник для инженеров и научных работников. — М.: Физматлит, 2006. — 816 с.

Ссылки

  • Statistical hypothesis testing — статья в англоязычной Википедии.

Содержание:

Теория статистической проверки гипотез

Пусть имеется выборка Теория статистической проверки гипотез - определение и вычисление с примерами решения

Тогда нулевой гипотезой Теория статистической проверки гипотез - определение и вычисление с примерами решения называют основную (проверяемую) гипотезу, которая утверждает, что различие между сравниваемыми величинами отсутствует.
 

Альтернативной (конкурирующей, противоположной) гипотезой Н называется гипотеза, которая принимается тогда, когда отвергается нулевая.

Целью статистической проверки гипотез является выбор критерия по выборке Теория статистической проверки гипотез - определение и вычисление с примерами решения на основании которого принимается гипотеза Теория статистической проверки гипотез - определение и вычисление с примерами решения или отклоняется в пользу альтернативной. При этом возможны ошибки двух видов:

  1. Отклонение Теория статистической проверки гипотез - определение и вычисление с примерами решения, когда она на самом деле верна — ошибка первого рода. Вероятность этой ошибки обозначается а и называется уровнем значимости.
  2. Принятие Теория статистической проверки гипотез - определение и вычисление с примерами решения когда она на самом деле не верна — ошибка второго рода, вероятность ошибки — Теория статистической проверки гипотез - определение и вычисление с примерами решения.

Чем серьезнее будут последствия ошибки первого рода, тем меньше надо выбирать уровень значимости Теория статистической проверки гипотез - определение и вычисление с примерами решения Обычно выбирают Теория статистической проверки гипотез - определение и вычисление с примерами решения
 

Статистической характеристикой Z гипотезы Теория статистической проверки гипотез - определение и вычисление с примерами решения называется некоторая случайная величина, определяемая по выборке, для которой известен закон распределения.
 

Областью отклонения (критической областью) Теория статистической проверки гипотез - определение и вычисление с примерами решения называется область, при попадании в которую статистической характеристики Z гипотеза Теория статистической проверки гипотез - определение и вычисление с примерами решения отклоняется.
 

Дополнение области отклонения до всех возможных значений статистической характеристики Z называется областью принятия G.

При попадании статистической характеристики Z в область принятия ги­потеза Теория статистической проверки гипотез - определение и вычисление с примерами решения принимается. На рис. 11.1 изображены область отклонения Теория статистической проверки гипотез - определение и вычисление с примерами решения и область принятия G . Разделяет их точка на числовой оси Теория статистической проверки гипотез - определение и вычисление с примерами решения

Теория статистической проверки гипотез - определение и вычисление с примерами решения

При попадании Z в область принятия гипотеза Теория статистической проверки гипотез - определение и вычисление с примерами решения принимается. По существу область принятия есть доверительный интервал для статистической характеристики Z с доверительной вероятностью Теория статистической проверки гипотез - определение и вычисление с примерами решения

Область отклонения Теория статистической проверки гипотез - определение и вычисление с примерами решения выбирается таким образом, чтобы вероятность попадания в нее статистической характеристики Z при условии, что Теория статистической проверки гипотез - определение и вычисление с примерами решения верна, равнялась уровню значимости Теория статистической проверки гипотез - определение и вычисление с примерами решения То есть область отклонения удовлетворяет условию:

Теория статистической проверки гипотез - определение и вычисление с примерами решения             (11.1)

С другой стороны, для того чтобы уменьшить вероятность ошибки второго рода при выбранном Теория статистической проверки гипотез - определение и вычисление с примерами решения область отклонения Теория статистической проверки гипотез - определение и вычисление с примерами решения, удовлетворяющую условию 1, нужно выбрать таким образом, чтобы вероятность попадания в нее статистической характеристики Z при условии, что верна альтернативная гипотеза Теория статистической проверки гипотез - определение и вычисление с примерами решения была максимальной, т. е.

Теория статистической проверки гипотез - определение и вычисление с примерами решения
Вероятность Теория статистической проверки гипотез - определение и вычисление с примерами решения — называется мощностью критерия проверки гипотез.
Так как события Теория статистической проверки гипотез - определение и вычисление с примерами решения, — противоположны, то можно написать

Теория статистической проверки гипотез - определение и вычисление с примерами решения
Таким образом, имеем

Теория статистической проверки гипотез - определение и вычисление с примерами решения

где Теория статистической проверки гипотез - определение и вычисление с примерами решения — вероятность совершения ошибки второго рода).

Отметим, что ошибка первого рода существенней, поэтому а мы выбираем, а р — нет (принимаем полученное значение).

Из (11.2) следует, что между Теория статистической проверки гипотез - определение и вычисление с примерами решения существует простая зависимость и чтобы уменьшить Теория статистической проверки гипотез - определение и вычисление с примерами решения надо увеличить мощность критерия Теория статистической проверки гипотез - определение и вычисление с примерами решения Если Теория статистической проверки гипотез - определение и вычисление с примерами решения то Теория статистической проверки гипотез - определение и вычисление с примерами решенияТеория статистической проверки гипотез - определение и вычисление с примерами решения

Между Теория статистической проверки гипотез - определение и вычисление с примерами решения простой функциональной связи не существует, можно только сказать, что с увеличением одной, другая уменьшается и наоборот.

На рис. 11.2 приведены две кривые плотности распределения: одна кривая Теория статистической проверки гипотез - определение и вычисление с примерами решения — когда верна гипотеза Теория статистической проверки гипотез - определение и вычисление с примерами решения , другая кривая Теория статистической проверки гипотез - определение и вычисление с примерами решения— когда верна альтернативная гипотеза Н.

Теория статистической проверки гипотез - определение и вычисление с примерами решения

Из рис. 11.2 видно, что при уменьшении Теория статистической проверки гипотез - определение и вычисление с примерами решения, возрастает, область отклонения сужается и, следовательно, уменьшается вероятность отклонения гипотезы Теория статистической проверки гипотез - определение и вычисление с примерами решения если она верна. Вместе с тем при сужении области отклонения Теория статистической проверки гипотез - определение и вычисление с примерами решения расширяется область принятия G и увеличивается вероятность принятия гипотезы Теория статистической проверки гипотез - определение и вычисление с примерами решения если она на самом деле не верна. Поэтому нельзя брать Теория статистической проверки гипотез - определение и вычисление с примерами решения слишком малой.
Гипотезы бывают двух видов — параметрические и непараметрические.

Параметрические гипотезы — это гипотезы о проверке параметров законов распределения.

Непараметрические — это гипотезы о виде закона распределения.

Проверка гипотезы равенства математических ожиданий при неизвестной дисперсии (критерий Стьюдента)

Пусть Хи У — независимые нормальные случайные величины.
Введем обозначения:

Теория статистической проверки гипотез - определение и вычисление с примерами решения

Пусть дисперсии этих случайных величин равны и неизвестны:
Теория статистической проверки гипотез - определение и вычисление с примерами решения
где Теория статистической проверки гипотез - определение и вычисление с примерами решения — не предполагается известным.
Пусть даны выборки

Теория статистической проверки гипотез - определение и вычисление с примерами решения

По выборкам найдем критерий проверки гипотезы Теория статистической проверки гипотез - определение и вычисление с примерами решения, состоящей в том, что математические ожидания этих случайных величин одинаковы:

Теория статистической проверки гипотез - определение и вычисление с примерами решения
При альтернативной гипотезе Теория статистической проверки гипотез - определение и вычисление с примерами решения

Известно, что случайные величины
Теория статистической проверки гипотез - определение и вычисление с примерами решения
имеют распределение Теория статистической проверки гипотез - определение и вычисление с примерами решения степенями свободы, где
Теория статистической проверки гипотез - определение и вычисление с примерами решения

Сумма независимых случайных величин с распределением Теория статистической проверки гипотез - определение и вычисление с примерами решения имеет то же распределение Теория статистической проверки гипотез - определение и вычисление с примерами решения с суммарным числом степеней свободы:
Теория статистической проверки гипотез - определение и вычисление с примерами решения

Случайная величина W имеет распределение Теория статистической проверки гипотез - определение и вычисление с примерами решения степенями свободы, (этот факт не очевиден, но несложно показать с помощью характеристических функций).

Ранее мы показывали, что несмещенной оценкой математического ожидания является выборочное среднее. Поэтому для проверки гипотезы Теория статистической проверки гипотез - определение и вычисление с примерами решения возьмем разность между оценками математических ожиданий: Теория статистической проверки гипотез - определение и вычисление с примерами решения Нормируем эту разность, т. е. сделаем безразмерной. Для этого разделим ее на Теория статистической проверки гипотез - определение и вычисление с примерами решения и обозначим как U:

Теория статистической проверки гипотез - определение и вычисление с примерами решения

Очевидно, что случайная величина U имеет нормальное распределение, т. к. X и Y нормально распределены. Если проверяемая гипотеза Теория статистической проверки гипотез - определение и вычисление с примерами решения о равенстве математических ожиданий выполняется Теория статистической проверки гипотез - определение и вычисление с примерами решения то имеем:

Теория статистической проверки гипотез - определение и вычисление с примерами решения

Теория статистической проверки гипотез - определение и вычисление с примерами решения

Таким образом, если гипотеза Теория статистической проверки гипотез - определение и вычисление с примерами решения верна, то случайная величина U имеет нормированный нормальный закон распределения.

Рассмотрим случайную величину Теория статистической проверки гипотез - определение и вычисление с примерами решения

Теория статистической проверки гипотез - определение и вычисление с примерами решения

где Теория статистической проверки гипотез - определение и вычисление с примерами решения где ; — ооъединенная выборочная дисперсия.
Случайную величину t можно представить в следующем виде через ранее введенные Un W:
Теория статистической проверки гипотез - определение и вычисление с примерами решения
Действительно:

Теория статистической проверки гипотез - определение и вычисление с примерами решения

т. е. правые части (11.5) и (11.6 или 11.7) совпадают.

Но величина t (11.6) имеет распределение Стьюдента с Теория статистической проверки гипотез - определение и вычисление с примерами решения степенями свободы. Это следует из того, что U имеет нормированное нормальное распределение при условии, что Теория статистической проверки гипотез - определение и вычисление с примерами решения — верна. W — имеет распределение Теория статистической проверки гипотез - определение и вычисление с примерами решения с Теория статистической проверки гипотез - определение и вычисление с примерами решения степенями свободы, кроме того величины U и W независимы. Таким образом, величина t определяется по (11.5) и имеет распределение Стью­дента с Теория статистической проверки гипотез - определение и вычисление с примерами решения степенями свободы, если верна проверяемая гипотеза Теория статистической проверки гипотез - определение и вычисление с примерами решения

Эту величину t (11.5) примем за статистическую характеристику Z. Про­верка гипотезы о равенстве .математических ожиданий состоит в следующем.

По таблицам распределения Стьюдента для заданного уровня значимости Теория статистической проверки гипотез - определение и вычисление с примерами решения или доверительной вероятности Теория статистической проверки гипотез - определение и вычисление с примерами решения и числу степеней свободы Теория статистической проверки гипотез - определение и вычисление с примерами решения находим квантиль Теория статистической проверки гипотез - определение и вычисление с примерами решения , удовлетворяющий условию (на рис. 11.3 изображена кривая распределения Стьюдента и заштрихована область отклонения Теория статистической проверки гипотез - определение и вычисление с примерами решения ):

Теория статистической проверки гипотез - определение и вычисление с примерами решения

Тогда если фактически найденное по выборкам значение статистиче­ской характеристики t (11.5) удовлетворяет условию Теория статистической проверки гипотез - определение и вычисление с примерами решения  то проверяемую гипотезу Теория статистической проверки гипотез - определение и вычисление с примерами решения о равенстве математических ожиданий отклоняем как несогласующуюся с результатами выборочных данных; при этом вероятность ошибки равна Теория статистической проверки гипотез - определение и вычисление с примерами решения Если Теория статистической проверки гипотез - определение и вычисление с примерами решения то гипотеза Теория статистической проверки гипотез - определение и вычисление с примерами решенияпринимается, математические ожидания случайных величин Х и Y одинаковы.

Проверка гипотезы о равенстве дисперсий (критерий Фишера)

Пусть Х и Y — нормальные независимые случайные величины. Обозначим их дисперсии:

Теория статистической проверки гипотез - определение и вычисление с примерами решения

По выборкам Теория статистической проверки гипотез - определение и вычисление с примерами решения найдем критерий проверки гипотезы Теория статистической проверки гипотез - определение и вычисление с примерами решения состоящей в том, что дисперсии этих случайных величин равны

Теория статистической проверки гипотез - определение и вычисление с примерами решения
При альтернативной гипотезе Теория статистической проверки гипотез - определение и вычисление с примерами решения.
Такая гипотеза выбирается, например, при Теория статистической проверки гипотез - определение и вычисление с примерами решения, где Теория статистической проверки гипотез - определение и вычисление с примерами решения— модифицированные выборочные дисперсии.

В качестве статистической характеристики возьмем случайную величину

Теория статистической проверки гипотез - определение и вычисление с примерами решения

Если гипотеза Теория статистической проверки гипотез - определение и вычисление с примерами решения, о равенстве дисперсии верна, то случайная величина F имеет распределение Фишера с Теория статистической проверки гипотез - определение и вычисление с примерами решения степенями свободы. Покажем это, представляя числитель и знаменатель (11.8) в следующем виде:

Теория статистической проверки гипотез - определение и вычисление с примерами решения

Видим, что величина Теория статистической проверки гипотез - определение и вычисление с примерами решения имеет распределение Теория статистической проверки гипотез - определение и вычисление с примерами решения степенью свободы, Теория статистической проверки гипотез - определение и вычисление с примерами решения степенями свободы. Следовательно, согласно определению (см. раздел 9.5, формула (9.7)), случайная величина F имеет распределение Фишера с Теория статистической проверки гипотез - определение и вычисление с примерами решения степенями свободы.
 

Проверка гипотезы Теория статистической проверки гипотез - определение и вычисление с примерами решениясостоит в следующем:

Из таблиц распределения Фишера по выбранному уровню значимости Теория статистической проверки гипотез - определение и вычисление с примерами решения и числу степеней свободы Теория статистической проверки гипотез - определение и вычисление с примерами решения находим квантиль Теория статистической проверки гипотез - определение и вычисление с примерами решения , который удовлетворяет условию Теория статистической проверки гипотез - определение и вычисление с примерами решения Ha рис. 11.4 изображена кривая распределения Фишера с числом степеней свободы Теория статистической проверки гипотез - определение и вычисление с примерами решения и заштрихована область отклонения Теория статистической проверки гипотез - определение и вычисление с примерами решения площадь которой области равна Теория статистической проверки гипотез - определение и вычисление с примерами решения отмечен квантиль Теория статистической проверки гипотез - определение и вычисление с примерами решения

Теория статистической проверки гипотез - определение и вычисление с примерами решения

По выборкам, используя (11.8), определяем значение статистической характеристики F. Если фактически вычисленное по формуле (11.8) значение F окажется больше табличного Теория статистической проверки гипотез - определение и вычисление с примерами решения (как видно из рис. 11.4, мы попадаем в область отклонения), то гипотезу о равенстве дисперсий отклоняем как не согласующуюся с выборкой. При этом вероятность ошибки равна Теория статистической проверки гипотез - определение и вычисление с примерами решения В противном случае, когда Теория статистической проверки гипотез - определение и вычисление с примерами решения, принимается гипотеза Теория статистической проверки гипотез - определение и вычисление с примерами решения т. е. дисперсии случайных величин Х и Yравны.
 

Пример:

Пусть X — чувствительность телевизоров марки «Горизонт», Y — чувствительность телевизоров марки «Витязь». Проведены выборочные измерения чувствительности телевизоров для Теория статистической проверки гипотез - определение и вычисление с примерами решения = 7 телевизоров марки «Горизонт» и Теория статистической проверки гипотез - определение и вычисление с примерами решения = 6 телевизоров марки «Витязь». Результаты измерений чувствительности в Теория статистической проверки гипотез - определение и вычисление с примерами решения представлены в таблицах.

Теория статистической проверки гипотез - определение и вычисление с примерами решения

Определить лучшую марку телевизора, если лучшим будет тот, у которого чувствительность в Теория статистической проверки гипотез - определение и вычисление с примерами решения будет меньше.

Найдем по результатам измерений средние значения чувствительности, вычисляя Теория статистической проверки гипотез - определение и вычисление с примерами решения

Теория статистической проверки гипотез - определение и вычисление с примерами решения

Можно ли сказать, что чувствительность телевизоров марки «Горизонт» лучше? Нет, т. к. выборки, выборочные средние Теория статистической проверки гипотез - определение и вычисление с примерами решения и разность между ними — элементы случайные.

Сначала убедимся в равенстве дисперсий по критерию Фишера — гипотеза Теория статистической проверки гипотез - определение и вычисление с примерами решения

Вычислим несмещенные оценки дисперсий Теория статистической проверки гипотез - определение и вычисление с примерами решения
Теория статистической проверки гипотез - определение и вычисление с примерами решения
Используя (11.8), найдем значение статистической характеристики F:

Теория статистической проверки гипотез - определение и вычисление с примерами решения

По таблицам распределения Фишера для [6;5] степеней свободы, задавая уровень значимости Теория статистической проверки гипотез - определение и вычисление с примерами решения = 0,05, найдем квантиль — Теория статистической проверки гипотез - определение и вычисление с примерами решения= 4,95. Сравнивая Теория статистической проверки гипотез - определение и вычисление с примерами решения видим, что 1,196 < 4,95. Значит, гипотеза Теория статистической проверки гипотез - определение и вычисление с примерами решения принимается, т. е. дисперсии случайных величин X и Y равны.

Теперь проверим гипотезу о равенстве математических ожиданий случайных величин X и Y , применяя критерий Стьюдента.
Гипотеза Теория статистической проверки гипотез - определение и вычисление с примерами решения т. е. чувствительность телевизоров марки «Горизонт» и «Витязь» одинакова.

Найдем объединенную выборочную дисперсию:
Теория статистической проверки гипотез - определение и вычисление с примерами решения
По формуле (11.5) вычислим статистическую характеристику t :

Теория статистической проверки гипотез - определение и вычисление с примерами решения

Задавая уровень значимости Теория статистической проверки гипотез - определение и вычисление с примерами решения = 0,05 для числа степеней свободы v = 7 + 6 — 2 = ll, по таблицам распределения Стьюдента находим квантиль Теория статистической проверки гипотез - определение и вычисление с примерами решения Сравнивая Теория статистической проверки гипотез - определение и вычисление с примерами решения видим, что |0,343| <2,201, значит, гипотезу о равенстве чувствительности телевизоров марки «Горизонт» и «Витязь» принимаем.

Проверка гипотезы о законе распределения генеральной случайной величины. Критерий Пирсона

Проверка гипотезы о законе распределения генеральной случайной величины. Критерий Пирсона. (Критерий согласия Теория статистической проверки гипотез - определение и вычисление с примерами решения)

Пусть задана генеральная случайная величинами выборка Теория статистической проверки гипотез - определение и вычисление с примерами решения
Если по выборке построить гистограмму, то по виду гистограммы можно выдвинуть гипотезу о виде закона распределения генеральной случайной величины X. Тогда в качестве нулевой гипотезы Теория статистической проверки гипотез - определение и вычисление с примерами решения будет предположение, что случайная величина X имеет плотность распределенияТеория статистической проверки гипотез - определение и вычисление с примерами решения

Теория статистической проверки гипотез - определение и вычисление с примерами решения
При альтернативной гипотезе Теория статистической проверки гипотез - определение и вычисление с примерами решения

Обычно для построения гистограммы равноинтервальным способом разбивают весь диапазон выборочных значений случайной величины X на Теория статистической проверки гипотез - определение и вычисление с примерами решения одинаковых интервалов. Если Теория статистической проверки гипотез - определение и вычисление с примерами решения— число выборочных значений, попавших в Теория статистической проверки гипотез - определение и вычисление с примерами решения интервал, то Теория статистической проверки гипотез - определение и вычисление с примерами решения — объем выборки. Введем случайную величину Теория статистической проверки гипотез - определение и вычисление с примерами решения относительную частоту попадания случайной величины X в Теория статистической проверки гипотез - определение и вычисление с примерами решения интервал. Тео­ретическая вероятность Теория статистической проверки гипотез - определение и вычисление с примерами решения попадания значений случайной величины X в Теория статистической проверки гипотез - определение и вычисление с примерами решения интервал может быть определена как Теория статистической проверки гипотез - определение и вычисление с примерами решения — длина Теория статистической проверки гипотез - определение и вычисление с примерами решения интервала, Теория статистической проверки гипотез - определение и вычисление с примерами решения — границы Теория статистической проверки гипотез - определение и вычисление с примерами решения интервала.

Рассмотрим событие, состоящее в том, что случайная величина X попадет в интервал Теория статистической проверки гипотез - определение и вычисление с примерами решения раз. Тогда введем случайную величину Y, равную числу попаданий случайной величины в Теория статистической проверки гипотез - определение и вычисление с примерами решения интервал Теория статистической проверки гипотез - определение и вычисление с примерами решения Вероятности возможных ее значений определяются по формуле Бернулли, случайная величина У имеет биномиальный закон распределения, и ее числовые характеристики имеют вид Теория статистической проверки гипотез - определение и вычисление с примерами решения

Для введенной ранее случайной величины Теория статистической проверки гипотез - определение и вычисление с примерами решения определим числовые характеристики:
Теория статистической проверки гипотез - определение и вычисление с примерами решения

Проведем нормировку случайной величины Теория статистической проверки гипотез - определение и вычисление с примерами решения для этого мы ее центрируем, сделаем безразмерной, разделив на Теория статистической проверки гипотез - определение и вычисление с примерами решения и обозначим Теория статистической проверки гипотез - определение и вычисление с примерами решения

Теория статистической проверки гипотез - определение и вычисление с примерами решения
Эта величина распределена по биномиальному закону, т. к. в нее входит случайная величина Теория статистической проверки гипотез - определение и вычисление с примерами решения Образуем сумму квадратов случайных величин Теория статистической проверки гипотез - определение и вычисление с примерами решения

Теория статистической проверки гипотез - определение и вычисление с примерами решения

Теория статистической проверки гипотез - определение и вычисление с примерами решения

Сумма квадратов нормированных нормальных случайных величин (как было показано ранее) имеет распределение Теория статистической проверки гипотез - определение и вычисление с примерами решения обозначим

Теория статистической проверки гипотез - определение и вычисление с примерами решения

Эта случайная величина имеет закон распределения Теория статистической проверки гипотез - определение и вычисление с примерами решения с числом степеней свободы
Теория статистической проверки гипотез - определение и вычисление с примерами решения                              (11.11)
где Теория статистической проверки гипотез - определение и вычисление с примерами решения — число параметров закона распределения, оцениваемых по выборочным данным.

Анализируя правые части формул (11.9) и (11.10), можно отметить, что в критерии согласия Теория статистической проверки гипотез - определение и вычисление с примерами решения фактически сравниваются эмпирические и теоретические частоты распределения.
 

Проверка гипотезы состоит в следующем. Задаем уровень значимости Теория статистической проверки гипотез - определение и вычисление с примерами решения

По таблицам Теория статистической проверки гипотез - определение и вычисление с примерами решения — распределения для заданных Теория статистической проверки гипотез - определение и вычисление с примерами решения и числу степеней свободы Теория статистической проверки гипотез - определение и вычисление с примерами решения находим квантиль Теория статистической проверки гипотез - определение и вычисление с примерами решения , удовлетворяющий условию Теория статистической проверки гипотез - определение и вычисление с примерами решения По формуле (11.10) вычисляем значение Теория статистической проверки гипотез - определение и вычисление с примерами решения . Сравнивая рассчитанное значение Теория статистической проверки гипотез - определение и вычисление с примерами решения с квантилем Теория статистической проверки гипотез - определение и вычисление с примерами решения, найденным по таблицам, принимаем одно из двух решений:

  1. Если Теория статистической проверки гипотез - определение и вычисление с примерами решения то нулевая гипотеза Теория статистической проверки гипотез - определение и вычисление с примерами решения отвергается в пользу альтернативной Н, т. е. Теория статистической проверки гипотез - определение и вычисление с примерами решения не согласуется с результатами эксперимента.
  2. Если Теория статистической проверки гипотез - определение и вычисление с примерами решения, то Теория статистической проверки гипотез - определение и вычисление с примерами решения, принимается, т. е. Теория статистической проверки гипотез - определение и вычисление с примерами решения согласуется с эксперимен­тальными данными, закон распределения Теория статистической проверки гипотез - определение и вычисление с примерами решения подтверждается. При этом вероятность ошибки равна Теория статистической проверки гипотез - определение и вычисление с примерами решения

Критерий Романовского

Рассмотрим неравенство
Теория статистической проверки гипотез - определение и вычисление с примерами решения                               (11.12)
где Теория статистической проверки гипотез - определение и вычисление с примерами решения вычисляется по формуле (11.10);

Теория статистической проверки гипотез - определение и вычисление с примерами решения

Проверка гипотезы состоит в следующем: если это неравенство выполняется Теория статистической проверки гипотез - определение и вычисление с примерами решения то расхождение теоретических и экспериментальных данных неслучайно, т. е. закон распределения не подтверждается, гипотеза Теория статистической проверки гипотез - определение и вычисление с примерами решения отклоняется.
В противном случае гипотеза Теория статистической проверки гипотез - определение и вычисление с примерами решения подтверждается, действительно случайная величина X имеет плотность распределенияТеория статистической проверки гипотез - определение и вычисление с примерами решения Этот критерий хорош тем, что для проверки гипотезы не требуются таблицы Теория статистической проверки гипотез - определение и вычисление с примерами решения— распределения.

Критерий согласия Колмогорова

В критерии согласия А. Н. Колмогорова проводится сравнение эмпириче­ской и теоретической функций распределения. Укажем этапы проверки гипотез этим критерием.

1. По выборке Теория статистической проверки гипотез - определение и вычисление с примерами решения строится вариационный ряд и график эмпирической функции распределения.

2. По виду графика функции распределения выдвигается гипотеза о виде закона распределения генеральной случайной величины X. Тогда в качестве нулевой гипотезы Теория статистической проверки гипотез - определение и вычисление с примерами решения будет предположение, что генеральная случайная величина X имеет функцию распределения Теория статистической проверки гипотез - определение и вычисление с примерами решения

Теория статистической проверки гипотез - определение и вычисление с примерами решения
При альтернативной гипотезе Теория статистической проверки гипотез - определение и вычисление с примерами решения

3. По выборке Теория статистической проверки гипотез - определение и вычисление с примерами решения находят точечные оценки параметров теоретической функции распределения Теория статистической проверки гипотез - определение и вычисление с примерами решения, используя метод моментов или метод наибольшего правдоподобия.

4. На графике эмпирической функции распределения строится график теоретической функции распределения Теория статистической проверки гипотез - определение и вычисление с примерами решения

5. Путем сравнения графиков вычисляется максимальное значение моду­ля отклонения значений эмпирической функции распределения от теоретиче­ской функции распределения Теория статистической проверки гипотез - определение и вычисление с примерами решения

Теория статистической проверки гипотез - определение и вычисление с примерами решения

6. Рассчитывают значение Теория статистической проверки гипотез - определение и вычисление с примерами решениякритерия Колмогорова:

Теория статистической проверки гипотез - определение и вычисление с примерами решения
7. Задавая уровень значимости а , определяем квантиль из условия 

Теория статистической проверки гипотез - определение и вычисление с примерами решения

Отметим, что самостоятельно решать это уравнение не надо, поскольку составлены таблицы квантилей распределения Колмогорова, из которых по заданному уровню значимости Теория статистической проверки гипотез - определение и вычисление с примерами решения определяем квантиль Теория статистической проверки гипотез - определение и вычисление с примерами решения
 

Сравнивая значение Теория статистической проверки гипотез - определение и вычисление с примерами решения рассчитанное по формуле (11.13) с квантилем Теория статистической проверки гипотез - определение и вычисление с примерами решения делаем следующие выводы:

Следует отметить, что критерий Колмогорова применяется тогда, когда полностью известен закон распределения функции распределения F(x) и зна­чения ее параметров. При решении практических задач это не всегда удается выполнить. Для этого прибегают к некоторым дополнительным исследованиям: применяют вероятностные бумаги, строят гистограммы и т. д. Это помогает правильно подобрать теоретический закон распределения для функции распределения F(x). Но в этом случае неизвестны ее параметры. И если их оценивать по этой же выборке, то это может привести к ошибочным выводам в отношении принятой гипотезы. В этом случае следует использовать другие критерии согласия, например Теория статистической проверки гипотез - определение и вычисление с примерами решения .
 

Пример:

Проведено 100 измерений расстояния радиодальномером до цели. Результаты представлены в виде статистического ряда Теория статистической проверки гипотез - определение и вычисление с примерами решения — границы интервалов в [км], Теория статистической проверки гипотез - определение и вычисление с примерами решения — число выборочных значений, попавших в Теория статистической проверки гипотез - определение и вычисление с примерами решенияинтервал).
Оценить закон распределения ошибки измерения дальности радиодальномером.

Теория статистической проверки гипотез - определение и вычисление с примерами решения

Занесем в таблицу значения относительных частот Теория статистической проверки гипотез - определение и вычисление с примерами решения

Анализ значений относительных частот позволяет выдвинуть гипотезу о равномерном законе распределения. Теоретическая функция распределения для этого закона имеет вид

Теория статистической проверки гипотез - определение и вычисление с примерами решения

Принимаем а = 450, b = 800. Полагая Теория статистической проверки гипотез - определение и вычисление с примерами решения для каждого интервала, рассчитываем Теория статистической проверки гипотез - определение и вычисление с примерами решения в этих точках и заносим результат в таблицу. Зная Теория статистической проверки гипотез - определение и вычисление с примерами решения рассчитаем эмпирическую функцию распределения Теория статистической проверки гипотез - определение и вычисление с примерами решения в точках Теория статистической проверки гипотез - определение и вычисление с примерами решения для каждого интервала: Теория статистической проверки гипотез - определение и вычисление с примерами решения где Теория статистической проверки гипотез - определение и вычисление с примерами решения — число значений Теория статистической проверки гипотез - определение и вычисление с примерами решения меньших заданного х, Теория статистической проверки гипотез - определение и вычисление с примерами решения — объем выборки. Рассчитаем разность: Теория статистической проверки гипотез - определение и вычисление с примерами решения Данные заносим в таблицу.

Теория статистической проверки гипотез - определение и вычисление с примерами решения

Вычисляем критерий Колмогорова по формуле (11.13), учитывая, что из таблицы Теория статистической проверки гипотез - определение и вычисление с примерами решениятогда Теория статистической проверки гипотез - определение и вычисление с примерами решения Задавая уровень значимости Теория статистической проверки гипотез - определение и вычисление с примерами решения — 0,05, по таблице квантилей Колмогорова находим кван­тиль Теория статистической проверки гипотез - определение и вычисление с примерами решения 1,358. Поскольку Теория статистической проверки гипотез - определение и вычисление с примерами решения то гипотеза Теория статистической проверки гипотез - определение и вычисление с примерами решения принимается, т. е. действительно генеральная случайная величина X имеет функцию распределения Теория статистической проверки гипотез - определение и вычисление с примерами решения c равномерным законом распределения.

  • Линейный регрессионный анализ
  • Вариационный ряд
  • Законы распределения случайных величин
  • Дисперсионный анализ
  • Случайные процессы
  • Выборочный метод
  • Статистическая проверка гипотез
  • Статистические оценки

Ошибки I и II рода при проверке гипотез, мощность

Общий обзор

Принятие неправильного решения

Мощность и связанные факторы

Проверка множественных гипотез

Общий обзор

Большинство проверяемых гипотез сравнивают между собой группы объектов, которые испытывают влияние различных факторов.

Например, можно сравнить эффективность двух видов лечения, чтобы сократить 5-летнюю смертность от рака молочной железы. Для данного исхода (например, смерть) сравнение, представляющее интерес (напри­мер, различные показатели смертности через 5 лет), называют эффектом или, если уместно, эффектом лечения.

Нулевую гипотезу выражают как отсутствие эффекта (например 5-летняя смертность от рака мо­лочной железы одинаковая в двух группах, получаю­щих разное лечение); двусторонняя альтернативная гипотеза будет означать, что различие эффектов не равно нулю.

Критериальная проверка гипотезы дает возможность определить, достаточно ли аргументов, чтобы отвергнуть нулевую гипотезу. Можно принять только одно из двух решений:

  1. отвергнуть нулевую гипотезу и принять альтер­нативную гипотезу
  2. остаться в рамках нулевой гипотезы

Важно: В литературе достаточно часто встречается понятие «принять нулевую гипотезу». Хотелось бы внести ясность, что со статистической точки зрения принять нулевую гипотезу невозможно, т.к. нулевая гипотеза представляет собой достаточно строгое утверждение (например, средние значения в сравниваемых группах равны ).

Поэтому фразу о принятии нулевой гипотезы следует понимать как то, что мы просто остаемся в рамках гипотезы.

Принятие неправильного решения

Возможно неправильное решение, когда отвергают/не отвергают нулевую гипотезу, потому что есть только выборочная информация.

 
Верная гипотеза
H0 H1
Результат

 применения 

критерия
H0 H0 верно принята H0 неверно принята 

(Ошибка второго рода)
H1 H0 неверно отвергнута 

(Ошибка первого рода)
H0 верно отвергнута

Ошибка 1-го рода: нулевую гипотезу отвергают, когда она истинна, и делают вывод, что имеется эффект, когда в действительности его нет. Максимальный шанс (вероятность) допустить ошибку 1-го рода обозначается α (альфа). Это уровень значимости критерия; нулевую гипотезу отвергают, если наше значение p ниже уровня значимости, т. е., если p < α.

Следует принять решение относительно значения а прежде, чем будут собраны данные; обычно назначают условное значение 0,05, хотя можно выбрать более ограничивающее значение, например 0,01.

Шанс допустить ошибку 1-го рода никогда не превысит выбранного уровня значимости, скажем α = 0,05, так как нулевую гипотезу отвергают только тогда, когда p< 0,05. Если обнаружено, что p > 0,05, то нулевую гипотезу не отвергнут и, следовательно, не допустят ошибки 1-го рода.

Ошибка 2-го рода: не отвергают нулевую гипотезу, когда она ложна, и делают вывод, что нет эффекта, тогда как в действительности он существует. Шанс возникновения ошибки 2-го рода обозначается β (бета); а величина (1-β) называется мощностью критерия.

Следовательно, мощность — это вероятность отклонения нулевой гипотезы, когда она ложна, т.е. это шанс (обычно выраженный в процентах) обнаружить реальный эффект лечения в выборке данного объема как статистически значимый.

В идеале хотелось бы, чтобы мощность критерия составляла 100%; однако это невозможно, так как всегда остается шанс, хотя и незначительный, допустить ошибку 2-го рода.

К счастью, известно, какие факторы влияют на мощность и, таким образом, можно контролировать мощность критерия, рассматривая их.

Мощность и связанные факторы

Планируя исследование, необходимо знать мощность предложенного критерия. Очевидно, можно начинать исследование, если есть «хороший» шанс обнаружить уместный эффект, если таковой существует (под «хорошим» мы подразумеваем, что мощность должна быть по крайней мере 70-80%).

Этически безответственно начинать исследование, у которого, скажем, только 40% вероятности обнаружить реальный эффект лечения; это бесполезная трата времени и денежных средств.

Ряд факторов имеют прямое отношение к мощности критерия.

Объем выборки: мощность критерия увеличивается по мере увеличения объема выборки. Это означает, что у большей выборки больше возможностей, чем у незначительной, обнаружить важный эффект, если он существует.

Когда объем выборки небольшой, у критерия может быть недостаточно мощности, чтобы обнаружить отдельный эффект. Эти методы также можно использовать для оценки мощности критерия для точно установленного объема выборки.

Вариабельность наблюдений: мощность увеличивается по мере того, как вариабельность наблюдений уменьшается.

Интересующий исследователя эффект: мощность критерия больше для более высоких эффектов. Критерий проверки гипотез имеет больше шансов обнаружить значительный реальный эффект, чем незначительный.

Уровень значимости: мощность будет больше, если уровень значимости выше (это эквивалентно увеличению допущения ошибки 1-го рода, α, а допущение ошибки 2-го рода, β, уменьшается).

Таким образом, вероятнее всего, исследователь обнаружит реальный эффект, если на стадии планирования решит, что будет рассматривать значение р как значимое, если оно скорее будет меньше 0,05, чем меньше 0,01.

Обратите внимание, что проверка ДИ для интересующего эффекта указывает на то, была ли мощность адекватной. Большой доверительный интервал следует из небольшой выборки и/или набора данных с существенной вариабельностью и указывает на недостаточную мощность.

Проверка множественных гипотез

Часто нужно выполнить критериальную проверку значимости множественных гипотез на наборе данных с многими переменными или существует более двух видов лечения.

Ошибка 1-го рода драматически увеличивается по мере увеличения числа сравнений, что приводит к ложным выводам относительно гипотез. Следовательно, следует проверить только небольшое число гипотез, выбранных для достижения первоначальной цели исследования и точно установленных априорно.

Можно использовать какую-нибудь форму апостериорного уточнения значения р, принимая во внимание число выполненных проверок гипотез.

Например, при подходе Бонферрони (его часто считают довольно консервативным) умножают каждое значение р на число выполненных проверок; тогда любые решения относительно значимости будут основываться на этом уточненном значении р.

Связанные определения:
p-уровень
Альтернативная гипотеза, альтернатива
Альфа-уровень
Бета-уровень
Гипотеза
Двусторонний критерий
Критерий для проверки гипотезы
Критическая область проверки гипотезы
Мощность
Мощность исследования
Мощность статистического критерия
Нулевая гипотеза
Односторонний критерий
Ошибка I рода
Ошибка II рода
Статистика критерия
Эквивалентные статистические критерии

В начало

Содержание портала

Понравилась статья? Поделить с друзьями:
  • Как составить заявление для приема на работу образец
  • Как найти личный кабинет яндекс маркета
  • Как найти спрятанную папку на windows 10
  • Как найти бесплатную кавказскую овчарку
  • Как найти длину касательной между двумя окружностями