Критерий Пирсона.
Достоинством
критерия Пирсона является его
универсальность: с его помощью можно
проверять гипотезы о различных законах
распределения.
1.
Проверка гипотезы о нормальном
распределении. Пусть
получена выборка достаточно большого
объема п
с большим количеством различных значений
вариант. Для удобства ее обработки
разделим интервал от наименьшего до
наибольшего из значений вариант на s
равных частей и будем считать, что
значения вариант, попавших в каждый
интервал, приближенно равны числу,
задающему середину интервала. Подсчитав
число вариант, попавших в каждый интервал,
составим так называемую сгруппированную
выборку:
варианты………..х1
х2
… хs
частоты………….п1
п2
… пs
,
где хi
– значения середин интервалов, а пi
– число вариант, попавших в i-й
интервал (эмпирические частоты). По
полученным данным можно вычислить
выборочное среднее
и выборочное среднее квадратическое
отклонение σВ.
Проверим предположение, что генеральная
совокупность распределена по нормальному
закону с параметрами M(X)
=
,
D(X)
=
.
Тогда можно найти количество чисел из
выборки объема п,
которое должно оказаться в каждом
интервале при этом предположении (то
есть теоретические частоты). Для этого
по таблице значений функции Лапласа
найдем вероятность попадания в i-й
интервал:
,
где аi
и bi
— границы
i-го
интервала. Умножив полученные вероятности
на объем выборки п, найдем теоретические
частоты: пi
=n·pi.
Наша цель –
сравнить эмпирические и теоретические
частоты, которые, конечно, отличаются
друг от друга, и выяснить, являются ли
эти различия несущественными, не
опровергающими гипотезу о нормальном
распределении исследуемой случайной
величины, или они настолько велики, что
противоречат этой гипотезе. Для этого
используется критерий в виде случайной
величины
.
(7)
Смысл ее очевиден:
суммируются части, которые квадраты
отклонений эмпирических частот от
теоретических составляют от соответствующих
теоретических частот. Можно доказать,
что вне зависимости от реального закона
распределения генеральной совокупности
закон распределения случайной величины
(7) при
стремится к закону распределения
с числом степеней свободы k
= s
– 1 – r,
где r
– число
параметров предполагаемого распределения,
оцененных по данным выборки. Нормальное
распределение характеризуется двумя
параметрами, поэтому k
= s
– 3. Для
выбранного критерия строится правосторонняя
критическая область, определяемая
условием
(8)
где α
– уровень значимости. Следовательно,
критическая область задается неравенством
а область принятия гипотезы —
.
Итак, для проверки
нулевой гипотезы Н0:
генеральная совокупность распределена
нормально – нужно вычислить по выборке
наблюдаемое значение критерия:
,
(7`)
а по таблице
критических точек распределения χ2
найти критическую точку
,
используя известные значения α и k
= s
– 3. Если
— нулевую гипотезу принимают, при
ее отвергают.
Пример.
Результаты исследования спроса на товар
представлены в таблице:
Стоимость, руб. |
120–160 |
160–180 |
180–200 |
200–220 |
220–280 |
Кол-во, шт. |
5 |
10 |
14 |
12 |
9 |
Выдвинуть
гипотезу о виде распределения и проверить
её на уровне значимости =0,01.
I. Выдвижение
гипотезы.
Для указания вида
эмпирического распределения построим
гистограмму
120
160 180 200 220 280
По
виду гистограммы можно сделать
предположение о нормальном законе
распределения изучаемого признака в
генеральной совокупности.
II.
Проверим выдвинутую гипотезу о нормальном
распределении, используя критерий
согласия Пирсона.
1.
Вычисляем
,
В.
В
качестве вариант возьмём среднее
арифметическое концов интервалов:
;
.
2.
Найдём интервалы (Zi;
Zi+1):
;
.
За
левый конец первого интервала примем
(-),
а за правый конец последнего интервала
— (+).
Результаты представлены в табл. 4.
3.
Найдем теоретические вероятности Рi
и теоретические частоты
(см. табл. 4).
Таблица
4
i |
Граница |
Ф(Zi) |
Ф(Zi+1) |
Pi= |
|
|||
xi |
xi+1 |
Zi |
Zi+1 |
|||||
1 |
120 |
160 |
- |
-1,14 |
-0,5 |
-0,3729 |
0,1271 |
6,36 |
2 |
160 |
180 |
-1,14 |
-0,52 |
-0,3729 |
-0,1985 |
0,1744 |
8,72 |
3 |
180 |
200 |
-0,52 |
0,11 |
-0,1985 |
0,0438 |
0,2423 |
12,12 |
4 |
200 |
220 |
0,11 |
0,73 |
0,0438 |
0,2673 |
0,2235 |
11,18 |
5 |
220 |
280 |
0,73 |
+ |
0,2673 |
0,5 |
0,2327 |
11,64 |
4.
Сравним эмпирические и теоретические
частоты. Для этого:
а)
вычислим наблюдаемое значение критерия
Пирсона.
Вычисления
представлены в табл.5.
Таблица
5
i |
|
|
|
|
|
1 |
5 |
6,36 |
-1,36 |
1,8496 |
0,291 |
2 |
10 |
8,72 |
1,28 |
1,6384 |
0,188 |
3 |
114 |
12,12 |
1,88 |
3,5344 |
0,292 |
4 |
12 |
11,18 |
0,82 |
0,6724 |
0,060 |
5 |
9 |
11,64 |
-2,64 |
6,9696 |
0,599 |
|
50 |
50 |
|
б) по
таблице критических точек распределения
2
при заданном уровне значимости =0,01
и числе степеней свободы k=m–3=5–3=2
находим критическую точку
;
имеем
.
Сравниваем
c
.
.
Следовательно,
нет оснований отвергать гипотезу о
нормальном законе распределения
изучаемого признака генеральной
совокупности. Т.е. расхождение между
эмпирическими и теоретическими частотами
незначимо (случайно). ◄
Замечание.
Интервалы, содержащие малочисленные
эмпирические частоты (ni<5),
следует объединить, а частоты этих
интервалов сложить. Если производилось
объединение интервалов, то при определении
числа степеней свободы по формуле K=m-3
следует в качестве m
принять число оставшихся после объединения
интервалов.
Пример.
По выборке из 24 вариант выдвинута
гипотеза о нормальном распределении
генеральной совокупности. Используя
критерий Пирсона при уровне значимости
среди заданных значений
= {34, 35, 36, 37, 38} указать: а) наибольшее, для
которого нет оснований отвергать
гипотезу; б) наименьшее, начиная с
которого гипотеза должна быть отвергнута.
Найдем число
степеней свободы
с помощью формулы:
,
где
—
число групп выборки (вариант),
— число параметров распределения.
Так как нормальное
распределение имеет 2 параметра (
и
),
получаем
.
По таблице
критических точек распределения
,
по заданному уровню значимости
и числу степеней свободы
определяем критическую точку
.
В случае а) для
значений
,
равных 34 и 35, нет оснований отвергать
гипотезу о нормальном распределении,
так как
.
А наибольшее среди этих значений
.
В случае б) для
значений 36, 37, 38 гипотезу отвергают, так
как
.
Наименьшее среди них
.◄
2.
Проверка гипотезы о равномерном
распределении.
При использовании критерия Пирсона для
проверки гипотезы о равномерном
распределении генеральной совокупности
с предполагаемой плотностью вероятности
необходимо, вычислив
по имеющейся выборке значение
,
оценить параметры а
и b
по формулам:
, (9)
где а*
и b*
— оценки а
и b.
Действительно, для равномерного
распределения М(Х)
=
,
,
откуда можно получить систему для
определения а*
и b*:
,
решением которой являются выражения
(9).
Затем, предполагая,
что
,
можно найти теоретические частоты по
формулам
Здесь s
– число интервалов, на которые разбита
выборка.
Наблюдаемое
значение критерия Пирсона вычисляется
по формуле (7`), а критическое – по таблице
с учетом того, что число степеней свободы
k
= s
– 3. После
этого границы критической области
определяются так же, как и для проверки
гипотезы о нормальном распределении.
3.
Проверка гипотезы о показательном
распределении. В
этом случае, разбив имеющуюся выборку
на равные по длине интервалы, рассмотрим
последовательность вариант
,
равноотстоящих друг от друга (считаем,
что все варианты, попавшие в i
– й интервал, принимают значение,
совпадающее с его серединой), и
соответствующих им частот ni
(число вариант
выборки, попавших в i
– й интервал). Вычислим по этим данным
и примем в качестве оценки параметра λ
величину
.
Тогда теоретические частоты вычисляются
по формуле
Затем сравниваются
наблюдаемое и критическое значение
критерия Пирсона с учетом того, что
число степеней свободы k
= s
– 2.
Пример.
Для выборки, интервальный статистический
ряд которой имеет вид
Номер |
Границы |
Эмпирические |
1 |
2 |
6 |
2 |
5 |
8 |
3 |
8 |
15 |
4 |
11 |
22 |
5 |
14 |
14 |
6 |
17 |
5 |
проверить при
уровне значимости α
= 0,05 гипотезу о:
а) показательном;
б) равномерном; в) нормальном законе
распределения генеральной совокупности
с помощью критерия Пирсона.
Объем выборки п
= 70. Будем считать вариантами середины
частичных интервалов: х1
= 3,5, х2
= 6,5,…, х6
= 18,5.
Найдем
= 11,43; σВ
= 4,03; s
= 4,05.
а) Вычислим
теоретические частоты в предположении
о показательном распределении генеральной
совокупности при
аналогично
Наблюдаемое значение критерия
Критическая точка χ2(0,05;4)=9,5;
и гипотеза о показательном распределении
отклоняется.
б) Для равномерного
распределения
теоретические
частоты:
Наблюдаемое значение критерия
Критическая
точка
и гипотеза о равномерном распределении
отклоняется.
в) Теоретические
частоты для нормального распределения:
Так же вычисляются
Наблюдаемое значение критерия
Критическая точка
Поскольку
гипотеза о нормальном распределении
генеральной совокупности принимается.
◄
Критерий
Колмогорова.
Этот критерий
применяется для проверки простой
гипотезы Н0
о том, что независимые одинаково
распределенные случайные величины Х1,
Х2,
…, Хп
имеют заданную непрерывную функцию
распределения F(x).
Найдем функцию
эмпирического распределения Fn(x)
и будем искать границы двусторонней
критической области, определяемой
условием
.
(10)
А.Н.Колмогоров
доказал, что в случае справедливости
гипотезы Н0
распределение статистики Dn
не зависит от функции F(x),
и при
где
—
(11)
— критерий
Колмогорова, значения которого можно
найти в соответствующих таблицах.
Критическое значение критерия λп(α)
вычисляется по заданному уровню
значимости α
как корень уравнения
.
Можно показать,
что приближенное значение вычисляется
по формуле
,
где z
– корень уравнения
На практике для
вычисления значения статистики Dn
используется то, что
,
где
а
— вариационный ряд, построенный по
выборке Х1,
Х2,
…, Хп.
Можно дать следующее геометрическое
истолкование критерия Колмогорова:
если изобразить на плоскости Оху
графики функций Fn(x),
Fn(x)
±λn(α)
(рис. 1), то гипотеза Н0
верна, если график функции F(x)
не выходит за пределы области, лежащей
между графиками функций Fn(x)
-λn(α)
и Fn(x)
+λn(α).
Критерий согласия Пирсона
Опр Критерий проверки гипотезы о предполагаемом законе неизвестного распределения называется критерием согласия.
Имеется несколько критериев согласия: $chi ^2$ { хи-квадрат } К. Пирсона, Колмогорова, Смирнова и др.
Обычно теоретические и эмпирические частоты различаются. Случай расхождения может быть не случайным, значит и объясняется тем, что не верно выбрана гипотеза. Критерий Пирсона отвечает на поставленный вопрос, но как любой критерий он ничего не доказывает, а лишь устанавливает на принятом уровне значимости её согласие или несогласие с данными наблюдений.
Опр Достаточно малую вероятность, при которой событие можно считать практически невозможным называют уровнем значимости.
На практике обычно принимают уровни значимости, заключённые между 0,01 и 0,05, $alpha =0,05$ — это $5 { % } $ уровень значимости.
В качестве критерия проверки гипотезы примем величину begin{equation} label { eq1 } chi ^2=sum { frac { ( { n_i -n_i’ } )^2 } { n_i’ } } qquad (1) end{equation}
здесь $n_i -$ эмпирические частоты, полученные из выборки, $n_i’ -$ теоретические частоты, найденные теоретическим путём.
Доказано, что при $nto infty $ закон распределения случайной величины { 1 } независимо от того, по какому закону распределена генеральная совокупность, стремится к закону $chi ^2$ { хи-квадрат } с $k$ степенями свободы.
Опр Число степеней свободы находят по равенству $k=S-1-r$ где $S-$ число групп интервалов, $r-$ число параметров.
1) равномерное распределение: $r=2, k=S-3 $
2) нормальное распределение: $r=2, k=S-3 $
3) показательное распределение: $r=1, k=S-2$.
Правило. Проверка гипотезы по критерию Пирсона.
- Для проверки гипотезы вычисляют теоретические частоты и находят $chi _ { набл } ^2 =sum { frac { ( { n_i -n_i’ } )^2 } { n_i’ } } $
- По таблице критических точек распределения $chi ^2$ по заданному уровню значимости $alpha $ и числу степеней свободы $k$ находят $chi _ { кр } ^2 ( { alpha ,k } )$.
- Если $chi _ { набл } ^2 <chi _ { кр } ^2 $ то нет оснований отвергать гипотезу, если не выполняется данное условие — то отвергают.
Замечание Для контроля вычислений применяют формулу для $chi ^2$ в виде $chi _ { набл } ^2 =sum { frac { n_i^2 } { n_i’ } -n } $
Проверка гипотезы о равномерном распределении
Функция плотности равномерного распределения величины $X$ имеет вид $f( x )=frac { 1 } { b-a } xin left[ { a,b }right]$.
Для того, чтобы при уровне значимости $alpha $ проверить гипотезу о том, что непрерывная случайная величина распределена по равномерному закону, требуется:
1) Найти по заданному эмпирическому распределению выборочное среднее $overline { x_b } $ и $sigma _b =sqrt { D_b } $. Принять в качестве оценки параметров $a$ и $b$ величины
$a = overline x _b -sqrt 3 sigma _b $, $b = overline x _b +sqrt 3 sigma _b $
2) Найти вероятность попадания случайной величины $X$ в частичные интервалы $( { x_i ,x_ { i+1 } } )$ по формуле $ P_i =P( { x_i <X<x_ { i+1 } } )=intlimits_ { x_i } ^ { x_ { i+1 } } { f( x )dx=left. { frac { 1 } { b-a } x }right| { begin{array} { c } { x_ { i+1 } } \ { x_i } \ end{array} } } =frac { x_ { i+1 } } { b-a } -frac { x_i } { b-a } . $
3) Найти теоретические { выравнивающие } частоты по формуле $n_i’ =np_i $.
4) Приняв число степеней свободы $k=S-3$ и уровень значимости $alpha =0,05$ по таблицам $chi ^2$ найдём $chi _ { кр } ^2 $ по заданным $alpha $ и $k$, $chi _ { кр } ^2 ( { alpha ,k } )$.
5) По формуле $chi _ { набл } ^2 =sum { frac { ( { n_i -n_i’ } )^2 } { n_i’ } } $ где $n_i -$ эмпирические частоты, находим наблюдаемое значение $chi _ { набл } ^2 $.
6) Если $chi _ { набл } ^2 <chi _ { кр } ^2 -$ нет оснований, отвергать гипотезу.
Проверим гипотезу на нашем примере.
1) $overline x _b =13,00,,,sigma _b =sqrt { D_b } = 6,51$
2) $a=13,00-sqrt 3 cdot 6,51=13,00-1,732cdot 6,51=1,72468$
$b=13,00+1,732cdot 6,51=24,27532$
$b-a=24,27532-1,72468=22,55064$
3) $P_i =P( { x_i <X<x_ { i+1 } } )=frac { x_ { i+1 } } { b-a } -frac { x_i } { b-a } $ $ P_1 =( { -1<X<3 } )=frac { 3 } { 22,55064 } -frac { -1 } { 22,55064 } =0,13303+0,04434=0,177375 $
$ P_2 =( { 3<X<7 } )=frac { 7 } { 22,55064 } -frac { 3 } { 22,55064 } =0,177375 $
$ P_3 =( { 7<X<11 } )=frac { 11 } { 22,55064 } -frac { 7 } { 22,55064 } =0,177375 $
$ P_4 =( { 11<X<15 } )=frac { 15 } { 22,55064 } -frac { 11 } { 22,55064 } =0,177375 $
$ P_5 =( { 15<X<19 } )=frac { 19 } { 22,55064 } -frac { 15 } { 22,55064 } =0,177375 $
$ P_6 =( { 19<X<23 } )=frac { 23 } { 22,55064 } -frac { 19 } { 22,55064 } =0,177375 $
В равномерном распределении если одинакова длина интервала, то $P_i -$ одинаковы.
4) Найдём $n_i’ =np_i $.
5) Найдём $sum { frac { ( { n_i -n_i’ } )^2 } { n_i’ } } $ и найдём $chi _ { набл } ^2 $.
Занесём все полученные значения в таблицу
begin{array} { |l|l|l|l|l|l|l| } hline i& n_i & n_i’ =np_i & n_i -n_i’ & ( { n_i -n_i’ } )^2& frac { ( { n_i -n_i’ } )^2 } { n_i’ } & Контроль~ frac { n_i^2 } { n_i’ } \ hline 1& 1& 4,43438& -3.43438& 11,7950& 2,659898& 0,22551 \ hline 2& 6& 4,43438& 1,56562& 2,45117& 0,552765& 8,11838 \ hline 3& 3& 4,43438& -1,43438& 2,05744& 0,471463& 2,0296 \ hline 4& 3& 4,43438& -1,43438& 2,05744& 0,471463& 2,0296 \ hline 5& 6& 4,43438& 1,56562& 2,45117& 0,552765& 8,11838 \ hline 6& 6& 4,43438& 1,56562& 2,45117& 0,552765& 8,11838 \ hline & & & & & sum = chi _ { набл } ^2 =3,261119& chi _ { набл } ^2 =sum { frac { n_i^2 } { n_i’ } -n } =3,63985 \ hline end{array}
$chi _ { кр } ^2 ( { 0,05,3 } )=7,8$
$chi _ { набл } ^2 <chi _ { кр } ^2 =3,26<7,8$
Вывод отвергать гипотезу нет оснований.
Критерий согласия Пирсона (или хи-квадрат) вычисляется по формуле:
ni – эмпирические частоты;
ni* – теоретические частоты;
l – количество интервалов (вариант)
Объем выборки по критерию Пирсона:
n>30
Теоретические частоты должны быть больше 5.
Распределение Пирсона с k степенями свободы рассчитывается по формуле:
k=l−r−1
r – число параметров предполагаемого распределения
Если предполагаемое распределение имеет нормальный закон распределения, то число степеней свободы оценивают по двум параметрам (математическое ожидание и СКО) и формула имеет вид:
k=l−3
Пример
Проверить гипотезу о нормальном распределении по критерию Пирсона при уровне значимости 0,01. Дана выборка данных измерений в виде таблицы
Найдем выборочное среднее по формуле:
Отсюда
Формула выборочной исправленной дисперсии:
Тогда
Откуда получаем выборочную исправленную СКО:
Получаем параметры нормального распределения mx=15,9, σ=1,87.
Найдем теоретические частоты по формуле:
h – шаг между вариантами, h=0,5
При уровне значимости α=0,01 и число степеней свободы k=13−3=10 по таблице Пирсона найдем критическое значение:
Наблюдаемое значение критерия равно:
Ввиду того, что
следовательно, нулевую гипотезу о нормальном распределении принимаем.
14770
До конца XIX века нормальное распределение считалась всеобщим законом вариации данных. Однако К. Пирсон заметил, что эмпирические частоты могут сильно отличаться от нормального распределения. Встал вопрос, как это доказать. Требовалось не только графическое сопоставление, которое имеет субъективный характер, но и строгое количественное обоснование.
Так был изобретен критерий χ2 (хи квадрат), который проверяет значимость расхождения эмпирических (наблюдаемых) и теоретических (ожидаемых) частот. Это произошло в далеком 1900 году, однако критерий и сегодня на ходу. Более того, его приспособили для решения широкого круга задач. Прежде всего, это анализ категориальных данных, т.е. таких, которые выражаются не количеством, а принадлежностью к какой-то категории. Например, класс автомобиля, пол участника эксперимента, вид растения и т.д. К таким данным нельзя применять математические операции вроде сложения и умножения, для них можно только подсчитать частоты.
Наблюдаемые частоты обозначим О (Observed), ожидаемые – E (Expected). В качестве примера возьмем результат 60-кратного бросания игральной кости. Если она симметрична и однородна, вероятность выпадения любой стороны равна 1/6 и, следовательно, ожидаемое количество выпадения каждой из сторон равна 10 (1/6∙60). Наблюдаемые и ожидаемые частоты запишем в таблицу и нарисуем гистограмму.
Нулевая гипотеза заключается в том, что частоты согласованы, то есть фактические данные не противоречат ожидаемым. Альтернативная гипотеза – отклонения в частотах выходят за рамки случайных колебаний, расхождения статистически значимы. Чтобы сделать строгий вывод, нам потребуется.
- Обобщающая мера расхождения между наблюдаемыми и ожидаемыми частотами.
- Распределение этой меры при справедливости гипотезы о том, что различий нет.
Начнем с расстояния между частотами. Если взять просто разницу О — E, то такая мера будет зависеть от масштаба данных (частот). Например, 20 — 5 =15 и 1020 – 1005 = 15. В обоих случаях разница составляет 15. Но в первом случае ожидаемые частоты в 3 раза меньше наблюдаемых, а во втором случае – лишь на 1,5%. Нужна относительная мера, не зависящая от масштаба.
Обратим внимание на следующие факты. В общем случае количество категорий, по которым измеряются частоты, может быть гораздо больше, поэтому вероятность того, что отдельно взятое наблюдение попадет в ту или иную категорию, довольно мала. Раз так, то, распределение такой случайной величины будет подчинятся закону редких событий, известному под названием закон Пуассона. В законе Пуассона, как известно, значение математического ожидания и дисперсии совпадают (параметр λ). Значит, ожидаемая частота для некоторой категории номинальной переменной Ei будет являться одновременное и ее дисперсией. Далее, закон Пуассона при большом количестве наблюдений стремится к нормальному. Соединяя эти два факта, получаем, что, если гипотеза о согласии наблюдаемых и ожидаемых частот верна, то, при большом количестве наблюдений, выражение
имеет стандартное нормальное распределение.
Важно помнить, что нормальность будет проявляться только при достаточно больших частотах. В статистике принято считать, что общее количество наблюдений (сумма частот) должна быть не менее 50 и ожидаемая частота в каждой группе должна быть не менее 5. Только в этом случае величина, показанная выше, имеет стандартное нормальное распределение. Предположим, что это условие выполнено.
У стандартного нормального распределения почти все значение находятся в пределах ±3 (правило трех сигм). Таким образом, мы получили относительную разность в частотах для одной группы. Нам нужна обобщающая мера. Просто сложить все отклонения нельзя – получим 0 (догадайтесь почему). Пирсон предложил сложить квадраты этих отклонений.
Это и есть статистика для критерия Хи-квадрат Пирсона. Если частоты действительно соответствуют ожидаемым, то значение статистики Хи-квадрат будет относительно не большим (отклонения находятся близко к нулю). Большое значение статистики свидетельствует в пользу существенных различий между частотами.
«Большой» статистика Хи-квадрат становится тогда, когда появление наблюдаемого или еще большего значения становится маловероятным. И чтобы рассчитать такую вероятность, необходимо знать распределение статистики Хи-квадрат при многократном повторении эксперимента, когда гипотеза о согласии частот верна.
Как нетрудно заметить, величина хи-квадрат также зависит от количества слагаемых. Чем больше слагаемых, тем больше ожидается значение статистики, ведь каждое слагаемое вносит свой вклад в общую сумму. Следовательно, для каждого количества независимых слагаемых, будет собственное распределение. Получается, что χ2 – это целое семейство распределений.
И здесь мы подошли к одному щекотливому моменту. Что такое число независимых слагаемых? Вроде как любое слагаемое (т.е. отклонение) независимо. К. Пирсон тоже так думал, но оказался неправ. На самом деле число независимых слагаемых будет на один меньше, чем количество групп номинальной переменной n. Почему? Потому что, если мы имеем выборку, по которой уже посчитана сумма частот, то одну из частот всегда можно определить, как разность общего количества и суммой всех остальных. Отсюда и вариация будет несколько меньше. Данный факт Рональд Фишер заметил лет через 20 после разработки Пирсоном своего критерия. Даже таблицы пришлось переделывать.
По этому поводу Фишер ввел в статистику новое понятие – степень свободы (degrees of freedom), которое и представляет собой количество независимых слагаемых в сумме. Понятие степеней свободы имеет математическое объяснение и проявляется только в распределениях, связанных с нормальным (Стьюдента, Фишера-Снедекора и сам Хи-квадрат).
Чтобы лучше уловить смысл степеней свободы, обратимся к физическому аналогу. Представим точку, свободно движущуюся в пространстве. Она имеет 3 степени свободы, т.к. может перемещаться в любом направлении трехмерного пространства. Если точка движется по какой-либо поверхности, то у нее уже две степени свободы (вперед-назад, вправо-влево), хотя и продолжает находиться в трехмерном пространстве. Точка, перемещающаяся по пружине, снова находится в трехмерном пространстве, но имеет лишь одну степень свободы, т.к. может двигаться либо вперед, либо назад. Как видно, пространство, где находится объект, не всегда соответствует реальной свободе перемещения.
Примерно также распределение статистики может зависеть от меньшего количества элементов, чем нужно слагаемых для его расчета. В общем случае количество степеней свободы меньше наблюдений на число имеющихся зависимостей.
Таким образом, распределение хи квадрат (χ2) – это семейство распределений, каждое из которых зависит от параметра степеней свободы. Формальное определение следующее. Распределение χ2 (хи-квадрат) с k степенями свободы — это распределение суммы квадратов k независимых стандартных нормальных случайных величин.
Далее можно было бы перейти к самой формуле, по которой вычисляется функция распределения хи-квадрат, но, к счастью, все давно подсчитано за нас. Чтобы получить интересующую вероятность, можно воспользоваться либо соответствующей статистической таблицей, либо готовой функцией в Excel.
Интересно посмотреть, как меняется форма распределения хи-квадрат в зависимости от количества степеней свободы.
С увеличением степеней свободы распределение хи-квадрат стремится к нормальному. Это объясняется действием центральной предельной теоремы, согласно которой сумма большого количества независимых случайных величин имеет нормальное распределение. Про квадраты там ничего не сказано )).
Проверка гипотезы по критерию Хи квадрат Пирсона
Вот мы и подошли к проверке гипотез по методу хи-квадрат. В целом техника остается прежней. Выдвигается нулевая гипотеза о том, что наблюдаемые частоты соответствуют ожидаемым (т.е. между ними нет разницы, т.к. они взяты из той же генеральной совокупности). Если этот так, то разброс будет относительно небольшим, в пределах случайных колебаний. Меру разброса определяют по статистике Хи-квадрат. Далее либо полученную статистику сравнивают с критическим значением (для соответствующего уровня значимости и степеней свободы), либо, что более правильно, рассчитывают наблюдаемый p-value, т.е. вероятность получить такое или еще больше значение статистики при справедливости нулевой гипотезы.
Т.к. нас интересует согласие частот, то отклонение гипотезы произойдет, когда статистика окажется больше критического уровня. Т.е. критерий является односторонним. Однако иногда (иногда) требуется проверить левостороннюю гипотезу. Например, когда эмпирические данные уж оооочень сильно похожи на теоретические. Тогда критерий может попасть в маловероятную область, но уже слева. Дело в том, что в естественных условиях, маловероятно получить частоты, практически совпадающие с теоретическими. Всегда есть некоторая случайность, которая дает погрешность. А вот если такой погрешности нет, то, возможно, данные были сфальсифицированы. Но все же обычно проверяют правостороннюю гипотезу.
Вернемся к задаче с игральной костью. Рассчитаем по имеющимся данным значение статистики критерия хи-квадрат.
Теперь найдем критическое значение при 5-ти степенях свободы (k) и уровне значимости 0,05 (α) по таблице критических значений распределения хи квадрат.
То есть квантиль 0,05 хи квадрат распределения (правый хвост) с 5-ю степенями свободы χ20,05; 5 = 11,1.
Сравним фактическое и табличное значение. 3,4 (χ2) < 11,1 (χ20,05; 5). Расчетный значение оказалось меньшим, значит гипотеза о равенстве (согласии) частот не отклоняется. На рисунке ситуация выглядит вот так.
Если бы расчетное значение попало в критическую область, то нулевая гипотеза была бы отклонена.
Более правильным будет рассчитать еще и p-value. Для этого нужно в таблице найти ближайшее значение для заданного количества степеней свободы и посмотреть соответствующий ему уровень значимости. Но это прошлый век. Воспользуемся ЭВМ, в частности MS Excel. В эксель есть несколько функций, связанных с хи-квадрат.
Ниже их краткое описание.
ХИ2.ОБР – критическое значение Хи-квадрат при заданной вероятности слева (как в статистических таблицах)
ХИ2.ОБР.ПХ – критическое значение при заданной вероятности справа. Функция по сути дублирует предыдущую. Но здесь можно сразу указывать уровень α, а не вычитать его из 1. Это более удобно, т.к. в большинстве случаев нужен именно правый хвост распределения.
ХИ2.РАСП – p-value слева (можно рассчитать плотность).
ХИ2.РАСП.ПХ – p-value справа.
ХИ2.ТЕСТ – по двум диапазонам частот сразу проводит тест хи-квадрат. Количество степеней свободы берется на одну меньше, чем количество частот в столбце (так и должно быть), возвращая значение p-value.
Давайте пока рассчитаем для нашего эксперимента критическое (табличное) значение для 5-ти степеней свободы и альфа 0,05. Формула Excel будет выглядеть так:
=ХИ2.ОБР(0,95;5)
Или так
=ХИ2.ОБР.ПХ(0,05;5)
Результат будет одинаковым – 11,0705. Именно это значение мы видим в таблице (округленное до 1 знака после запятой).
Рассчитаем, наконец, p-value для 5-ти степеней свободы критерия χ2 = 3,4. Нужна вероятность справа, поэтому берем функцию с добавкой ПХ (правый хвост)
=ХИ2.РАСП.ПХ(3,4;5) = 0,63857
Значит, при 5-ти степенях свободы вероятность получить значение критерия χ2 = 3,4 и больше равна почти 64%. Естественно, гипотеза не отклоняется (p-value больше 5%), частоты очень хорошо согласуются.
А теперь проверим гипотезу о согласии частот с помощью теста хи квадрат и функции Excel ХИ2.ТЕСТ.
Никаких таблиц, никаких громоздких расчетов. Указав в качестве аргументов функции столбцы с наблюдаемыми и ожидаемыми частотами, сразу получаем p-value. Красота.
Представим теперь, что вы играете в кости с подозрительным типом. Распределение очков от 1 до 5 остается прежним, но он выкидывает 26 шестерок (количество всех бросков становится 78).
p-value в этом случае оказывается 0,003, что гораздо меньше чем, 0,05. Есть серьезные основания сомневаться в правильности игральной кости. Вот, как выглядит эта вероятность на диаграмме распределения хи-квадрат.
Статистика критерия хи-квадрат здесь получается 17,8, что, естественно, больше табличного (11,1).
Надеюсь, мне удалось объяснить, что такое критерий согласия χ2 (хи-квадрат) Пирсона и как с его помощью проверяются статистические гипотезы.
Напоследок еще раз о важном условии! Критерий хи-квадрат исправно работает только в случае, когда количество всех частот превышает 50, а минимальное ожидаемое значение для каждой группы не меньше 5. Если в какой-либо категории ожидаемая частота менее 5, но при этом сумма всех частот превышает 50, то такую категорию объединяют с ближайшей, чтобы их общая частота превысила 5. Если это сделать невозможно, или сумма частот меньше 50, то следует использовать более точные методы проверки гипотез. О них поговорим в другой раз.
Ниже находится видео ролик о том, как в Excel проверить гипотезу с помощью критерия хи-квадрат.
Скачать файл с примером.
Поделиться в социальных сетях:
Предположим, что выполнено измерений некоторой случайной величины ξ :
, …,
, (4.4)
И есть основания полагать, что результаты распределены нормально с плотностью вероятности
. (4.5)
Параметры закона распределения и σ обычно неизвестны. Вместо неизвестных параметров подставляют значения их оценок, которые вычисляют по следующим формулам:
, (4.6)
. (4.7)
В качестве критерия проверки выдвинутой гипотезы примем критерий согласия Пирсона (критерий согласия “хи- квадрат”)
, (4.8)
Где – число интервалов, на которые разбито выборочное распределение,
— частоты эмпирического распределения;
– частоты теоретического распределения. Из формулы вытекает, что критерий характеризует близость эмпирического и теоретического распределений: чем меньше различаются
и
, тем меньше значение χ2.
Доказано, что при закон распределения случайной величины (4.8) независимо от того, какому закону распределения подчинена генеральная совокупность, стремится к закону распределения χ2 с
степенями свободы. Число степеней свободы определяется равенством
, где
— число частичных интервалов;
– число параметров предполагаемого распределения, которые были оценены. Для нормального распределения оцениваются два параметра (математическое ожидание и среднее квадратическое отклонение), поэтому
.
В соответствии с процедурой проверки гипотезы следует вычислить наблюдаемое значение критерия. Чтобы вычислить частоты эмпирического распределения, весь интервал наблюдаемых значений делят на частичных интервалов (бинов) точками
:
. (4.9)
определяют, подсчитав число измерений (4.4), которые попадают в
— й интервал
.
Используя теоретический закон распределения (4.5) можно рассчитать ожидаемое число Результатов измерений для каждого интервала
. Вероятность того, что результат одного измерения попадает в интервал
, равна
, (4.10)
Где – интегральный закон нормального распределения:
. Учитывая, что функция распределения
с параметрами
и σ связана со стандартной нормальной функцией формулой
, соотношение (4.10) можно записать в следующем виде:
. (4.11)
Поскольку проводится не одно, а измерений и эти измерения независимы, то их можно рассматривать как
испытаний Бернулли, в которых “успехом” считается попадание результата измерения в интервал
. Тогда числа
вычисляются по формуле
(4.12)
(математическое ожидание числа “успехов” при испытаниях).
Для заданного уровня значимости по таблицам определяют критическое значение критерия. Сравнивая наблюдаемое и критическое значения критерия делают, вывод о соответствии экспериментальных данных предполагаемому закону распределения.
Пример 4.1. Проверить с помощью критерия χ2 при уровне значимости 0,05 гипотезу о том, что выборка объема , представленная интервальным вариационным рядом в таблице 4.4, извлечена из нормальной генеральной совокупности.
Таблица 4.4
Номер Интервала I |
Границы Интервала |
Частота |
1 |
0 – 2 |
5 |
2 |
2 – 4 |
11 |
3 |
4 –6 |
17 |
4 |
6 – 8 |
10 |
5 |
8 – 10 |
7 |
Решение. 1. Сформулируем нулевую и альтернативную гипотезы: H0 – эмпирическое распределение соответствует нормальному; H1 — эмпирическое распределение не соответствует нормальному.
Для проверки нулевой гипотезы необходимо рассчитать наблюдаемое значение критерия χ2набл по формуле (4.8) и сравнить его с критическим значением χ2кр.
2. Определим параметры предполагаемого (теоретического) нормального закона распределения.
Найдем середины интервалов и относительные частоты
. Получим следующие значения:
|
1 |
3 |
5 |
6 |
7 |
|
|
|
|
|
|
Оценку математического ожидания найдем по формуле (4.1):
.
Оценки дисперсии и стандартного отклонения вычислим по формулам (4.2) и (4.3):
;
.
3. Выполним расчет теоретических частот по формуле (4.12). Для вычисления вероятностей
по формуле (4.11) воспользуемся таблицей В Приложения со значениями нормальной стандартной функции распределения. При этом наименьшее значение, т. е.
, полагаем равным
, а наибольшее, т. е.
, полагаем равным
. Последовательно находим для интервала (-∞, 2)
и
;
Для интервала находим
и ;
Для интервала (4,6) соответственно :
;
Для интервала (6,8):
И ;
Для интервала вычислим
;
.
4. По формуле (4.8) найдем значение :
.
5. По таблице квантилей распределения χ2 (см. таблицу С Приложения) с числом степеней свободы находим, что χ2кр = 6,0 для
.
Поскольку (
), то можно считать, что гипотеза о нормальном распределении генеральной совокупности не противоречит опытным данным.
Порядок выполнения лабораторной работы
В данной лабораторной работе задания 1 и 2 представляют собой контрольный пример, решение которого приводится ниже. Задания 3 и 4 составляют индивидуальное задание.
Задание 1. Для выборки из 40 значений случайной величины ξ, полученной в задании 1 работы 1, оценить близость эмпирического распределения к нормальному распределению:
А) построить интервальный вариационный ряд и гистограмму частот;
Б) построить на одном графике гистограмму относительных частот и график плотности нормального распределения.
Задание 2. При уровне значимостит 0,05 проверить гипотезу о нормальном распределении генеральной совокупности с использованием χ2 — критерия как критерия согласия.
Задание 3. Для выборки нормальной случайной величины, смоделированной в задании 3 работы 1, построить, на выбор, либо гистограмму частот, либо гистограмму относительных частот.
Задание 4. Пользуясь критерием Пирсона при уровне значимости 0,01 проверить, согласуется ли с нормальным распределением статистическое распределение из задания 3 работы 1.
Выполнение задания 1.
1. Подготовьте рабочий лист в EXCEL. Для этого выполните следующее:
· перейдите на новый лист и введите в ячейку B1 название таблицы ПОСТРОЕНИЕ ГИСТОГРАММЫ;
· назовите ярлык листа Гистограмма;
· разместите в ячейках A5:B24 выборку, которая была получена при выполнении задания 1.1 лабораторной работы 1 (40 значений нормальной случайной величины с параметрами и σ=0,5 ), либо выполнив копирование значений с листа Оценки, либо повторив процедуру моделирования выборки заданного закона распределения.
Создаваемая электронная таблица представлена в таблице 4.5 в режиме вычислений и в таблице 4.6 в режиме формул.
2. Для построения интервального вариационного ряда выполните следующие действия:
2.1. Произведите расчет длины частичных интервалов в ячейках C5:G5 по указанным в ячейках формулам и комментариям так, как указано ниже.
Ячейка Значение Ячейка Значение
C5 40 C4 объем выб.
D5 =МИН(A5:B24) D4 минимум
E5 =МАКС(A5:B24) E4 максимум
F5 =1+3,32*LOG10(C5) F4 k
G5 =(E5-D5)/F5 G4 вел. инт-ла
H5 =СРЗНАЧ(A5:B24) H4 оценка мат. ож.
I5 =СТАНДОТКЛОН(A5:B24) I4 несм. станд. откл.
2.2. Разместите массив значений границ интервалов в ячейках C9:D15 (в столбце С – значения левых границ, в столбце D – значения правых границ).
Выполните это так:
· для определения левой границы первого частичного промежутка введите в ячейку С9 формулу — =$D$5-$G$5/2;
· для определения правой границы введите в ячейку D9 формулу C9+$G$5;
· поскольку левая граница последующего частичного промежутка совпадает с правой границей предыдущего введите в ячейку С10 формулу — =D9;
· перенесите автозаполнением формулу из ячейки С10 на диапазон С11:C15, а формулу из D9 – в ячейки D10:D15;
· в ячейку С8 введите текст Левый кон, в ячейку D8 – Правый кон.
3. Для построения гистограммы частот воспользуемся инструментом анализа Гистограмма. Выполните команду Сервис – Анализ данных – Гистограмма. В окне “Гистограмма” задайте параметры;
· введите в поле Входной интервал $A$5:$B$24, в поле Интервал карманов – $D$9:$D$15, в Выходной интервал – $E$8;
· установите флажок Вывод графика;
· нажмите OK.
На экране появятся выходная таблица и гистограмма. В левом столбце таблицы размещен Карман – так в MS Excel называется набор граничных значений частичных интервалов. Правый столбец содержит вычисленные значения частот.
Поместите полученную диаграмму (выделите и перетащите) так, чтобы левый верхний конец находился в ячейке J8.
4. Подготовим исходные данные для построения гистограммы относительных частот и графика плотности вероятности.
4.1. Расчет относительных частот произведите в ячейках G9:G15, для этого введите в ячейку G9 формулу =F9/$C$5 и перенесите ее на диапазон G10:G15.
4.2. При построении гистограммы используются значения плотности относительных частот. Выполните расчет этих значений в ячейках H9:H15. Введите в ячейку H9 формулу =G9/$G$5 и скопируйте ее в ячейки H10:H15. Озаглавьте столбцы: введите в G8 текст Отн. част., в H8 – Плот. отн. част.
4.3. Сформируйте в ячейках I9:I15 массив значений плотности вероятности, по которым будет построен график. Указанные значения вычислите с использованием функции НОРМРАСП в граничных точках частичных интервалов, размещенных в ячейках D9:D15. Введите в I9 формулу
=НОРМРАСП(D9;$H$5;$I$5;0)
И перенесите ее на диапазон I10:I15.
5. Как отмечалось выше, площадь гистограммы относительных частот численно равна единице. Введите для контроля правильности вычислений в ячейку G16 текст Контроль, а в ячейку H16 – формулу =СУММ(H9:H15)*$G$5.
6. Для построения гистограммы и графика выполните следующие действия:
· выделите ячейки H9:I15, в которых размещены данные;
· нажмите кнопку Мастер диаграмм, откроется окно диалога;
· выберите вкладку “Нестандартные” и вид графика График! гистограмма, нажмите кнопку Далее;
· на втором шаге построения диаграммы выберите вкладку “Ряд”. Измените текст легенды (условного обозначения для рядов данных): в разделе Ряд выделите Ряд 1, перейдите в поле Имя и введите текст Плотность вероятности, затем выделите Ряд 2 и в поле Имя Наберите Плотность отн. частот;
· введите в поле “Подписи оси Х” диапазон D9:D15 и нажмите кнопку Далее;
· оформление гистограммы на третьем шаге можно опустить (либо выполните по своему желанию);
· на четвертом шаге задайте место размещения гистограммы –Имеющийся лист И нажмите OK.
Выполнение задания 2
1. Подготовьте рабочий лист. Для этого выполните следующие действия:
· перейдите на новый лист и введите в ячейку С1 название таблицы ПРОВЕРКА ГИПОТЕЗЫ ПО КРИТЕРИЮ ПИРСОНА;
· назовите ярлык листа Крит Пирсона;
· занесите в ячейку E2 значение заданного уровня значимости 0,05, а в С2 — Уровень значимости;
· перенесите содержимое столбцов A, B, C, D, а также четвертой и пятой строк с листа Гистограмма На лист Крит Пирсона.
Создаваемая электронная таблица представлена в таблице 4.7 в режиме формул и в таблице 4.8 в режиме вычислений.
Чтобы вычислить наблюдаемое значение критерия по формуле (4.7), для каждого частичного интервала необходимо найти значения эмпирической и теоретической частот.
2. Частоту появления значений выборки в построенных частичных интервалах (эмпирическую частоту) вычислите с помощью функции ЧАСТОТА, которая возвращает распределение частот в виде вертикального массива. Эта функция подсчитывает для данного множества значений и данного множества карманов (интервалов, в математическом смысле), сколько исходных значений попадает в каждый интервал. Выполните следующие действия:
· выделите ячейки E9:E15, в которые будет введена функция ЧАСТОТА (данная функция возвращает массив, поэтому она должна задаваться в качестве формулы массива);
· нажмите кнопку Вставка функции;
· в открывшемся окне диалога “Мастер функций” выберите функцию ЧАСТОТА из категории Статистические и нажмите кнопку OK;
· укажите в поле Массив данных диапазон $A$5:$B$24, в поле Двоичный массив – $D$9:$D$15 (массив верхних границ интервалов);
· не выходя из строки формул, одновременно нажмите клавиши Ctrl+Shift+Enter;
· введите в ячейку E7 текст Эмп. частота, в D16 – Число бинов, а в E16 – формулу для подсчета числа бинов
=СЧЕТ(E9:E15).
3. Расчет теоретической частоты по формулам (4.10) и (4.12) произведите в ячейках F9:H15. Выполните следующее:
· определите значения интегральной функции распределения на правом конце для каждого частичного промежутка, для чего введите в ячейку F9 формулу =НОРМРАСП(D9;$H$5;$I$5;1)
· и перенесите ее автозаполнением на диапазон F10:F14 (в ячейку F15 введите 1, поскольку );
· вычислите вероятность того, что результат одного измерения попадет в частичный интервал, для чего введите в ячейку G9 формулу: =F9-F8
И скопируйте ее на диапазон G10:G15;
· сосчитайте теоретические частоты, введя в ячейку H9 формулу:
=$C$5*G9
и автозаполнением перенесите ее на диапазон H10:H15;
Продолжение таблицы 4.7
K |
Вел инт-ла |
Оценка мат ож |
Несм станд откл |
=1+3,32*LOG10(C5) |
=(E5-D5)/F5 |
=СРЗНАЧ(A5:B24) |
=СТАНДОТКЛОН(A5:B24) |
Ф р на пр конце |
Вер |
Теор частота |
|
=НОРМРАСП(D9;$H$5;$I$5;1) |
=F9-F8 |
=$C$5*G9 |
=(E9-H9)^2/H9 |
=НОРМРАСП(D10;$H$5;$I$5;1) |
=F10-F9 |
=$C$5*G10 |
=(E10-H10)^2/H10 |
=НОРМРАСП(D11;$H$5;$I$5;1) |
=F11-F10 |
=$C$5*G11 |
=(E11-H11)^2/H11 |
=НОРМРАСП(D12;$H$5;$I$5;1) |
=F12-F11 |
=$C$5*G12 |
=(E12-H12)^2/H12 |
=НОРМРАСП(D13;$H$5;$I$5;1) |
=F13-F12 |
=$C$5*G13 |
=(E13-H13)^2/H13 |
=НОРМРАСП(D14;$H$5;$I$5;1) |
=F14-F13 |
=$C$5*G14 |
=(E14-H14)^2/H14 |
1 |
=F15-F14 |
=$C$5*G15 |
=(E15-H15)^2/H15 |
Набл зн критерия |
=СУММ(I9:I15) |
||
Крит зн критерия |
=ХИ2ОБР($E$2;$E$16-3) |
||
Таблица 4.8
ПРОВЕРКА ГИПОТЕЗЫ ПО КРИТЕРИЮ ПИРСОНА |
||||||||
Уровень значимости |
0,05 |
|||||||
Вариац. ряд |
Объем выб. |
Мин. |
Макс |
K |
Вел. инт-ла |
Оценка мат ожидания |
Несм. станд. откл. |
|
2,522 |
3,08504 |
40 |
2,52182 |
4,951854 |
6,318839171 |
0,3845703 |
3,904166 |
0,5240692 |
4,06 |
4,54702 |
|||||||
4,475 |
3,99218 |
Левый кон. |
Правый кон. |
Эмп. частота |
Ф. р. на пр..конце |
Вер. |
Теор. частота |
|
2,868 |
4,18848 |
|||||||
4,037 |
3,80175 |
2,3295 |
2,7141 |
1 |
0,011579055 |
0,0115791 |
0,463162 |
0,622233 |
4,496 |
3,86077 |
2,7141 |
3,09867 |
3 |
0,062146626 |
0,0505676 |
2,022703 |
0,4721948 |
4,173 |
3,9781 |
3,0987 |
3,48324 |
4 |
0,210934098 |
0,1487875 |
5,951499 |
0,6398973 |
4,163 |
3,29599 |
3,4832 |
3,86781 |
8 |
0,472348174 |
0,2614141 |
10,45656 |
0,577121 |
3,786 |
4,02087 |
3,8678 |
4,25238 |
15 |
0,746798016 |
0,2744498 |
10,97799 |
1,473542 |
3,549 |
3,96672 |
4,2524 |
4,63695 |
7 |
0,918983001 |
0,172185 |
6,887399 |
0,0018409 |
3,504 |
3,92577 |
4,637 |
5,02152 |
2 |
1 |
0,081017 |
3,24068 |
0,4749888 |
4,547 |
4,12434 |
Число бинов |
7 |
Набл. зн. .критерия |
4,2618178 |
|||
4,318 |
4,30071 |
Крит. зн. критерия |
9,487729 |
|||||
3,047 |
4,272 |
|||||||
3,788 |
4,23425 |
|||||||
4,13 |
3,98299 |
|||||||
4,059 |
4,95185 |
|||||||
3,184 |
3,20143 |
|||||||
3,759 |
4,7737 |
|||||||
3,766 |
3,43299 |
— поясните полученные результаты, для этого в ячейку F7 введите текст Ф. р. на пр. конце, в ячейку G7 – Вер., а в H7 – Теор. частота.
4. Вычислите слагаемые критерия Пирсона, для чего введите в ячейку I9 формулу
=(E9-H9)^2/H9
И автозаполнением перенесите эту формулу в ячейки I10:I15.
5. Наблюдаемое значение критерия вычислите по формуле (4.6) в ячейке I16, для чего введите формулу =СУММ(I9:I15).
6. Критическое значение критерия “хи-квадрат” для уровня значимости 0,95 и числа степеней свободы выведите в ячейке I17, набрав формулу
=ХИ2ОБР($E$2;$E$16-3).
Функция ХИ2ОБР возвращает обратную функцию для χ2-распределения.
В ячейку H16 введите текст Набл. зн. критерия, а в H17 – Крит. зн. критерия.
Так как наблюдаемое значение критерия, равное 4,26, меньше критического значения, равного 9,49, то гипотезу о нормальном распределении генеральной совокупности не отвергаем. Другими словами, расхождение эмпирических и теоретических частот незначительное. Следовательно, смоделированные значения случайной величины согласуются с гипотезой о распределении случайной величины с заданным законом распределения.
Подготовить отчет:
1. Название работы и задание.
2. По две распечатки таблиц, созданных при выполнении заданий 3 и 4 (одна распечатка содержит результаты вычислений, другая – сами формулы).
3. Выводы по результатам выполнения задания 4.
< Предыдущая | Следующая > |
---|