Как найти связанные выборки

to continue to Google Sites

Not your computer? Use Guest mode to sign in privately. Learn more

Зависимые(связанные) и независимые (несвязанные) выборки

Если
можно установить гомоморфную пару
(то есть, когда одному случаю из выборки
X соответствует один и только один
случай из выборки Y и наоборот) для
каждого случая в двух выборках (и это
основание взаимосвязи является важным
для измеряемого на выборках признака),
такие выборки называются зависимыми.
Примеры зависимых выборок:

пары
близнецов, два измерения какого-либо
признака до и после экспериментального
воздействия, мужья и жёны и т. п.

В
случае, если такая взаимосвязь между
выборками отсутствует, то эти выборки
считаются независимыми,
например:
мужчины и женщины,
психологи и математики.

Соответственно,
зависимые выборки всегда имеют одинаковый
объём, а объём независимых может
отличаться.

Нулевая
гипотеза и Альтернативная гипотезы:

Первоначально
гипотезу всегда можно сформулировать
таким образом: между двумя генеральными
совокупностями нет ожидаемого различия.
Такая
гипотеза называется нулевой
гипотезой
,
или нуль-гипотезой. Обратное ей
утверждение о том, что в действительности
между генеральными совокупностями
есть различие, называется альтернативной
гипотезой
,
или альтернативой.

Нулевой
(основной)
 называют
выдвинутую гипотезу Н0Конкурирую-щей
(альтернативной)
  называют
гипотезу Н1,
которая противоречит нулевой.

27.
Принципы проверки статистических
гипотез, уровень значимости, параметрические
и
 
непараметрические
критерии различия. Процедура принятия
статистического вывода.

Общие
принципы проверки статистических
гипотез

Процедура
проверки нулевой гипотезы в общем
случае включает следующие этапы:

1.      задается
допустимая вероятность ошибки первого
рода (Ркр=0,05)

2.      выбирается
статистика критерия (Т)

3.      ищется
область допустимых значений

4.      по
исходным данным вычисляется значение
статистики Т

5.
если Т
(статистика критерия)
 принадлежит
области принятия нулевой гипотезы, то
нулевая гипотеза принимается (корректнее
говоря, делается заключение, что исходные
данные не противоречат нулевой гипотезе),
а в противном случае нулевая гипотеза
отвергается и принимается альтернативная
гипотеза.

При
проверке статистических гипотез
возможны ошибки (ошибочные
суждения) двух видов:

—   можно
отвергнуть нулевую гипотезу, когда она
на самом деле верна (так называемая ошибка
первого рода
);

—   можно
принять нулевую гипотезу, когда она на
самом деле не верна (так называемая ошибка
второго рода
)

Допустимая
вероятность ошибки первого рода
 (Ркр) может
быть равна 5% или 1% (0.05 или 0.01). Уровень
значимости
 –
это вероятность ошибки первого рода
при принятии решения (вероятность
ошибочного отклонения нулевой гипотезы).

Критерий
различия называют параметрическим,
если он основан на конкретном типе
распределения генеральной совокупности
(как правило, нормальном) или использует
параметры этой совокупности (среднее,
дисперсии и т. д.).Обратное –
непараметрический. При нормальном
распределении генеральной совокупности
параметрические критерии обладают
большей мощностью по сравнению с
непараметрическими (способны с большей
достоверностью отвергать нулевую
гипотезу, если последняя не верна).

Однако,
как показывает практика, подавляющее
большинство данных, получаемых в
психологических экспериментах, не
распределены нормально
,
поэтому применение параметрических
критериев при анализе результатов
психологических исследований может
привести к ошибкам в статистических
выводах. В таком случае непараметрические
критерии становятся более мощными, т.
е. способными с большей достоверностью
отвергать нулевую гипотезу.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

  • #
  • #
  • #
  • #
  • #
  • #
  • #
  • #
  • #
  • #
  • #

Лекция 8.
ПРОВЕРКА ГИПОТЕЗЫ О РАВЕНСТВЕ ГЕНЕРАЛЬНЫХ СРЕДНИХ
(ЗАВИСИМЫЕ ВЫБОРКИ)
1. Постановка задачи о различии средних для зависимых выборок
Существует много практических задач, в которых две сравниваемые выборки
взаимосвязаны в силу особенностей организации эксперимента или просто потому, что
этой взаимосвязи нельзя избежать.
Примеры зависимых выборок:
— первая и вторая выборки состоят из наблюдений типа «до – после»;
— первая выборка – совокупность значений времени самостоятельного выполнения
задания, а вторая – совокупность значений времени выполнения задания под
наблюдением и при руководстве преподавателя.
В практике психологических, педагогических, медицинских исследований часто
используются так называемые парные сравнения. При парных сравнениях нельзя
использовать методы для независимых выборок, поскольку это приведет к большим
ошибкам.
Для сравнения средних значений здесь используется модификация t -критерия Стьюдента
для зависимых выборок.
Постановка задачи.
Даны две зависимые выборки объема n , то есть связанные пары наблюдений:  x1, y1  ,
x2 , y2  , …, xn , yn . Проверяется гипотеза H 0 о равенстве математических ожиданий
a x  a y . Альтернативной гипотезой H1 является гипотеза a x  a y .
Критерий (правило) проверки гипотезы
1. Формулируем нулевую гипотезу H 0 : x  y , что генеральные средние равны.
2. Формулируем альтернативную гипотезу Н1 : x  y .
3. Назначаем уровень значимости  .
4. Делаем предположение о нормальном распределении разностей di  xi  yi .
5. Вычисляется эмпирическое значение t -критерия по формуле
t эмп 
d
 n,
Sd
n
1 n
1
  ( xi  y i ) ; S d 
  (d i  d ) 2 .
n i 1
n  1 i 1
6. По таблице критических значений t -критерия распределения Стьюдента находится
критическое значение t кр (, k ) при уровне значимости  и числе степеней свободы
где величины d 
k  n  1.
7. Сравниваем t эмп и t кр . Если t эмп  t кр , то гипотеза H 0 отклоняется, так как t эмп.
попало в критическую область. Значит, наблюдаемое различие между средними значениями
двух связанных выборок значимо на уровне значимости  . Если t эмп  t крит , то различие
между средними значениями двух связанных выборок статистически незначимо.
2. Задача об оценке различия средних значений признака в зависимых выборках
Задача.
Группа школьников ( n  10 ) в течение летних каникул находилась в спортивном лагере.
До и после сезона у них измерили жизненную емкость легких (признак X ).
До «эксперимента» ( x i , мл):
3400, 3600, 3000, 3500, 2900, 3100, 3200, 3400, 3200, 3400.
После «эксперимента» ( y i , мл):
3800, 3700,3300, 3600, 3100, 3200, 3200, 3300, 3500, 3600.
По результатам измерений нужно определить, значимо ли изменился этот показатель под
влиянием интенсивных физических упражнений.
Решение.
Вычислим средние значения жизненной емкости легких школьников
до эксперимента
x
3400  3600  3000  3500  2900  3100  3200  3400  3200  3400
 3270
10
и
после эксперимента
y
3800  3700  3300  3600  3100  3200  3200  3300  3500  3600
 3430 .
10
Как оказалось, средние значения двух зависимых выборок различаются.
Определим, значимо ли это различие.
Будем считать, что разности d i  xi  yi имеют нормальное распределение. Выдвигаем
нулевую гипотезу о равенстве средних значений жизненной емкости легких школьников
до и после спортивного сезона H 0 : x  y .
В качестве альтернативной возьмем двустороннюю гипотезу H 1 : x  y .
Выбираем уровень значимости   0,05 . Имеем две зависимые (связанные) выборки
объема n  10 .
Для удобства результаты вычислений проведем в таблице.
Расчетная таблица критерия t -Стьюдента для зависимых выборок
Значения признака
Разности связанных Квадраты
Номер
пар
результатов отклонений
до
после
школьн эксперимента
эксперимент измерений
d i2  ( xi  yi ) 2
ика
di  xi  yi
( xi )
а ( yi )
1
2
3
4
5
6
7
8
9
10
Сумма
Среднее
3400
3600
3000
3500
2900
3100
3200
3400
3200
3400
32700
3800
3700
3300
3600
3100
3200
3200
3300
3500
3600
34300
— 400
— 100
— 300
— 100
— 200
— 100
100
— 300
— 200
— 1600
х  3270
y  3430
1 n
d    di  160
n
i 1
1600
10000
90000
10000
40000
10000
10000
90000
40000
460000

Вычислим среднее арифметическое разностей d i :
1 n
1
d    d i    400  100  300  100  200  100  0  100  300  200  160 .
n
10
i 1
Теперь вычислим для разностей d i «исправленную» выборочную дисперсию (так как
n
1
2
 d 2  (d ) 2 , получим:
объем выборки меньше 30) по формуле S 
d n 1  i
i 1
1
S 2    400 2  100 2  300 2  100 2  200 2  100 2  0  100 2  300 2  200 2   (160) 2 
d 9 

 25511,11.
Тогда выборочное среднее квадратическое отклонение равно S d 
и эмпирическое значение t -критерия:
t эмп 
25511,11  159,72
d
 160
 n
 10  3,17 .
Sd
159,72
Найдем критическое значение распределения Стьюдента t крит (0,05; 9)  2,262 для
уровня значимости
  0,05 и числа степеней свободы k  n  1  9 .
Так как альтернативная гипотеза H 1 : x  y  0 , то критическая область двусторонняя.
Строим ось значимости для t -критерия Стьюдента, на которой отмечаем значение
t эмп  3,17 .
Критическая
область
(различия значимы)
t эмп  3,17
Критическая
область
(различия значимы)
Область
допустимых
значений
t кр  2,262
t кр  2,262
t
Значение t эмп  2,238 попало в область допустимых значений, поэтому показатели
жизненной емкости легких школьников до и после спортивного лагеря значимо
различаются с достоверностью 0,95.
Контрольные вопросы
1. Опишите последовательность действий применения критерия Стьюдента для
зависимых выборок.
2. Каковы особенно применения критерия Стьюдента для зависимых выборок

Если можно установить гомоморфную пару (то есть, когда одному случаю из выборки X соответствует один и только один случай из выборки Y и наоборот) для каждого случая в двух выборках (и это основание взаимосвязи является важным для измеряемого на выборках признака), такие выборки называются зависимыми. Примеры зависимых выборок: пары близнецов, два измерения какого-либо признака до и после экспериментального воздействия, мужья и жёны и т. п. В случае, если такая взаимосвязь между выборками отсутствует, то эти выборки считаются независимыми, например: мужчины и женщины, психологи и математики. Соответственно, зависимые выборки всегда имеют одинаковый объём, а объём независимых может отличаться.

Нулевая гипотеза и Альтернативная гипотезы:

Первоначально гипотезу всегда можно сформулировать таким образом: между двумя генеральными совокупностями нет ожидаемого различия. Такая гипотеза называется нулевой гипотезой, или нуль-гипотезой. Обратное ей утверждение о том, что в действительности между генеральными совокупностями есть различие, называется альтернативной гипотезой, или альтернативой.

Нулевой (основной) называют выдвинутую гипотезу Н0. Конкурирую-щей (альтернативной) называют гипотезу Н1, которая противоречит нулевой.

27. Принципы проверки статистических гипотез, уровень значимости, параметрические и непараметрические критерии различия. Процедура принятия статистического вывода.

Общие принципы проверки статистических гипотез

Процедура проверки нулевой гипотезы в общем случае включает следующие этапы:

1. задается допустимая вероятность ошибки первого рода (Ркр=0,05)

2. выбирается статистика критерия (Т)

3. ищется область допустимых значений

4. по исходным данным вычисляется значение статистики Т

5. если Т (статистика критерия) принадлежит области принятия нулевой гипотезы, то нулевая гипотеза принимается (корректнее говоря, делается заключение, что исходные данные не противоречат нулевой гипотезе), а в противном случае нулевая гипотеза отвергается и принимается альтернативная гипотеза.

При проверке статистических гипотез возможны ошибки (ошибочные суждения) двух видов:

— можно отвергнуть нулевую гипотезу, когда она на самом деле верна (так называемая ошибка первого рода);

— можно принять нулевую гипотезу, когда она на самом деле не верна (так называемая ошибка второго рода)

Допустимая вероятность ошибки первого рода (Ркр) может быть равна 5% или 1% (0.05 или 0.01). Уровень значимости – это вероятность ошибки первого рода при принятии решения (вероятность ошибочного отклонения нулевой гипотезы).

Критерий различия называют параметрическим, если он основан на конкретном типе распределения генеральной совокупности (как правило, нормальном) или использует параметры этой совокупности (среднее, дисперсии и т. д.).Обратное – непараметрический. При нормальном распределении генеральной совокупности параметрические критерии обладают большей мощностью по сравнению с непараметрическими (способны с большей достоверностью отвергать нулевую гипотезу, если последняя не верна).

Однако, как показывает практика, подавляющее большинство данных, получаемых в психологических экспериментах, не распределены нормально, поэтому применение параметрических критериев при анализе результатов психологических исследований может привести к ошибкам в статистических выводах. В таком случае непараметрические критерии становятся более мощными, т. е. способными с большей достоверностью отвергать нулевую гипотезу.

Понравилась статья? Поделить с друзьями:
  • Как найти свой майл ру на телефоне
  • Как найти русскую девушку в москве
  • Как найти удаленный ватсап в телефоне самсунг
  • Как найти ивана охлобыстина
  • Как исправить осанку с помощью массажа