Как исправить среднее квадратическое отклонение

Автор статьи

Евгений Николаевич Беляев

Эксперт по предмету «Математика»

Задать вопрос автору статьи

Генеральная дисперсия

Пусть нам дана генеральная совокупность относительно случайной величины $X$. Для начала напомним следующее определение:

Определение 1

Генеральная совокупность — совокупность случайно отобранных объектов данного вида, над которыми проводят наблюдения с целью получения конкретных значений случайной величины, проводимых в неизменных условиях при изучении одной случайной величины данного вида.

Определение 2

Генеральная дисперсия — среднее арифметическое квадратов отклонений значений вариант генеральной совокупности от их среднего значения.

Пусть значения вариант $x_1, x_2,dots ,x_k$ имеют, соответственно, частоты $n_1, n_2,dots ,n_k$. Тогда генеральная дисперсия вычисляется по формуле:

Рассмотрим частный случай. Пусть все варианты $x_1, x_2,dots ,x_k$ различны. В этом случае $n_1, n_2,dots ,n_k=1$. Получаем, что в этом случае генеральная дисперсия вычисляется по формуле:

С этим понятием также связано понятие генерального среднего квадратического отклонения.

Определение 3

Генеральное среднее квадратическое отклонение — квадратный корень из генеральной дисперсии:

[{sigma }_г=sqrt{D_г}]

Выборочная дисперсия

Пусть нам дана выборочная совокупность относительно случайной величины $X$. Для начала напомним следующее определение:

Определение 4

Выборочная совокупность — часть отобранных объектов из генеральной совокупности.

Определение 5

Выборочная дисперсия — среднее арифметическое значений вариант выборочной совокупности.

«Дисперсия: генеральная, выборочная, исправленная» 👇

Пусть значения вариант $x_1, x_2,dots ,x_k$ имеют, соответственно, частоты $n_1, n_2,dots ,n_k$. Тогда выборочная дисперсия вычисляется по формуле:

Рассмотрим частный случай. Пусть все варианты $x_1, x_2,dots ,x_k$ различны. В этом случае $n_1, n_2,dots ,n_k=1$. Получаем, что в этом случае выборочная дисперсия вычисляется по формуле:

С этим понятием также связано понятие выборочного среднего квадратического отклонения.

Определение 6

Выборочное среднее квадратическое отклонение — квадратный корень из генеральной дисперсии:

[{sigma }_в=sqrt{D_в}]

Исправленная дисперсия

Для нахождения исправленной дисперсии $S^2$ необходимо умножить выборочную дисперсию на дробь $frac{n}{n-1}$, то есть

С этим понятием также связано понятие исправленного среднего квадратического отклонения, которое находится по формуле:

!!! В случае, когда значение вариант не являются дискретными, а представляют из себя интервалы, то в формулах для вычисления генеральной или выборочной дисперсий за значение $x_i$ принимается значение середины интервала, которому принадлежит $x_i.$

Пример задачи на нахождение дисперсии и среднего квадратического отклонения

Пример 1

Выборочная совокупность задана следующей таблицей распределения:

Рисунок 1.

Найдем для нее выборочную дисперсию, выборочное среднее квадратическое отклонение, исправленную дисперсию и исправленное среднее квадратическое отклонение.

Решение:

Для решения этой задачи для начала сделаем расчетную таблицу:

Рисунок 2.

Величина $overline{x_в}$ (среднее выборочное) в таблице находится по формуле:

[overline{x_в}=frac{sumlimits^k_{i=1}{x_in_i}}{n}]

То есть

[overline{x_в}=frac{sumlimits^k_{i=1}{x_in_i}}{n}=frac{305}{20}=15,25]

Найдем выборочную дисперсию по формуле:

[D_в=frac{sumlimits^k_{i=1}{{{(x}_i-overline{x_в})}^2n_i}}{n}=frac{523,75}{20}=26,1875]

Выборочное среднее квадратическое отклонение:

[{sigma }_в=sqrt{D_в}approx 5,12]

Исправленная дисперсия:

[{S^2=frac{n}{n-1}D}_в=frac{20}{19}cdot 26,1875approx 27,57]

Исправленное среднее квадратическое отклонение:

[S=sqrt{S^2}approx 5,25]

Находи статьи и создавай свой список литературы по ГОСТу

Поиск по теме

Определение.
Арифметическое
значение квад
ратного
корня из выборочной дисперсии называется
выборочным
средним квадратическим отклонением:

(10)

Исправленное
выборочное среднее квадратическое
отклонение

(11)

4. Мода.
Определение.
Модой М0
называют
значение
признака, которое имеет наибольшую
ча
стоту
(ni
= max).

Например, для
распределения, данного табл. 5, мода
равна 5.

5. Медиана.
Медианой
т
е
называют значение признака, которое
делит статистическое распределение на
две равные части:

me
=
xk+1,
если
n
=
2k+1,

me
=

,
если n=2k

6. Коэффициент
вариации.

Для сравнивания меры рассеяния значений
признаков около выборочной средней в
разных выборках служит коэффициент
вариации.

Определение.
Коэффициентом
вариации
V
на
зывается
отношение выборочного среднего
квадрати
ческого
отклонения к выборочной средней,
выраженное в процентах:

(12)

Пусть изучается
случайная величина X.
Из генеральной
совокупности сделана выборка объема п
со значениями
признака х1
х
2,…,
хn.
Предположим,
что х1,
х
2,…,хn
различны.
Их можно рассматривать как случайные
величины Х1,
Х
2,
…, Х
n,
имеющие то
же распределение, что и случайная
величина X,
и, следовательно,
одинаковые значения М(Х)
и
D(Х).
Тогда

Воспользовавшись
свойствами дисперсии находим

Пусть σ– средняя
квадратическая ошибка выборочной
средней. Тогда

Вывод. Средняя
квадратическая ошибка выборочной
средней σ(B)
в
раз меньше среднего квадратического
отклонения случайной величиныX,
возможные
значения которой попали в выборочную
совокупность.

1.6. Статистические оценки параметров распределения

Оценки
математического ожидания и дисперсии.

С понятием параметров
распределения мы познакомились в теории
вероятностей. Например, в нормальном
законе распределения, задаваемом
функцией плотности вероятности

параметрами служат
а
математическое ожидание и а
– среднее
квадратическое отклонение. В распределении
Пуассона параметром является число а
= пр.

Определение.
Статистической
оценкой неизвестного параметра
теоретического распределения называют
его приближенное значение, зависящее
от данных выборки
(х1,
х
2,
х
3,
…, хk;
п
1,
п
2,
п
3,…,
пk),
т. е. некоторую функцию этих величин.

Здесь х1,
х
2,
х
3,
…, хk
– значения признака, п1,
п
2,
п
3,…,
пk
–соответствующие частоты. Статистическая
оценка является случайной величиной.

Обозначим через
θ
– оцениваемый параметр, а через
θ*
– его статистическую оценку. Величину
|θ*–θ|
называют
точностью
оценки.
Чем
меньше |θ*–θ|,
тем лучше, точнее определен неизвестный
параметр.

Чтобы оценка θ*
имела практическое значение, она не
должна содержать систематической ошибки
и вместе с тем иметь возможно меньшую
дисперсию. Кроме того, при увеличении
объема выборки вероятность сколь угодно
малых отклонений |θ*–θ|
должна быть близка к 1.

Сформулируем
следующие определения.

  1. Оценка параметра
    называется несмещенной, если ее
    математическое ожидание
    М(θ*)
    равно
    оцениваемому параметру
    θ,
    т. е.

М(θ*)
= θ,
(1)

и смещенной, если

М(θ*)
θ, (2)

  1. Оценка θ*
    называется состоятельной, если при
    любом δ > 0

(3)

Равенство (3)
читается так: оценка θ*
сходится по вероятности к θ.

3. Оценка θ*
называется эффективной, если при заданном
п она имеет наименьшую дисперсию.

Теорема
1.
Выборочная
средняя Х
В
является несмещенной и состоятельной
оценкой математического ожидания.

Доказательство.
Пусть выборка репрезентативна, т. е..
все элементы генеральной совокупности
имеют одинаковую возможность попасть
в выборку. Значения признака х1,
х2,
х
3,…,хn
можно принять
за независимые случайные величины Х1,
Х
2,
Х
3, …,Хn
с одинаковыми
распределениями и числовыми
характеристиками, в том числе с равными
математическими ожиданиями, равными
а,

Так
как каждая из величин Х1,
Х
2,
Х
3,
,
Х
п
имеет
распределение,
совпадающее с распределением генеральной
совокупности, то М(Х)
= а.
Поэтому

Далее, на основании
закона больших чисел имеем

откуда следует,
что


состоятельная оценка М(Х).

Используя правило
исследования на экстремум, можно
доказать, что
является и эффективной оценкойМ(Х).

В качестве оценки
дисперсии изучаемого признака в
генеральной совокупности D(Х)
принимается
исправленная дисперсия.

Теорема
2.
Исправленная
выборочная дисперсия

является
несмещенной и состоятельной

оценкой
дисперсии
D(Х).

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

  • #
  • #
  • #
  • #
  • #
  • #
  • #
  • #
  • #
  • #
  • #

ЛЕКЦИЯ 13

ТЕМА: СТАТИСТИЧЕСКИЕ
ОЦЕНКИ ПАРАМЕТРОВ ВЫБОРКИ


1.
Точечные оценки параметров распределения.

1.1.
Генеральная средняя.

1.2.
Выборочная средняя.

1.3.
Генеральная дисперсия.

1.4.
Выборочная дисперсия.

1.5.
Исправленная дисперсия.


2.
Интервальные оценки параметров
распределения.

2.1.
Интервальные оценки параметров
нормального распределения.

2.1.1.
Доверительный интервал для оценки
математического ожидания при известном
s.

2.1.2.

Доверительный
интервал для оценки математического
ожидания при неизвестном
s.

2.1.3.
Доверительный интервал для оценки
дисперсии и среднего квадратического
отклонения.

2.2.
Интервальная оценка вероятности
биноминального распределения по
относительной частоте.

1.     
Точечные
оценки параметров распределения.

Пусть
требуется изучить количественный признак
генеральной совокупности. Допустим, что из
теоретических соображений удалось
установить, какое именно распределение
имеет признак. Возникает задача оценки
параметров, которыми определяется это
распределение.

Обычно
в распоряжении исследователя имеются лишь
данные выборки, полученные в результате
n
наблюдений (здесь и далее наблюдения
предполагаются независимыми). Через эти
данные и выражают оцениваемый параметр.
Рассматривая значения количественного
признака как независимые случайные
величины, можно сказать, что найти
статистическую оценку неизвестного
параметра теоретического распределения —
это значит найти функцию от наблюдаемых
случайных величин, которая и дает
приближенное значение оцениваемого
параметра.


Итак, статистической
оценкой неизвестного параметра
теоретического распределения называют
функцию от наблюдаемых случайных величин.

Для
того чтобы статистические оценки давали «хорошие»
приближения оцениваемых параметров, они
должны удовлетворять определенным
требованиям: оценка должна быть несмещенной,
эффективной и состоятельной.

Поясним
каждое из понятий.

 
Несмещенной
называют статистическую оценку
Q*, математическое ожидание которой
равно оцениваемому параметру
Q при любом объеме выборки, т. е.

M(Q*)
= Q.


Смещенной
называют оценку, математическое ожидание
которой не равно оцениваемому параметру.

 
Эффективной
называют статистическую оценку, которая (при
заданном объеме выборки п) имеет наименьшую 
возможную дисперсию.

При
рассмотрении выборок большого объема (
n велико!) к статистическим
оценкам предъявляется требование
состоятельности.

 
Состоятельной
называют статистическую оценку, которая
при

п
®¥
стремится по вероятности
к оцениваемому параметру. Например, если
дисперсия несмещенной оценки при
п
®¥
 стремится
к нулю, то такая оценка оказывается и
состоятельной.


Рассмотрим
точечные оценки параметров
распределения, т.е.

оценки, которые
определяются одним числом
Q*
=f( x1, x2,…,xn), где x1, x2,…,xn— выборка.

1.1.Генеральная средняя.

Пусть
изучается генеральная совокупность
относительно количественного признака Х.

 
Генеральной
средней называют среднее арифметическое
значений признака генеральной
совокупности.

Если все
значения признака различны, то


Если значения признака имеют частоты N1, N2, …, Nk, где N1 +N2+…+Nk= N, то


1.2.Выборочная средняя.

Пусть для
изучения генеральной совокупности
относительно количественного признака Х
извлечена выборка объема
n.

 
Выборочной
средней называют среднее арифметическое
значение признака выборочной совокупности.

Если
все значения признака выборки различны, то


если
же все значения имеют частоты
n1
, n2,…,nk, то


Выборочная
средняя является несмещенной и
состоятельной  оценкой
генеральной средней.

Замечание:
Если выборка представлена интервальным
вариационным рядом, то за
xi
принимают середины частичных интервалов.

 

1.3.
Генеральная дисперсия.

Для
того чтобы охарактеризовать рассеяние
значений количественного признака Х генеральной совокупности вокруг
своего среднего значения, вводят сводную
характеристику — генеральную дисперсию.

 
Генеральной
дисперсией

Dг
называют
среднее арифметическое квадратов
отклонений значений признака генеральной
совокупности от их среднего значения

.

Если
все значения признака генеральной
совокупности объема N
различны, то


Если
же значения признака имеют соответственно
частоты
N1, N2, …, Nk, где N1 +N2+…+Nk= N, то


Кроме
дисперсии для характеристики рассеяния зна­чений
признака генеральной совокупности вокруг
своего среднего значения пользуются
сводной характеристикой— средним
квадратическим отклонением.

 
Генеральным
средним квадратическим отклонением
(стандартом) называют квадратный корень из
генеральной дисперсии:


1.4.Выборочная
дисперсия.

Для
того, чтобы наблюдать рассеяние
количественного признака значений выборки
вокруг своего среднего значения , вводят
сводную характеристику- выборочную
дисперсию.

 
Выборочной дисперсией

называют
среднее арифметическое квадратов
отклонения наблюдаемых значений признака
от их среднего значения

.

Если все
значения признака выборки различны, то


 если же все значения имеют
частоты
n1, n2,…,nk, то



Для
характеристики рассеивания значений
признака выборки вокруг своего среднего
значения пользуются сводной
характеристикой — средним квадратическим
отклонением.

 
Выборочным средним
квадратическим отклоненим называют
квадратный корень из выборочной дисперсии:


Вычисление
дисперсии- выборочной или генеральной,
можно упростить, используя формулу:


Замечание:
если выборка представлена интервальным
вариационным рядом, то за
xi

принимают середины частичных интервалов.

1.5.Исправленная
дисперсия.

Выборочная
дисперсия является смещенной оценкой
генеральной дисперсии, т.е. математическое
ожидание выборочной дисперсии не равно
оцениваемой генеральной дисперсии, а равно

 

 
Для
исправления выборочной дисперсии
достаточно умножить ее на дробь



получим
исправленную
дисперсию
S2. Исправленная дисперсия
является несмещенной оценкой.

В
качестве оценки генеральной дисперсии
принимают исправленную дисперсию.

Для
оценки среднего квадратического
генеральной совокупности используют исправленное среднее
квадратическое отклонение


Замечание:
формулы для вычисления выборочной
дисперсии и исправленной дисперсии
отличаются только знаменателями. При
достаточно больших
n
выборочная и исправленная дисперсии мало
отличаются, поэтому на практике
исправленной дисперсией пользуются, если
n<30.

 Вычислим выборочные характеристики по
выборкам, рассмотренным в 
лекции 12 пункт 3.1.(дискретный вариационный
ряд и пункт 3.2.(интервальный вариационный
ряд).

Пример
1. Для
дискретного вариационного ряда:

Среднее
выборочное

 

Выборочная
дисперсия

 

Выборочное
среднее квадратическое отклонение


Исправленная
дисперсия


Пример2.
Для интервального вариационного ряда:

За  хi примем середины частичных
интервалов:

 

Для
вычисления выборочной дисперсии
воспользуемся формулой

 



Выборочное
среднее квадратическое отклонение :

2.     
Интервальные
оценки параметров распределения.

 
Интервальной
называют оценку, которая определяется
двумя числами—концами интервала.
Интервальные оценки позволяют установить
точность и надежность оценок .

Пусть найденная по данным
выборки статистическая характеристика
Q* служит оценкой
неизвестного пара­метра Q. Будем считать Q
постоянным числом (Q может быть и случайной
величиной). Ясно, что Q* тем точнее
определяет параметр Q, чем меньше
абсолютная величина разности |
Q

Q*|. Другими словами, если
d>0
и |Q- Q*| <
d , то чем
меньше

d

, тем оценка точнее.

 
Таким
образом, положительное число
d
характеризует
точность оценки.

Однако статистические
методы не позволяют категорически
утверждать, что оценка
Q*
удовлетворяет неравенству |Q- Q*| <
d;
можно лишь говорить о
вероятности
g,
с которой это неравенство
осуществляется.

 
Надежностью
(доверительной вероятностью)

оценки
называют вероятность
g , с
которой осуществляется неравенство |
QQ*
| <
d .

Обычно
надежность оценки задается наперед, причем
в качестве
g берут
число, близкое к единице. Наиболее часто
задают
надежность,
равную 0,95; 0,99 и 0,999.

Пусть
вероятность того, что,
|Q- Q*| <
d равна g:

P(|Q-
Q*| <
d)= g.

Заменив
неравенство равносильным ему двойным
неравенством получим:

Р [Q* —d< Q < Q* +d] = g

  Это соотношение следует понимать
так: вероятность того, что интервал Q*
d<
Q
< Q* +
d заключает
в себе (покрывает) неизвестный параметр Q,
равна
g.

 
Интервал (Q* — d
Q* +
d) называется
доверительным интервалом , который
покрывает неизвестный параметр с
надежностью
g
.

2.1.Интервальные
оценки параметров нормального
распределения.

2.1.1.
Доверительный интервал для оценки
математического ожидания при известном

s.

Пусть количественный признак
генеральной совокупности распределен
нормально. Известно среднее квадратическое
отклонение  этого
распределения
s. Требуется
оценить математическое ожидание а
по выборочной средней. Найдем
доверительный интервал, покрывающий а
с надежностью
g.
Выборочную среднюю будем
рассматривать как случайную величину ( она
изменяется от выборки  к
выборке), выборочные значения признака- как
одинаково распределенные независимые СВ с
математическим ожиданием каждой а
и средним квадратическим отклонением
s. Примем
без доказательства, что если величина Х
распределена нормально, то и выборочная
средняя тоже распределена нормально с
параметрами



.

Потребуем,
чтобы выполнялось равенство



 


Заменив
Х и
s, получим

 

получим


Задача
решена.  Число
t
находят по таблице функции Лапласа Ф(х).

Пример1.
СВХ распределена нормально и
s
=3. Найти доверительный
интервал для оценки математического
ожидания по выборочным средним, если
n
= 36 и задана надежность
g
=0,95.

Из
соотношения 2Ф(
t)= 0,95 ,
откуда Ф(t) = 0,475 по таблице 
найдем
t
:
t
=1,96. Точность оценки

Доверительный
интервал

 

.

Пример2.
Найти минимальный объем выборки, который
обеспечивает заданную точность
d =0,3 и
надежность
g = 0,975, если
СВХ распределена нормально и
s =1,2.

                                           
Из равенства



 

                                          
выразим
n:



,

подставим
значения и получим минимльный объем
выборки  
n ~
81.

2.1.2.
Доверительный интервал для оценки
математического ожидания при неизвестном

s
.

Т.к.
мы не знакомы с законами распределения СВ,
которые используются при
выводе
формулы, то примем ее без доказательства.

В
качестве неизвестного параметра


s
используют
исправленную дисперсию
s2

. Заменяя
s на
s, t на величину t
g.
Значение 
этой величины зависит от надежности

g и объема
выборки
n  и определяется 
по » Таблице значений
t
g.« 
Итак :



и
доверительный интервал имеет вид


Пример1.
Найти доверительный интервал для оценки
математического ожидания с надежностью 0,95,
если объем выборки
n =16, среднее выборочное и
исправленная дисперсия соответственно
равны 20,2 и 0,8.

По
таблице приложения найдем
tg
по заданной
надежности
g =0,95 и n=
16:
tg
=2,13. Подставим
в формулу
s =0,8 и
t
g
=2,13
, вычислим границы доверительного интевала:



,

откуда
получим доверительный интервал (19,774; 20,626)

Смысл
полученного результата: если взять 100
различных выборок, то в 95 из них
математическое ожидание будет находится в
пределах данного интервала, а в 5 из них- нет.

Пример2.
Измеряют диаметры 25 корпусов
электродвигателей. Получены выборочные
характеристики

 

 

Необходимо
найти вероятность

(надежность) того, что




является доверительным интервалом оценки
математического ожидания при нормальном
распределении.

Из
условия задачи найдем точность
d,
составив и решив систему:


           
     Откуда
d =10.         
Из
равенства 


 

                                               
        
выразим
 



,

откуда
tg =3,125.
По таблице для найденного

tg  и
n=
25 находим
g
=0,99.

2.1.3.
Доверительный интервал для оценки
дисперсии и среднего квадратического
отклонения.

Требуется
оценить неизвестную генеральную дисперсию
и генеральное среднее квадратическое
отклонение по исправленной дисперсии, т.е.
найти доверительные интервалы, покрывающие
параметры
D
и s с заданной надежностью
g.

Потребуем
выполнения соотношения


.

Раскроем
модуль и получим двойное неравенство:


.

Преобразуем:



.

Обозначим
d/s
= q
(величина
q

находится по  «Таблице значений q»и зависит
от надежности и объема
выборки)
,
тогда д
оверительный
интервал для оценки генерального среднего
квадратического отклонения имеет вид:



.

Замечание
: Так как
s >0, то
если
q
>1 , левая граница интервала равна 0:
  
               

 0<
s
<
s ( 1 + q ).

Пример1. 
По выборке объема
n
= 25 найдено «исправленное» среднее
квадратическое отклонение
s
=
0,8.  Найти
доверительный интервал, покрывающий
генеральное
среднее квадратическое отклонение с
надежностью 0,95.

По
таблице приложения по данным :
g
= 0,95;
n =25 ,
находим
q
= 0,32.

Искомый
доверительный интервал 0,8(1- 0,32)<
s
< 0,8(1+ 0,32) или 
0,544
<
s
<0,056.

Пример2.
По выборке объема
n = 10
найдено
s = 0,16. Найти доверительный
интервал, покрывающий генеральное среднее
квадратическое отклонение с надежностью
0,999.

q( n=10, g
=0,999) =
1,8>0.

Искомый
доверительный интервал 
0<
s <0,16(1+1,8)  или  0<
s <0,448.

Так
как дисперсия есть квадрат среднего
квадратического отклонения, то
доверительный интервал, покрывающий
генеральную дисперсию с заданной
надежностью
g, имеет вид:


2.2.
Интервальная оценка
вероятности биноминального распределения
по относительной частоте.

Найдем
доверительный интервал для оценки
вероятности по относительной частоте,
используя формулу:

 

Если
n
достаточно велико и р не очень близка к нулю
и единице, то можно считать, что
относительная частота распределена
приближенно по нормальному закону, причем
М(
W)= р.
Заменив Х на относительную частоту ,
математическое ожидание — на вероятность,
получим равенство:



Приступим к
построению доверительного интервала (р1,
р2), который с надежностью
g
 покрывает
оцениваемый параметр р
Потребуем, чтобы с надежностью
g
выполнялось соотношение указанное выше
равенство:

                                                         
Заменив



,

                                   
получим:

Таким образом,
с надежностью
g выполняется
неравенство (чтобы получить рабочую
формулу, случайную величину
W
заменим неслучайной наблюдаемой
относительной частотой
w
и подставим 1- р
вместо
q):


Учитывая,
что вероятность р
неизвестна, решим это неравенство
относительно р.
Допустим, что w > р. Тогда


Обе
части неравенства положительны; возведя
их в квадрат, получим равносильное
квадратное неравенство относительно р:


Дискриминант
трехчлена положительный, поэтому корни
действительные и различные:

меньший
корень


больший
корень:

 

 Замечание1:
При больших значениях
n
, пренебрегая слагаемыми



                                                                    
учитывая


получим
приближенные формулы для границ
доверительного интервала :



  







Пример1.
Производят независимые испытания с
одинаковой и неизвестной вероятностью
появления события А в каждом испытании.
Найти доверительный интервал для оценки
вероятности с надежностью 0,95, если в 80
испытаниях событие А появилось 16 раз.

По
условию
n =80, m
=16,
g =0,95. Относительная
частота

 

.

Из
соотношения Ф(
t)=0,95/2
= 0,475 по таблице находим
t = 1,96. Т.к. n<100, 
то используем точные формулы, получим :
р1= 0,128, р2= 0,299.

 Замечание 2: Если n
мало, то используем для определения концов
доверительного интервала вероятности
события при биноминальном распределении
«Таблицу доверительных границ р1 и р2«. Значения р1 и р2
находят в зависимости от
n
и
m.

Пример.
В пяти независимых испытаниях событие А
произошло 3 раза. Найти с надежностью 0,95
интервальную оценку для вероятности
события А в единичном испытании.

По
условию задачи
n=5, m=3.
Имеет место схема повторных испытаний.
Используя таблицу, находим доверительный
интервал : 0,147<
p<0,947.

Контрольные
вопросы


1.     
Определение статистической оценки
неизвестного параметра.

2.     
Какая оценка называется точечной?

3.     
Каким требованиям должны удовлетворять
статистические оценки?

4.     
Сформулировать определения
генеральной средней и генеральной
дисперсии.

5.     
Записать выражения для вычисления
выборочной средней, выборочной дисперсии и
исправленной дисперсии. Какая из этих
оценок не является несмещенной?

6.     
Методики вычисления границ
доверительного интервала 
для оценки математического ожидания
нормально распределенной СВ при известном
и неизвестном

s.

7.     
Методика вычисления границ
доверительного интервала для оценки
среднего квадратического отклонения
нормально распределенной СВ.

8.     
Доверительный интервал вероятности
биноминального распределения по
относительной частоте при больших
n , при n<100.

Несмещенная оценка выборочной дисперсии

Краткая теория


Пусть из генеральной совокупности в результате

 независимых наблюдений над количественным
признаком

 извлечена повторная выборка объема

:

При этом

Требуется по данным выборки оценить (приближенно найти) неизвестную
генеральную дисперсию

.
Если в качестве оценки генеральной дисперсии принять выборочную дисперсию, то
эта оценка будет приводить в систематическим ошибкам, давая заниженное значение
генеральной дисперсии. Объясняется это тем, что, как можно доказать, выборочная
дисперсия является смещенной оценкой

,
другими словами, математическое ожидание выборочной дисперсии не равно
оцениваемой генеральной дисперсии, а равно:

Легко «исправить» выборочную дисперсию так, чтобы ее математическое
ожидание было равно генеральной дисперсии. Достаточно для этого умножить

 на дробь

.
Сделав это, получим исправленную дисперсию, которую обычно обозначают через

:

Исправленная дисперсия является, конечно, несмещенной оценкой
генеральной дисперсии. Действительно:

Итак, в качестве оценки генеральной дисперсии принимают
исправленную дисперсию:

Для оценки среднего квадратического
отклонения генеральной совокупности используют исправленное среднее квадратическое отклонение, которое равно квадратному корню
из исправленной дисперсии:

При достаточно больших значениях

 объема выборки выборочная и исправленная
дисперсия отличаются мало. На практике используются исправленной дисперсией,
если примерно

.

Пример решения задачи


Задача

Найти
несмещенную выборочную дисперсию на основании данного распределения выборки.

Решение

На сайте можно заказать решение контрольной или самостоятельной работы, домашнего задания, отдельных задач. Для этого вам нужно только связаться со мной:

ВКонтакте
WhatsApp
Telegram

Мгновенная связь в любое время и на любом этапе заказа. Общение без посредников. Удобная и быстрая оплата переводом на карту СберБанка. Опыт работы более 25 лет.

Подробное решение в электронном виде (docx, pdf) получите точно в срок или раньше.

Выборочная дисперсия является смещенной оценкой генеральной дисперсии, поэтому в статистике применяют также исправленную выборочную дисперсию, которая является несмещенной оценкой генеральной дисперсии.

Сумма
частот:

Вычислим
среднюю:

Средняя квадратов:

Несмещенная
выборочная дисперсия:

Ответ:

Кроме этой задачи на другой странице сайта есть

пример расчета исправленной выборочной дисперсии и среднего квадратического отклонения для интервального вариационного ряда

Из предыдущей статьи мы узнали о таких показателях, как размах вариации, межквартильный размах и среднее линейное отклонение. В этой статье изучим дисперсию, среднеквадратичное отклонение и коэффициент вариации.

Дисперсия

Дисперсия случайной величины – это один из основных показателей в статистике. Он отражает меру разброса данных вокруг средней арифметической.

Сейчас небольшой экскурс в теорию вероятностей, которая лежит в основе математической статистики. Как и матожидание, дисперсия является важной характеристикой случайной величины. Если матожидание отражает центр случайной величины, то дисперсия дает характеристику разброса данных вокруг центра.

Формула дисперсии в теории вероятностей имеет вид:

Формула дисперсии в теории вероятностей

То есть дисперсия — это математическое ожидание отклонений от математического ожидания.

На практике при анализе выборок математическое ожидание, как правило, не известно. Поэтому вместо него используют оценку – среднее арифметическое. Расчет дисперсии производят по формуле:

Дисперсия во выборке

где

s2 – выборочная дисперсия, рассчитанная по данным наблюдений,

X – отдельные значения,

– среднее арифметическое по выборке.

Стоит отметить, что у такого расчета дисперсии есть недостаток – она получается смещенной, т.е. ее математическое ожидание не равно истинному значению дисперсии. Подробней об этом здесь. Однако при увеличении объема выборки она все-таки приближается к своему теоретическому аналогу, т.е. является асимптотически не смещенной.

Простыми словами дисперсия – это средний квадрат отклонений. То есть вначале рассчитывается среднее значение, затем берется разница между каждым исходным и средним значением, возводится в квадрат, складывается и затем делится на количество значений в данной совокупности. Разница между отдельным значением и средней отражает меру отклонения. В квадрат возводится для того, чтобы все отклонения стали исключительно положительными числами и чтобы избежать взаимоуничтожения положительных и отрицательных отклонений при их суммировании. Затем, имея квадраты отклонений, просто рассчитываем среднюю арифметическую. Средний – квадрат – отклонений. Отклонения возводятся в квадрат, и считается средняя. Теперь вы знаете, как найти дисперсию.

Генеральную и выборочную дисперсии легко рассчитать в Excel. Есть специальные функции: ДИСП.Г и ДИСП.В соответственно.

Функции Excel для расчета дисперсии

В чистом виде дисперсия не используется. Это вспомогательный показатель, который нужен в других расчетах. Например, в проверке статистических гипотез или расчете коэффициентов корреляции. Отсюда неплохо бы знать математические свойства дисперсии.

Свойства дисперсии

Свойство 1. Дисперсия постоянной величины A равна 0 (нулю).

D(A) = 0

Свойство 2. Если случайную величину умножить на постоянную А, то дисперсия этой случайной величины увеличится в А2 раз. Другими словами, постоянный множитель можно вынести за знак дисперсии, возведя его в квадрат.

D(AX) = А2 D(X)

Свойство 3. Если к случайной величине добавить (или отнять) постоянную А, то дисперсия останется неизменной.

D(A + X) = D(X)

Свойство 4. Если случайные величины X и Y независимы, то дисперсия их суммы равна сумме их дисперсий.

D(X+Y) = D(X) + D(Y)

Свойство 5. Если случайные величины X и Y независимы, то дисперсия их разницы также равна сумме дисперсий.

D(X-Y) = D(X) + D(Y)

Среднеквадратичное (стандартное) отклонение

Если из дисперсии извлечь квадратный корень, получится среднеквадратичное (стандартное) отклонение (сокращенно СКО). Встречается название среднее квадратичное отклонение и сигма (от названия греческой буквы). Общая формула стандартного отклонения в математике следующая:

Среднеквадратичное отклонение

На практике формула стандартного отклонения следующая:

Среднеквадратичное отклонение по генеральной совокупности

Как и с дисперсией, есть и немного другой вариант расчета. Но с ростом выборки разница исчезает.

Расчет cреднеквадратичного (стандартного) отклонения в Excel

Для расчета стандартного отклонения достаточно из дисперсии извлечь квадратный корень. Но в Excel есть и готовые функции: СТАНДОТКЛОН.Г и СТАНДОТКЛОН.В (по генеральной и выборочной совокупности соответственно).

Среднеквадратичное (стандартное) отклонение в Excel

Среднеквадратичное отклонение имеет те же единицы измерения, что и анализируемый показатель, поэтому является сопоставимым с исходными данными.

Коэффициент вариации

Значение стандартного отклонения зависит от масштаба самих данных, что не позволяет сравнивать вариабельность разных выборках. Чтобы устранить влияние масштаба, необходимо рассчитать коэффициент вариации по формуле:

Формула коэффициента вариации

По нему можно сравнивать однородность явлений даже с разным масштабом данных. В статистике принято, что, если значение коэффициента вариации менее 33%, то совокупность считается однородной, если больше 33%, то – неоднородной. В реальности, если коэффициент вариации превышает 33%, то специально ничего делать по этому поводу не нужно. Это информация для общего представления. В общем коэффициент вариации используют для оценки относительного разброса данных в выборке.

Расчет коэффициента вариации в Excel

Расчет коэффициента вариации в Excel также производится делением стандартного отклонения на среднее арифметическое:

=СТАНДОТКЛОН.В()/СРЗНАЧ()

Коэффициент вариации обычно выражается в процентах, поэтому ячейке с формулой можно присвоить процентный формат:

Процентный формат

Коэффициент осцилляции

Еще один показатель разброса данных на сегодня – коэффициент осцилляции. Это соотношение размаха вариации (разницы между максимальным и минимальным значением) к средней. Готовой формулы Excel нет, поэтому придется скомпоновать три функции: МАКС, МИН, СРЗНАЧ.

Коэффициент осцилляции в Excel

Коэффициент осцилляции показывает степень размаха вариации относительно средней, что также можно использовать для сравнения различных наборов данных.

Таким образом, в статистическом анализе существует система показателей, отражающих разброс или однородность данных. 

Ниже видео о том, как посчитать коэффициент вариации, дисперсию, стандартное (среднеквадратичное) отклонение и другие показатели вариации в Excel.

Поделиться в социальных сетях:

Понравилась статья? Поделить с друзьями:
  • Как найти инфоповоды журналисту
  • Как найти лицензиара радмир
  • Как найти процент ндс в том числе
  • Слишком острая еда как исправить
  • Ошибки в реестре windows 10 как исправить программа