Как найти оценку точности

Чаще всего оценки делятся на два вида: точечная оценка и интервальная оценка.

Определение 1

Точечная оценка — оценка, которая определяется одним числом.

В математической статистике, при оценке различных совокупностей чаще сего используется интервальная оценка.

Определение 2

Интервальная оценка — оценка, которая определяется двумя числами, которые являются концами интервала.

Для понятия интервальной оценки используются параметры точности и надежности оценки.

Определение 3

Точность оценки — положительное число $delta >0$, характеризующие величину расхождения между оценками выборки и генеральной совокупности, а именно:

[left|Q-Q^*right|1.]

Определение 4

Надежность или доверительная вероятность оценки $Q по Q^*$ — вероятность $gamma $, удовлетворяющее равенству:

[Pleft(Q^*-delta

Чаще всего надежность имеет значения $0,95, 0,99 и 0,999$, то есть значения, близкие к единице.

Доверительный интервал

Определение 5

Доверительный интервал — интервал $(Q^*-delta ,Q^*+delta )$, который покрывает неизвестную величину $Q$ c надежностью $gamma $, то есть $Q^*-delta

Понятие доверительного интервала существует для оценки многих параметров выборки: математического ожидания, среднего квадратического отклонения, дисперсии

В данной статье мы не будем вдаваться в подробности вывода формул для нахождения доверительных интервалов.

  • Доверительный интервал для оценки математического ожидания при заданном среднем квадратическом отклонении $sigma $.

[left(overline{x}-frac{sigma t}{sqrt{n}};overline{x}+frac{sigma t}{sqrt{n}}right)]

где $t$ находится из равенства $2Фleft(tright)=gamma $.

  • Доверительный интервал для оценки математического ожидания при неизвестном среднем квадратическом отклонении $sigma $.

[left(overline{x}-frac{St}{sqrt{n}},overline{x}+frac{St}{sqrt{n}}right)]

  • Доверительный интервал для оценки среднего квадратического отклонения.

[left(Sleft(1-qright),Sleft(1+qright)right), при q1.]

  • Доверительный интервал для оценки дисперсии.

[left(S^2left(1-qright),S^2left(1+qright)right), при q1.]

В последних двух пунктах $q$ имеет табличное значение (таблица 1).

Значения величины $q$.

Рисунок 1. Значения величины $q$.

Пример задачи на нахождения доверительных интервалов

Пример 1

Пусть величина $X$ имеет нормальное распределение с дисперсией $sigma =2$ и исправленным среднем квадратическим отклонением $S=1,8$. Пусть объем выборки $n=25$, а надежность равна $gamma =0,99$.

Найти:1) доверительный интервал для оценки математического ожидания.

2) доверительный интервал для оценки среднего квадратического отклонения.

3) доверительный интервал для оценки дисперсии.

Решение:

1) Для нахождения доверительного интервала для оценки математического ожидания необходимо найти интервал вида

[left(overline{x}-frac{sigma t}{sqrt{n}};overline{x}+frac{sigma t}{sqrt{n}}right)]

Параметр $t$ найдем из формулы

[2Фleft(tright)=gamma ]

Откуда

[Фleft(tright)=frac{gamma }{2}=frac{0,99}{2}=0,495]

Из таблицы значений функции Лапласа получим, что $t=2,6$.

Имеем интервал:

[left(overline{x}-frac{4,6}{sqrt{25}};overline{x}+frac{4,6}{sqrt{25}}right)=left(overline{x}-0,92;overline{x}+0,92right)]

2) Для начала найдем значение величины $q$. Так как $n=25$ и $gamma =0,99$, то из таблицы 1, получим, что $q=0,49$.

Видим, что $q
[left(Sleft(1-qright),Sleft(1+qright)right)] [left(1,8cdot 0,51;1,8cdot 1,49right)=(0,918;2,682)]

3) Так как, как было показано в пункте 2, $q
[left(S^2left(1-qright),S^2left(1+qright)right)]

end{enumerate}

Получим:

[left(1,6524;4,8276right)]

Точечной называют оценку, которая
определяется одним числом. Все оценки,
рассмотренные выше,- точечные. При
выборке малого объема точечная оценка
может значительно отличаться от
оцениваемого параметра, т. е. приводить
к грубым ошибкам. По этой причине при
небольшом объеме выборки следует
пользоваться интервальными оценками.

Интервальной называют
оценку, которая определяется двумя
числами — концами интервала. Интервальные
оценки позволяют установить точность
и надежность оценок (смысл этих понятий
выясняется ниже).

Пусть найденная по данным
выборки статистическая характеристика
Θ* служит оценкой неизвестного параметра
Θ. Будем считать Θ постоянным числом (Θ
может быть и случайной величиной). Ясно,
что Θ* тем точнее определяет параметр
Θ, чем меньше абсолютная величина
разности |Θ — Θ*|. Другими словами, если
δ>0
и |Θ — Θ*|<δ,
то чем меньше δ,
тем оценка точнее. Таким образом,
положительное число δ
характеризует точность
оценки.

Однако статистические
методы не позволяют категорически
утверждать, что оценка Θ * удовлетворяет
неравенству |Θ — Θ*|<δ;
можно лишь говорить о вероятности γ, с
которой это неравенство осуществляется.

Надежностью (доверительной
вероятностью
)
оценки Θ по Θ* называют
вероятность γ,
с которой осуществляется
неравенство |Θ — Θ*|<δ.
Обычно надежность оценки задается
наперед, причем в качестве γ берут число,
близкое к единице. Наиболее часто задают
надежность, равную 0,95; 0,99 и 0,999.

Пусть вероятность того, что
|Θ — Θ*|<δ,
равна γ:

Р[|Θ —
Θ*|<δ]=
γ.

Заменив неравенство |Θ —
Θ*|<δ
равносильным ему двойным неравенством

— Θ*< δ,
или Θ*- δ <Θ<
Θ* + δ,
имеем

Р[Θ* — δ
<Θ< Θ* + δ]
= γ.

Это соотношение следует
понимать так: вероятность того, что
интервал(Θ*-δ,
Θ*+δ)
заключает в себе (покрывает) неизвестный
параметр Θ, равна γ.

Доверительным называют
интервал (Θ*-δ,
Θ*+δ),
который покрывает неизвестный параметр
с заданной надежностью γ.

Замечание.
Интервал (Θ*-δ,
Θ*+δ)
имеет случайные концы (их называют
доверительными границами). Действительно,
в разных выборках получаются различные
значения Θ*. Следовательно, от выборки
к выборке будут изменяться и концы
доверительного интервала, т. е.
доверительные границы сами являются
случайными величинами — функциями от
х1,
x2,
…,
хn.

Так
как случайной величиной является не
оцениваемый параметр Θ, а доверительный
интервал, то более правильно говорить
не о вероятности попадания Θ в доверительный
интервал, а о вероятности того, что
доверительный интервал покроет Θ.

Метод доверительных интервалов разработал
американский статистик Ю. Нейман, исходя
из идей английского статистика Р. Фишера.

§ 15. Доверительные интервалы для оценки математического ожидания нормального распределения при известном σ

Пусть количественный признак
X
генеральной совокупности
распределен нормально, причем среднее
квадратическое отклонение σ
этого распределения известно. Требуется
оценить неизвестное математическое
ожидание а
по выборочной средней
.
Поставим своей задачей
найти доверительные интервалы, покрывающие
параметр а с
надежностью γ.

Будем рассматривать
выборочную среднюю

как случайную величину(изменяется от выборки к выборке) и
выборочные значения признаках1,
x2,
…,хn
— как одинаково распределенные независимые
случайные величины Х1,
Х
2,
…,Хn
(эти числа также
изменяются от выборки к выборке). Другими
словами, математическое ожидание каждой
из этих величин равно а
и среднее квадратическое
отклонение — σ.

Примем без доказательства,
что если случайная величина X
распределена нормально,
то выборочная средняя
,
найденная по
независимым наблюдениям, также
распределена нормально. Параметры
распределения

таковы (см. гл. VIII,
§ 9):

M()=a,

.

Потребуем, чтобы выполнялось соотношение

Р(
— а|
< δ)
=
γ,

где γ
— заданная
надежность.

Пользуясь формулой (см. гл.
XII,
§ 6)

Р(|Х-а|
< δ)
=
2Ф(δ/σ),

заменив X
на

и σ
на
,
получим

Р(|Х-а|)
)
= 2Ф(δ)
= 2Ф (t),

где t
=
δ
.

Найдя из последнего равенства


, можем написать

Р (|—а
| <
)
= 2Ф(t).

Приняв во внимание, что
вероятность P
задана и равна γ,
окончательно
имеем (чтобы получить рабочую формулу,
выборочную среднюю вновь обозначим
через
)

Смысл полученного соотношения
таков: с надежностью γ
можно утверждать,
что доверительный интервал (,
) покрывает неизвестный
параметр а;
точность оценки
.

Итак, поставленная выше
задача полностью решена. Укажем еще,
что число t
определяется из равенства 2Ф(t)
=
γ. или Ф(t)=
γ
/2;
по таблице функции
Лапласа (см. приложение 2) находят аргумент
t, которому
соответствует значение функции Лапласа,
равное γ /2.

Замечание
1.

Оценку
называют
классической. Из формулы
,
определяющей
точность классической оценки, можно
сделать следующие выводы:

1) при
возрастании объема выборки п
число
δ
убывает
и, следовательно, точность оценки
увеличивается;

2)
увеличение надежности оценки γ
=
2Ф(t)
приводит к увеличению t(Ф
(t)
— возрастающая функция), следовательно,
и к возрастанию δ;
другими словами, увеличение надежности
классической оценки влечет за собой
уменьшение ее точности.

Пример.
Случайная величина X
имеет
нормальное распределение с известным
средним квадратическим отклонением σ
= 3. Найти доверительные интервалы для
оценки неизвестного математического
ожидания а
по
выборочным средним
,
если
объем выборки n
= 36 и задана надежность оценки
γ= 0,95.

Решение.
Найдем
t.
Из
соотношения 2Ф(t)=0,95
получим Ф(t)
= 0,475. По таблице приложения 2 находим
t=1,96.

Найдем точность
оценки:

.

Доверительный
интервал таков: (-0,98;


+ 0,98). Например, если

= 4,1, то доверительный интервал имеет
следующие доверительные границы:


0,98
= 4,1- 0,98 = 3,12;
+
0,98 = 4,1 + 0,98 = 5,08.

Таким
образом, значения неизвестного параметра
а,
согласующиеся
с данными выборки, удовлетворяют
неравенству 3,12 < а
<
5,08.
Подчеркнем, что было бы ошибочным
написать Р(3,12
<
а < 5,08) = 0,95. Действительно, так как а

постоянная величина, то либо она заключена
в найденном интервале (тогда событие
3,12 < а
<
5,08
достоверно и его вероятность равна
единице), либо в нем не заключена (в
этом
случае событие 3,12 < а
<
5,08 невозможно и его вероятность равна
нулю). Другими словами, доверительную
вероятность не следует связывать с
оцениваемым параметром; она связана
лишь с границами доверительного
интервала, которые, как уже было указано,
изменяются от выборки к выборке.

Поясним
смысл, который имеет заданная надежность.
Надежность γ = 0,95 указывает, что если
произведено достаточно большое число
выборок, то 95% из них определяет такие
доверительные интервалы, в которых
параметр действительно заключен; лишь
в 5% случаев он может выйти за границы
доверительного интервала.

Замечание
2.

Если требуется оценить математическое
ожидание с наперед заданной точностью
δ
и
надежностью γ, то минимальный объем
выборки, который обеспечит эту точность,
находят по формуле

(следствие
равенства
).

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

  • #
  • #
  • #
  • #
  • #
  • #
  • #
  • #
  • #
  • #
  • #

Предложите, как улучшить StudyLib

(Для жалоб на нарушения авторских прав, используйте

другую форму
)

Ваш е-мэйл

Заполните, если хотите получить ответ

Оцените наш проект

1

2

3

4

5

Точность оценки, доверительная вероятность (надежность)

Точность
оценки, доверительная вероятность (надежность)

Доверительный интервал

При выборке малого объема следует пользоваться интервальными оценками
т.к. это позволяет избежать грубых ошибок, в отличие от точечных оценок.

Интервальной называют оценку, которая определяется двумя числами —
концами интервала, покрывающего оцениваемый параметр. Интервальные оценки
позволяют установить точность и надежность оценок.

Пусть найденная по данным выборки статистическая характеристика Q* служит оценкой неизвестного
параметра Q. Будем считать
Q постоянным числом (Q может быть и случайной величиной).
Ясно, что Q* тем точнее
определяет параметр в, чем меньше абсолютная величина разности |Q — Q* |. Другими словами, если d>0 и |Q — Q* | < d, то чем меньше d, тем оценка точнее. Таким образом, положительное число d характеризует точность оценки.

Однако статистические методы не позволяют категорически утверждать, что
оценка Q* удовлетворяет неравенству |Q — Q*|<d, можно лишь говорить о вероятности g, с которой это неравенство осуществляется.

Надежностью (доверительной вероятностью) оценки Q по Q* называют вероятность g, с которой осуществляется неравенство |Q — Q*|<d. Обычно надежность оценки задается наперед, причем в качестве g берут число, близкое к единице. Наиболее
часто задают надежность, равную 0,95; 0,99 и 0,999.

Пусть вероятность того, что |Q — Q*|<d, равна g т.е.

Р(|Q — Q*|<d)=g

Заменив неравенство |Q — Q*|<d равносильным ему двойным
неравенством -d<|Q — Q*|<d, или Q*- d<Q<Q*+d, имеем

Р(Q*- d< Q <Q*+d)=g.

Доверительным называют интервал (Q*- d, Q*+d), который покрывает неизвестный параметр Q с заданной надежностью g.

Доверительные интервалы для оценки математического ожидания нормального
распределения при известном s.

Интервальной
оценкой с надежностьюg
математического ожидания а нормально распределенного количественного признака Х
по выборочной средней `х
при известном среднем квадратическом отклонении s генеральной совокупности служит доверительный
интервал

`х — t(s/n^½) < a <
`х + t(s/n^½),

где t(s/n^½)=d — точность оценки, n —
объем выборки, t — значение
аргумента функции Лапласа Ф(t),
при котором Ф(t)=g/2.

Из равенства t(s/n^½)=d, можно сделать следующие выводы:

1.      при возрастании объема выборки n число d
убывает и, следовательно, точность оценки увеличивается;

2.      увеличение надежности оценки g = 2Ф(t)
приводит к увеличению t (Ф(t) — возрастающая функция),
следовательно, и к возрастанию d; другими словами, увеличение надежности классической оценки влечет за
собой уменьшение ее точности.

Пример. Случайная величина X
имеет нормальное распределение с известным средним квадратическим отклонением s=3. Найти доверительные интервалы для
оценки неизвестного математического ожидания a по выборочным средним х, если объем выборки n = 36 и задана надежность оценки g = 0,95.

Решение. Найдем t. Из
соотношения 2Ф(t) = 0,95 получим
Ф (t) = 0,475. По таблице находим t=1,96.

точность
доверительный интервал измерение

d=t(s/n^½)= ( 1 ,96 . 3)/ /36 = 0,98.

Доверительный интервал таков: (`х — 0,98; `х + 0,98). Например, если `х = 4,1, то доверительный интервал имеет следующие
доверительные границы:

`х — 0,98 = 4,1 — 0,98 = 3,12; `х + 0,98 = 4,1+ 0,98 = 5,08.

Таким образом, значения неизвестного параметра а, согласующиеся с данными
выборки, удовлетворяют неравенству 3,12 < а < 5,08. Подчеркнем, что было
бы ошибочным написать Р (3,12 < а < 5,08) = 0,95. Действительно, так как
а — постоянная величина, то либо она заключена в найденном интервале (тогда
событие 3,12 < а < 5,08 достоверно и его вероятность равна единице), либо
в нем не заключена (в этом случае событие 3,12 < а < 5,08 невозможно и
его вероятность равна нулю). Другими словами, доверительную вероятность не
следует связывать с оцениваемым параметром; она связана лишь с границами доверительного
интервала, которые, как уже было указано, изменяются от выборки к выборке.

Поясним смысл, который имеет заданная надежность. Надежность g= 0,95 указывает, что если
произведено достаточно большое число выборок, то 95% из них определяет такие
доверительные интервалы, в которых параметр действительно заключен; лишь в 5%
случаев он может выйти за границы доверительного интервала.

Если требуется оценить математическое ожидание с наперед заданной
точностью d и надежностью g, то минимальный объем выборки,
который обеспечит эту точность, находят по формуле

N=t^2s^2/d^2

Доверительные интервалы для оценки математического ожидания нормального
распределения при неизвестном s

Интервальной
оценкой с надежностьюg
математического ожидания а нормально распределенного количественного признака Х
по выборочной средней `х
при неизвестном среднем квадратическом отклонении s генеральной совокупности служит
доверительный интервал

`х — t(g)(s/n^½) < a < `х + t(g)(s/n^½),

где s -«исправленное» выборочное среднее
квадратическое отклонение, t(g) находят по таблице по заданным g и n.

Пример. Количественный признак X генеральной совокупности распределен нормально. По выборке объема n=16 найдены выборочная средняя `x = 20,2 и «исправленное» среднее
квадратическое отклонение s =
0,8. Оценить неизвестное математическое ожидание при помощи доверительного
интервала с надежностью 0,95.

Решение. Найдем t(g). Пользуясь таблицей, по g = 0,95 и n=16 находим t(g)=2,13.

Найдем доверительные границы:

`х — t(g)(s/n^½) = 20,2 — 2,13 *. 0 ,8/16^½ = 19,774

`х + t(g)(s/n^½) = 20,2 + 2,13 * 0 ,8/16^½ = 20,626

Итак, с надежностью 0,95 неизвестный параметр а заключен в доверительном
интервале 19,774 < а < 20,626

Оценка истинного значения измеряемой величины

Пусть производится n
независимых равноточных измерений некоторой физической величины, истинное
значение а которой неизвестно.

Будем рассматривать результаты отдельных измерений как случайные величины
Хl, Х2,…Хn. Эти величины независимы (измерения независимы). Имеют одно
и то же математическое ожидание а (истинное значение измеряемой величины),
одинаковые дисперсии s^2
(измерения равноточные) и распределены нормально (такое допущение
подтверждается опытом).

Пример. По данным девяти независимых равноточных измерений физической
величины найдены среднее арифметической результатов отдельных измерений `х = 42,319 и «исправленное» среднее
квадратическое отклонение s =
5,0. Требуется оценить истинное значение измеряемой величины с надежностью g = 0,95.

Решение. Истинное значение измеряемой величины равно ее математическому
ожиданию. Поэтому задача сводится к. оценке математического ожидания (при
неизвестном s) при помощи
доверительного интервала покрывающего а с заданной надежностью g = 0,95.

х — t(g)(s/n^½) < a < `х + t(g)(s/n^½)

Пользуясь таблицей, по у = 0,95 и л = 9 находим

Найдем точность оценки:

t(g)(s/n^½) = 2 ,31 * 5/9^½=3.85

Найдем доверительные границы:

`х — t(g)(s/n^½) = 42,319 — 3,85 =
38,469;

`х + t(g)(s/n^½) = 42,319 +3,85 = 46,169.

Итак, с надежностью 0,95 истинное значение измеряемой величины заключено
в доверительном интервале 38,469 < а < 46,169.

Доверительные интервалы для оценки среднего квадратического отклонения s нормального распределения.

Пусть количественный признак X генеральной совокупности распределен нормально. Требуется оценить
неизвестное генеральное среднее квадратическое отклонение s по «исправленному» выборочному
среднему квадратическому отклонению s. Для этого воспользуемся интервальной оценкой.

Интервальной оценкой (с надежностью g) среднего квадратического отклонения о нормально
распределенного количественного признака X по «исправленному» выборочному среднему квадратическому
отклонению s служит доверительный интервал

s (1 — q) < s < s (1 + q) (при q < 1),

< s< s (1 + q) (при q > 1),

где q находят по таблице по заданным n н g.

Пример 1. Количественный признак X генеральной совокупности распределен нормально. По выборке
объема n = 25 найдено «исправленное» среднее
квадратическое отклонение s =
0,8. Найти доверительный интервал, покрывающий генеральное среднее
квадратическое отклонение s с надежностью 0,95.

Решение. По таблице по данным g = 0,95 и n = 25 найдем q = 0,32.

Искомый доверительный интервал s (1 — q) < s < s (1 +
q) таков:

0,8(1- 0,32) < s
< 0,8(1+0,32), или 0,544 < s < 1,056.

Решение. По таблице приложения по данным g = 0,999 и n=10 найдем 17= 1,80 (q >
1). Искомый доверительный интервал таков:

< s < 0,16(1 +
1,80), или 0 < s
< 0,448.

Оценка
точности измерений

В теории ошибок принято точность измерений (точность прибора)
характеризовать с помощью среднего квадратического отклонения s случайных ошибок измерений. Для
оценки s используют «исправленной» среднее
квадратическое отклонение s.
Поскольку обычно результаты измерений взаимно независимы, имеют одно и то же
математическое ожидание (истинное значение измеряемой величины) и одинаковую
дисперсию (в случае равноточных измерений), то теория, изложенная в предыдущем
параграфе, применима для оценки точности измерений.

Пример. По 15 равноточным измерениям найдено «исправленное» среднее
квадратическое отклонение s =
0,12. Найти точность измерений с надежностью 0,99.

Решение. Точность измерений характеризуется средним квадратическим
отклонением s случайных
ошибок, поэтому задача сводится к отысканию доверительного интервала s (1 — q) < s
< s (1 + q) , покрывающего s с заданной надежностью 0,99

По таблице приложения по g = 0,99 и n=15 найдем q = 0,73.

Искомый доверительный интервал

,12(1- 0,73) < s
< 0,12(1+0,73), или 0.03 < s < 0,21.

Оценка вероятности (биномиального распределения) по относительной частоте

Интервальной оценкой (с надежностью g) неизвестной вероятности p биномиального распределения по относительной частоте w служит доверительный интервал (с
приближенными концами p1 и
р2)

p1 < p < p2,

где n — общее число испытаний; m — число появлений события; w — относительная частота, равная
отношению m/n; t — значение
аргумента функции Лапласа, при котором Ф(t) = g/2.

Замечание. При больших значениях n (порядка сотен) можно принять в качестве приближенных границ
доверительного интервала

Понравилась статья? Поделить с друзьями:
  • Как найти количество теплоты выделившееся при соударении
  • Как исправить свободные локти собаке
  • Ошибка при запуске приложения 0xc0000005 как исправить у меня нет таких ошибок
  • Как найти сайт геев бесплатно
  • Как найти среднюю кинетическую энергию вращательного движения