Как найти среднюю если известна дисперсия



4.6. Оценка генеральной средней по повторной и бесповторной выборкам

Итак, вникаем: пусть из нормально распределенной (или около того) генеральной совокупности

объёма  проведена выборка объёма  и по её результатам найдена выборочная средняя . Тогда доверительный интервал для оценки

генеральной средней  имеет вид:
,  где  («дельта» большая) – точность

оценки, которую также называют предельной ошибкойвыборки.

Точность оценки рассчитывается как произведение  – коэффициента доверия  на среднюю ошибкувыборки («мю»).

Если известна дисперсия генеральной совокупности , то коэффициент доверия  отыскивается из лапласовского соотношения , а средняя ошибка рассчитывается по формуле:
 – для бесповторной выборки или  – для повторной.

Если же генеральная дисперсия не известна, то в качестве её приближения используют исправленную выборочную дисперсию . В этом случае коэффициент доверия  определяют с помощью распределения Стьюдента, а при  можно использовать  соотношение . Средняя же ошибка рассчитывается по аналогичным формулам:
 – для бесповторной или  – для повторной выборки.

Напоминаю, что доверительная вероятность (надёжность)  задаётся наперёд и показывает, с какой вероятностью построенный

доверительный интервал  накрывает истинное

значение .

С конспектом отмучились, теперь задачи :)

Модифицируем задание Примера 19, а именно уточним способ отбора попугаев:

Пример 25

Известно, что генеральная совокупность распределена нормально со средним квадратическим отклонением . По результатам 4%-ной бесповторной выборки объёма , найдена выборочная средняя  (условно средний рост птицы).

1) Найти доверительный интервал для оценки генеральной средней   с надежностью .

2) Выборку какого объёма нужно организовать, чтобы уменьшить данный интервал в два раза?

Не решение даже, а целое исследование впереди, начинаем. Прежде всего, найдём объём генеральной

совокупности:
 попугаев, и на самом деле нам предстоит

ответить на следующий вопрос: а достаточно ли выборки объёма ? Или для качественного исследования роста попугаев нужно выбрать побольше

птиц?

1) Доверительный интервал для оценки генеральной средней составим по формуле:

, где  – точность оценки. В задачах данного типа у коэффициента доверия часто

опускают подстрочный индекс и пишут просто ,

однако я не буду следовать мейнстриму, т. к. эта «кастрация» ухудшает понимание.

По условию, нам известна генеральная дисперсия, поэтому коэффициент доверия найдём из

соотношения  . По таблице значений функции Лапласа либо на макете (пункт 1*) определяем, что этому значению функции соответствует аргумент .

Поскольку выборка бесповторная, то среднюю ошибку рассчитаем по

формуле:

Таким образом, точность оценки  и

соответствующий доверительный интервал:


 – с вероятностью  данный интервал накроет истинное значение генерального среднего

роста  попугая.

Теперь предположим, что нас не устраивает точность полученного результата. Хотелось бы уменьшить интервал. Или оставить

его таким же, но повысить доверительную вероятность. Этим вопросам и посвящён следующий пункт решения:

2) Выясним, сколько попугаев нужно взять, чтобы уменьшить полученный интервал в два раза. Иными словами, была точность

0,96, а мы хотим . При условии сохранения

доверительной вероятности необходимый объём выборки можно рассчитать по формуле , которая выводится из .
А нашей задаче:
 и обязательно проверочка:
, ч.т.п.

Таким образом, чтобы обеспечить точность  при

надёжности  нужно провести выборку объёмом

не менее 358 попугаев  (округлили в бОльшую сторону). В этом случае получится доверительный

интервал в два раза короче:

И внимание! Здесь нельзя использовать значение  предыдущего пункта! Почему? Потому что в новой выборке мы почти

наверняка получим НОВУЮ выборочную среднюю. Вот её-то и нужно будет подставить.

Осталось прикинуть, а не много ли это – 358 попугаев? Объём выборки составит:  от генеральной совокупности – ну, в принципе, сносно, хотя и многовато. Поэтому здесь

можно использовать другой подход: оставить точность оценки  прежней, но повысить доверительную вероятность до . В этом случае нужно найти новый коэффициент доверия  (из соотношения ) и решить уравнение , получив в качестве корня необходимый объём выборки . Желающие могут выполнить этот пункт самостоятельно, в результате

получается выборка в  попугаев или  генеральной совокупности. Что лучше, конечно, ведь измерить

линейкой 358 попугаев – задача хлопотная, они явно будут сопротивляться, а некоторые ещё и говорить нехорошие слова J.

Теперь распишем доверительный интервал  подробно:

и ответим вот на какой вопрос: а что будет, если генеральная совокупность великА или даже бесконечна? В

этом случае дробь  близкА к нулю, и мы получаем

интервал:
, который фигурировал в Примере 19. То есть по

умолчанию (когда не сказано, бесповторная выборка или нет), считают именно так.
Следует отметить, что полученный выше интервал соответствует повторной выборке со

средней ошибкой , таким образом, при слишком

большом объёме  генеральной совокупности

математическое различие между бесповторной и повторной выборкой стирается.

Пришло время запланировать собственное статистическое исследование:

Пример 26

В результате многократных независимых измерений некоторой физической величины  в прошлом достаточно точно определена генеральная дисперсия  ед.; при этом средняя величина склонна изменениям (от исследования к

исследованию). Сколько измерений нужно осуществить, чтобы с вероятностью  заключить текущее истинное значение генеральной средней  в интервале длиной 0,5 ед. 

И это как раз только что описанный случай: данную выборку можно считать бесповторной, при этом ген. совокупность

теоретически бесконечна; либо повторной, так как округлённые результаты измерений могут повторяться.

Краткое решение в конце книги, числа можете выбрать по своему вкусу J. Но здесь есть одно «странное» значение . Оно не случайно и соответствует

правилу «трёх сигм», т. е.,

практически достоверным является тот факт, что построенный интервал накроет истинное значение .

Разумеется, на практике генеральная дисперсия чаще не известна, и поэтому за неимением лучшего, используют исправленную

выборочную дисперсию:

Пример 27

С целью изучения урожайности подсолнечника в колхозах области проведено 5%-ное выборочное обследование 100 га посевов,

отобранных в случайном порядке, в результате которого получены следующие данные:

С вероятностью 0,9974 определить предельную ошибку выборки и возможные границы, в которых ожидается средняя

урожайность подсолнечника в области.

Решение: в условии не указан тип отбора, но исходя из логики исследования, положим, что он

бесповторный. Поскольку выборка 5%-ная, то объем генеральной совокупности (общая посевная площадь области)

составляет:
 гектаров – не знаю, насколько это

реалистично, оставим этот вопрос на совести автора задачи.

По условию, требуется найти предельную ошибку выборки (точность оценки) , где  –

коэффициент доверия, соответствующий доверительной вероятности , и коль скоро выборка бесповторна и генеральной дисперсии мы не знаем, то средняя ошибка рассчитывается по формуле . Далее нужно составить интервал , который с вероятностью 99,74% (практически достоверно) накроет генеральную среднюю  урожайность

подсолнечника по области.

И если с коэффициентом «тэ гаммовое» трудностей никаких, то коэффициент «мю» здесь трудовой – по той причине, что нам не

известна исправленная выборочная дисперсия. Ну что же, хороший повод освежить пройденный материал. Смотрим на таблицу

выше и приходим к выводу, что нам предложен интервальный вариационный ряд с

открытыми крайними интервалами. Поскольку длина частичного интервала составляет  га, то вопрос закрываем так: 11-13 и 19-21 га.

Находим середины  интервалов (переходим к

дискретному ряду), произведения  и их суммы:

Вычислим выборочную среднюю:  центнеров с гектара.

Выборочную дисперсию вычислим по формуле:
 и этим частенько пренебрегают, но я

призываю поправлять дисперсию:
 – мелочь, а приятно.

Теперь составляем доверительный интервал ,

 где .

Найдём коэффициент доверия .

Поскольку нам известна лишь исправленная выборочная дисперсия (а не генеральная), то правильнее использовать распределение

Стьюдента. Но, к сожалению, в таблице нет значений для , но зато есть расчётный макет (пункт 2б). Для заданной надёжности и количества степеней свободы  получаем .

Поскольку объём выборки , то можно использовать

нормальное распределение, и тут получается конфетка:
, какой способ выбрать – зависит от вашей

методички, и я так подозреваю, второй :). Но сейчас выберем первый.

Вычислим среднюю ошибку бесповторной выборки:
 ц/га, таким образом, предельная ошибка

составляет  ц/га, и искомый доверительный

интервал:

 (ц/га) – границы, в которых ожидается

средняя урожайность подсолнечника в области с вероятностью  (практически достоверно).

Ответ:  ц/га,        (ц/га)

В рассмотренной задаче можно поставить вопросы, аналогичные Примеру 25, а именно попытаться улучшить исследование, в

частности, уменьшить точность оценки . В этом

случае для определения необходимого объема выборки используется та же формула , но она менее достоверна, поскольку в разных выборках мы будем получать разные значения

. Такие задачи, однако, встречаются, будьте

готовы. Да, и аналогичная формула для повторной выборки: .

Пример 28

По результатам 10%-ной бесповторной выборки объёма , найдены выборочная средняя  и дисперсия .

а) Найти пределы, за которые с доверительной вероятностью 0,954 не выйдет среднее значение генеральной совокупности.
б) Найти эти пределы, если выборка повторная. Какой способ точнее?

Значение 0,954 обусловлено тем, что автор задачи пощадил студентов, в методичке используется функция Лапласа и получается целое значение .

Решаем самостоятельно!

4.7. Оценка генеральной доли

4.5. Повторная и бесповторная выборка

| Оглавление |



Дисперсия признака равна 10, средний квадрат индивидуальных его значений – 130. Чему равна средняя?

Решение:

По условию задачи:

Дисперсия и средний квадрат индивидуальных значений

Так как дисперсию можно найти как разность среднего квадрата индивидуальных значений признака и квадрата средней величины:

Формула дисперсии

Отсюда средняя будет равна:

Расчёт средней

Как найти среднюю и дисперсию

Вычисление среднего показателя – один из наиболее распространенных приемов обобщения. Средний показатель отражает все общее, что характерно для признаков совокупности. Но в то же время он игнорирует различия отдельных ее единиц.

Как найти среднюю и дисперсию

Инструкция

Наиболее распространенной в расчетах является простая средняя величина. Ее вы можете легко найти, если имеется совокупность из двух и более статистических показателей, расположенных в произвольном порядке. Средняя арифметическая простая определяется как отношение суммы индивидуальных значений признака к количеству признаков в совокупности: Хср = ?хi/n.

Если объем совокупности большой и представляет собой ряд распределения, то при расчете необходимо использовать среднюю арифметическую взвешенную. Таким способом можно определить, например, среднюю цену за единицу продукции: общую стоимость продукции (произведение количества каждого ее вида на цену) делят на совокупный объем продукции: Хср = ?хi*fi/?fi. Иными словами средняя арифметическая взвешенная определяется как отношение суммы произведений значения признака и частоты повторения данного признака к сумме частот всех признаков. Она используется в случаях, когда варианты исследуемой совокупности встречаются неодинаковое число раз.

В некоторых случаях необходимо применять в расчетах среднюю гармоническую. Она используется, когда известны индивидуальные значения признака х и произведение fx, а значение f не известно: Хср = ?wi/?(wi/хi), где wi = хi*fi. Если индивидуальные значения признака встречаются по одному разу (все wi =1), применяется средняя гармоническая простая: Хср = N/?(wi/хi).

Дисперсию вы можете посчитать следующим образом: Д = ?(Х-Хср)^2/N, иными словами дисперсия – это средний квадрат отклонения от среднего арифметического значения. Существует еще один способ расчета данного показателя: Д = (Х^2)ср – (Хср)^2. Дисперсию трудно интерпретировать содержательно. Однако квадратный корень из нее характеризует стандартное отклонение. Он отражает среднее отклонение признака от среднего значения выборки.

Войти на сайт

или

Забыли пароль?
Еще не зарегистрированы?

This site is protected by reCAPTCHA and the Google Privacy Policy and Terms of Service apply.

Сейчас Вы научитесь находить числовые характеристики статистического распределения выборки. Примеры подобраны на основании индивидуальных заданий по теории вероятностей, которые задавали студентам ЛНУ им. И. Франка. Ответы послужат для студентов математических дисциплин хорошей инструкцией на экзаменах и тестах. Подобные решения точно используют в обучении экономисты , поскольку именно им задавали все что приведено ниже. ВУЗы Киева, Одессы, Харькова и других городов Украины имеют подобную систему обучения поэтому много полезного для себя должен взять каждый студент. Задачи различной тематики связаны между собой линками в конце статьи, поэтому можете найти то, что Вам нужно.

Индивидуальное задание 1
Вариант 11

Задача 1. Построить статистическое распределение выборки, записать эмпирическую функцию распределения и вычислить такие числовые характеристики:

  1. выборочное среднее;
  2. выборочную дисперсию;;
  3. подправленную дисперсию;
  4. выборочное среднее квадратичное отклонение;
  5. подправленное среднее квадратичное отклонение;
  6. размах выборки;
  7. медиану;
  8. моду;
  9. квантильное отклонение;
  10. коэффициент вариации;
  11. коэффициент асимметрии;
  12. эксцесс для выборки:

Выборка задана рядом 11, 9, 8, 7, 8, 11, 10, 9, 12, 7, 6, 11, 8, 7, 10, 9, 11, 8, 13, 8.

Решение:
Запишем выборку в виде вариационного ряда (в порядке возрастания):
6; 7; 7; 7; 8; 8; 8; 8; 8; 9; 9; 9; 10; 10; 11; 11; 11; 11; 12; 13.
Далее записываем статистическое распределение выборки в виде дискретного статистического распределения частот:

Эмпирическую функцию распределения определим по формуле

Здесь nx – количество элементов выборки которые меньше х. Используя таблицу и учитывая что объем выборки равен n = 20, запишем эмпирическую функцию распределения:

Далее вычислим числовые характеристики статистического распределения выборки.
Выборочное среднее вычисляем по формуле

Выборочную дисперсию находим по формуле


Выборочное среднее, что фигурирует в формуле дисперсии в квадрате найдено выше. Остается все подставить в формулу

Подправленную дисперсию вычисляем согласно формулы

Выборочное среднее квадратичное отклонение вычисляем по формуле

Подправленное среднее квадратичное отклонение вычисляем как корень из подправленной дисперсии

Размах выборки вычисляем как разность между наибольшим и наименьшим значениями вариант, то есть:

Медиану находим по 2 формулам:
если число n — четное;
если число n — нечетное.
Здесь берем индексы в xi согласно нумерации варианта в вариационном ряду.
В нашем случае n = 20, поэтому

Мода – это варианта которая в вариационном ряду случается чаще всего, то есть

Квантильное отклонение находят по формуле

где – первый квантиль, – третий квантиль.
Квантили получаем при разбивке вариационного ряда на 4 равные части.
Для заданного статистического распределения квантильное отклонения примет значение

Коэффициент вариации равный процентному отношению подправленного среднего квадратичного к выборочному среднему

Коэффициент асимметрии находим по формуле

Здесь центральный эмпирический момент 3-го порядка,

Подставляем в формулу коэффициента асимметрии

Эксцессом статистического распределения выборки называется число, которое вычисляют по формуле:

Здесь m4 центральный эмпирический момент 4-го порядка. Находим момент

а далее эксцесс
Теперь Вы имеете все необходимые формулы чтобы найти числовые характеристики статистического распределения. Как найти моду, медиану и дисперсию должен знать каждый студент, который изучает теорию вероятностей.

Готовые решения по теории вероятностей

  • Следующая статья — Построение уравнения прямой регрессии Y на X

Математическое ожидание, дисперсия, среднее квадратичное отклонение

Эти величины определяют некоторое
среднее значение, вокруг которого
группируются значения случайной
величины, и степень их разбросанности
вокруг этого среднего значения.

Математическое ожидание Mдискретной случайной величины — это
среднее значение случайной величины,
равное сумме произведений всех возможных
значений случайной величины на их
вероятности.

Свойства математического ожидания:

  1. Математическое ожидание постоянной
    величины равно самой постоянной .

  2. Постоянный множитель можно выносить
    за знак математического ожидания .

  3. Математическое ожидание произведения
    двух независимых случайных величин
    равно произведению их математических
    ожиданий .

  4. Математическое ожидание суммы двух
    случайных величин равно сумме
    математических ожиданий слагаемых

Для описания многих практически важных
свойств случайной величины необходимо
знание не только ее математического
ожидания, но и отклонения возможных ее
значений от среднего значения.

Дисперсия случайной величины— мера разброса случайной величины,
равная математическому ожиданию квадрата
отклонения случайной величины от ее
математического ожидания.

.

Принимая во внимание свойства
математического ожидания, легко показать
что

Казалось бы естественным рассматривать
не квадрат отклонения случайной величины
от ее математического ожидания, а просто
отклонение. Однако математическое
ожидание этого отклонения равно нулю.
Это объясняется тем, что одни возможные
отклонения положительны, другие
отрицательны, и в результате их взаимного
погашения получается ноль. Можно было
бы принять за меру рассеяния математическое
ожидание модуля отклонения случайной
величины от ее математического ожидания,
но как правило, действия связанные с
абсолютными величинами, приводят к
громоздким вычислениям.

Свойства дисперсии:

  1. Дисперсия постоянной равна нулю.

  2. Постоянный множитель можно выносить
    за знак дисперсии, возводя его в квадрат.

  3. Если x и y независимые случайные величины
    , то дисперсия суммы этих величин равна
    сумме их дисперсий.

Средним квадратическим отклонением
случайной величины
(иногда применяется
термин «стандартное отклонение случайной
величины») называется число равное.

Среднее квадратическое отклонение,
является, как и дисперсия, мерой рассеяния
распределения, но измеряется, в отличие
от дисперсии, в тех же единицах, которые
используют для измерения значений
случайной величины.

Решение задач:

1)Дана случайная величина Х:

xi

-3

-2

0

1

2

pi

0,1

0,2

0,05

0,3

0,35

Найти М(х), D(X).

Решение:

.

=9=2,31.

.

2) Известно, что М(Х)=5, М(Y)=2.
Найти математическое ожидание случайной
величиныZ=6X-2Y+9-XY.

Решение:М(Z)=6М(Х)-2М(Y)+9-M(X)M(Y)=30-4+9-10=25.

Пример:Известно, чтоD(Х)=5,D(Y)=2. Найти
математическое ожидание случайной
величиныZ=6X-2Y+9.

Решение:D(Z)=62D(Х)-22D(Y)+0=180-8=172.

Тема 7. Непрерывные случайные величины

Задача 14

Случайная
величина, значения которой заполняют
некоторый промежуток, называется
непрерывной.

Плотностью распределениявероятностей непрерывной случайной
величины Х называется функцияf(x)– первая производная от функции
распределенияF(x).

Плотность
распределения также называют
дифференциальной
функцией
.
Для описания дискретной случайной
величины плотность распределения
неприемлема.

Зная плотность распределения, можно
вычислить вероятность того, что некоторая
случайная величина Х примет значение,
принадлежащее заданному интервалу.

Вероятность того, что непрерывная
случайная величина Х примет значение,
принадлежащее интервалу (
a,
b), равна определенному
интегралу от плотности распределения,
взятому в пределах от
a
до
b.

Функция распределения может быть легко
найдена, если известна плотность
распределения, по формуле:

Свойства плотности распределения.

1) Плотность распределения – неотрицательная
функция.

2) Несобственный интеграл
от плотности распределения в пределах
от -доравен единице.

Решение задач.

1.Случайная величина подчинена
закону распределения с плотностью:

Требуется найти коэффициент а,
определить вероятность того, что
случайная величина попадет в интервал
от 0 до.

Решение:

Для нахождения коэффициента авоспользуемся свойством.

2 .Задана непрерывная случайная
величинахсвоей функцией распределенияf(x).

Требуется определить
коэффициент А, найти функцию распределения,
определить вероятность того, что
случайная величинахпопадет в
интервал.

Решение:

Найдем коэффициент А.

Найдем функцию распределения:

1) На участке
:

2) На участке

3) На участке

Итого:

Найдем вероятность попадания случайной
величины в интервал
.

Ту же самую вероятность можно искать
и другим способом:

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

  • #
  • #
  • #
  • #
  • #
  • #
  • #
  • #
  • #
  • #
  • #

Понравилась статья? Поделить с друзьями:
  • Видео как нашли рус
  • Как составить правильно коллаж или коллаж
  • Как составить сканворд с вопросами
  • Как найти периметр неровной фигуры впр
  • Как найти тангенс угла в прямоугольном параллелепипеде