Как найти дисперсию?
Понравилось? Добавьте в закладки
Дисперсия — это мера разброса значений случайной величины $X$ относительно ее математического ожидания $M(X)$ (см. как найти математическое ожидание случайной величины). Дисперсия показывает, насколько в среднем значения сосредоточены, сгруппированы около $M(X)$: если дисперсия маленькая — значения сравнительно близки друг к другу, если большая — далеки друг от друга (см. примеры нахождения дисперсии ниже).
Если случайная величина описывает физические объекты с некоторой размерностью (метры, секунды, килограммы и т.п.), то дисперсия будет выражаться в квадратных единицах (метры в квадрате, секунды в квадрате и т.п.). Ясно, что это не совсем удобно для анализа, поэтому часто вычисляют также корень из дисперсии — среднеквадратическое отклонение $sigma(X)=sqrt{D(X)}$, которое имеет ту же размерность, что и исходная величина и также описывает разброс.
Еще одно формальное определение дисперсии звучит так: «Дисперсия — это второй центральный момент случайной величины» (напомним, что первый начальный момент — это как раз математическое ожидание).
Нужна помощь? Решаем теорию вероятностей на отлично
Формула дисперсии случайной величины
Дисперсия случайной величины Х вычисляется по следующей формуле:
$$
D(X)=M(X-M(X))^2,
$$
которую также часто записывают в более удобном для расчетов виде:
$$
D(X)=M(X^2)-(M(X))^2.
$$
Эта универсальная формула для дисперсии может быть расписана более подробно для двух случаев.
Если мы имеем дело с дискретной случайной величиной (которая задана перечнем значений $x_i$ и соответствующих вероятностей $p_i$), то формула принимает вид:
$$
D(X)=sum_{i=1}^{n}{x_i^2 cdot p_i}-left(sum_{i=1}^{n}{x_i cdot p_i} right)^2.
$$
Если же речь идет о непрерывной случайной величине (заданной плотностью вероятностей $f(x)$ в общем случае), формула дисперсии Х выглядит следующим образом:
$$
D(X)=int_{-infty}^{+infty} f(x) cdot x^2 dx — left( int_{-infty}^{+infty} f(x) cdot x dx right)^2.
$$
Пример нахождения дисперсии
Рассмотрим простые примеры, показывающие как найти дисперсию по формулам, введеным выше.
Пример 1. Вычислить и сравнить дисперсию двух законов распределения:
$$
x_i quad 1 quad 2 \
p_i quad 0.5 quad 0.5
$$
и
$$
y_i quad -10 quad 10 \
p_i quad 0.5 quad 0.5
$$
Для убедительности и наглядности расчетов мы взяли простые распределения с двумя значениями и одинаковыми вероятностями. Но в первом случае значения случайной величины расположены рядом (1 и 2), а во втором — дальше друг от друга (-10 и 10). А теперь посмотрим, насколько различаются дисперсии:
$$
D(X)=sum_{i=1}^{n}{x_i^2 cdot p_i}-left(sum_{i=1}^{n}{x_i cdot p_i} right)^2 =\
= 1^2cdot 0.5 + 2^2 cdot 0.5 — (1cdot 0.5 + 2cdot 0.5)^2=2.5-1.5^2=0.25.
$$
$$
D(Y)=sum_{i=1}^{n}{y_i^2 cdot p_i}-left(sum_{i=1}^{n}{y_i cdot p_i} right)^2 =\
= (-10)^2cdot 0.5 + 10^2 cdot 0.5 — (-10cdot 0.5 + 10cdot 0.5)^2=100-0^2=100.
$$
Итак, значения случайных величин различались на 1 и 20 единиц, тогда как дисперсия показывает меру разброса в 0.25 и 100. Если перейти к среднеквадратическому отклонению, получим $sigma(X)=0.5$, $sigma(Y)=10$, то есть вполне ожидаемые величины: в первом случае значения отстоят в обе стороны на 0.5 от среднего 1.5, а во втором — на 10 единиц от среднего 0.
Ясно, что для более сложных распределений, где число значений больше и вероятности не одинаковы, картина будет более сложной, прямой зависимости от значений уже не будет (но будет как раз оценка разброса).
Пример 2. Найти дисперсию случайной величины Х, заданной дискретным рядом распределения:
$$
x_i quad -1 quad 2 quad 5 quad 10 quad 20 \
p_i quad 0.1 quad 0.2 quad 0.3 quad 0.3 quad 0.1
$$
Снова используем формулу для дисперсии дискретной случайной величины:
$$
D(X)=M(X^2)-(M(X))^2.
$$
В случае, когда значений много, удобно разбить вычисления по шагам. Сначала найдем математическое ожидание:
$$
M(X)=sum_{i=1}^{n}{x_i cdot p_i} =-1cdot 0.1 + 2 cdot 0.2 +5cdot 0.3 +10cdot 0.3+20cdot 0.1=6.8.
$$
Потом математическое ожидание квадрата случайной величины:
$$
M(X^2)=sum_{i=1}^{n}{x_i^2 cdot p_i}
= (-1)^2cdot 0.1 + 2^2 cdot 0.2 +5^2cdot 0.3 +10^2cdot 0.3+20^2cdot 0.1=78.4.
$$
А потом подставим все в формулу для дисперсии:
$$
D(X)=M(X^2)-(M(X))^2=78.4-6.8^2=32.16.
$$
Дисперсия равна 32.16 квадратных единиц.
Пример 3. Найти дисперсию по заданному непрерывному закону распределения случайной величины Х, заданному плотностью $f(x)=x/18$ при $x in(0,6)$ и $f(x)=0$ в остальных точках.
Используем для расчета формулу дисперсии непрерывной случайной величины:
$$
D(X)=int_{-infty}^{+infty} f(x) cdot x^2 dx — left( int_{-infty}^{+infty} f(x) cdot x dx right)^2.
$$
Вычислим сначала математическое ожидание:
$$
M(X)=int_{-infty}^{+infty} f(x) cdot x dx = int_{0}^{6} frac{x}{18} cdot x dx = int_{0}^{6} frac{x^2}{18} dx =
left.frac{x^3}{54} right|_0^6=frac{6^3}{54} = 4.
$$
Теперь вычислим
$$
M(X^2)=int_{-infty}^{+infty} f(x) cdot x^2 dx = int_{0}^{6} frac{x}{18} cdot x^2 dx = int_{0}^{6} frac{x^3}{18} dx = left.frac{x^4}{72} right|_0^6=frac{6^4}{72} = 18.
$$
Подставляем:
$$
D(X)=M(X^2)-(M(X))^2=18-4^2=2.
$$
Дисперсия равна 2.
Другие задачи с решениями по ТВ
Подробно решим ваши задачи на вычисление дисперсии
Вычисление дисперсии онлайн
Как найти дисперсию онлайн для дискретной случайной величины? Используйте калькулятор ниже.
- Введите число значений случайной величины К.
- Появится форма ввода для значений $x_i$ и соответствующих вероятностей $p_i$ (десятичные дроби вводятся с разделителем точкой, например: -10.3 или 0.5). Введите нужные значения (проверьте, что сумма вероятностей равна 1, то есть закон распределения корректный).
- Нажмите на кнопку «Вычислить».
- Калькулятор покажет вычисленное математическое ожидание $M(X)$ и затем искомое значение дисперсии $D(X)$.
Видео. Полезные ссылки
Видеоролики: что такое дисперсия и как найти дисперсию
Если вам нужно более подробное объяснение того, что такое дисперсия, как она вычисляется и какими свойствами обладает, рекомендую два видео (для дискретной и непрерывной случайной величины соответственно).
Спасибо за ваши закладки и рекомендации
Полезные ссылки
Не забывайте сначала прочитать том, как найти математическое ожидание. А тут можно вычислить также СКО: Калькулятор математического ожидания, дисперсии и среднего квадратического отклонения.
Что еще может пригодиться? Например, для изучения основ теории вероятностей — онлайн учебник по ТВ. Для закрепления материала — еще примеры решений задач по теории вероятностей.
А если у вас есть задачи, которые надо срочно сделать, а времени нет? Можете поискать готовые решения в решебнике или заказать в МатБюро:
Онлайн-калькулятор дисперсии поможет вам определить дисперсию, сумму квадратов и коэффициент дисперсии для определенного набора данных. Кроме того, этот калькулятор также отображает среднее значение и стандартное отклонение путем пошагового расчет дисперсии онлайн. Прочтите, чтобы узнать, как найти дисперсию онлайн и стандартное отклонение, используя формулу выборочной дисперсии.
Что такое дисперсия?
Дисперсия группы или набора чисел – это число, которое представляет «разброс» набора. Формально это квадрат отклонения набора от среднего и квадрат стандартного отклонения.
Другими словами, небольшая дисперсия означает, что точки данных имеют тенденцию быть близкими к среднему и очень близко друг к другу. Высокая дисперсия указывает на то, что точки данных далеки от среднего значения и друг от друга. Дисперсия – это среднее значение квадрата расстояния от каждой точки до среднего.
Типы дисперсии:
Вариация выборки: дисперсия выборки не охватывает всю возможную выборку (случайная выборка людей).
Дисперсия населения: дисперсия, которая измеряется для всего населения (например, всех людей).
Однако онлайн-калькулятор стандартного отклонения позволяет определить стандартное отклонение (σ) и другие статистические измерения данного набора данных.
Формулы отклонения:
Формула дисперсии совокупности
дисперсия формула (совокупности):
Дисперсия (обозначается как σ2) выражается как среднеквадратическое отклонение от среднего для всех точек данных. Мы пишем:
$$ σ2 = ∑ (xi – μ) ^ 2 / N $$
где,
- σ2 – дисперсия;
- μ – среднеквадратическое значение; а также
- xᵢ представляет i-ю точку данных среди N общих точек данных.
Вы можете рассчитать его с помощью калькулятора дисперсии генеральной совокупности, в противном случае есть три шага для оценки дисперсии:
- Чтобы найти разницу между средним значением точки, используйте формулу: xi – μ
- Теперь возьмите в квадрат разницу между средним значением каждой точки: (xi – μ) ^ 2
- Затем найдите среднее квадратическое отклонение от среднего: ∑ (xi – μ) ^ 2 / N.
Это дисперсия формула совокупности.
Пример формулы отклонения
Уравнение выборки дисперсии имеет следующий вид:
s2 = ∑ (xi – x̄) 2 / (N – 1)
где,
s2 – оценка дисперсии;
x – выборочное среднее; а также
xi – i-я точка данных среди N общих точек данных.
Как рассчитать дисперсию?
Чтобы найти среднее значение данного набора данных. Подставьте все значения и разделите на размер выборки n.
ni = 1x дюйм x = ∑ i = 1 nx дюйм
Теперь найдите среднюю разницу значений данных, вам нужно вычесть среднее значение данных и возвести результат в квадрат.
(хи – х) ^ 2 (хи – х) ^ 2
Затем вычислите квадратичные разности и сумму квадратов всех квадратичных разностей.
S = ∑ I = 1n (xi – x) ^ 2
Итак, найдите дисперсию, дисперсия формула генеральной совокупности:
Дисперсия = σ ^ 2 = Σ (xi – μ) ^ 2
Уравнение дисперсии набора данных выборки:
Дисперсия = s ^ 2 = Σ (xi – x) ^ {2n − 1}
Эти формулы запоминать не нужно. Чтобы вам было удобно, наш примерный калькулятор дисперсии выполняет все расчет дисперсии онлайн, связанные с дисперсией, автоматически, используя их.
Тем не менее, Калькулятор диапазона среднего среднего значения режима поможет вам рассчитать средний средний режим и диапазон для введенного набора данных.
Пример расчета
Давайте посчитаем дисперсию оценок пяти студентов на экзамене: 50, 75, 89, 93, 93. Выполните следующие действия:
- Найдите среднее
Чтобы найти среднее значение (x), разделите сумму всех этих значений на количество точек данных:
х = (50 + 75 + 89 + 93 + 93) / 5
х̄ = 80
- Вычислите разницу между средним значением и квадратом отличий от среднего. Следовательно, среднее значение равно 80, мы используем формулу для вычисления разницы от среднего:
xi – x̄
Первая точка – 50, поэтому разница от среднего составляет 50 – 80 = -30.
Квадрат отклонения от среднего – это квадрат предыдущего шага:
(xi – x̄) 2
Итак, квадрат отклонения равен:
(50 – 80) 2 = (-30) 2 = 900
В приведенной ниже таблице квадрат отклонения рассчитан на основе среднего значения всех результатов испытаний. Столбец «Среднее отклонение» – это результат минус 30, а столбец «Стандартное отклонение» – это столбец перед квадратом.
Счет | Отклонение от среднего | Квадратное отклонение |
50 | -30 | 900 |
75 | -5 | 25 |
89 | 9 | 81 |
93 | 13 | 169 |
93 | 13 | 169 |
- Рассчитайте стандартное отклонение и дисперсию
Затем используйте квадраты отклонений от среднего:
σ2 = ∑ (xi – x̄) 2 / N
σ2 = (900 + 25 + 81 + 169 + 169) / 5
σ2 = 268,5
дисперсия случайной величины онлайн результатов экзамена составила 268,8.
Как работает калькулятор дисперсии?
Онлайн-калькулятор дисперсии совокупности вычисляет дисперсию для заданных наборов данных. Вы можете просмотреть работу, проделанную для расчет дисперсии онлайн из набора данных, следуя этим инструкциям:
Вход:
- Сначала введите значения набора данных через запятую.
- Затем выберите дисперсию для выборки или совокупности.
- Нажмите кнопку «Рассчитать», чтобы получить результаты.
Выход:
- Калькулятор дисперсии выборки отображает дисперсию, стандартное отклонение, количество, сумму, среднее значение, коэффициент дисперсии и сумму квадратов.
- Этот калькулятор также обеспечивает пошаговые вычисления дисперсии, коэффициента дисперсии и стандартного отклонения.
ЧАСТО ЗАДАВАЕМЫЕ ВОПРОСЫ:
В чем разница между стандартным отклонением и дисперсией?
Дисперсия – это квадрат отклонения от среднего, а стандартное отклонение – это квадратный корень из числа. Оба показателя отражают изменчивость распределения, но их единицы разные: стандартное отклонение определяется в той же единице, что и исходное значение (например, минуты или метры).
Значение высокой дисперсии – это плохо или хорошо?
Низкая дисперсия связана с меньшим риском и более низкой доходностью. Акции с высокой дисперсией обычно выгодны для агрессивных инвесторов с меньшим неприятием риска, в то время как акции с низкой дисперсией обычно выгодны для консервативных инвесторов с более низкой толерантностью к риску.
Каков диапазон отклонений?
Диапазон – это разница между высоким и низким значением. Поскольку используются только крайние значения, потому что эти значения будут сильно на него влиять. Чтобы найти диапазон отклонения, возьмите максимальное значение и вычтите минимальное значение.
Заключение:
Воспользуйтесь этим онлайн-калькулятором дисперсии, который работает как с выборкой, так и с наборами данных о генеральной совокупности, используя формулу генеральной и выборочной дисперсии. Это лучший образовательный калькулятор, который расскажет вам, как рассчитать дисперсию заданных наборов данных за доли секунды.
Other Languages: Variance Calculator, Varyans Hesaplama, Calculadora De Variancia, Kalkulator Varians, Kalkulator Wariancji, Výpočet Rozptylu, 分散 計算.
Загрузить PDF
Загрузить PDF
Дисперсия случайной величины является мерой разброса значений этой величины. Малая дисперсия означает, что значения сгруппированы близко друг к другу. Большая дисперсия свидетельствует о сильном разбросе значений. Понятие дисперсии случайной величины применяется в статистике. Например, если сравнить дисперсию значений двух величин (таких как результаты наблюдений за пациентами мужского и женского пола), можно проверить значимость некоторой переменной.[1]
Также дисперсия используется при построении статистических моделей, так как малая дисперсия может быть признаком того, что вы чрезмерно подгоняете значения.[2]
-
1
Запишите значения выборки. В большинстве случаев статистикам доступны только выборки определенных генеральных совокупностей. Например, как правило, статистики не анализируют расходы на содержание совокупности всех автомобилей в России – они анализируют случайную выборку из нескольких тысяч автомобилей. Такая выборка поможет определить средние расходы на автомобиль, но, скорее всего, полученное значение будет далеко от реального.
- Например, проанализируем количество булочек, проданных в кафе за 6 дней, взятых в случайном порядке. Выборка имеет следующий вид: 17, 15, 23, 7, 9, 13. Это выборка, а не совокупность, потому что у нас нет данных о проданных булочках за каждый день работы кафе.
- Если вам дана совокупность, а не выборка значений, перейдите к следующему разделу.
-
2
Запишите формулу для вычисления дисперсии выборки. Дисперсия является мерой разброса значений некоторой величины. Чем ближе значение дисперсии к нулю, тем ближе значения сгруппированы друг к другу. Работая с выборкой значений, используйте следующую формулу для вычисления дисперсии:[3]
-
3
Вычислите среднее значение выборки. Оно обозначается как x̅.[4]
Среднее значение выборки вычисляется как обычное среднее арифметическое: сложите все значения в выборке, а затем полученный результат разделите на количество значений в выборке.- В нашем примере сложите значения в выборке: 15 + 17 + 23 + 7 + 9 + 13 = 84
Теперь результат разделите на количество значений в выборке (в нашем примере их 6): 84 ÷ 6 = 14.
Выборочное среднее x̅ = 14. - Выборочное среднее – это центральное значение, вокруг которого распределены значения в выборке. Если значения в выборке группируются вокруг выборочного среднего, то дисперсия мала; в противном случае дисперсия велика.
- В нашем примере сложите значения в выборке: 15 + 17 + 23 + 7 + 9 + 13 = 84
-
4
Вычтите выборочное среднее из каждого значения в выборке. Теперь вычислите разность — x̅, где – каждое значение в выборке. Каждый полученный результат свидетельствует о мере отклонения конкретного значения от выборочного среднего, то есть как далеко это значение находится от среднего значения выборки.[5]
-
5
Возведите в квадрат каждый полученный результат. Как отмечалось выше, сумма разностей — x̅ должна быть равна нулю. Это означает, что средняя дисперсия всегда равна нулю, что не дает никакого представления о разбросе значений некоторой величины. Для решения этой проблемы возведите в квадрат каждую разность — x̅. Это приведет к тому, что вы получите только положительные числа, которые при сложении никогда не дадут 0.[6]
-
6
-
7
Полученный результат разделите на n — 1, где n – количество значений в выборке. Некоторое время назад для вычисления дисперсии выборки статистики делили результат просто на n; в этом случае вы получите среднее значение квадрата дисперсии, которое идеально подходит для описания дисперсии данной выборки. Но помните, что любая выборка – это лишь небольшая часть генеральной совокупности значений. Если взять другую выборку и выполнить такие же вычисления, вы получите другой результат. Как выяснилось, деление на n — 1 (а не просто на n) дает более точную оценку дисперсии генеральной совокупности, в чем вы и заинтересованы. Деление на n – 1 стало общепринятым, поэтому оно включено в формулу для вычисления дисперсии выборки.[7]
- В нашем примере выборка включает 6 значений, то есть n = 6.
Дисперсия выборки = 33,2
- В нашем примере выборка включает 6 значений, то есть n = 6.
-
8
Отличие дисперсии от стандартного отклонения. Заметьте, что в формуле присутствует показатель степени, поэтому дисперсия измеряется в квадратных единицах измерения анализируемой величины. Иногда такой величиной довольно сложно оперировать; в таких случаях пользуются стандартным отклонением, которое равно квадратному корню из дисперсии. Именно поэтому дисперсия выборки обозначается как , а стандартное отклонение выборки – как .
- В нашем примере стандартное отклонение выборки: s = √33,2 = 5,76.
Реклама
-
1
Проанализируйте некоторую совокупность значений. Совокупность включает в себя все значения рассматриваемой величины. Например, если вы изучаете возраст жителей Ленинградской области, то совокупность включает возраст всех жителей этой области. В случае работы с совокупностью рекомендуется создать таблицу и внести в нее значения совокупности. Рассмотрим следующий пример:
-
2
Запишите формулу для вычисления дисперсии генеральной совокупности. Так как в совокупность входят все значения некоторой величины, то приведенная ниже формула позволяет получить точное значение дисперсии совокупности. Для того чтобы отличить дисперсию совокупности от дисперсии выборки (значение которой является лишь оценочным), статистики используют различные переменные: [8]
-
3
Вычислите среднее значение совокупности. При работе с генеральной совокупностью ее среднее значение обозначается как μ (мю). Среднее значение совокупности вычисляется как обычное среднее арифметическое: сложите все значения в генеральной совокупности, а затем полученный результат разделите на количество значений в генеральной совокупности.
- Имейте в виду, что средние величины не всегда вычисляются как среднее арифметическое.
- В нашем примере среднее значение совокупности: μ = = 10,5
-
4
Вычтите среднее значение совокупности из каждого значения в генеральной совокупности. Чем ближе значение разности к нулю, тем ближе конкретное значение к среднему значению совокупности. Найдите разность между каждым значением в совокупности и ее средним значением, и вы получите первое представление о распределении значений.
- В нашем примере:
— μ = 5 — 10,5 = -5,5
— μ = 5 — 10,5 = -5,5
— μ = 8 — 10,5 = -2,5
— μ = 12 — 10,5 = 1,5
— μ = 15 — 10,5 = 4,5
— μ = 18 — 10,5 = 7,5
- В нашем примере:
-
5
Возведите в квадрат каждый полученный результат. Значения разностей будут как положительными, так и отрицательными; если нанести эти значения на числовую прямую, то они будут лежать справа и слева от среднего значения совокупности. Это не годится для вычисления дисперсии, так как положительные и отрицательные числа компенсируют друг друга. Поэтому возведите в квадрат каждую разность, чтобы получить исключительно положительные числа.
- В нашем примере:
( — μ) для каждого значения совокупности (от i = 1 до i = 6):
(-5,5) = 30,25
(-5,5) = 30,25
(-2,5) = 6,25
(1,5) = 2,25
(4,5) = 20,25
(7,5) = 56,25
- В нашем примере:
-
6
Найдите среднее значение полученных результатов. Вы нашли, как далеко каждое значение совокупности расположено от ее среднего значения. Найдите среднее значение суммы квадратов разностей, поделив ее на количество значений в генеральной совокупности.
- В нашем примере:
Дисперсия совокупности = 24,25
- В нашем примере:
-
7
Соотнесите это решение с формулой. Если вы не поняли, как приведенное выше решение соотносится с формулой, ниже представлено объяснение решения:
Реклама
Советы
- Дисперсию довольно сложно интерпретировать, поэтому в большинстве случаев она вычисляется как промежуточная величина, которая необходима для нахождения стандартного отклонения.
- При вычислении дисперсии выборки деление на n-1, а не просто на n, называется коррекцией Бесселя. Дисперсия выборки представляет собой только оценочное значение дисперсии генеральной совокупности, при этом выборочное среднее смещено, чтобы соответствовать этому оценочному значению. Коррекция Бесселя устраняет такое смещение.[9]
Это связано с тем, что при анализе n – 1 значения использование n-го значения уже ограничено, так как только определенные значения приводят к выборочному среднему (x̅), которое используется в формуле для вычисления дисперсии.[10]
Реклама
Об этой статье
Эту страницу просматривали 122 353 раза.
Была ли эта статья полезной?
Download Article
Download Article
What is variance? Variance is a measure of how spread out a data set is, and we calculate it by finding the average of each data point’s squared difference from the mean.[1]
It’s useful when creating statistical models since low variance can be a sign that you are over-fitting your data. Once you get the hang of the formula, you’ll just have to plug in the right numbers to find your answer. Read on for a complete step-by-step tutorial that’ll teach you how to calculate both sample variance and population variance.
-
1
Use the sample variance formula if you’re working with a partial data set. In most cases, statisticians only have access to a sample, or a subset of the population they’re studying. For example, instead of analyzing the population «cost of every car in Germany,» a statistician could find the cost of a random sample of a few thousand cars. He can use this sample to get a good estimate of German car costs, but it will likely not match the actual numbers exactly.[2]
- Example: Analyzing the number of muffins sold each day at a cafeteria, you sample six days at random and get these results: 38, 37, 36, 28, 18, 14, 12, 11, 10.7, 9.9. This is a sample, not a population, since you don’t have data on every single day the cafeteria was open.
- If you have every data point in a population, skip down to the method below instead.
-
2
Write down the sample variance formula. The variance of a data set tells you how spread out the data points are. The closer the variance is to zero, the more closely the data points are clustered together. When working with sample data sets, use the following formula to calculate variance:[3]
Advertisement
-
3
Calculate the mean of the sample. The symbol x̅ or «x-bar» refers to the mean of a sample.[4]
Calculate this as you would any mean: add all the data points together, then divide by the number of data points.[5]
-
Example: First, add your data points together: 17 + 15 + 23 + 7 + 9 + 13 = 84
Next, divide your answer by the number of data points, in this case six: 84 ÷ 6 = 14.
Sample mean = x̅ = 14. - You can think of the mean as the «center-point» of the data. If the data clusters around the mean, variance is low. If it is spread out far from the mean, variance is high.[6]
-
Example: First, add your data points together: 17 + 15 + 23 + 7 + 9 + 13 = 84
-
4
Subtract the mean from each data point. Now it’s time to calculate — x̅, where is each number in your data set. Each answer tells you that number’s deviation from the mean, or in plain language, how far away it is from the mean.[7]
-
5
Square each result. As noted above, your current list of deviations ( — x̅) sum up to zero. This means the «average deviation» will always be zero as well, so that doesn’t tell use anything about how spread out the data is. To solve this problem, find the square of each deviation.[8]
This will make them all positive numbers, so the negative and positive values no longer cancel out to zero.[9]
-
6
-
7
Divide by n — 1, where n is the number of data points. A long time ago, statisticians just divided by n when calculating the variance of the sample. This gives you the average value of the squared deviation, which is a perfect match for the variance of that sample. But remember, a sample is just an estimate of a larger population. If you took another random sample and made the same calculation, you would get a different result. As it turns out, dividing by n — 1 instead of n gives you a better estimate of variance of the larger population, which is what you’re really interested in. This correction is so common that it is now the accepted definition of a sample’s variance.[12]
-
Example: There are six data points in the sample, so n = 6.
Variance of the sample = 33.2
-
Example: There are six data points in the sample, so n = 6.
-
8
Understand variance and standard deviation. Note that, since there was an exponent in the formula, variance is measured in the squared unit of the original data. This can make it difficult to understand intuitively. Instead, it’s often useful to use the standard deviation. You didn’t waste your effort, though, as the standard deviation is defined as the square root of the variance. This is why the variance of a sample is written , and the standard deviation of a sample is .
- For example, the standard deviation of the sample above = s = √33.2 = 5.76.
Advertisement
-
1
Use the population variance formula if you’ve collected data from every point in the population. The term «population» refers to the total set of relevant observations. For example, if you’re studying the age of Texas residents, your population would include the age of every single Texas resident. You would normally create a spreadsheet for a large data set like that, but here’s a smaller example data set:[13]
-
2
Write down the population variance formula. Since a population contains all the data you need, this formula gives you the exact variance of the population. In order to distinguish it from sample variance (which is only an estimate), statisticians use different variables:[14]
-
3
Find the mean of the population. When analyzing a population, the symbol μ («mu») represents the arithmetic mean. To find the mean, add all the data points together, then divide by the number of data points.[15]
- You can think of the mean as the «average,» but be careful, as that word has multiple definitions in mathematics.
- Example: mean = μ = = 10.5
-
4
Subtract the mean from each data point. Data points close to the mean will result in a difference closer to zero. Repeat the subtraction problem for each data point, and you might start to get a sense of how spread out the data is.[16]
-
5
Square each answer. Right now, some of your numbers from the last step will be negative, and some will be positive. If you picture your data on a number line, these two categories represent numbers to the left of the mean, and numbers to the right of the mean. This is no good for calculating variance, since these two groups will cancel each other out. Square each number so they are all positive instead.[17]
-
6
Find the mean of your results. Now you have a value for each data point, related (indirectly) to how far that data point is from the mean. Take the mean of these values by adding them all together, then dividing by the number of values.[18]
-
Example:
Variance of the population = 24.25
-
Example:
-
7
Relate this back to the formula. If you’re not sure how this matches the formula at the beginning of this method, try writing out the whole problem in longhand:
Advertisement
Help Calculating Variance
Add New Question
-
Question
What are deviations?
Mario Banuelos is an Assistant Professor of Mathematics at California State University, Fresno. With over eight years of teaching experience, Mario specializes in mathematical biology, optimization, statistical models for genome evolution, and data science. Mario holds a BA in Mathematics from California State University, Fresno, and a Ph.D. in Applied Mathematics from the University of California, Merced. Mario has taught at both the high school and collegiate levels.
Assistant Professor of Mathematics
Expert Answer
-
Question
What is the easiest way to find variance?
Mario Banuelos is an Assistant Professor of Mathematics at California State University, Fresno. With over eight years of teaching experience, Mario specializes in mathematical biology, optimization, statistical models for genome evolution, and data science. Mario holds a BA in Mathematics from California State University, Fresno, and a Ph.D. in Applied Mathematics from the University of California, Merced. Mario has taught at both the high school and collegiate levels.
Assistant Professor of Mathematics
Expert Answer
Support wikiHow by
unlocking this expert answer.First, calculate the mean or average of all of the data points. Then, calculate the difference between each data point and that mean. Square each of those differences, add them all up, then divide them by n (the total number of data points) minus 1.
-
Question
How do I calculate the variance of four numbers?
Follow these steps: Work out the mean (the simple average of the numbers.) Then, for each number, subtract the mean and square the result (the squared difference). Finally, work out the average of those squared differences.
See more answers
Ask a Question
200 characters left
Include your email address to get a message when this question is answered.
Submit
Advertisement
-
Using «n-1» instead of «n» in the denominator when analyzing samples is a technique called Bessel’s correction. The sample is only an estimate of the full population, and the mean of the sample is biased to fit that estimate. This correction removes this bias. This is related to the fact that, once you’ve listed n — 1 data points, the final nth point is already constrained, since only certain values will result in the sample mean (x̅) used in the variance formula.[19]
-
Since it is difficult to interpret the variance, this value is usually calculated as a starting point for calculating the standard deviation.
Advertisement
References
About This Article
Article SummaryX
To calculate the variance of a sample, or how spread out the sample data is across the distribution, first add all of the data points together and divide by the number of data points to find the mean. For example, if your data points are 3, 4, 5, and 6, you would add 3 + 4 + 5 + 6 and get 18. Then, you would divide 18 by the total number of data points, which is 4, and get 4.5. Therefore, the mean of the data set is 4.5. Next, subtract the mean from each data point in the sample. In this example, you would subtract the mean, or 4.5, from 3, then 4, then 5, and finally 6 and end up with -1.5, -0.5, 0.5, and 1.5. Now, square each of these results by multiplying each result by itself. If you square -1.5, -0.5, 0.5, and 1.5, you would get 2.25, 0.25, 0.25, and 2.25. Then, add up all of the squared values. Here, you would add 2.25 + 0.25 + 0.25 + 2.25 and get 5. Finally, divide the sum by n — 1, where n is the total number of data points. In the example there are 4 data points, so you would divide the sum, which is 5, by 4 — 1, or 3, and get 1.66. Therefore, the variance of the sample is 1.66. To learn how to calculate the variance of a population, scroll down!
Did this summary help you?
Thanks to all authors for creating a page that has been read 2,989,225 times.
Reader Success Stories
-
«I am currently solving a non-perfect hedge problem between grapefruit and orange juice where I need to calculate…» more
Did this article help you?
Дисперсия и ее свойства.
Среднее квадратическое отклонение
- Краткая теория
- Примеры решения задач
- Задачи контрольных и самостоятельных работ
Краткая теория
Дисперсия и формула для ее вычисления
На практике часто требуется оценить рассеяние возможных значений случайной величины вокруг ее среднего значения. Например, в артиллерии важно знать, насколько кучно лягут снаряды вблизи цели, которая должна быть поражена.
На первый взгляд может показаться, что для оценки рассеяния проще всего вычислить все возможные значения отклонения случайной величины и затем найти их среднее значение. Однако такой путь ничего не даст, так как среднее значение отклонения, т. е. M[X-M(X)], для любой случайной величины равно нулю. Это свойство объясняется тем, что одни возможные отклонения положительны, а другие — отрицательны; в результате их взаимного погашения среднее значение отклонения равно нулю. Эти соображения говорят о целесообразности заменить возможные отклонения их абсолютными значениями или их квадратами. Так и поступают на деле. Правда, в случае, когда возможные отклонения заменяют их абсолютными значениями, приходится оперировать с абсолютными величинами, что приводит иногда к серьезным затруднениям. Поэтому чаще всего идут по другому пути, то есть вычисляют среднее значение квадрата отклонения, которое и называют дисперсией.
Дисперсией называется
математическое ожидание квадрата отклонения случайной величины
от
:
Для того чтобы найти дисперсию, достаточно вычислить сумму произведений возможных значений квадрата отклонения на их вероятности.
Для вычисления дисперсии
на практике удобно пользоваться следующей формулой:
Свойства дисперсии
Свойство 1.
Дисперсия равна разности между
математическим ожиданием квадрата случайной величины
и
квадратом ее математического ожидания.
Свойство 2.
Дисперсия константы
равна нулю:
Свойство 3.
Постоянный множитель
выносится из-под знака дисперсии в квадрате:
Свойство 4.
Дисперсия суммы
случайных величин:
где
–
ковариация случайных величин
и
На сайте можно заказать решение контрольной или самостоятельной работы, домашнего задания, отдельных задач. Для этого вам нужно только связаться со мной:
ВКонтакте
WhatsApp
Telegram
Мгновенная связь в любое время и на любом этапе заказа. Общение без посредников. Удобная и быстрая оплата переводом на карту СберБанка. Опыт работы более 25 лет.
Подробное решение в электронном виде (docx, pdf) получите точно в срок или раньше.
Следствия из свойств дисперсии.
В частности, если
и
независимы, то
Прибавление константы
в
случайной величине не меняет ее дисперсии:
Дисперсия разности равна сумме дисперсий:
Среднеквадратическое отклонение
Для оценки рассеяния возможных значений случайной величины вокруг ее среднего значения кроме дисперсии служат и некоторые другие характеристики. К их числу относится среднее квадратическое отклонение.
Стандартное (среднее
квадратичное) отклонение случайной величины
определяется
как корень из дисперсии и обозначается
Легко показать, что дисперсия имеет размерность, равную квадрату размерности случайной величины. Так как среднее квадратическое отклонение равно квадратному корню из дисперсии, то ее размерность совпадает с размерностью X. Поэтому в тех случаях, когда желательно, чтобы оценка рассеяния имела размерность случайной величины, вычисляют среднее квадратическое отклонение, а не дисперсию. Например, если X выражается в линейных метрах, то среднее квадратичное отклонение X будет выражаться также в линейных метрах, a дисперсия X — в квадратных метрах.
Смежные темы решебника:
- Математическое ожидание и его свойства
- Дискретная случайная величина
- Непрерывная случайная величина
Примеры решения задач
Пример 1
В коробке 20 конфет, из которых 4 с
вареньем. Х – число конфет с вареньем среди двух случайно выбранных. Найти
дисперсию случайной величины Х.
Решение
На сайте можно заказать решение контрольной или самостоятельной работы, домашнего задания, отдельных задач. Для этого вам нужно только связаться со мной:
ВКонтакте
WhatsApp
Telegram
Мгновенная связь в любое время и на любом этапе заказа. Общение без посредников. Удобная и быстрая оплата переводом на карту СберБанка. Опыт работы более 25 лет.
Подробное решение в электронном виде (docx, pdf) получите точно в срок или раньше.
Случайная
величина
– число конфет с вареньем, может принимать
значения 0,1,2
Найдем
соответствующие вероятности:
Проверка:
Получаем
следующий закон распределения СВ
:
Математическое
ожидание:
Дисперсию
можно вычислить по формуле:
Искомая
дисперсия:
Пример 2
Даны
законы распределения независимых случайных величин X и Y:
и
Найти
закон распределения суммы (X+Y). Проверить равенство D(X+Y)=D(X)+D(Y).
Решение
На сайте можно заказать решение контрольной или самостоятельной работы, домашнего задания, отдельных задач. Для этого вам нужно только связаться со мной:
ВКонтакте
WhatsApp
Telegram
Мгновенная связь в любое время и на любом этапе заказа. Общение без посредников. Удобная и быстрая оплата переводом на карту СберБанка. Опыт работы более 25 лет.
Подробное решение в электронном виде (docx, pdf) получите точно в срок или раньше.
Распределение суммы
:
Окончательно получаем:
|
2 | 3 | 4 | Итого |
|
0.2 | 0.5 | 0.3 | 1 |
Вычислим математические ожидания:
Вычислим
дисперсии:
Проверим
равенство
:
Равенство
выполняется.
Пример 3
Вероятность
изготовления бракованной детали на первом станке составляет 3%, на втором
станке 5%. На первом станке было изготовлено 20 деталей, на втором 40 деталей.
Найти математическое ожидание и дисперсию числа бракованных деталей.
Решение
Математическое
ожидание биномиального распределения:
Дисперсия:
Математическое
ожидание величины
– числа бракованных деталей на 1-м станке:
Дисперсия:
Математическое
ожидание величины
– числа бракованных деталей на 2-м станке:
Дисперсия:
Математическое
ожидание числа бракованных деталей:
Дисперсия
числа бракованных деталей:
Ответ:
;
.
Пример 4
Случайные
величины X,Y распределены по закону
Пуассона. Найдите M{(X+Y)2}, если M(X)=40 и
M(Y)=70, а коэффициент корреляции X и Yравен 0,8.
Решение
На сайте можно заказать решение контрольной или самостоятельной работы, домашнего задания, отдельных задач. Для этого вам нужно только связаться со мной:
ВКонтакте
WhatsApp
Telegram
Мгновенная связь в любое время и на любом этапе заказа. Общение без посредников. Удобная и быстрая оплата переводом на карту СберБанка. Опыт работы более 25 лет.
Подробное решение в электронном виде (docx, pdf) получите точно в срок или раньше.
Поскольку
случайные величины
и
распределены по закону Пуассона и известны их
математические ожидания, соответствующие дисперсии равны:
Пользуясь
свойствами математического ожидания и дисперсии:
Подставляя
числовые значения, получаем:
Ответ:
.
Задачи контрольных и самостоятельных работ
Задача 1
Независимые случайные величины X и Y
заданы следующими законами:
x | 2.3 | 2.5 | 2.7 | 2.9 |
p | 0.4 | 0.3 | 0.2 | 0.1 |
Укажите
законы распределения случайной величины X+Y, X-Y и найдите их
математическое ожидание и дисперсию.
Задача 2
Найти
дисперсию, математическое ожидания, среднекваратическое отклонение ДСВ X,
заданной законом распределения.
x | -5 | 2 | 3 | 4 |
p | 0,4 | 0,3 | 0,1 | 0,2 |
Написать F(x) и построить ее график.
Задача 3
Случайная
величина X имеет плотность вероятности
Требуется
найти дисперсию Dx.
На сайте можно заказать решение контрольной или самостоятельной работы, домашнего задания, отдельных задач. Для этого вам нужно только связаться со мной:
ВКонтакте
WhatsApp
Telegram
Мгновенная связь в любое время и на любом этапе заказа. Общение без посредников. Удобная и быстрая оплата переводом на карту СберБанка. Опыт работы более 25 лет.
Подробное решение в электронном виде (docx, pdf) получите точно в срок или раньше.
Задача 4
Вероятность
того, что прибор исправен, равна 0,8. X – число исправных приборов
из двух выбранных. Найти дисперсию случайной величины X.
Задача 5
Случайные
величины X и Y независимы. Найти
дисперсию случайной величины Z=2X+3Y, если известно, что D(X)=4, D(Y)=5.
Задача 6
Найти
дисперсию дискретной случайной величины X – числа отказов элемента
некоторого устройства в десяти независимых опытах, если вероятность отказа
элемента в каждом опыте равна 0,9.
Задача 7
Дискретная
случайная величина X имеет только два возможных значения: x1 и x2, причем x2>x1. Вероятность того, что X
примет значение x1, равна 0,6. Найти закон распределения величины X, если
математическое ожидание и дисперсия известны: M(X)=1,4; D(X)=0,24.
Задача 8
Закон
распределения случайной величины ξ имеет вид:
ξ | -1 | 2 | 3 | 5 |
P | 1/4 | 1/2 | 1/8 | 1/8 |
Найти функцию распределения случайной величины ξ,
вычислить ее математическое ожидание, дисперсию и среднее квадратическое
отклонение. Вычислить вероятность P{5⁄2<ξ<5}.
Задача 9
Дискретная
случайная величины X принимает лишь два значения. Большее из значений 3
она принимает с вероятностью 0,4. Кроме того, известна дисперсия случайной
величины D(X)=6. Найти математическое
ожидание случайной величины.
Задача 10
Найти
дисперсию по заданному непрерывному закону распределения случайной величины X,
заданному плотностью вероятности
при
и
в остальных точках.
- Краткая теория
- Примеры решения задач
- Задачи контрольных и самостоятельных работ