Как найти коэффициент линейной вариации

По данным выборочного обследования произведена группировка вкладчиков по размеру вклада в Сбербанке города:

Размер вклада, руб. До 400 400 — 600 600 — 800 800 — 1000 Свыше 1000
Число вкладчиков 32 56 120 104 88

Определите:

1) размах вариации;

2) средний размер вклада;

3) среднее линейное отклонение;

4) дисперсию;

5) среднее квадратическое отклонение;

6) коэффициент вариации вкладов.

Решение:

Данный ряд распределения содержит открытые интервалы. В таких рядах условно принимается величина интервала первой группы равна величине интервала последующей, а величина интервала последней группы равна величине интервала предыдущей.

Величина интервала второй группы равна 200, следовательно, и величина первой группы также равна 200. Величина интервала предпоследней группы равна 200, значит и последний интервал будет иметь величину, равную 200.

Размер вклада, руб. 200 — 400 400 — 600 600 — 800 800 — 1000 1000 — 1200
Число вкладчиков 32 56 120 104 88

1) Определим размах вариации как разность между наибольшим и наименьшим значением признака:

Формула и расчёт размаха вариации

Размах вариации размера вклада равен 1000 рублей.

2) Средний размер вклада определим по формуле средней арифметической взвешенной.

Предварительно определим дискретную величину признака в каждом интервале. Для этого по формуле средней арифметической простой найдём середины интервалов.

Среднее значение первого интервала будет равно:

Средняя арифметическая простая

второго — 500 и т. д.

Занесём результаты вычислений в таблицу:

Размер вклада, руб. Число вкладчиков, f Середина интервала, х xf
200-400 32 300 9600
400-600 56 500 28000
600-800 120 700 84000
800-1000 104 900 93600
1000-1200 88 1100 96800
Итого 400 312000

Средний размер вклада в Сбербанке города будет равен 780 рублей:

Формула и расчёт средней арифметической взвешенной

3) Среднее линейное отклонение есть средняя арифметическая из абсолютных отклонений отдельных значений признака от общей средней:

 Формула среднего линейного отклонения

Порядок расчёта среднего линейонго отклонения в интервальном ряду распределения следующий:

1. Вычисляется средняя арифметическая взвешенная, как показано в п. 2).

2. Определяются абсолютные отклонения вариант от средней:

Абсолютное отклонение варианта от средней

3. Полученные отклонения умножаются на частоты:

Взвешенные абсолютные отклонения

4. Находится сумма взвешенных отклонений без учёта знака:

Сумма взвешенных абсолютных отклонений

5. Сумма взвешенных отклонений делится на сумму частот:

Отношение суммы взвешенных отклонений и суммы весов

Удобно пользоваться таблицей расчётных данных:

 Формула и расчёт среднего линейного отклонения

Среднее линейное отклонение размера вклада клиентов Сбербанка составляет 203,2 рубля.

4) Дисперсия — это средняя арифметическая квадратов отклонений каждого значения признака от средней арифметической.

Расчёт дисперсии в интервальных рядах распределения производится по формуле:

 Формула дисперсии

Порядок расчёта дисперсии в этом случае следующий:

1. Определяют среднюю арифметическую взвешенную, как показано в п. 2).

2. Находят отклонения вариант от средней:

Отклонение варианта от средней

3. Возводят в квадрат отклонения каждой варианты от средней:

Квадрат отклонений варианта от средней

4. Умножают квадраты отклонений на веса (частоты):

Произведение отклонения варианта от средей на частоту

5. Суммируют полученные произведения:

Сумма произведений отклонений варианта от средней на частоту

6. Полученная сумма делится на сумму весов (частот):

Формула дисперсии

Расчёты оформим в таблицу:

Формула и расчёт дисперсии

5) Среднее квадратическое отклонение размера вклада определяется как корень квадратный из дисперсии:

Расчёт среднего квадратического отклонения

6) Коэффициент вариации — это отношение среднего квадратического отклонения к средней арифметической:

 Формула и расчёт коэффициента вариации

По величине коэффициента вариации можно судить о степени вариации признаков совокупности. Чем больше его величина, тем больше разброс значений признаков вокруг средней, тем менее однородна совокупность по своему составу и тем менее представительна средняя.

В статистике под вариацией понимают количественные
изменения величины исследуемого признака в пределах однородной совокупности,
обусловленные взаимодействием различных факторов.  Причины, порождающие вариацию социально-экономических
явлений, очень сложны и многообразны. Они лежат в коренных особенностях
исследуемого явления, в его сущности, а также в методологии сбора исходной
информации. Социально-экономические явления, как правило, обладают большой
вариацией. Если исследуются результаты целенаправленной человеческой
деятельности, то вариация будет выражать вмешательство многочисленных факторов,
природу которых не всегда можно установить. Однако, в большинстве теоретических
исследований и практических применений статистики необходимы наряду со средней
показатели вариации, характеризующие группировку значений признака вокруг
средней,  т. е. степень упорядоченности
статистической совокупности.

В соответствии с определением вариация измеряется
степенью колеблемости вариантов признака от уровня их
средней величины. Именно на этом и основано большинство показателей,
применяемых в статистике для измерения вариации значений признака в
совокупности. К показателям вариации относятся: размах вариации, среднее
линейное отклонение, дисперсия, среднее квадратическое
отклонение, коэффициент вариации.

Простейшим показателем вариации является размах вариации, определяемый как разность между максимальным и минимальным значениями
признака:

Размах вариации выражается в тех же единицах
измерений, что в варианты ряда. По величине его можно определить, например,
передовое и отстающее в достижении какой-либо цели. Величина вариации служит
также и для характеристики средней. Размах вариации имеет и самостоятельное
значение. Например, в промышленности для измерения точности изделий
устанавливают определенные пределы, соответствующие иногда величине размаха
вариации их признаков.

Однако показатель размаха вариации не может в полной
мере охарактеризовать колеблемость ряда, поскольку он
не учитывает промежуточных значений вариантов внутри этих пределов, а по этому
не отражает колеблемость ряда в целом, кроме того, он
полностью зависит от максимального и минимального значений, которые могут
оказаться не достаточно характерными.

Таким образом, размах вариации отражает иногда
случайную, а не типичную для данного ряда величину колеблемости.
По этому необходимы другие показатели вариации, основанные на всех значениях
признака в данной совокупности, а именно: среднее линейное отклонение,
дисперсия и среднее квадратическое отклонение.

Среднее линейное отклонение представляет среднюю
арифметическую из абсолютных значений отклонений отдельных вариантов от их
среднего значения. 

Для данных, где частота каждого варианта равна
единице, среднее линейное отклонение определяется по формуле:

Для вариационных рядов

 определяется с учетом частот по формуле:

Среднее линейное отклонение по сравнению с размахом
вариации дает более полную характеристику колеблемости
признака в совокупности.

Средний квадрат отклонений вариантов от их средней
величины называют дисперсией

.
Дисперсия рассчитывается по формуле:

Для негруппированных
данных, где частота каждого варианта равна единице, дисперсия рассчитывается по
формуле простой средней:

Среднее квадратическое отклонение представляет собой корень квадратный из дисперсии:

либо при равенстве весов:

Среднее квадратическое
отклонение является также обобщающим показателем колеблемости
признака и характеризует средний показатель отклонения вариантов ряда от их
общей средней. Выражается s в тех же именованных числах, в которых выражены
варианты совокупности и средняя величина.

Дисперсия и среднее квадратическое отклонение — наиболее широко применяемые
показатели вариации. Объясняется это тем, что они входят в большинство теорем
теории вероятностей, служащих фундаментом математической статистики. Кроме
того, дисперсия может быть разложена на составные элементы, позволяющие оценить
влияние различных факторов, обусловливающих вариацию признака. Порядок расчета
среднего квадратического отклонения следующий:

1) Определяется средняя
величина:

2) Рассчитывается
отклонения вариантов от средней:

3) Отклонение каждого
варианта от средней возводится в квадрат:

4) Квадрат отклонений
взвешивается по частотам:

5) Взвешенные по
частотам квадраты отклонений суммируются:

6) Полученная сумма
делится на сумму частот, и из нее извлекается квадратный корень.

Среднее квадратическое
отклонение можно вычислить, составив следующую расчетную таблицу:

№ п/п Линейные отклонения от средней

Квадрат линейных отклонений

Взвешенные квадраты

Итого

Среднее квадратическое
отклонение можно вычислить на основании математических преобразований значений
варьирующего признака, применяя способ условных моментов:

где первый условный
момент:

второй условный момент:

Среднее квадратическое
отклонение по способу условных моментов определяется по формуле:

Система условных
моментов различных порядков, в частности, третьего

 и
четвертого

 используется при расчете различных
статистических характеристик (например, коэффициентов асимметрии и эксцесса).

Чем больше σ, тем разнообразнее состав
совокупности по величине изучаемого признака, и, наоборот, чем меньше σ, тем
состав совокупности по величине изучаемого признака более одинаков. Однако
оценка величины σ
как качественной характеристики ряда в конечном итоге определяется сущностью
изучаемых явлений. Среднее квадратическое отклонение
используется для сопоставления вариации по однородным совокупностям, а также
для одной совокупности за разные годы. Среднее квадратическое
отклонение является критерием надежности средней. Чем меньше оно, тем лучше
средняя арифметическая отражает всю представляемую совокупность.

Коэффициент осцилляции – процентное отношение размаха
вариации к средней

Линейный 
коэффициент вариации (относительное линейное отклонение)
измеряют через
соотношение среднего линейного отклонения и средней:

Коэффициент вариации представляет собой отношение
среднего квадратического отклонения к средней
арифметической:

Характеризуя степень колеблемости
признака, коэффициент вариации позволяет давать сравнительную характеристику
этой колеблемости одного и того же признака в
различных совокупностях.

Коэффициент вариации используется также, если
сравнивается степень вариации одного и того же признака в двух совокупностях,
имеющих разные по величине средние. Как относительные величины коэффициенты
вариации могут сопоставляться не только для одинаковых одноименных показателей,
но и для различных показателей, выраженных в разных единицах измерения. Таким
образом, коэффициент вариации в отличие от среднего квадратического
отклонения позволяет сопоставить глубину вариации неоднородных совокупностей.

Вариация – степень
изменчивости признака в совокупности.

Для характеристики
вариации используются абсолютные и
относительные показатели.

Для начала рассмотрим
и найдём абсолютные показатели.

Таблица 12

Интервал

Кол-во кварталов

Величина интервала

Сер.интер.

lXi­Xвзв.l

1

(166,6;167,8)

1

1,2

167,2

36,74

2

(167,8;170,1)

2

2,3

168,95

34,99

3

(170,1;173,6)

0

3,5

171,85

32,09

4

(173,6;178,3)

4

4,7

175,95

27,99

5

(178,3;184,2)

1

5,9

181,25

22,69

6

(184,2;191,2)

0

7

187,7

16,24

7

(191,2;199,4)

1

8,2

195,3

8,63

8

(199,4;208,8)

3

9,4

204,1

0,17

9

(208,8;219,3)

5

10,5

214,05

10,12

10

(219,3;231,0)

4

11,7

225,15

21,22

11

(231,0;243,9)

2

12,9

237,45

33,52

12

(243,9;258)

1

14,1

250,95

47,02

Продолжение таблицы

lXi­-Xвзв.l*fi

(Xi­-Xвзв.)²*fi

36,74

1349,460

69,97

2447,900

0,00

0

111,94

50122,254

22,69

514,609

0,00

0

8,63

74,563

0,50

0,735

50,58

12789,153

84,86

28804,878

67,03

8986,042

47,02

2210,410

Xвзв.

203,935

1) Первый абсолютный
показатель — размах вариации, который
рассчитывается по формуле:

R
= Хmax
Xmin

Подставив наши
значения в формулу, находим:

Таблица 13

R(размах
вариации)

91,4

Xmax

258

Xmin

166,6

Вывод: Таким
образом, разница между максимальным и
минимальным значением квартальной
выручки в период с 2005 по 2010 год составила
91,4 млн. рублей.

2) Среднее линейное
отклонение, которое рассчитывается по
формуле:

Подставив наши
значения в формулу, находим

đ

41,66

3) Среднее квадратичное
отклонение, которое рассчитывается по
формуле:

Подставив наши значения в формулу,
находим

σ

94,560

Вывод: Среднее
линейное и среднее квадратичное
отклонение показывают, на сколько в
среднем колеблются индивидуальные
значения выручки от ее среднего значения,
таким образом, индивидуальные значения
выручки от её среднего значения в среднем
колеблются на 41,66 млн. рублей и 92,56 млн.
рублей.

4) Дисперсия, которая
рассчитывается по формуле:

Подставив наши
значения в формулу, находим

σ²

8941,667

Вывод: Дисперсия
измеряет вариацию признака по всей
совокупности в целом под влиянием всех
факторов, обуславливающих эту вариацию.

Теперь рассмотрим
относительные показатели.

  1. Коэффициент
    осцилляции, который рассчитывается по
    формуле:

R

91,4

Xвзв.

203,935

Xmax

258

Xmin

166,6

R/Xвзв.

0,45

Vr(%)

44,82%

Таблица 14

  1. Линейный
    коэффициент вариации, который
    рассчитывается по формуле:

Таблица 15

Xвзв.

203,935

đ

41,66

20,43%

  1. Коэффициент
    вариации, который рассчитывается по
    формуле:

Таблица 16

Xвзв.

203,935

σ

94,560

46,37%

Вывод: Относительные
показатели вариации характеризуют
степень однородности совокупности,
т.к. значения коэффициента вариации
превышают 33%, то совокупность считается
неоднородной.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

  • #
  • #
  • #
  • #
  • #
  • #
  • #
  • #
  • #
  • #
  • #

ПРАКТИЧЕСКОЕ ЗАНЯТИЕ №5.

Расчёт показателей вариации.

Студент должен:

знать:

   область применения и методику расчёта
степенных средних величин;

уметь:

   исчислять
степенные средние
величины;

   формулировать вывод по полученным
результатам.

Методические указания

Наряду со средними
величинами в статистике исчисляются показатели вариации. Вариацией в статистике
называются различия индивидуальных значений изучаемого признака. Возникает
вариация в силу того, что отдельные значения признака статистической совокупности
формируются под воздействием разнообразных факторов. Значение изучения вариации
в том, что по колеблемости признаков можно судить о качественной однородности
совокупности. Совокупности могут иметь одинаковые значения средней величины, но
отличаться колеблемостью индивидуальных значений.

Например: По имеющимся данным о дневной выработке рабочих двух бригад определить
среднюю выработку рабочего за день в каждой бригаде, сделать вывод об
однородности рассматриваемых совокупностей и надёжности их средних.

Выработка в первой
бригаде: 31, 25, 30, 26, 28 деталей.

Выработка во второй
бригаде: 27, 20, 56, 19, 18 деталей.

Решение:

Исходные данные не
сгруппированы, поэтому для расчёта средней выработки применяем среднюю
арифметическую простую. Средняя дневная выработка рабочего:

в первой бригаде

во второй бригаде  

Среднедневная выработка рабочего в
обеих бригадах одинакова, но  индивидуальные
значения выработки во второй бригаде подвержены значительным колебаниям. Это
вызывает необходимость измерять вариацию.

К
абсолютным показателям вариации относятся

 размах вариации, среднее линейное отклонение,
дисперсия и среднее квадратическое отклонение.

Элементарным
показателем колеблемости является размах вариации, который определяется
как разность между наибольшим и наименьшим значением признака:                   
Rmax Xmin

В нашем примере размах
вариации индивидуальной выработки:

в первой бригаде R1 =31-25=6 деталей

во второй бригаде R2 =56-18=38 деталей

Сравнение этих
показателей свидетельствует о том, что размах вариации индивидуальной выработки
во второй бригаде на 32 детали больше, чем в первой бригаде. Однако размах
вариации не улавливает колеблемости вариантов внутри изучаемой совокупности.
Для получения обобщающей характеристики колеблемости всех вариантов
совокупности исчисляются другие показатели вариации.

Среднее линейное отклонение даёт обобщённую характеристику степени колеблемости признака
в совокупности относительно среднего уровня признака и рассчитывается  как средняя арифметическая из индивидуальных
линейных отклонений по формуле:

                
для
невзвешенных данных         

                
для
взвешенных данных             

где  — индивидуальное
линейное отклонение.

Показатель
среднего линейного отклонения нашел широкое применение на практике. С его
помощью анализируют состав работающих, ритмичность производства, равномерность
поставок материалов; разрабатывают системы материального стимулирования. Но
этот показатель усложняет расчёты вероятностного типа, затрудняет применение
методов математической статистики. Поэтому в статистических научных
исследованиях для измерения вариации чаще всего применяют показатель дисперсии.

В
статистике дисперсия, центральный момент второго порядка, является оценкой
одноимённого показателя теории вероятностей и оценкой дисперсии в
математической статистике, что позволяет использовать теоретические положения
этих дисциплин для анализа социально – экономических процессов. На дисперсии
практически основаны все метод математической статистики. Большое значение
имеет правило сложения дисперсий. Дисперсия рассчитывается как средний  квадрат отклонений индивидуальных значений
признака от среднего

значения признака по формуле:

                
для
невзвешенных данных        

                
для
взвешенных данных            

Среднее квадратическое отклонение является обобщающей характеристикой размеров вариации признака совокупности. Это мера вариации, показатель надёжности средней. Чем меньше значение
среднего квадратического отклонения, тем лучше средняя величина представляет собой
рассматриваемую совокупность.Среднее квадратическое отклонение рассчитывается
по формуле:                   

Для
расчёта показателей вариации в нашем примере строим вспомогательную таблицу:

Первая бригада

Вторая бригада

Выработка,деталей

i )

Индивидуальное линейное отклонение

Выработка, деталей

i )

Индивидуальное линейное отклонение 

25

|-3|

9

18

|-10|

100

26

|-2|

4

19

|-9|

81

28

0

0

20

|-8|

64

30

2

4

27

|-1|

1

31

3

9

56

28

784

Итого:

10

26

56

1030

Среднее
линейное отклонение:

в первой бригаде ;              во второй
бригаде .

Дисперсия:

в первой бригаде ;               во
второй бригаде .

Среднее квадратическое отклонение:

в первой бригаде ; во второй бригаде

Таким образом,
выполненные нами расчёты показывают, что колеблемость индивидуальных значений
выработки во второй бригаде намного выше, чем в первой бригаде.

Для
целей сравнения колеблемости различных признаков в одной и той же совокупности
или же при сравнении колеблемости одного и того же признака в нескольких
совокупностях исчисляют показатели
вариации в относительных величинах.
Базой для сравнения должна служить
средняя арифметическая. Эти показатели вычисляются как отношение размаха
вариации, среднего линейного отклонения или среднего квадратического отклонения
к средней арифметической (реже к медиане). Чаще всего они выражаются в
процентах и определяют не только сравнительную оценку вариации, но и дают
характеристику однородности совокупности. Совокупность
считается однородной, если коэффициент вариации не превышает 33%
(для
распределения близкого к нормальному). Различают следующие относительные
показатели вариации:

Коэффициент осцилляции (vR) рассчитывается по формуле:

     

и отражает относительную меру
колеблемости крайних значений признака вокруг средней.

Линейный коэффициент вариации (vd) рассчитывается
по формуле:
 

 

и отражает долю усреднённого значения
абсолютных отклонений от средней величины.

Коэффициент вариации (vσ ) как относительное квадратическое отклонение от средней величины
рассчитывается по формуле:

Рассчитаем относительные
показатели вариации для нашего примера.

Коэффициент осцилляции

Для первой бригады:                                  Для
второй бригады:

                                     

Линейный коэффициент вариации

Для первой бригады:                                           Для
второй бригады:

                                          

Коэффициент вариации

Для первой бригады:                                  Для
второй бригады:

                                   

Величина рассчитанных
нами коэффициентов свидетельствует о том, что колеблемость индивидуальных
значений выработки во второй бригаде высокая. Первую совокупность можно считать
однородной, а её среднюю – надёжной. Вторую совокупность следует считать
неоднородной, а её среднюю – ненадёжной.

Рассмотрим
примеры расчёта показателей вариации для сгруппированных данных.

Пример
1. По имеющимся данным узла связи рассчитайте абсолютные и относительные
показатели вариации. Сделать вывод об однородности рассматриваемой совокупности
и надёжности её средней.

Количество
слов в телеграмме
i)

Число
телеграмм
(fi)

12

13

14

15

16

17

18

18

22

34

26

20

13

7

Итого

140

Решение:

Исходные
данные представлены в виде дискретного ряда распределения.

Для
исчисления среднего значения признака и показателей вариации строим и
рассчитываем вспомогательную таблицу:

Количество слов в телеграммеi)

Число телеграмм (fi)

12

18

216

54

9

162

13

22

286

44

4

88

14

34

476

34

1

34

15

26

390

0

0

0

0

16

20

320

1

20

1

20

17

13

221

2

26

4

52

18

7

126

3

21

9

63

итого

140

2035

199

419

1). Определяем среднее количество слов в телеграмме по
формуле средней арифметической взвешенной, так как исходные данные
сгруппированы:

2). Определяем абсолютные показатели
вариации:

Размах вариации Rmax Xmin=18-12=6 слов

Среднее линейное отклонение по
формуле  для взвешенных данных:

где  — индивидуальное
линейное отклонение.

Дисперсию исчисляем по формуле для
взвешеных данных 

Среднее квадратическое отклонение:

3). Определяем относительные 
показатели вариации:

Коэффициент осцилляции: т.е. колеблемость крайних значений признака вокруг средней
составляет 40%.

Линейный коэффициент
вариации:
 , т.е. доля усреднённого значения абсолютных отклонений от
средней величины составляет 9,3%.

Коэффициент вариации:    

Вывод:
Величина рассчитанного нами коэффициента вариации свидетельствует о том, что
колеблемость индивидуальных значений слов в телеграмме  невысокая, т.е.
Vσ ≤ 33%.

Поэтому совокупность можно считать
однородной, а её среднюю – надёжной.

Пример 2. Имеются следующие данные о
распределении сотрудников организации по среднемесячной заработной плате.
Рассчитать абсолютные и относительные показатели вариации. Сделать вывод об
однородности рассматриваемой совокупности и надёжности её средней.

Группы сотрудников по
среднемесячной заработной плате, тыс. руб.

Количество

сотрудников, чел. (fi)

До 3

3-4

4-5

5-6

6-7

7-8

8-9

9-10

10 и свыше

14

22

25

29

10

8

6

5

3

Итого:

122

Решение:

Исходные данные представлены в виде
интервального ряда распределения.

Для исчисления среднего значения
признака и показателей вариации строим и рассчитываем вспомогательную таблицу:

Группы
сотрудников

по
среднемесяч-

ной
заработной плате, тыс. руб.

Централь-

ное
значение признака в интервале

с)

Коли-

чество
сотруд-

ников,
чел. (
fi)

До 3

2,5

14

35

38,36

7,51

105,14

3-4

3,5

22

77

38,28

3,03

66,61

4-5

4,5

25

112,5

18,5

0,55

13,69

5-6

5,5

29

159,5

0,26

7,54

0,07

1,96

6-7

6,5

10

65

1,26

12,6

1,59

15,90

7-8

7,5

8

60

2,26

18,08

5,11

40,86

8-9

8,5

6

51

3,26

19,56

10,63

63,76

9-10

9,5

5

47,5

4,26

21,3

18,15

90,74

10 и выше

10,5

3

31,5

5,26

15,78

27,67

83,00

итого

122

639

190

481,66

1). Определяем среднюю
заработную плату по формуле средней арифметической взвешенной для интервального
ряда распределения:

2). Определяем абсолютные показатели
вариации:

Размах вариации не рассчитываем, т.к.
нижняя граница первого интервала и верхняя граница последнего интервала не
указаны.

Среднее линейное отклонение по
формуле  для взвешенных данных:

где  — индивидуальное
линейное отклонение.

Дисперсию исчисляем по формуле для
взвешеных данных:

Среднее квадратическое отклонение:

3). Определяем относительные показатели вариации:

Коэффициент осцилляции (VR) не рассчитываем, т.к. не
рассчитывали размах вариации.

Линейный коэффициент вариации: , т.е. доля усреднённого значения абсолютных отклонений от
средней величины составляет 29,8%.

Коэффициент вариации:    

Вывод: Величина
рассчитанного нами коэффициента вариации свидетельствует о том, что
колеблемость индивидуальных значений заработной платы высокая, т.е.
Vσ ≥ 33%.  Поэтому совокупность считаем неоднородной, а
её среднюю – ненадёжной.

Свойства дисперсии

Свойство 1.
Дисперсия постоянной величины равна нулю.

Свойство 2.
Уменьшение всех значений признака на одну и ту же величину А не меняет величины
дисперсии:

Значит, средний квадрат отклонений можно вычислить не по заданным
значениям признака, а по отклонениям их от какого-то постоянного числа.

Свойство 3.
Уменьшение всех значений признака в  раз уменьшает
дисперсию в  раз, а среднее квадратическое
отклонение — в  раз:

Значит, все значения признака можно разделить на какое-то постоянное
число (скажем, на величину интервала ряда), исчислить среднее квадратическое
отклонение, а затем умножить его на постоянное число:

Свойство 4.
Если исчислить средний квадрат отклонений от любой величины А, в той или иной
степени отличающейся от средней арифметической (), то он всегда будет больше среднего квадрата отклонений,
исчисленного от средней арифметической:

Средний квадрат отклонений при этом будет больше на вполне определенную
величину — на квадрат разности средней и этой условно взятой величины, т. е. на
:

         или

Значит, дисперсия от средней всегда меньше дисперсий, исчисленных от
любых других величин, т. е. она имеет свойство минимальности.

В случае когда А приравнивается к нулю и, следовательно, не вычисляются
отклонения, формула принимает такой вид:

      или        

Значит, средний квадрат отклонений равен среднему квадрату значений
признака минус квадрат среднего значения признака

Виды (показатели) дисперсий и правило
их сложения

В статистическом исследовании очень
часто бывает необходимо не только изучить вариации признака по всей
совокупности, но и проследить количественные изменения признака по однородным
группам совокупности, а также и между группами. Следовательно, помимо общей
средней для всей совокупности необходимо просчитывать и частные средние
величины по отдельным группам.

Различают три вида дисперсий:

                
общая;

                
средняя
внутригрупповая;

                
межгрупповая.

Общая дисперсия () характеризует вариацию признака всей совокупности под
влиянием всех тех факторов, которые обусловили данную вариацию. Эта величина
определяется по формуле

 

где  — общая средняя
арифметическая всей исследуемой совокупности.

Средняя внутригрупповая
дисперсия
() свидетельствует о случайной вариации, которая может
возникнуть под влиянием каких-либо неучтенных факторов и которая не зависит от
признака-фактора, положенного в основу группировки. Данная дисперсия
рассчитывается следующим образом: сначала рассчитываются дисперсии по отдельным
группам ():

,

а затем — рассчитывается средняя внутригрупповая дисперсия :

где ni
число единиц в группе

Межгрупповая дисперсия
(
) (дисперсия групповых средних) характеризует систематическую
вариацию, т.е. различия в величине исследуемого признака, возникающие под
влиянием признака-фактора, который положен в основу группировки. Эта дисперсия
рассчитывается по формуле:

где — средняя величина по отдельной группе.

Все три вида дисперсии связаны между собой: общая дисперсия
равна сумме средней внутригрупповой дисперсии и межгрупповой дисперсии:

Данное соотношение отражает закон,
который называют правилом сложения дисперсий.
Согласно этому закону (правилу), общая дисперсия, которая возникает под
влиянием всех факторов, равна сумме дисперсий, которые появляются как под
влиянием признака-фактора, положенного в основу группировки, так и под влиянием
других факторов. Благодаря правилу сложения дисперсий можно определить, какая
часть общей дисперсии находится под влиянием признака-фактора, положенного в
основу группировки.

Правило сложения дисперсий широко
применяется при исчислении показателей тесноты связи, в дисперсионном анализе,
при оценке точности типической выборки и в ряде других случаев.

Содержание курса лекций «Статистика»

Показатели вариации в анализе взаимосвязей

Тема 9 Показатели вариации

Для измерения степени колеблемости отдельных значений признака относительно средней исчисляют основные показатели вариации.



Информация о средних уровнях исследуемых показателей обычно бывает недостаточной для полного анализа изучаемого процесса или явления. Иногда совершенно непохожие по своему внутреннему строению совокупности могут иметь равные средние величины. Поэтому для более детального изучения того или иного явления необходимо учитывать разброс или вариацию значений отдельных единиц совокупности. Измерение вариации признаков имеет как теоретическое, так и практическое значение.

Так, например, для выявления наиболее стабильно работающего коллектива или предприятия наравне с другими показателями рассчитывают и основные показатели вариации. Эти показатели дают возможность количественно определить размеры устойчивости производительности труда, уровня квалификации, цен на основные виды выпускаемой продукции и т.п. Измерение размеров вариации такого показателя, как «выполнение работ в срок» имеет важное значение для принятия решений заказчиками и инвесторами, т.к. ситуация, в которой присутствует изменчивость признака, часто содержит риск. Осо­бое значение показатели вариации приобретают в анализе рынка ценных бумаг, где мера колеблемости отождествляется с мерой рискованности вложения денежных средств.



Основными показателями, характеризующими вариацию, являются:

  • размах вариации;
  • среднее линейное отклонение;
  • дисперсия;
  • среднее квадратическое отклонение;
  • коэффициент вариации.


1)  Размах вариации

9.1 Размах вариации

(9.1 ) –  размах вариации



2) Среднее линейное отклонение исчисляют для того, чтобы дать обобщающую характеристику распределению отклонений:

среднее линейное отклонение для несгруп данных

(9.2) – среднее линейное отклонение                  для несгруппированных данных


Среднее линейное отклонение для вариационного ряда

(9.3) – среднее линейное отклонение                          для вариационного ряда


где  –абсолютные значения отклоненийабсолютные значения отклонений отдельных вариантов xi от средней арифметической ;  fi  – частота.



3. Дисперсия – это средняя арифметическая квадратов отклонений отдельных значений признака от их средней арифметической:

Дисперсия

(9.4) –  дисперсия



4. Среднее квадратическое отклонение – корень квадратный из дисперсии:

Среднее квадратическое отклонение для несгруппированных данных

(9.5) – среднее квадратическое отклонение                  для несгруппированных данных


 среднее квадратическое отклонение для вариационного ряда

(9.6)- среднее квадратическое отклонение                         для вариационного ряда



!!!В отличие от дисперсии среднее квадратическое отклонение является абсолютной мерой вариации признака в совокупности и выражается в единицах измерения варьирующего признака (руб., тыс., млн и т.д.).!!!



5. Коэффициент вариации – используется для сравнительной оценки вариации, а также для характеристики однородности совокупности:

коэффициент вариации

(9.7) – коэффициент вариации



Пример. Для иллюстрации расчетов воспользуемся данными нижеприведенной табл. 9.1:

Таблица 9.1 ‑ Данные о продаже основных марок холодильников:

Модель Цена

( $ )

Объем продаж (шт.) xifi
1 Siemens 1000 30 30000
2 Bosch 800 26 20800
3 AEG Santo 900 24 21600
4 Miele KF 1200 30 36000
5 Gorenje 870 20 17400
6 Haier 570 23 13110
7 Samsung 760 30 22800
8 Zanussi 700 20 14000
9 Daewoo 460 20 9200
10 Beko 650 25 16250
11 Candy 480 20 9600
10 Whirpool 470 21 9870
ИТОГО 8860 289 220630

Рассчитаем размах вариации.

R= 1200-460=740$

Пример вычисления размаха вариации


Размах вариации служит незаменимой мерой разброса экстремальных значений признака. Кроме характеристики границ разброса признака, размах вариации может быть использован для выявления ошибок. При наличии очень больших (или очень малых) ошибочно записанных значений признака размах вариации сразу резко возрастает, что требует проверки и корректировки исходных данных.

Недостатком данного показателя является то, что он оценивает только границы варьирующего признака и не отражает его колеблемость внутри этих границ. Вследствие этого размах вариации может неправильно характеризовать общую колеблемость признака.


Этого недостатка лишен другой показатель – дисперсия, рассчитываемый как средний квадрат отклонений значений признака от их средней величины.

Между индиви­дуальными отклонениями от средней и колеблемостью признака существует прямая зави­симость: чем сильнее колеблемость признака, тем больше отклонения его значений от средней величины и менее устойчив изучаемый показатель.

Как и средняя величина этот показатель может быть рассчитан в двух формах: взвешенной и невзвешенной

По приведенным выше данным определим средневзвешенную цену холодильника:

Пример расчета сред арифм взвешенная

Пример вычисления средней арифметической взвешенной


Далее рассчитаем дисперсию:

Пример расчета дисперсии

Пример вычисления дисперсии


!!!Следует отметить, что дисперсия еще не дает представления об однородности со­вокупности, и этому показателю трудно дать экономическую интерпретацию, т.к. он рас­считан в квадратных единицах. Поэтому следующим шагом в исследовании однородности совокупности является расчет среднего квадратического отклонения, показывающего, на­сколько в среднем отклоняются конкретные варианты признака от его среднего значения. Оно определяется как квадратный корень из дисперсии и имеет ту же размерность что и изучаемый признак.!!!



Рассчитаем среднее квадратическое отклонение

Пример расчета сред квадрат отклон

Пример вычисления среднего квадратического отклонения


Вывод: Таким образом, цена каждой марки холодильника отклоняется от средней цены в среднем на 271,1 $



Рассмотренные показатели позволяют получить абсолютное значение вариации признака. Однако для сравнения разных совокупностей с точки зрения устойчивости ка­кого-либо одного признака или для определения однородности совокупности рассчиты­вают относительные показатели.

Эти показатели вычисляются как отношение размаха вариации, среднего линейно­го отклонения или среднего квадратического отклонения к средней арифметической или медиане. Чаще всего эти показатели выражаются в процентах.



Определим значение  показателя вариации по вышеприведенным данным таблицы

Пример расчета показателя вариации

Пример вычисления показателя вариации


Совокупность считается однородной, если V не превышает 33%.

Если V<10%  вариация признака слабая;

10% < V<25% –  вариация средняя;

V>25% – вариация сильная.

Вывод: Рассчитанная величина свидетельствует о неоднородности цен на холодильники, т.к. однородной совокупность считается, если коэффициент вариации меньше 33% (для распределений близких к нормальному).



!! Следует отметить, что коэффициент вариации может быть более 100%, что, в част­ности, может быть при наличии значений сильно отличающихся от средней величины. Такой результат означает, что в исследуемой совокупности сильна вариация признаков по отношению к средней величине.


Изучая вариацию интересующего нас признака в пределах исследуемой совокупно­сти и опираясь на общую среднюю в расчетах, трудно оценить степень воздействия на него какого-либо отдельного признака.

При проведении такого анализа исходная совокупность должна представлять собой множество единиц, каждая из которых характеризуется двумя признаками – факторным (оказывающим влияние на взаимосвязанный с ним признак) и результативным (подвер­женным влиянию).



Для выявления взаимосвязи исходная совокупность делится по факторному признаку на группы. Выводы о степени взаимосвязи базируются на анализе вариации резуль­тативного признака. Если статистическая совокупность разбита на группы по какому-либо признаку, то для оценки влияния различных факторов, определяющих вариацию индиви­дуальных значений признака, используют правило сложения дисперсий.

Общая дисперсия представляет собой сумму средней из виутригрупповой и меж­групповой и дисперсий:

Общая дисперсия

(9.8) – общая дисперсия


 где:

пояснение к общей диспер


Общая дисперсия характеризует вариацию признака по всей совокупности как ре­зультат влияния всех факторов, определяющих индивидуальные различия единиц сово­купности.


формула 9.9

(9.9)


где:

к формуле 9.9



Межгрупповая дисперсия  характеризует вариацию, обусловленную влиянием фактора, положенного в основу группировки.

межгрупповая дисперсия

(9.10) – межгрупповая дисперсия


где:

Пояснение межгрупповая дисперсия



Средняя из внутригрупповых дисперсий отражает ту часть вариации результа­тивного признака, которая обусловлена действием всех прочих неучтенных факторов, кроме фактора, по которому осуществлялась группировка. Другими словами внутригрупповая дисперсия отражает случайную вариацию. Внутригрупповая дисперсия рас­считывается отдельно по каждой j-ой группе.

Внутригрупповая дисперсия

(9.11) – внутригрупповая дисперсия


где:

Пояснение внутригрупповая дисперсия



Для всех групп в целом вычисляется средняя из внутригрупповых дисперсий, взвешенных на частоты соответствующих групп по формуле:

Средняя из внутригрупповых дисперсий

(9.12) – средняя из внутригрупповых дисперсий



Взаимосвязь между тремя видами дисперсий получила название правила сложения дисперсий. Таким образом, зная два вида дисперсий всегда можно определить третий:

Взаимосвязь между тремя видами дисперсий

(9.13) – правило сложения                                    дисперсий


Из этого равенства следует, что общая дисперсия, как правило, будет больше средней из групповых дисперсий. Это обусловлено тем, что при расчленении об­щей совокупности единиц на части по какому-либо признаку образуются более или менее однородные группы, в результате чего сокращается колеблемость признаков в пределах каждой группы. Это приводит к тому, что средняя из групповых дисперсий оказывается меньше дисперсии признака по всей совокупности единиц, причем разница между этими показателями будет тем больше, чем однороднее получаются группы в результате расчле­нения общей совокупности.



Теснота связи между факторным и результативным признаками оценивается на ос­нове эмпирического корреляционного отношения:

эмпирич корреляц отнош

(9.14)


Данный показатель может принимать значения от 0 до 1. Чем ближе к 1 будет его величина, тем сильнее взаимосвязь между рассматриваемыми признаками.



Пример. На следующем условном примере исследуем зависимость объема выполненных ра­бот от формы собственности проектно-изыскательских организаций.

Таблица 9.2. Выполнение работ проектно-изыскательскими организациями разной формы собственности

Форма собственности Количество предприятий

Объем выполненных работ

(млн. руб.)

Итого
Государственная 4 10,30,20,40 100
Негосударственная 6 20, 40, 60, 20, 50, 50 240
Итого 10 340

Решение:

1) Определим средний объем работ для предприятий двух форм собственности.

пример 1


2) Определим средний объем работ для каждой формы собственности.

Пример 2


3) Рассчитаем общую и внутригрупповые (т.е. для каждой группы) дисперсии.

пример 3


4) Определим среднюю из внутригрупповых и межгрупповую дисперсию. Для этого полученные ранее данные заносятся в таблицу расчета.

Таблица 9.3. – Вспомогательная таблица

Форма

собственности

Число

предприятий

Средняя

по группе

Внутригрупповые

дисперсии

Государственная 4 25 125
Негосударственная 6 40 233
Итого 10

Пример. Средняя из внутригрупповых дисперсий

Пример расчета средней из внутригрупповых дисперсий


Пример. Межгрупповая дисперсия

ПРимер расчета межгрупповой дисперсии



На последнем этапе решения задачи необходимо проверить тождество, отражающее закон сложения дисперсий:

Проверка закона сложения дисперсий:  54,0+189,8=243,8


Вывод: Таким образом, можно сделать вывод о том, что объем работ, выполненных проектно-изыскательскими организациями на 22% [(54,0/243,8) х 100%] зависит от фак­тора, положенного в основание группировки, т.е. от формы собственности, а на 78% [(189,8/243,8)х100%)] ‑ от прочих факторов.


Вывод о том, что объем выполненных работ в гораздо большей степени зависит от каких-либо других факторов, чем от формы собственности предприятий подтверждается и величиной эмпирического корреляционного отношения:

Пример расчета эмперич корреляц отнош

Вывод: Величина этого показателя свидетельствует о том, что зависимость объема работ от формы собственности предприятия невелика


Содержание курса лекций «Статистика»


Контрольные задания

  1. Распределение студентов одного из факультетов по возрасту характеризуется следующими данными:
Возраст студентов, лет 17 18 19 20 21 22 23 24 Всего
Число студентов 20 80 90 110 130 170 90 60 750

Вычислить: а) размах вариации; б)среднее линейное отклонение; в) дисперсию; г) среднее квадратическое отклонение; относительные показатели вариации возраста студентов.

2. По данным статистических ежегодников постройте таблицу с рядом показателей и определите показатели вариации: а) размах; б) среднее линейное отклонение; в) среднее квадратическое отклонение; г) коэффициент вариации. Оцените количественную однородность совокупности.

Содержание курса лекций «Статистика»

Понравилась статья? Поделить с друзьями:
  • Как найти площадь фигуры видео
  • Что значит конечный файл велик для конечной файловой системы как исправить
  • Моя анкета как составить
  • Как составить акт кс2 в гранд смете
  • Как найти необходимое количество теплоты для плавления