Медиана интервального вариационного ряда как найти - Исправление недочетов и поиск решений вместе с Examum.ru

,(20)

где
–
нижняя граница медианного интервала;– величина медианного интервала;–
накопленная частота (или частость)
интервала, предшествующего медианному;–
половина суммы всех частот (или частостей);– частота медианного интервала.

При
исчислении медианы интервального
вариационного ряда сначала находят
интервал, содержащий медиану. Для этого
используют накопленные частоты (или
частости). Медианному
интервалу соответствует первая из
накопленных частот (или частостей),
превышающая половину всего объёма
совокупности.

Пример:
процент выполнения норм выработки (х).

Интервалы	x_i	m_i	Накопленные частоты
90–100	95	3	3
100–110	105	8	11
110–120	115	7	18
120–130	125	2	20
Σ	–	20	–

Первая из накопленных
частот превышает 0,5·Σm_i,
т.е. 10:

0,5·Σm_i,
= 10.

Значит медианный
интервал (100–110):

=
100; = 3;

k
=
100 – 100 = 10; = 3;

11. Мода

В математической
статистике модой
называют вариант, наиболее
часто встречающийся в данном вариационном
ряду.

Для дискретного
ряда мода
определяется по наибольшей частоте и
соответствует
варианту с наибольшей частотой.

Мода для непрерывного
(интервального с равными интервалами)
ряда исчисляется по формуле:

,(21)

где
х_Мо₍_min₎ —
нижняя граница модального интервала;

m_Мо —
частота модального интервала;

m_Мо–1 —
частота интервала, предшествующего
модальному;

m_Мо+1
— частота интервала, последующего за
модальным;

k_i
— величина модального интервала.

Может
быть: одна мода –
унимодальное распределение;

две моды –
бимодальное распределение;

три и более –
мультимодальное распределение.

Модальный интервал
определяется по набольшей частоте.

Пример:

Интервалы	m_i
90–100	3
100–110	8
110–120	7
120–130	2
Σ	20

Модальный интервал
(100–110), т.к. он имеет наибольшую частоту.

х_Мо₍_min₎
= 100

k
=
10 m_Мо–1
= 3;

m_Мо
= 8; m_Мо+1
= 7;

Мо
≈108,3

Показатели колеблемости (вариации) признака

Такие признаки,
как заработная плата, профессия, число
членов семьи, возраст и т.д. — варьируют.

Для измерения
вариации признака математическая
статистика применяет ряд показателей.

12.
Вариационный размах (R),
или широта распределения

R
= x_max– x_min

(22)

применялся в
формуле (8.6)

x_max
— наибольший вариант вариационного
ряда.

x_min
— наименьший вариант вариационного
ряда.

R
представляет
собой величину неустойчивую, зависящую
от случайных обстоятельств. Она
применяется в качестве приблизительной
оценки вариации.

Среднее
линейное отклонение

невзвешенное

взвешенное
(23)

13
Дисперсия (средний квадрат отклонения)

невзвешенная

взвешенная
(24)

Упрощённая
формула дисперсии

,
(25)

где

14.
Среднее квадратическое отклонение
(с.к.о.)

(26)

15.
Коэффициент вариации (υ)

(27)

Применяется
только для признака, принимающего только
положительные значения.

Если ν > 40%, то это
говорит о большой колеблемости признака
в изучаемой совокупности (например
большая колеблемость товарооборота в
регионе).

–коэффициент
осцилляции

–коэффициент
вариации по среднему линейному
отклонению.

16.
Свойства дисперсии

1. σ²(С)
= 0, где
С –
const.

2. Если все
значения вариантов признака Х уменьшить
на постоянную величину, то дисперсия
не изменится.

3. Если все
значения вариантов признака Х увеличить
в k
раз, то дисперсия увеличится в k²
раз.

4. Вычисление
дисперсии методом отсчёта от условного
нуля (методом моментов).

(28)

17.
Частные средние и частные дисперсии

Пусть вся совокупность
разбита на l
групп. Для каждой группы вариантов
вариационного ряда можно вычислить
средние, которые называются частными
средними
и дисперсии, которые называются частными
дисперсиями или внутригрупповыми
дисперсиями.
Пусть l
групп:

(29)

j=1,
2, …, l;

Σm_i
= N_j
– объём j-ой
группы

–частная средняя
j-ой
группы

(30)

Частные средние
могут не совпадать с общей средней
.
Убедимся в этом:

n₁ = 3	n₂ = 5	n₃ = 2
x₁ x₂ x₃	x₄ x₅ x₆ x₇ x₈	x₉ x₁₀
m₁ m₂ m₃	m₄ m₅ m₆ m₇ m₈	m₉ m₁₀

Разбили на три
группы. l=3.
Группы не пересекаются

n₁
+ n₂
+ … + n_l
= k

n₁, n₂, n₃ – число вариантов в группе	k = 10
3 + 5 + 2 = 10

m₁
+ m₂
+ m₃
= N₁
– объём 1^ой
группы (сумма
частот в 1^ой
группе)

m₄
+ m₅
+ … + m₈
= N₂
– объём 2^ой
группы

m₉
+ m₁₀
= N₃
– объём 3^ей
группы

N_j
– объём j^той
группы

j
= 1, 2, … , l

или

i
= 3 + 5 + 1 = 8 + 1 = 9

Итак

где j
= 1, 2, …, l

Отсюда видно, как
получается формула (29).

Соседние файлы в папке 11-03-2014_20-15-21

Источник

8.4. МОДА и МЕДИАНА (структурные средние)

Мода и медиана наиболее часто используемые в экономической практике структурные средние.

Мода – это величина признака (варианта), который наиболее часто встречается в данной совокупности, т.e. это варианта, имеющая наибольшую частоту.

В дискретном ряду мода определяется в соответствии с определением, т.е. это одна из вариант признака, которая в ряду распределения имеет наибольшую частоту.

Для интервального ряда моду находим по формуле (8.16), сначала по наибольшей частоте определив модальный интервал:

(8.16 – формула Моды)

где х_о – начальная (нижняя) граница модального интервала;

h – величина интервала;

f_Мо – частота модального интервала;

f_Мо-1 – частота интервала, предшествующая модальному;

f_Мо+1– частота интервала следующая за модальным.

Медианой называется такое значение признака, которое приходится на середину ранжированного ряда, т.е. в ранжированном ряду распределения одна половина ряда имеет значение признака больше медианы, другая – меньше медианы.

В дискретном ряду медиана находится непосредственно по накопленной частоте, соответствующей номеру медианы.

В случае интервального вариационного ряда медиану определяют по формуле:

(8.17 – формула Медианы)

где х_о – нижняя граница медианного интервала;

N_Ме– порядковый номер медианы (Σf/2);

S _Me_-1 – накопленная частота до медианного интервала;

f_Ме – частота медианного интервала.

Пример вычисления Моды.

Рассчитаем моду и медиану по данным табл. 8.4.

Таблица 8.4 – Распределение семей города N по размеру среднедушевого дохода в январе 2018 г. руб.(цифры условные)

Группы семей по размеру дохода, руб.	Число семей	Накоп- ленные частоты	в % к итогу
До 5000	600	600	6
5000-6000	700	1300 (600+700)	13
6000-7000	1700 (f_Мо-1)	3000 (S _Me_-1 ) (1300+1700)	30
7000-8000 (х_о)	2500 (f_Мо) (f_Ме)	5500 (S _Me)	55
8000-9000	2200 (f_Мо+1)	7700	77
9000-10000	1500	9200	92
Свыше 10000	800	10000	100
Итого	10000	–	–

Пример вычисления Моды. Найдем моду по формуле (8.16) см. обозначения в таблице, а h = 8000-7000=1000, т.е. получаем:

Пример вычисления Моды

Пример вычисления Медианы интервального вариационного ряда. Рассчитаем медиану по формуле (8.17):

1) сначала находим порядковый номер медианы: N_Ме = Σf_i/2= 5000.

2) по накопленным частотам в соответствии с номером медианы определяем, что 5000 находится в интервале (7000 – 8000), далее значение медианы определим по формуле (8.17):

Пример вычисления Медианы

Вывод: по моде – наиболее часто встречается среднедушевой доход в размере 7730 руб., по медиане – что половина семей города имеет среднедушевой доход ниже 7800 руб., остальные семьи – более 7800 руб.

Пример .СРЕДНИЙ, МЕДИАННЫЙ И МОДАЛЬНЫЙ УРОВЕНЬ ДЕНЕЖНЫХ ДОХОДОВ НАСЕЛЕНИЯ ЦЕЛОМ ПО РОССИИ И ПО СУБЪЕКТАМ РОССИЙСКОЙ ФЕДЕРАЦИИ ЗА 2013 год см. по ссылке. Источник: оценка на основании данных ^{выборочного обследования бюджетов домашних хозяйств}^и^{макроэкономического показателя денежных доходов населения}

Соотношение моды, медианы и средней арифметической указывает на характер распределения признака в совокупности, позволяет оценить его асимметрию.

Если Мо<М_е<Х – имеет место правосторонняя асимметрия.

При Х<М_е<Мо следует сделать вывод о левосторонней асимметрии ряда.

Средние величины (арифметическая, гармоническая, геометрическая, квадратическая) см. по ссылке

Оценка статьи:

Загрузка…

Источник

Медианой

называется вариант, расположенный в центре ранжированного ряда.

Медиана делит ряд на две равные части таким образом, что по обе стороны от нее находится одинаковое количество единиц совокупности. При этом у одной половины единиц совокупности значение варьирующего признака не больше медианы, у другой — не меньше. .

Для дискретного ряда,

медиану находим по следующему алгоритму:

— ранжируем ряд,

— если выборка содержит нечетное количество элементов, медиана равна (n+1)/2-му элементу,

— если выборка содержит четное количество элементов, медиана лежит между двумя средними элементами выборки и равна среднему арифметическому, вычисленному по этим двум элементам.

Пример 1. Найти медиану дискретного ряда

16,13,15,10,19,22,25,12,18,14,19,14,16,10.

Решение. Ранжируем ряд: 10,10,12,13,14,14,15,16,16,18,19,19,22,25, выборка содержит четное число элементов n=14, следовательно медиана лежит между двумя средними элементами выборки — между 7-элементом и 8-элементом:

10,10,12,13,14,14,15,16,16,18,19,19,22,25

и равна среднему арифметическому этих элементов:

Me=(15+16)/2=15,5

Найти медиану дискретного ряда, можно онлайн, с помощью данного калькулятора. Калькулятор автоматически ранжирует ряд и вычисляет медиану.

При вычислении медианы для интервального вариационного ряда сначала определяют медианный интервал, в пределах которого находится медиана, а затем — значение медианы по формуле:

Пример 2. Найти медиану интервального ряда:

Решение:

Медианный интервал находится в возрастной группе 25-30 лет, так как в пределах этого интервала расположена варианта, которая делит совокупность на две равные части

(Σf_i/2 = 3462/2 = 1731).

Далее подставляем в формулу необходимые числовые данные и получаем значение медианы:

Это значит что одна половина студентов имеет возраст до 27,4 года, а другая свыше 27,4 года.

ОСОБЕННОСТИ

Медиана обладает высокой робастностью, то есть нечувствительностью к неоднородностям и ошибкам выборки.
Сумма разностей между членами ряда выборки и медианой меньше, чем сумма этих разностей с любой другой величиной. В том числе с арифметическим средним.

Вычислить медиану в Excel

Можно скачать готовый шаблон для вычисления медианы в Excel

Источник

Интервальный вариационный ряд и его характеристики

Построение интервального вариационного ряда по данным эксперимента
Гистограмма и полигон относительных частот, кумулята и эмпирическая функция распределения
Выборочная средняя, мода и медиана. Симметрия ряда
Выборочная дисперсия и СКО
Исправленная выборочная дисперсия, стандартное отклонение выборки и коэффициент вариации
Алгоритм исследования интервального вариационного ряда
Примеры

п.1. Построение интервального вариационного ряда по данным эксперимента

Интервальный вариационный ряд – это ряд распределения, в котором однородные группы составлены по признаку, меняющемуся непрерывно или принимающему слишком много значений.

Общий вид интервального вариационного ряда

Интервалы, (left.left[a_{i-1},a_iright.right))	(left.left[a_{0},a_1right.right))	(left.left[a_{1},a_2right.right))	…	(left.left[a_{k-1},a_kright.right))
Частоты, (f_i)	(f_1)	(f_2)	…	(f_k)

Здесь k — число интервалов, на которые разбивается ряд.

Размах вариации – это длина интервала, в пределах которой изменяется исследуемый признак: $$ F=x_{max}-x_{min} $$

Правило Стерджеса
Эмпирическое правило определения оптимального количества интервалов k, на которые следует разбить ряд из N чисел: $$ k=1+lfloorlog_2 Nrfloor $$ или, через десятичный логарифм: $$ k=1+lfloor 3,322cdotlg Nrfloor $$

Скобка (lfloor rfloor) означает целую часть (округление вниз до целого числа).

Шаг интервального ряда – это отношение размаха вариации к количеству интервалов, округленное вверх до определенной точности: $$ h=leftlceilfrac Rkrightrceil $$

Скобка (lceil rceil) означает округление вверх, в данном случае не обязательно до целого числа.

Алгоритм построения интервального ряда
На входе: все значения признака (left{x_jright}, j=overline{1,N})
Шаг 1. Найти размах вариации (R=x_{max}-x_{min})
Шаг 2. Найти оптимальное количество интервалов (k=1+lfloorlog_2 Nrfloor)
Шаг 3. Найти шаг интервального ряда (h=leftlceilfrac{R}{k}rightrceil)
Шаг 4. Найти узлы ряда: $$ a_0=x_{min}, a_i=1_0+ih, i=overline{1,k} $$ Шаг 5. Найти частоты (f_i) – число попаданий значений признака в каждый из интервалов (left.left[a_{i-1},a_iright.right)).
На выходе: интервальный ряд с интервалами (left.left[a_{i-1},a_iright.right)) и частотами (f_i, i=overline{1,k})

Заметим, что поскольку шаг h находится с округлением вверх, последний узел (a_kgeq x_{max}).

Например:
Проведено 100 измерений роста учеников старших классов.
Минимальный рост составляет 142 см, максимальный – 197 см.
Найдем узлы для построения соответствующего интервального ряда.
По условию: (N=100, x_{min}=142 см, x_{max}=197 см).
Размах вариации: (R=197-142=55) (см)
Оптимальное число интервалов: (k=1+lfloor 3,322cdotlg ⁡100rfloor=1+lfloor 6,644rfloor=1+6=7)
Шаг интервального ряда: (h=lceilfrac{55}{5}rceil=lceil 7,85rceil=8) (см)
Получаем узлы ряда: $$ a_0=x_{min}=142, a_i=142+icdot 8, i=overline{1,7} $$

(left.left[a_{i-1},a_iright.right)) cм

(left.left[142;150right.right))

(left.left[150;158right.right))

(left.left[158;166right.right))

(left.left[166;174right.right))

(left.left[174;182right.right))

(left.left[182;190right.right))

(left[190;198right])

п.2. Гистограмма и полигон относительных частот, кумулята и эмпирическая функция распределения

Относительная частота интервала (left.left[a_{i-1},a_iright.right)) — это отношение частоты (f_i) к общему количеству исходов: $$ w_i=frac{f_i}{N}, i=overline{1,k} $$

Гистограмма относительных частот интервального ряда – это фигура, состоящая из прямоугольников, ширина которых равна шагу ряда, а высота – относительным частотам каждого из интервалов.
Площадь гистограммы равна 1 (с точностью до округлений), и она является эмпирическим законом распределения исследуемого признака.

Полигон относительных частот интервального ряда – это ломаная, соединяющая точки ((x_i,w_i)), где (x_i) — середины интервалов: (x_i=frac{a_{i-1}+a_i}{2}, i=overline{1,k}).

Накопленные относительные частоты – это суммы: $$ S_1=w_1, S_i=S_{i-1}+w_i, i=overline{2,k} $$ Ступенчатая кривая (F(x)), состоящая из прямоугольников, ширина которых равна шагу ряда, а высота – накопленным относительным частотам, является эмпирической функцией распределения исследуемого признака.
Кумулята – это ломаная, которая соединяет точки ((x_i,S_i)), где (x_i) — середины интервалов.

Например:
Продолжим анализ распределения учеников по росту.
Выше мы уже нашли узлы интервалов. Пусть, после распределения всех 100 измерений по этим интервалам, мы получили следующий интервальный ряд:

i	1	2	3	4	5	6	7
(left.left[a_{i-1},a_iright.right)) cм	(left.left[142;150right.right))	(left.left[150;158right.right))	(left.left[158;166right.right))	(left.left[166;174right.right))	(left.left[174;182right.right))	(left.left[182;190right.right))	(left[190;198right])
(f_i)	4	7	11	34	33	8	3

Найдем середины интервалов, относительные частоты и накопленные относительные частоты:

(x_i)	146	154	162	170	178	186	194
(w_i)	0,04	0,07	0,11	0,34	0,33	0,08	0,03
(S_i)	0,04	0,11	0,22	0,56	0,89	0,97	1

Построим гистограмму и полигон:

Построим кумуляту и эмпирическую функцию распределения:

Эмпирическая функция распределения (относительно середин интервалов): $$ F(x)= begin{cases} 0, xleq 146\ 0,04, 146lt xleq 154\ 0,11, 154lt xleq 162\ 0,22, 162lt xleq 170\ 0,56, 170lt xleq 178\ 0,89, 178lt xleq 186\ 0,97, 186lt xleq 194\ 1, xgt 194 end{cases} $$

п.3. Выборочная средняя, мода и медиана. Симметрия ряда

Выборочная средняя интервального вариационного ряда определяется как средняя взвешенная по частотам: $$ X_{cp}=frac{x_1f_1+x_2f_2+…+x_kf_k}{N}=frac1Nsum_{i=1}^k x_if_i $$ где (x_i) — середины интервалов: (x_i=frac{a_{i-1}+a_i}{2}, i=overline{1,k}).
Или, через относительные частоты: $$ X_{cp}=sum_{i=1}^k x_iw_i $$

Модальным интервалом называют интервал с максимальной частотой: $$ f_m=max f_i $$ Мода интервального вариационного ряда определяется по формуле: $$ M_o=x_o+frac{f_m-f_{m-1}}{(f_m-f_{m-1})+(f_m+f_{m+1})}h $$ где
(h) – шаг интервального ряда;
(x_o) — нижняя граница модального интервала;
(f_m,f_{m-1},f_{m+1}) — соответственно, частоты модального интервала, интервала слева от модального и интервала справа.

Медианным интервалом называют первый интервал слева, на котором кумулята превысила значение 0,5. Медиана интервального вариационного ряда определяется по формуле: $$ M_e=x_o+frac{0,5-S_{me-1}}{w_{me}}h $$ где
(h) – шаг интервального ряда;
(x_o) — нижняя граница медианного интервала;
(S_{me-1}) накопленная относительная частота для интервала слева от медианного;
(w_{me}) относительная частота медианного интервала.

Расположение выборочной средней, моды и медианы в зависимости от симметрии ряда аналогично их расположению в дискретном ряду (см. §65 данного справочника).

Например:
Для распределения учеников по росту получаем:

(x_i)	146	154	162	170	178	186	194	∑
(w_i)	0,04	0,07	0,11	0,34	0,33	0,08	0,03	1
(x_iw_i)	5,84	10,78	17,82	57,80	58,74	14,88	5,82	171,68

$$ X_{cp}=sum_{i=1}^k x_iw_i=171,68approx 171,7 text{(см)} $$ На гистограмме (или полигоне) относительных частот максимальная частота приходится на 4й интервал [166;174). Это модальный интервал.
Данные для расчета моды: begin{gather*} x_o=166, f_m=34, f_{m-1}=11, f_{m+1}=33, h=8\ M_o=x_o+frac{f_m-f_{m-1}}{(f_m-f_{m-1})+(f_m+f_{m+1})}h=\ =166+frac{34-11}{(34-11)+(34-33)}cdot 8approx 173,7 text{(см)} end{gather*} На кумуляте значение 0,5 пересекается на 4м интервале. Это – медианный интервал.
Данные для расчета медианы: begin{gather*} x_o=166, w_m=0,34, S_{me-1}=0,22, h=8\ \ M_e=x_o+frac{0,5-S_{me-1}}{w_me}h=166+frac{0,5-0,22}{0,34}cdot 8approx 172,6 text{(см)} end{gather*} begin{gather*} \ X_{cp}=171,7; M_o=173,7; M_e=172,6\ X_{cp}lt M_elt M_o end{gather*} Ряд асимметричный с левосторонней асимметрией.
При этом (frac{|M_o-X_{cp}|}{|M_e-X_{cp}|}=frac{2,0}{0,9}approx 2,2lt 3), т.е. распределение умеренно асимметрично.

п.4. Выборочная дисперсия и СКО

Выборочная дисперсия интервального вариационного ряда определяется как средняя взвешенная для квадрата отклонения от средней: begin{gather*} D=frac1Nsum_{i=1}^k(x_i-X_{cp})^2 f_i=frac1Nsum_{i=1}^k x_i^2 f_i-X_{cp}^2 end{gather*} где (x_i) — середины интервалов: (x_i=frac{a_{i-1}+a_i}{2}, i=overline{1,k}).
Или, через относительные частоты: $$ D=sum_{i=1}^k(x_i-X_{cp})^2 w_i=sum_{i=1}^k x_i^2 w_i-X_{cp}^2 $$

Выборочное среднее квадратичное отклонение (СКО) определяется как корень квадратный из выборочной дисперсии: $$ sigma=sqrt{D} $$

Например:
Для распределения учеников по росту получаем:

$x_i$	146	154	162	170	178	186	194	∑
(w_i)	0,04	0,07	0,11	0,34	0,33	0,08	0,03	1
(x_iw_i)	5,84	10,78	17,82	57,80	58,74	14,88	5,82	171,68
(x_i^2w_i) — результат	852,64	1660,12	2886,84	9826	10455,72	2767,68	1129,08	29578,08

$$ D=sum_{i=1}^k x_i^2 w_i-X_{cp}^2=29578,08-171,7^2approx 104,1 $$ $$ sigma=sqrt{D}approx 10,2 $$

п.5. Исправленная выборочная дисперсия, стандартное отклонение выборки и коэффициент вариации

Исправленная выборочная дисперсия интервального вариационного ряда определяется как: begin{gather*} S^2=frac{N}{N-1}D end{gather*}

Стандартное отклонение выборки определяется как корень квадратный из исправленной выборочной дисперсии: $$ s=sqrt{S^2} $$

Коэффициент вариации это отношение стандартного отклонения выборки к выборочной средней, выраженное в процентах: $$ V=frac{s}{X_{cp}}cdot 100text{%} $$

Подробней о том, почему и когда нужно «исправлять» дисперсию, и для чего использовать коэффициент вариации – см. §65 данного справочника.

Например:
Для распределения учеников по росту получаем: begin{gather*} S^2=frac{100}{99}cdot 104,1approx 105,1\ sapprox 10,3 end{gather*} Коэффициент вариации: $$ V=frac{10,3}{171,7}cdot 100text{%}approx 6,0text{%}lt 33text{%} $$ Выборка однородна. Найденное значение среднего роста (X_{cp})=171,7 см можно распространить на всю генеральную совокупность (старшеклассников из других школ).

п.6. Алгоритм исследования интервального вариационного ряда

На входе: все значения признака (left{x_jright}, j=overline{1,N})
Шаг 1. Построить интервальный ряд с интервалами (left.right[a_{i-1}, a_ileft.right)) и частотами (f_i, i=overline{1,k}) (см. алгоритм выше).
Шаг 2. Составить расчетную таблицу. Найти (x_i,w_i,S_i,x_iw_i,x_i^2w_i)
Шаг 3. Построить гистограмму (и/или полигон) относительных частот, эмпирическую функцию распределения (и/или кумуляту). Записать эмпирическую функцию распределения.
Шаг 4. Найти выборочную среднюю, моду и медиану. Проанализировать симметрию распределения.
Шаг 5. Найти выборочную дисперсию и СКО.
Шаг 6. Найти исправленную выборочную дисперсию, стандартное отклонение и коэффициент вариации. Сделать вывод об однородности выборки.

п.7. Примеры

Пример 1. При изучении возраста пользователей коворкинга выбрали 30 человек.
Получили следующий набор данных:
18,38,28,29,26,38,34,22,28,30,22,23,35,33,27,24,30,32,28,25,29,26,31,24,29,27,32,24,29,29
Постройте интервальный ряд и исследуйте его.

1) Построим интервальный ряд. В наборе данных: $$ x_{min}=18, x_{max}=38, N=30 $$ Размах вариации: (R=38-18=20)
Оптимальное число интервалов: (k=1+lfloorlog_2⁡ 30rfloor=1+4=5)
Шаг интервального ряда: (h=lceilfrac{20}{5}rceil=4)
Получаем узлы ряда: $$ a_0=x_{min}=18, a_i=18+icdot 4, i=overline{1,5} $$

(left.left[a_{i-1},a_iright.right)) лет

(left.left[18;22right.right))

(left.left[22;26right.right))

(left.left[26;30right.right))

(left.left[30;34right.right))

(left.left[34;38right.right))

Считаем частоты для каждого интервала. Получаем интервальный ряд:

(left.left[a_{i-1},a_iright.right)) лет	(left.left[18;22right.right))	(left.left[22;26right.right))	(left.left[26;30right.right))	(left.left[30;34right.right))	(left.left[34;38right.right))
(f_i)	1	7	12	6	4

2) Составляем расчетную таблицу:

(x_i)	20	24	28	32	36	∑
(f_i)	1	7	12	6	4	30
(w_i)	0,033	0,233	0,4	0,2	0,133	1
(S_i)	0,033	0,267	0,667	0,867	1	—
(x_iw_i)	0,667	5,6	11,2	6,4	4,8	28,67
(x_i^2w_i)	13,333	134,4	313,6	204,8	172,8	838,93

3) Строим полигон и кумуляту

Эмпирическая функция распределения: $$ F(x)= begin{cases} 0, xleq 20\ 0,033, 20lt xleq 24\ 0,267, 24lt xleq 28\ 0,667, 28lt xleq 32\ 0,867, 32lt xleq 36\ 1, xgt 36 end{cases} $$ 4) Находим выборочную среднюю, моду и медиану $$ X_{cp}=sum_{i=1}^k x_iw_iapprox 28,7 text{(лет)} $$ На полигоне модальным является 3й интервал (самая высокая точка).
Данные для расчета моды: begin{gather*} x_0=26, f_m=12, f_{m-1}=7, f_{m+1}=6, h=4\ M_o=x_o+frac{f_m-f_{m-1}}{(f_m-f_{m-1})+(f_m+f_{m+1})}h=\ =26+frac{12-7}{(12-7)+(12-6)}cdot 4approx 27,8 text{(лет)} end{gather*}
На кумуляте медианным является 3й интервал (преодолевает уровень 0,5).
Данные для расчета медианы: begin{gather*} x_0=26, w_m=0,4, S_{me-1}=0,267, h=4\ M_e=x_o+frac{0,5-S_{me-1}}{w_{me}}h=26+frac{0,5-0,4}{0,267}cdot 4approx 28,3 text{(лет)} end{gather*} Получаем: begin{gather*} X_{cp}=28,7; M_o=27,8; M_e=28,6\ X_{cp}gt M_egt M_0 end{gather*} Ряд асимметричный с правосторонней асимметрией.
При этом (frac{|M_o-X_{cp}|}{|M_e-X_{cp}|} =frac{0,9}{0,1}=9gt 3), т.е. распределение сильно асимметрично.

5) Находим выборочную дисперсию и СКО: begin{gather*} D=sum_{i=1}^k x_i^2w_i-X_{cp}^2=838,93-28,7^2approx 17,2\ sigma=sqrt{D}approx 4,1 end{gather*}
6) Исправленная выборочная дисперсия: $$ S^2=frac{N}{N-1}D=frac{30}{29}cdot 17,2approx 17,7 $$ Стандартное отклонение (s=sqrt{S^2}approx 4,2)
Коэффициент вариации: (V=frac{4,2}{28,7}cdot 100text{%}approx 14,7text{%}lt 33text{%})
Выборка однородна. Найденное значение среднего возраста (X_{cp}=28,7) лет можно распространить на всю генеральную совокупность (пользователей коворкинга).

Источник