Как составить интервальный ряд онлайн - Исправление недочетов и поиск решений вместе с Examum.ru

Интервальный вариационный ряд и его характеристики

Построение интервального вариационного ряда по данным эксперимента
Гистограмма и полигон относительных частот, кумулята и эмпирическая функция распределения
Выборочная средняя, мода и медиана. Симметрия ряда
Выборочная дисперсия и СКО
Исправленная выборочная дисперсия, стандартное отклонение выборки и коэффициент вариации
Алгоритм исследования интервального вариационного ряда
Примеры

п.1. Построение интервального вариационного ряда по данным эксперимента

Интервальный вариационный ряд – это ряд распределения, в котором однородные группы составлены по признаку, меняющемуся непрерывно или принимающему слишком много значений.

Общий вид интервального вариационного ряда

Интервалы, (left.left[a_{i-1},a_iright.right))	(left.left[a_{0},a_1right.right))	(left.left[a_{1},a_2right.right))	…	(left.left[a_{k-1},a_kright.right))
Частоты, (f_i)	(f_1)	(f_2)	…	(f_k)

Здесь k — число интервалов, на которые разбивается ряд.

Размах вариации – это длина интервала, в пределах которой изменяется исследуемый признак: $$ F=x_{max}-x_{min} $$

Правило Стерджеса
Эмпирическое правило определения оптимального количества интервалов k, на которые следует разбить ряд из N чисел: $$ k=1+lfloorlog_2 Nrfloor $$ или, через десятичный логарифм: $$ k=1+lfloor 3,322cdotlg Nrfloor $$

Скобка (lfloor rfloor) означает целую часть (округление вниз до целого числа).

Шаг интервального ряда – это отношение размаха вариации к количеству интервалов, округленное вверх до определенной точности: $$ h=leftlceilfrac Rkrightrceil $$

Скобка (lceil rceil) означает округление вверх, в данном случае не обязательно до целого числа.

Алгоритм построения интервального ряда
На входе: все значения признака (left{x_jright}, j=overline{1,N})
Шаг 1. Найти размах вариации (R=x_{max}-x_{min})
Шаг 2. Найти оптимальное количество интервалов (k=1+lfloorlog_2 Nrfloor)
Шаг 3. Найти шаг интервального ряда (h=leftlceilfrac{R}{k}rightrceil)
Шаг 4. Найти узлы ряда: $$ a_0=x_{min}, a_i=1_0+ih, i=overline{1,k} $$ Шаг 5. Найти частоты (f_i) – число попаданий значений признака в каждый из интервалов (left.left[a_{i-1},a_iright.right)).
На выходе: интервальный ряд с интервалами (left.left[a_{i-1},a_iright.right)) и частотами (f_i, i=overline{1,k})

Заметим, что поскольку шаг h находится с округлением вверх, последний узел (a_kgeq x_{max}).

Например:
Проведено 100 измерений роста учеников старших классов.
Минимальный рост составляет 142 см, максимальный – 197 см.
Найдем узлы для построения соответствующего интервального ряда.
По условию: (N=100, x_{min}=142 см, x_{max}=197 см).
Размах вариации: (R=197-142=55) (см)
Оптимальное число интервалов: (k=1+lfloor 3,322cdotlg ⁡100rfloor=1+lfloor 6,644rfloor=1+6=7)
Шаг интервального ряда: (h=lceilfrac{55}{5}rceil=lceil 7,85rceil=8) (см)
Получаем узлы ряда: $$ a_0=x_{min}=142, a_i=142+icdot 8, i=overline{1,7} $$

(left.left[a_{i-1},a_iright.right)) cм

(left.left[142;150right.right))

(left.left[150;158right.right))

(left.left[158;166right.right))

(left.left[166;174right.right))

(left.left[174;182right.right))

(left.left[182;190right.right))

(left[190;198right])

п.2. Гистограмма и полигон относительных частот, кумулята и эмпирическая функция распределения

Относительная частота интервала (left.left[a_{i-1},a_iright.right)) — это отношение частоты (f_i) к общему количеству исходов: $$ w_i=frac{f_i}{N}, i=overline{1,k} $$

Гистограмма относительных частот интервального ряда – это фигура, состоящая из прямоугольников, ширина которых равна шагу ряда, а высота – относительным частотам каждого из интервалов.
Площадь гистограммы равна 1 (с точностью до округлений), и она является эмпирическим законом распределения исследуемого признака.

Полигон относительных частот интервального ряда – это ломаная, соединяющая точки ((x_i,w_i)), где (x_i) — середины интервалов: (x_i=frac{a_{i-1}+a_i}{2}, i=overline{1,k}).

Накопленные относительные частоты – это суммы: $$ S_1=w_1, S_i=S_{i-1}+w_i, i=overline{2,k} $$ Ступенчатая кривая (F(x)), состоящая из прямоугольников, ширина которых равна шагу ряда, а высота – накопленным относительным частотам, является эмпирической функцией распределения исследуемого признака.
Кумулята – это ломаная, которая соединяет точки ((x_i,S_i)), где (x_i) — середины интервалов.

Например:
Продолжим анализ распределения учеников по росту.
Выше мы уже нашли узлы интервалов. Пусть, после распределения всех 100 измерений по этим интервалам, мы получили следующий интервальный ряд:

i	1	2	3	4	5	6	7
(left.left[a_{i-1},a_iright.right)) cм	(left.left[142;150right.right))	(left.left[150;158right.right))	(left.left[158;166right.right))	(left.left[166;174right.right))	(left.left[174;182right.right))	(left.left[182;190right.right))	(left[190;198right])
(f_i)	4	7	11	34	33	8	3

Найдем середины интервалов, относительные частоты и накопленные относительные частоты:

(x_i)	146	154	162	170	178	186	194
(w_i)	0,04	0,07	0,11	0,34	0,33	0,08	0,03
(S_i)	0,04	0,11	0,22	0,56	0,89	0,97	1

Построим гистограмму и полигон:

Построим кумуляту и эмпирическую функцию распределения:

Эмпирическая функция распределения (относительно середин интервалов): $$ F(x)= begin{cases} 0, xleq 146\ 0,04, 146lt xleq 154\ 0,11, 154lt xleq 162\ 0,22, 162lt xleq 170\ 0,56, 170lt xleq 178\ 0,89, 178lt xleq 186\ 0,97, 186lt xleq 194\ 1, xgt 194 end{cases} $$

п.3. Выборочная средняя, мода и медиана. Симметрия ряда

Выборочная средняя интервального вариационного ряда определяется как средняя взвешенная по частотам: $$ X_{cp}=frac{x_1f_1+x_2f_2+…+x_kf_k}{N}=frac1Nsum_{i=1}^k x_if_i $$ где (x_i) — середины интервалов: (x_i=frac{a_{i-1}+a_i}{2}, i=overline{1,k}).
Или, через относительные частоты: $$ X_{cp}=sum_{i=1}^k x_iw_i $$

Модальным интервалом называют интервал с максимальной частотой: $$ f_m=max f_i $$ Мода интервального вариационного ряда определяется по формуле: $$ M_o=x_o+frac{f_m-f_{m-1}}{(f_m-f_{m-1})+(f_m+f_{m+1})}h $$ где
(h) – шаг интервального ряда;
(x_o) — нижняя граница модального интервала;
(f_m,f_{m-1},f_{m+1}) — соответственно, частоты модального интервала, интервала слева от модального и интервала справа.

Медианным интервалом называют первый интервал слева, на котором кумулята превысила значение 0,5. Медиана интервального вариационного ряда определяется по формуле: $$ M_e=x_o+frac{0,5-S_{me-1}}{w_{me}}h $$ где
(h) – шаг интервального ряда;
(x_o) — нижняя граница медианного интервала;
(S_{me-1}) накопленная относительная частота для интервала слева от медианного;
(w_{me}) относительная частота медианного интервала.

Расположение выборочной средней, моды и медианы в зависимости от симметрии ряда аналогично их расположению в дискретном ряду (см. §65 данного справочника).

Например:
Для распределения учеников по росту получаем:

(x_i)	146	154	162	170	178	186	194	∑
(w_i)	0,04	0,07	0,11	0,34	0,33	0,08	0,03	1
(x_iw_i)	5,84	10,78	17,82	57,80	58,74	14,88	5,82	171,68

$$ X_{cp}=sum_{i=1}^k x_iw_i=171,68approx 171,7 text{(см)} $$ На гистограмме (или полигоне) относительных частот максимальная частота приходится на 4й интервал [166;174). Это модальный интервал.
Данные для расчета моды: begin{gather*} x_o=166, f_m=34, f_{m-1}=11, f_{m+1}=33, h=8\ M_o=x_o+frac{f_m-f_{m-1}}{(f_m-f_{m-1})+(f_m+f_{m+1})}h=\ =166+frac{34-11}{(34-11)+(34-33)}cdot 8approx 173,7 text{(см)} end{gather*} На кумуляте значение 0,5 пересекается на 4м интервале. Это – медианный интервал.
Данные для расчета медианы: begin{gather*} x_o=166, w_m=0,34, S_{me-1}=0,22, h=8\ \ M_e=x_o+frac{0,5-S_{me-1}}{w_me}h=166+frac{0,5-0,22}{0,34}cdot 8approx 172,6 text{(см)} end{gather*} begin{gather*} \ X_{cp}=171,7; M_o=173,7; M_e=172,6\ X_{cp}lt M_elt M_o end{gather*} Ряд асимметричный с левосторонней асимметрией.
При этом (frac{|M_o-X_{cp}|}{|M_e-X_{cp}|}=frac{2,0}{0,9}approx 2,2lt 3), т.е. распределение умеренно асимметрично.

п.4. Выборочная дисперсия и СКО

Выборочная дисперсия интервального вариационного ряда определяется как средняя взвешенная для квадрата отклонения от средней: begin{gather*} D=frac1Nsum_{i=1}^k(x_i-X_{cp})^2 f_i=frac1Nsum_{i=1}^k x_i^2 f_i-X_{cp}^2 end{gather*} где (x_i) — середины интервалов: (x_i=frac{a_{i-1}+a_i}{2}, i=overline{1,k}).
Или, через относительные частоты: $$ D=sum_{i=1}^k(x_i-X_{cp})^2 w_i=sum_{i=1}^k x_i^2 w_i-X_{cp}^2 $$

Выборочное среднее квадратичное отклонение (СКО) определяется как корень квадратный из выборочной дисперсии: $$ sigma=sqrt{D} $$

Например:
Для распределения учеников по росту получаем:

$x_i$	146	154	162	170	178	186	194	∑
(w_i)	0,04	0,07	0,11	0,34	0,33	0,08	0,03	1
(x_iw_i)	5,84	10,78	17,82	57,80	58,74	14,88	5,82	171,68
(x_i^2w_i) — результат	852,64	1660,12	2886,84	9826	10455,72	2767,68	1129,08	29578,08

$$ D=sum_{i=1}^k x_i^2 w_i-X_{cp}^2=29578,08-171,7^2approx 104,1 $$ $$ sigma=sqrt{D}approx 10,2 $$

п.5. Исправленная выборочная дисперсия, стандартное отклонение выборки и коэффициент вариации

Исправленная выборочная дисперсия интервального вариационного ряда определяется как: begin{gather*} S^2=frac{N}{N-1}D end{gather*}

Стандартное отклонение выборки определяется как корень квадратный из исправленной выборочной дисперсии: $$ s=sqrt{S^2} $$

Коэффициент вариации это отношение стандартного отклонения выборки к выборочной средней, выраженное в процентах: $$ V=frac{s}{X_{cp}}cdot 100text{%} $$

Подробней о том, почему и когда нужно «исправлять» дисперсию, и для чего использовать коэффициент вариации – см. §65 данного справочника.

Например:
Для распределения учеников по росту получаем: begin{gather*} S^2=frac{100}{99}cdot 104,1approx 105,1\ sapprox 10,3 end{gather*} Коэффициент вариации: $$ V=frac{10,3}{171,7}cdot 100text{%}approx 6,0text{%}lt 33text{%} $$ Выборка однородна. Найденное значение среднего роста (X_{cp})=171,7 см можно распространить на всю генеральную совокупность (старшеклассников из других школ).

п.6. Алгоритм исследования интервального вариационного ряда

На входе: все значения признака (left{x_jright}, j=overline{1,N})
Шаг 1. Построить интервальный ряд с интервалами (left.right[a_{i-1}, a_ileft.right)) и частотами (f_i, i=overline{1,k}) (см. алгоритм выше).
Шаг 2. Составить расчетную таблицу. Найти (x_i,w_i,S_i,x_iw_i,x_i^2w_i)
Шаг 3. Построить гистограмму (и/или полигон) относительных частот, эмпирическую функцию распределения (и/или кумуляту). Записать эмпирическую функцию распределения.
Шаг 4. Найти выборочную среднюю, моду и медиану. Проанализировать симметрию распределения.
Шаг 5. Найти выборочную дисперсию и СКО.
Шаг 6. Найти исправленную выборочную дисперсию, стандартное отклонение и коэффициент вариации. Сделать вывод об однородности выборки.

п.7. Примеры

Пример 1. При изучении возраста пользователей коворкинга выбрали 30 человек.
Получили следующий набор данных:
18,38,28,29,26,38,34,22,28,30,22,23,35,33,27,24,30,32,28,25,29,26,31,24,29,27,32,24,29,29
Постройте интервальный ряд и исследуйте его.

1) Построим интервальный ряд. В наборе данных: $$ x_{min}=18, x_{max}=38, N=30 $$ Размах вариации: (R=38-18=20)
Оптимальное число интервалов: (k=1+lfloorlog_2⁡ 30rfloor=1+4=5)
Шаг интервального ряда: (h=lceilfrac{20}{5}rceil=4)
Получаем узлы ряда: $$ a_0=x_{min}=18, a_i=18+icdot 4, i=overline{1,5} $$

(left.left[a_{i-1},a_iright.right)) лет

(left.left[18;22right.right))

(left.left[22;26right.right))

(left.left[26;30right.right))

(left.left[30;34right.right))

(left.left[34;38right.right))

Считаем частоты для каждого интервала. Получаем интервальный ряд:

(left.left[a_{i-1},a_iright.right)) лет	(left.left[18;22right.right))	(left.left[22;26right.right))	(left.left[26;30right.right))	(left.left[30;34right.right))	(left.left[34;38right.right))
(f_i)	1	7	12	6	4

2) Составляем расчетную таблицу:

(x_i)	20	24	28	32	36	∑
(f_i)	1	7	12	6	4	30
(w_i)	0,033	0,233	0,4	0,2	0,133	1
(S_i)	0,033	0,267	0,667	0,867	1	—
(x_iw_i)	0,667	5,6	11,2	6,4	4,8	28,67
(x_i^2w_i)	13,333	134,4	313,6	204,8	172,8	838,93

3) Строим полигон и кумуляту

Эмпирическая функция распределения: $$ F(x)= begin{cases} 0, xleq 20\ 0,033, 20lt xleq 24\ 0,267, 24lt xleq 28\ 0,667, 28lt xleq 32\ 0,867, 32lt xleq 36\ 1, xgt 36 end{cases} $$ 4) Находим выборочную среднюю, моду и медиану $$ X_{cp}=sum_{i=1}^k x_iw_iapprox 28,7 text{(лет)} $$ На полигоне модальным является 3й интервал (самая высокая точка).
Данные для расчета моды: begin{gather*} x_0=26, f_m=12, f_{m-1}=7, f_{m+1}=6, h=4\ M_o=x_o+frac{f_m-f_{m-1}}{(f_m-f_{m-1})+(f_m+f_{m+1})}h=\ =26+frac{12-7}{(12-7)+(12-6)}cdot 4approx 27,8 text{(лет)} end{gather*}
На кумуляте медианным является 3й интервал (преодолевает уровень 0,5).
Данные для расчета медианы: begin{gather*} x_0=26, w_m=0,4, S_{me-1}=0,267, h=4\ M_e=x_o+frac{0,5-S_{me-1}}{w_{me}}h=26+frac{0,5-0,4}{0,267}cdot 4approx 28,3 text{(лет)} end{gather*} Получаем: begin{gather*} X_{cp}=28,7; M_o=27,8; M_e=28,6\ X_{cp}gt M_egt M_0 end{gather*} Ряд асимметричный с правосторонней асимметрией.
При этом (frac{|M_o-X_{cp}|}{|M_e-X_{cp}|} =frac{0,9}{0,1}=9gt 3), т.е. распределение сильно асимметрично.

5) Находим выборочную дисперсию и СКО: begin{gather*} D=sum_{i=1}^k x_i^2w_i-X_{cp}^2=838,93-28,7^2approx 17,2\ sigma=sqrt{D}approx 4,1 end{gather*}
6) Исправленная выборочная дисперсия: $$ S^2=frac{N}{N-1}D=frac{30}{29}cdot 17,2approx 17,7 $$ Стандартное отклонение (s=sqrt{S^2}approx 4,2)
Коэффициент вариации: (V=frac{4,2}{28,7}cdot 100text{%}approx 14,7text{%}lt 33text{%})
Выборка однородна. Найденное значение среднего возраста (X_{cp}=28,7) лет можно распространить на всю генеральную совокупность (пользователей коворкинга).

Источник

При
большом
объеме выборки
работа с
вариационными рядами представляет
определенные неудобства, и тогда
наблюдаемые данные группируют.

Группировка
должна наиболее
полно выявлять существенные свойства
распределения. Существуют формулы для
определения оптимального количества
интервалов, но в психологии
считается, что следует брать от
5 до 15 интервалов.

Первый способ
построения интервального ряда.

Если
у исследователя нет предварительной
информации о характере распределения
признака, то лучше задавать равные
интервалы,
при этом длина
интервала

определяется по формуле
,
где— количество выбранных интервалов (числоокругляется до целого значения).

Начало
первого интервала равно
,
а конец(это будет одновременно и началом второго
интервала). Условимся все интервалы
считать соткрытым
правым концом:
.
Построение интервалов заканчивается,
если в интервал попало наибольшее
значение признака.

Далее
подсчитывают число
значений признака, попавших в каждый
интервал (с учетом открытого правого
конца). Получается таблица, называемаяинтервальным
вариационным рядом.

Интервалы	…	Сумма
Частоты,	…
Относительные частоты,		1

Второй
способ построения интервального ряда.

Весь
диапазон значений признака от
доразбивается на равныеинтервалы,
называемые также классами.
Затем все варианты совокупности
распределяются
по этим интервалам.
Порядок действий:

Определяется
число классов по формуле Стэрджеса
.
Затем
определяется размах выборки
.
Находим
ширину интервала
по формуле.
Находим
нижнюю границу первого интервала:
.
Начальные
и конечные значения всех последующих
интервалов можно вычислить путем
последовательного прибавления величины
интервала к значениям конца предыдущего
интервала:
,и так далее.

Пример
построения интервального вариационного
ряда.

Пусть измерен
некоторый показатель для 30 испытуемых:

23,
29, 35, 7, 11, 18, 23, 30, 36, 18, 11, 8, 13, 20, 25,

27,
14, 30, 20, 20, 24, 19, 21, 26, 22, 16, 26, 25, 33, 27.

Это
статистический
ряд.

Расставим
экспериментальные данные в возрастающем
порядке, то есть построим вариационный
ряд:

7,
8,
11,
11,
13,
14,
16,
18,
18,
19, 20,
20,
20,
21,
22,

23,
23,
24,
25,
25,
26,
26,
27,
27,
29,
30,
30,
33,
35,
36.

Число
классов (интервалов) для
:

Минимальное
и максимальное значения:
,.

Вариационный
размах:
.

Величина
интервала:
.

Находим границы
интервалов:

;

;
;

;
.

Построим
интервальный
вариационный ряд.

Номера интервалов	Интервалы	Серединные значения интервалов	Частоты
1	4 – 10	7	2
2	10 – 16	13	4
3	16 – 22	19	8
4	22 – 28	25	10
5	28 – 34	31	4
6	34 – 40	37	2

5. Гистограмма

Вариационные
ряды изображают графически с помощью
полигона и гистограммы.

с₁с₂с₃с₄с₅с₆с₇с₈с₉

Гистограммой
называется графическое изображение
интервального
вариационного
ряда. На оси
абсцисс откладываются отрезки,
изображающие интервалы значений
варьирующего признака, а затем на этих
отрезках, как на основаниях, строятся
прямоугольники, площади
которых пропорциональны частотам (или
относительным частотам).

Полигон
частот для
дискретного вариационного ряда — это
ломаная, отрезки которой соединяют
точки с координатами
.

Полигон
частот признака

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

Источник

Обработка статистических данных в Excel

Построение рядов распределения

Любой ряд распределения характеризуется двумя элементами:

— варианта (х_i) – это отдельные значения признака единиц выборочной совокупности. Для вариационного ряда варианта принимает числовые значения, для атрибутивного – качественные (например, х=«государственный служащий»);

— частота (n_i) – число, показывающее, сколько раз встречается то или иное значение признака.

Вариационный ряд называется интервальным, когда определены границы «от» и «до» для непрерывно варьируемого признака. Интервальный ряд также строят если множество значений дискретно варьируемого признака велико.

Интервальный ряд может строиться как с интервалами равной длины (равноинтервальный ряд) так и с неодинаковыми интервалами, если это диктуется условиями статистического исследования. Например, может рассматриваться ряд распределения доходов населения со следующими интервалами: <5тыс р., 5-10 тыс р., 10-20 тыс.р., 20-50 тыс р., и т.д. Если цель исследования не определяет способ построения интервального ряда, то строится равноинтервальный ряд, число интервалов в котором определяется по формуле Стерджесса:

k=1+3,322lg(n),

где k – число интервалов, n – объем выборки. (Конечно, формула обычно дает число дробное, а в качестве числа интервалов выбирается ближайшее целое к полученному число.)

Пример 1. Имеются данные о выбросах загрязняющих веществ из 50 источников:

Составить равноинтервальный ряд, построить гистограмму

Решение

Алгоритм построения равноинтервального ряда:

1) Внесем массив данных в лист Excel, он займет диапазон А1:J5

2) Подсчитаем объем выборки n – число выборочных данных, для этого в ячейку В7 введем формулу =СЧЁТ(А1:L5). Заметим, что для того, чтобы в формулу ввести нужный диапазон, необязательно вводить его обозначение с клавиатуры, достаточно его выделить.

3) Определим минимальное и максимальное значение в выборке, введя в ячейку В8 формулу =МИН(А1:L5), и в ячейку В9: =МАКС(А1:L5).

4) Поскольку число интервалов в задаче не задано, вычислим число интервалов k по формуле Стерджесса. Для этого в ячейку В10 введем формулу =1+3,322*LOG10(B7).

Рис.1.1. Пример 1. Построение равноинтервального ряда

5) Полученное значение не является целым, оно равно примерно 6,64. Поскольку при k=7 длина интервалов будет выражаться целым числом (в отличие от случая k=6) выберем k=7, введя это значение в ячейку С10.

6) Длину интервала d вычислим в ячейке В11, введя формулу =(В9-В8)/С10.

7) Зададим массив интервалов, указывая для каждого из 7 интервалов верхнюю границу. Для этого в ячейке Е8 вычислим верхнюю границу первого интервала, введя формулу =B8+B11; в ячейке Е9 верхнюю границу второго интервала, введя формулу =E8+B11. Для вычисления оставшихся значений верхних границ интервалов зафиксируем номер ячейки В11 в введенной формуле при помощи знака $, так что формула в ячейке Е9 примет вид =E8+B$11, и скопируем содержимое ячейки Е9 в ячейки Е10-Е14. Последнее полученное значение равно вычисленному ранее в ячейке В9 максимальному значению в выборке.

Рис.1.2. Пример 1. Построение равноинтервального ряда

Теперь заполним массив «карманов» при помощи функции ЧАСТОТА. Поскольку результатом является столбец частот, введение функции следует завершить нажатием сочетания клавиш CTRL+SHIFT+ENTER.

Рис.1.3. Пример 1. Построение равноинтервального ряда

По полученному вариационном ряду построим гистограмму: выделим столбец частот и выберем на вкладке «Вставка» «Гистограмма». Получив гистограмму, изменим в ней подписи горизонтальной оси на значения в диапазоне интервалов, для этого выберем опцию «Выбрать данные» вкладки «Конструктор». В появившемся окне выберем команду «Изменить» для раздела «Подписи горизонтальной оси» и введем диапазон значений варианты, выделив его «мышью».

Рис.1.4. Пример 1. Построение гистограммы

Рис.1.6. Пример 1. Построение гистограммы

Примечание: можно скачать готовый шаблон построение интервального ряда в Excel, построение гистограммы

По данной теме также смотрят: Построить дискретный вариационный ряд в Excel

Источник

Главная
Полезные советы
Построить интервальный статистический ряд и гистограмму распределения.

Построить интервальный статистический ряд и гистограмму распределения.

Для имеющейся совокупности опытных данных (выборки) требуется:

1) Построить интервальный статистический ряд и гистограмму распределения;

2) Вычислить выборочную среднюю, выборочную дисперсию, выборочное среднеквадратичное отклонение, коэффициент вариации;

3) Выбрать теоретический закон распределения.

Решение:

Для построения интервального ряда, определим по формуле Старджесса число интервалов:

Тогда величина интервала равна − разность между наибольшим и наименьшим значениями признака.

Отсюда имеем:

По этим данным составим интервальный статистический ряд:

Выборочное среднее определим по формуле среднего арифметического взвешенного:

Выборочная дисперсия равна:

Выборочное среднеквадратичное отклонение равно квадратному корню из дисперсии:

Коэффициент вариации равен:

Полученному статистическому ряду соответствует нормальное распределение. В качестве теоретического закона распределения используем нормальное распределение с математическим ожиданием 15,148 и дисперсией 19,79.

Если испытываете трудности в написании курсовой работы по статистике, оформите заявку и Вы узнаете сроки и стоимость работы. Цена — от 99 рублей.

Источник

You can use this grouped frequency distribution calculator to identify the class interval (or width) and subsequently generate a grouped frequency table to represent the data.

How to use the calculator: Enter the data values separated by commas, line breaks, or spaces. Enter the details of the required number of intervals, and click on the «Calculate» button.

Class Intervals

It can be useful to group data into class intervals when the frequency table has become large. Class intervals enable us to more readily present, interpret, and assess the data. The class interval frequency is the number of data values that fall within the range stipulated by the interval. It is sometimes referred to as the class width.

The class interval represents the distance between a given class’ lower class limit and the lower class limit of the next class. As described above, all the class intervals within a frequency distribution must be of equal width.

The formula for determining class intervals is as follows:

i ≥ (H − L) / k

Where:

i is the class interval,

H is the greatest observed value,

L is the smallest observed value,

k is the number of class intervals.

Generally, 5 ≤ k ≤ 15. You can use Sturges’ rule as a guide:

k = 1 + 3.322 log₁₀ (n) , where n = number of observations.

The inclusion of the greater than or equal sign, ≥, indicates that it may be necessary to round the outcome of the equation up to the next integer. It is vital that you round up, and not down. As such, while you may typically round the number 3.3 down to 3 in alternative contexts, when calculating class intervals, you need to round up. As such, 3.3 would become 4.

Источник