Как найти варианту с наибольшей частотой

Содержание:

В результате статистической обработки материалов, полученных при измерении величины явления, можно подсчитать число единиц, обладающих конкретным значением того или иного признака.

Допустим, что в качестве изучаемого признака взят вес детали. Будем обозначать этот признак X. Измерения веса, например, 50 деталей дали следующие результаты (в г): 83, 85, 81, 82, 84, 82, 79, 84, 80, 81, 82, 82, 80, 82, 80, 82, 83, 84, 79, 79, 83, 82, 83, 85, 82, 82, 81, 80, 82, 82, .83,80, 82, 85, 81, 83, 81, 81, 83, 82, 81, 85, 83, 79, 81, 85, 81, 84, 81, 82.

Условились каждое отдельное значение признака обозначать Вариационный ряд - определение и вычисление с примерами решения

Если мы расположим отдельные значения признака (варианты) в возрастающем или убывающем порядке и укажем относительно каждого варианта, как часто он встречался в данной совокупности, то получим распределение признака, или вариационный ряд.

Вариационные ряды и их характеристики

Построим вариационный ряд для приведенного выше примера. Для этого находим наименьший вариант, равный 79 г, и, располагая варианты в возрастающем порядке, подсчитываем их частоту. Так, вариант 79 г встречается 4 раза, вариант 80 г — 5 раз и т. д. Расположим полученные варианты следующим образом (см. табл. 1).

Такой ряд называется вариационным рядом; он характеризует изменение (варьирование) какого-нибудь количественного признака (в нашем примере варьирование веса деталей). Следовательно, вариационный ряд представляет собой две строки (или колонки). В одной из них приводятся варианты, а в другой частоты.

Вариационный ряд - определение и вычисление с примерами решения

Виды вариации

Вариация признака может быть дискретной и непрерывной. Дискретной вариацией признака называется такая, при которой отдельные значения признака (варианты) отличаются друг от друга на некоторую конечную величину (обычно целое число), т. е. даны в виде прерывных чисел. Непрерывной называется вариация, при которой значения признака могут отличаться одно от другого на сколь угодно малую величину. В качестве примера можно привести: для дискретной вариации признака — число станков, обслуживаемых одним рабочим, число семян в 1 кг и т. д.; для непрерывной вариации признака— процент выполнения рабочим нормы выработки, вес одного семени и т. д.

При непрерывной вариации распределение признака называется интервальным. Частоты относятся не к отдельному значению признака, как это бывает при дискретной вариации, а ко всему интервалу. Часто за значение интервала принимают его середину, т. е. центральное значение. В качестве примера можно привести интервальный вариационный ряд по проценту выполнения норм выработки.

Пример 1.

Распределение рабочих по проценту выполнения норм выработки.
Вариационный ряд - определение и вычисление с примерами решения

Частость

Нередко вместо абсолютных значений. частот используют относительные величины. Для этой цели можно использовать долю частоты того или иного варианта (а также интервала) в сумме всех частот. Такая величина называется частостью и обозначается Вариационный ряд - определение и вычисление с примерами решения

Мы имеем частоты Вариационный ряд - определение и вычисление с примерами решения

Для получения суммы всех частот их нужно сложить
Вариационный ряд - определение и вычисление с примерами решения
В математике используется знак Вариационный ряд - определение и вычисление с примерами решения (греческая буква сигма заглавная), означающий суммирование.

Следовательно, можно записать:
Вариационный ряд - определение и вычисление с примерами решения
где значки 1=1 и i=n под и над Вариационный ряд - определение и вычисление с примерами решения показывают, что суммированию подлежат все Вариационный ряд - определение и вычисление с примерами решения при условии, что i принимает все целые значения от 1 до n.

В дальнейшем в подобных случаях (т. е. при суммировании по подстрочному номеру i) мы не будем записывать значения, принимаемые i, но будем помнить смысл записи Вариационный ряд - определение и вычисление с примерами решения (уже без указания значений, принимаемых i).

Для получения частости каждого варианта или интервала-нужно его частоту разделить на Вариационный ряд - определение и вычисление с примерами решения
Вариационный ряд - определение и вычисление с примерами решения  Вариационный ряд - определение и вычисление с примерами решения и т.д.,
где Вариационный ряд - определение и вычисление с примерами решения — частость первого варианта или интервала, Вариационный ряд - определение и вычисление с примерами решения— второго и т. д.

Вычислим частости, используя данные табл. 1:Вариационный ряд - определение и вычисление с примерами решения

Сумма всех частостей равна 1:

Вариационный ряд - определение и вычисление с примерами решения

В нашем примере
0,08+0,1+0,2+0,28+0,16+0,08+0,1 = 1,00.
Частости можно выражать и в процентах (тогда сумма всех частостей равна 100%).

Границы интервалов

В интервальном вариационном ряду в каждом интервале различают нижнюю и верхнюю границы интервала:

При построении интервальных вариационных рядов в каждый интервал включаются варианты, числовые значения которых больше нижней границы и меньше или равны верхней грани це. Так, в табл.12 в интервал 95—100% попадают все рабочие, выполнившие нормы выработки от 95 до 100% включительно. Рабочие, выполнившие план на 100,01%, попадают в следующий интервал. Разумеется надо стремиться строить интервалы так, чтобы избегать попадания значительного числа случаев на границы интервалов.

Интервальные вариационные ряды бывают с одинаковыми и неодинаковыми интервалами. В последнем случае чаще всего встречаются интервалы последовательно увеличивающиеся.

Пример 2.

Вариационный ряд с равными интервалами:

Вариационный ряд - определение и вычисление с примерами решения

Пример 2а.

Вариационный ряд с последовательно увеличивающимися интервалами:

Вариационный ряд - определение и вычисление с примерами решения

Свойства сумм

Как видно (и из дальнейшего изучения материала), нам приходится иметь дело с суммами. Рассмотрим некоторые свойства сумм.

1)    Сумма ограниченного числа слагаемых, имеющих одну и ту же величину (сумма постоянной), равна произведению величины слагаемых на их число:Вариационный ряд - определение и вычисление с примерами решения

2)    Постоянный множитель может быть вынесен из-под знака суммы и введен под знак суммы:

Вариационный ряд - определение и вычисление с примерами решения

3)    Сумма алгебраической суммы нескольких переменных равна алгебраической сумме сумм каждой переменной:

Вариационный ряд - определение и вычисление с примерами решения

(легко обобщается на большее число слагаемых).

Величина интервала

Для выбора оптимальной величины интервала, т. е. такой величины интервала, при которой вариационный ряд не будет очень громоздким и в нем не исчезнут особенности явления, можно рекомендовать формулу:

Вариационный ряд - определение и вычисление с примерами решения

где n — число единиц в совокупности.

Так, если в совокупности 200 единиц наибольший вариант равен 49,961, а наименьший — 49,918, то

Вариационный ряд - определение и вычисление с примерами решения

Следовательно, в данном случае оптимальной величиной интервала может служить величина 0,005.

Плотность распределения

В качестве характеристики ряда распределения применяют плотность распределения, которую вычисляют как отношение-частот или частостей к величине интервала.  

Различают абсолютную плотность распределения:

Вариационный ряд - определение и вычисление с примерами решения

и относительную плотность распределения:
Вариационный ряд - определение и вычисление с примерами решения
где Вариационный ряд - определение и вычисление с примерами решения -— плотности распределения, абсолютная (со значком А) и относительная (со значком О).

Пример 3.

По данным примера 2 вычислим относительную плотность распределения. Для первого интервала

Вариационный ряд - определение и вычисление с примерами решения
для второго интервалаВариационный ряд - определение и вычисление с примерами решения

Расщепление интервалов

Часто возникает необходимость в расщеплении интервалов. Для этой цели можно воспользоваться следующим методом для интервальных вариационных рядов с равными интервалами.

Расщепление производится при предположении, что плотность вариационного ряда изменяется по параболе второго порядка. Имеется в виду, что весь интервал разбивается на две части: первую, составляющую долю Вариационный ряд - определение и вычисление с примерами решения в величине интервала, и вторую 1—Вариационный ряд - определение и вычисление с примерами решения. Соответственно частость расщепляемого интервала F распадается на Вариационный ряд - определение и вычисление с примерами решения В этом случае:

Вариационный ряд - определение и вычисление с примерами решения
где А —    частость интервала, предшествующего расщепляемому;

В —    частость расщепляемого интервала;

С —    частость интервала, последующего за расщепляемым;

Вариационный ряд - определение и вычисление с примерами решения—    приращение частости интервала, предшествующего расщепляемому (Вариационный ряд - определение и вычисление с примерами решения);

Вариационный ряд - определение и вычисление с примерами решения —    второе приращение частостей Вариационный ряд - определение и вычисление с примерами решения — (В—А)=С—2В+А].

Пример 4.

По данным примера 2 произведем расщепление интервала 100—125% на две части, выделим часть интервала 100—120% и определим удельный вес рабочих, выполняющих норму выработки от 100 до 120%.

Имеем:Вариационный ряд - определение и вычисление с примерами решения

Получаем частость по соответствующей формуле: Вариационный ряд - определение и вычисление с примерами решения

В случае неравных интервалов вычисление усложняется.

Графические методы изображения вариационных рядов

Большое значение для наглядного представления вариационного ряда имеют графические методы его изображения. Вариационный ряд графически может быть изображен в виде полигона, гистограммы, кумуляты и огивы.

Полигон распределения (Дословно — многоугольник распределения) строится в прямоугольной системе координат. Величина признака откладывается на оси абсцисс, частоты или частости (точнее — плотности распределения) — по оси ординат.

На оси абсцисс отмечаются точки, соответствующие, величине вариантов, и из них восстанавливаются ординаты (перпендикуляры), длина которых соответствует численности этих вариантов. Вершины ординат соединяются прямыми линиями. Чаще всего полигоны применяются для изображения дискретных вариационных рядов, но могут быть применены и для интервальных рядов. В этом случае ординаты, пропорциональные частоте или частости интервала, восстанавливаются перпендикулярно оси абсцисс в точке, соответствующей середине данного интервала. Для замыкания крайние ординаты соединяются с •серединой интервалов, в которых частоты или частости равны нулю.

Пример 5.

По данным примера 1 строим полигон.
Вариационный ряд - определение и вычисление с примерами решения
 

Гистограмма распределения строится аналогично полигону в прямоугольной системе координат. В отличие от полигона при построении гистограммы на оси абсцисс берутся не точки, а отрезки, изображающие интервал, а вместо ординат, соответствующих частотам или частостям отдельных вариантов, строят прямоугольники с высотой, пропорциональной частотам или частостям интервала.

Вариационный ряд - определение и вычисление с примерами решения

В случае неравенства интервалов гистограмма распределения строится не по частотам или частостям, а по плотности интервалов (абсолютной или относительной). При этом общая площадь гистограммы равна численности совокупности, если построение производится по абсолютной плотности, или единице, если гистограмма построена по относительной плотности.

Если соединить прямыми линиями середины верхних сторон прямоугольников, то получим полигоны распределения.

Разбивая интервалы на несколько частей и исходя из того, что вся площадь гистограммы должна остаться при этом неизменной, можно получить мелкоступенчатую гистограмму, которая в пределе (за счет уменьшения величины интервала) перейдет в плавную кривую, называемую кривой распределения.

Пример 6.

Имеются данные о диаметре 200 валиков (см. табл. 4).

Чтобы по этим данным построить вариационный ряд с равными интервалами, изобразить его с помощью гистограммы, а затем превратить ее в мелкоступенчатую, производим следующие действия:

а) Выбираем наименьший вариант, а затем наибольший и находим между ними разность. Делим полученную разность на число проектируемых интервалов и получаем величину каждого интервала.

Так, наименьший интервал 49,918, наибольший — 49,961. Разность 49,961—49,918=0,043.

Допустим, мы хотим получить пять интервалов, тогда величина каждого интервала равна
Вариационный ряд - определение и вычисление с примерами решения
Следовательно, будем иметь такие интервалы:

49,918—49,928; 49,928—49,938 и т. д.

Строим рабочую таблицу, в которой подсчитываем численность каждого интервала путём . разноски данных из табл. 4 в рабочую табл. 5 и проставления черточек, соответствующих единице счета. По мере накопления четырех черточек перечеркиваем их одной чертой и ведем счет пятками (см. табл. 5).

На основании рабочей таблицы получаем следующий вариационный ряд (см. табл. 6).

б) По полученному вариационному ряду строим гистограмму распределения: на оси абсцисс откладываем диаметры валиков, начиная с 49,918 до 49,968, а на оси ординат проставляем масштаб; далее строим прямоугольники с высотой, пропорциональной количеству валиков в каждом интервале.
Вариационный ряд - определение и вычисление с примерами решения

Вариационный ряд - определение и вычисление с примерами решения

Соединяем прямыми линиями середины верхних сторон прямоугольников и получаем полигон (см. график 2).

Для получения мелкоступенчатой гистограммы разбиваем интервалы на две равные части и получаем:

Вариационный ряд - определение и вычисление с примерами решения

Если построить гистограмму по новому вариационному ряду, с уменьшенными интервалами, то получим гистограмму с более мелкими ступенями. Учет требования о неизменности площади гистограммы приводит к необходимости увеличить масштаб оси ординат вдвое.
Вариационный ряд - определение и вычисление с примерами решения

Можно продолжить процесс расчленения интервалов и дальше, получая все более и более мелкоступенчатую гистограмму.

Кумулятивная кривая (кривая сумм — кумулята) получается при изображении вариационного ряда с накопленными частотами или частостями в прямоугольной системе координат. При построении кумуляты дискретного признака на ось абсцисс наносятся значения признака (варианты). Ординатами служат вертикальные отрезки, длина которых пропорциональна накопленной частоте или частости того или иного варианта. Соединением вершин ординат прямыми линиями получаем ломаную (кривую) кумуляту.

Пример 7.

По данным табл. 4 построить кумуляту.
Вариационный ряд - определение и вычисление с примерами решения

Составляем дискретный вариационный ряд с накопленными частотами (при наличии частостей можно для построения кумуляты пользоваться ими; см. табл. 8).

Накопленная частота определенного варианта получается суммированием всех частот вариантов, предшествующих данному, с частотой этого варианта.

Используя накопленные частоты, строим кумуляту.

Вариационный ряд - определение и вычисление с примерами решения
При построении кумуляты- интервального вариационного ряда нижней границе первого интервала соответствует частота, равная нулю, а верхней границе — вся частота интервала. Верхней границе второго интервала соответствует накопленная частота первых двух интервалов (т. е. сумма частот этих интервалов) и т. д. Верхней границе последнего (максимального) интервала соответствует накопленная частота, равная сумме всех частот.

Пример 8.

По данным табл. 7 построить кумуляту.

Составляем интервальный вариационный ряд с накопленными частотами (см. табл. 9). По полученным накопленным частотам строим кумуляту (см. график 5).

Огива строится аналогично кумуляте с той лишь разницей, что на ось абсцисс наносят накопленные частоты, а на ось ординат — значения признака. Если лист бумаги, на котором изображена кумулята, повернуть на 90° и посмотреть на него с обратной стороны на свет, то можно увидеть огиву.

Вариационный ряд - определение и вычисление с примерами решения

График 5. Кумулята интервального вариационного ряда

Пример 9. По данным табл. 9 построим огиву (см. график 6)-

Накопленные частоты можно получать не только в восходящем порядке, но и в нисходящем, тогда частоты вариантов суммируются снизу вверх.

Пример 10.

По данным табл. 7. вычислить накопленные частоты в нисходящем порядке.
Вариационный ряд - определение и вычисление с примерами решения

Средние величины

В качестве одной из важнейших характеристик вариационного ряда применяют среднюю величину. Математическая статистика различает ряд типов средних величин: арифметическую, геометрическую, гармоническую, квадратическую, кубическую и др. Все перечисленные типы средних могут быть исчислены для случаев, когда каждый из вариантов вариационного ряда встречается только один раз, — тогда средняя называется простой или невзвешенной, — и для случаев, когда варианты или интервалы повторяются различное число раз. При этом число повторений вариантов или интервалов называют частотой или статистическим весом, а среднюю, вычисленную с учетом статистического веса, —взвешенной средней.

Выбор одного из перечисленных типов средних для характеристики вариационного ряда производится не произвольно, а в зависимости от особенностей изучаемого явления и цели, для которой средняя исчисляется.

Практически при выборе того или другого типа средней следует исходить из принципа осмысленности результата при суммировании или при взвешивании. Только тогда средняя применена правильно, когда в результате взвешивания или суммирования получаются величины, имеющие реальный смысл.

Обычно затруднения при выборе типа средней возникают лишь в использовании средней арифметической или гармонической. Что же касается геометрической и квадратической средних, то их применение ограничено особыми случаями (см. далее).

Следует иметь в виду, что средняя только в том случае является обобщающей характеристикой, если она применяется к однородной совокупности., В случае использования средней для неоднородных совокупностей можно прийти к неверным выводам. Научной — основой статистического анализа является метод статистических группировок, т. е. расчленения совокупности на качественно однородные группы.

Степенная средняя

Все указанные типы средних величин могут быть получены из формул степенной средней. Если имеются варианты Вариационный ряд - определение и вычисление с примерами решениято средняя из вариант тов может быть исчислена по формуле простой невзвешенной степенной средней порядка z

Вариационный ряд - определение и вычисление с примерами решения
При наличии соответствующих частот Вариационный ряд - определение и вычисление с примерами решения средняя исчисляется по формуле взвешенной степенной средней
Вариационный ряд - определение и вычисление с примерами решения

где Вариационный ряд - определение и вычисление с примерами решения — степенная средняя;

z — показатель степени, определяющий тип средней;

х — варианты;

m — частоты или статистические веса вариантов.

Средняя арифметическая получается из формулы степенной средней при подстановке z=1

Вариационный ряд - определение и вычисление с примерами решения

средняя арифметическая невзвешенная и

Вариационный ряд - определение и вычисление с примерами решения

средняя арифметическая взвешенная.

Пример 11.

Измерения 20 единиц продукции дали следующие результаты (колонки 1 и 2):

Вариационный ряд - определение и вычисление с примерами решения

Вычислить средний размер единицы продукции.

Находим среднюю арифметическую. Для этого исчисляем в табл. 11 колонку 3

Вариационный ряд - определение и вычисление с примерами решения

Здесь умножение значения признака на вес и суммирование этих произведений дает общий размер продукции, т. е. имеет реальный смысл.

Средняя гармоническая получается при подстановке в формулу степенной средней значения z =—1.

Средняя гармоническая простая

Вариационный ряд - определение и вычисление с примерами решения

Средняя гармоническая взвешенная
Вариационный ряд - определение и вычисление с примерами решения
Средняя гармоническая вычисляется в тех случаях, когда средняя предназначается для расчета сумм слагаемых, обратно пропорциональных величине данного признака, т. е. когда суммированию подлежат не сами варианты, а обратные им величины

Вариационный ряд - определение и вычисление с примерами решения

или

Вариационный ряд - определение и вычисление с примерами решения

Пример 12.

По следующим данным о работе 22 рабочих в течение 6 часов вычислить среднюю гармоническую взвешенную.Вариационный ряд - определение и вычисление с примерами решения

В данном случае взвешивание состоит в делении по каждой группе количества рабочих (m) на затраты времени по изготовлению одной детали (х). Для проверки правильности выбора типа средней осмыслим результат взвешивания. Исходя из того, что все рабочие работали по 6 часов, количество рабочих можно рассматривать как величину, определяющую общие затраты времени. Тогда результат деления представит вполне осмысленную величину:

Вариационный ряд - определение и вычисление с примерами решения

Таким образом, средняя гармоническая в данном примере применена правильно. При использовании средней гармонической для упрощения расчетов целесообразно пользоваться таблицами обратных чисел (см. приложение VIII).

Средняя квадратическая получается из формулы степенной средней при подстановке z=2    

Вариационный ряд - определение и вычисление с примерами решения    

средняя квадратическая невзвешенная и 

Вариационный ряд - определение и вычисление с примерами решения
средняя квадратическая взвешенная.

Средняя квадратическая используется только в тех случаях, когда варианты представляют собой отклонения фактических величин от их средней арифметической или от заданной нормы.

Пример 13.

Имеются результаты измерения отклонений фактической длины изделий от заданной нормы.
Вариационный ряд - определение и вычисление с примерами решения

Вычислим среднюю величину отклонений.

Находим среднюю квадратическую взвешенную; для этого исчисляем в табл. 13 колонки 3 и 4:

Вариационный ряд - определение и вычисление с примерами решения

Значит, средняя величина отклонений фактической длины изделий от заданной нормы составляет 1,08 мм. В данном случае средняя арифметическая была бы непригодна, так как в результате мы получили бы нуль

Вариационный ряд - определение и вычисление с примерами решения
Средняя геометрическая получается из формулы степенной средней при подстановке z=0:

Вариационный ряд - определение и вычисление с примерами решения

Для раскрытия неопределенности этого вида прологарифмируем обе части равенства: Вариационный ряд - определение и вычисление с примерами решения
Вариационный ряд - определение и вычисление с примерами решения
Теперь при подстановке z в правую часть равенства получаем неопределенность вида Вариационный ряд - определение и вычисление с примерами решения Используя правило Лопиталя и дифференцируя отдельно числитель и знаменатель по переменной z, получаем:

Вариационный ряд - определение и вычисление с примерами решения
Таким образом:
Вариационный ряд - определение и вычисление с примерами решения   
Потенцируя, находим среднюю:
Вариационный ряд - определение и вычисление с примерами решения
Это и есть формула средней геометрической невзвешенной, которая записывается сокращенно так:

Вариационный ряд - определение и вычисление с примерами решения

где П — знак произведения;

n — число вариантов.

Если использовать частоты (m), то средняя геометрическая взвешенная примет следующий вид:

Вариационный ряд - определение и вычисление с примерами решения

Вычисления средней геометрической в значительной мере упрощаются применением логарифмирования. Для невзвешенной средней геометрической Вариационный ряд - определение и вычисление с примерами решения получаем:

Вариационный ряд - определение и вычисление с примерами решения
Для взвешенной средней геометрической:
Вариационный ряд - определение и вычисление с примерами решения
Таким образом, логарифм средней геометрической есть средняя арифметическая, из логарифмов вариантов (см. формулы средней арифметической).

Средняя геометрическая используется главным образом при изучении динамики (см. раздел II).

Расчет средних коэффициентов и темпов. роста производится по формулам средней геометрической.

Пример 14.

Выпуск промышленной продукции производился предприятием в следующих размерах:

Вариационный ряд - определение и вычисление с примерами решения

Чтобы найти средний месячный коэффициент и темп роста промышленной продукции, определяем помесячные коэффициенты роста Вариационный ряд - определение и вычисление с примерами решения, которые в данном случае и являются вариантами:

Вариационный ряд - определение и вычисление с примерами решения

Из найденных трех помесячных коэффициентов роста (вариантов) определяем средний месячный коэффициент роста Вариационный ряд - определение и вычисление с примерами решенияпо формуле средней геометрической. Для этого найденные коэффициенты роста перемножаются и из произведения извлекается корень третьей степени

Вариационный ряд - определение и вычисление с примерами решения

Из разобранного примера можно сделать два вывода: во-первых, что произведение трех найденных коэффициентов роста можно получить без их предварительного исчисления путем деления апрельского объема продукции (12,0) на январский объем (10,2):

Вариационный ряд - определение и вычисление с примерами решения

и, во-вторых, что показатель степени корня, равный трем (число коэффициентов роста), можно получить вычитанием единицы из числа приведенных в примере месяцев (четыре).

Таким образом, наиболее удобной для исчисления среднего коэффициента роста следует считать формулу:

 Вариационный ряд - определение и вычисление с примерами решения 

где n — число приведенных дат или периодов;

Вариационный ряд - определение и вычисление с примерами решения— последний член ряда;

Вариационный ряд - определение и вычисление с примерами решения — первый член ряда.

Математические свойства средней арифметической

Из вышеуказанных средних наиболее часто применяется средняя арифметическая. Знание свойств средней арифметической позволяет упрощенно ее вычислять.

Математические свойства средней арифметической:

1) Средняя постоянной величины равна этой же постоянной

величине.

2) Сумма отклонений от средней, умноженных на веса (частоты), равна нулю:

Вариационный ряд - определение и вычисление с примерами решения (если все веса равны единице)
или    

Вариационный ряд - определение и вычисление с примерами решения

Докажем это свойство для средней взвешенной.

Имеем: варианты Вариационный ряд - определение и вычисление с примерами решения

частоты Вариационный ряд - определение и вычисление с примерами решения

Вариационный ряд - определение и вычисление с примерами решения откуда Вариационный ряд - определение и вычисление с примерами решения

и Вариационный ряд - определение и вычисление с примерами решения

Подводя под общий знак суммы, получаем:

Вариационный ряд - определение и вычисление с примерами решения
Следовательно, Вариационный ряд - определение и вычисление с примерами решения

Пример 15.

Вычислить среднюю (по колонкам 1 и 2) и убедиться в правильности выведенной формулы.

Вариационный ряд - определение и вычисление с примерами решения

3)    Если у всех вариантов х частоты m равны друг другу, то средняя арифметическая взвешенная равна средней арифметической невзвешенной. 

Имеем Вариационный ряд - определение и вычисление с примерами решения

Тогда:

Вариационный ряд - определение и вычисление с примерами решения

4)    Если из всех вариантов (х) вычесть постоянную величину Вариационный ряд - определение и вычисление с примерами решения и из результатов вычитания, т. е. из отклонений вариантов от этой постоянной величины Вариационный ряд - определение и вычисление с примерами решения вычислить среднюю Вариационный ряд - определение и вычисление с примерами решения то она окажется меньше искомой средней на эту постоянную величину Вариационный ряд - определение и вычисление с примерами решения Поэтому, чтобы получить среднюю из вариантов Вариационный ряд - определение и вычисление с примерами решения нужно к найденной средней Вариационный ряд - определение и вычисление с примерами решения прибавить ту же постоянную величину:

Вариационный ряд - определение и вычисление с примерами решения

если Вариационный ряд - определение и вычисление с примерами решения

Доказательство.

Имеем отклонения от постоянной величины Вариационный ряд - определение и вычисление с примерами решения обозначенные Вариационный ряд - определение и вычисление с примерами решения

Вариационный ряд - определение и вычисление с примерами решения    
Находим среднюю из Вариационный ряд - определение и вычисление с примерами решения        Вариационный ряд - определение и вычисление с примерами решения

Откуда Вариационный ряд - определение и вычисление с примерами решения

Пример 16.

Вычислить среднюю путем вычитания 1000 из всех вариантов по следующим данным (колонки 1 и 2).
Вариационный ряд - определение и вычисление с примерами решения.

Пример 17.

Используя данные прёдыдущего примера, можно убедиться, что если за Вариационный ряд - определение и вычисление с примерами решения взять не 1000, а 1004, то величина средней не изменится.
Вариационный ряд - определение и вычисление с примерами решения

5) Если все варианты (х) уменьшить в одно и то же число раз, т. е. разделить на постоянную величину (k), и из частных Вариационный ряд - определение и вычисление с примерами решения вычислить среднюю, то онa окажется уменьшенной в такое же число раз, а поэтому, чтобы получить среднюю из вариантов Вариационный ряд - определение и вычисление с примерами решения нужно найденную среднюю Вариационный ряд - определение и вычисление с примерами решения умножить на ту же постоянную величину (k):
Вариационный ряд - определение и вычисление с примерами решения
Доказательство.

Имеем частные от деления вариантов х на постоянную величину k, обозначенные х’:
Вариационный ряд - определение и вычисление с примерами решения

Находим среднюю из Вариационный ряд - определение и вычисление с примерами решения

Вариационный ряд - определение и вычисление с примерами решения

откуда Вариационный ряд - определение и вычисление с примерами решения

Пример 18.

Вычислить среднюю путем деления всех вариантов на 100 по следующим данным (колонки 1 и 2):Вариационный ряд - определение и вычисление с примерами решения

6) При вычислении средней вместо абсолютных значений весов (m) можно использовать относительные величины структуры (частости), т. е. удельные веса отдельных частот в общей сумме всех частот (см. § 4), или относительные величины координации, которые получаются путем отношения частот всех вариантов к одной из частот, принятой за единицу

Вариационный ряд - определение и вычисление с примерами решения
Если же удельные веса частот выражены в процентах, то

Вариационный ряд - определение и вычисление с примерами решения
где Вариационный ряд - определение и вычисление с примерами решения — частость, т. е. доля частоты варианта в общей сумме частот.

Доказательство.

Вариационный ряд - определение и вычисление с примерами решения

Значит Вариационный ряд - определение и вычисление с примерами решения

Пример 19.

Вычислить средний размер детали по следующим данным (колонки 1 и 2):

Вариационный ряд - определение и вычисление с примерами решения

Предварительно найдем относительные величины структуры (колонка 3), а затем вычислим средний размер детали, используя их в качестве весов:
Вариационный ряд - определение и вычисление с примерами решения
Если теперь вычислить средний размер детали, используя в качестве весов частоты, то получим:
Вариационный ряд - определение и вычисление с примерами решения
что согласуется с результатом, полученным ранее.

Для вычисления средней можно было использовать колонку 4 :  Вариационный ряд - определение и вычисление с примерами решения

7) Если в частотах (m) имеется общий множитель (A), то его можно при вычислении средней не принимать во внимание т. е. взвешивание производить по сокращенным частотам Вариационный ряд - определение и вычисление с примерами решенияВариационный ряд - определение и вычисление с примерами решения Численное значение средней от замены частот (m) на сокращенные частоты Вариационный ряд - определение и вычисление с примерами решения не изменится
Вариационный ряд - определение и вычисление с примерами решения
Доказательство.

Имеем:Вариационный ряд - определение и вычисление с примерами решения

Разделим частоты на общий множитель А, содержащийся в них:

Вариационный ряд - определение и вычисление с примерами решения

Тогда
Вариационный ряд - определение и вычисление с примерами решения

Пример 20.

Вычислить среднюю по данным табл. 20 (колонки 1 и 2), произведя взвешивание вариантов по сокращенным весам.

Вычисляем среднюю по указанной формуле, предварительно сократив веса и заполнив колонки 3 и 4.
Вариационный ряд - определение и вычисление с примерами решения

Вариационный ряд - определение и вычисление с примерами решения

8) Общая средняя равна-.-взвешенной средней из частных средних: 
Вариационный ряд - определение и вычисление с примерами решения
где Вариационный ряд - определение и вычисление с примерами решения — частные средние, т. е. средние для отдельных групп совокупности;

Вариационный ряд - определение и вычисление с примерами решения — средняя из вариантов первой группы; 

Вариационный ряд - определение и вычисление с примерами решения — средняя из вариантов второй группы и т. д.;

Вариационный ряд - определение и вычисление с примерами решения —    частоты отдельных групп;

Вариационный ряд - определение и вычисление с примерами решения —    частота первой группы;

Вариационный ряд - определение и вычисление с примерами решения — частота второй группы и т. д.

Доказательство.

Пусть имеются частные средние:

Вариационный ряд - определение и вычисление с примерами решения

Найдем среднюю для всей совокупности:

Вариационный ряд - определение и вычисление с примерами решения

Пример 21.

В трех, партиях продукции численностью 1000, 2000 и 500 единиц найден средний вес детали (в кг): 3,3; 3,1; 3,7. Вычислить средний вес детали во всех трех партиях

Вариационный ряд - определение и вычисление с примерами решения

9) Сумма квадратов отклонений от средней меньше суммы квадратов отклонений от произвольной величины (В) на величину поправки С, равной произведению объема совокупности на квадрат разности между средней и данной произвольной величиной:

Вариационный ряд - определение и вычисление с примерами решения

для случая невзвешенной средней или

Вариационный ряд - определение и вычисление с примерами решения

для случая взвешенной средней.

Доказательство для случая невзвешенной средней.

Имеем:

Вариационный ряд - определение и вычисление с примерами решения

Пользуясь свойствами сумм (см. стр. 11), производим преобразования:

Вариационный ряд - определение и вычисление с примерами решения

На основании второго свойства средней арифметической Вариационный ряд - определение и вычисление с примерами решения а поэтому

Вариационный ряд - определение и вычисление с примерами решения

откуда

Вариационный ряд - определение и вычисление с примерами решения
Вариационный ряд - определение и вычисление с примерами решения

Пример 22.

По данным табл. 21 (колонки 1 и 2) убедиться в правильности указанных соотношений.

Вычисляем колонки 3, 4, 5, 6, 7, 8, 9 и находим:

Вариационный ряд - определение и вычисление с примерами решения

Подставляя полученные результаты в формулу

Вариационный ряд - определение и вычисление с примерами решенияВариационный ряд - определение и вычисление с примерами решения имеем:

Вариационный ряд - определение и вычисление с примерами решения

Метод отсчета от условного нуля

Упрощенное вычисление средней, состоящее в использовании ряда ее свойств, называется методом отсчета от условного нуля и предполагает:

  1. вычитание из всех вариантов начала отсчета или «ложного нуля» Вариационный ряд - определение и вычисление с примерами решения
  2. деление всех вариантов или отклонений вариантов от начала отсчета на общий множитель, содержащийся в них (k);
  3. условное принятие центра интервала за значение признака всех единиц в данном интервале.

Кроме того, в качестве весов используют сокращенные частоты Вариационный ряд - определение и вычисление с примерами решения или относительные величины (структуры или координации).

Формула исчисления средней методом отсчета от условного нуля:

Вариационный ряд - определение и вычисление с примерами решения

где Вариационный ряд - определение и вычисление с примерами решения, т. е. отклонение от начала отсчета делится на общий множитель, а исчисление средней из Вариационный ряд - определение и вычисление с примерами решения в зависимости от того, какими весами мы располагаем, производится по одной из следующих формул:

Вариационный ряд - определение и вычисление с примерами решения

где Вариационный ряд - определение и вычисление с примерами решения — относительные величины координации (см. табл. 19).

Пример 23.

Вычислить средний вес зерен (на Вариационный ряд - определение и вычисление с примерами решения) по данным колонок 1 и 2 табл. 22 (см. стр. 38), используя метод отсчета от условного нуля.

Используем формулу Вариационный ряд - определение и вычисление с примерами решения предварительно заполнив колонки 3, 4, 5 и 6 табл. 22:

Вариационный ряд - определение и вычисление с примерами решения

Вариационный ряд - определение и вычисление с примерами решения

Метод стандартизации средних

Часто сравниваемые совокупности неоднородны по своему составу, и выводы при использовании средних для подобных сравнений могут оказаться неправильными. Чтобы .этого избежать, используют метод стандартизации.

Метод стандартизации средних наиболее разработан в статистике населения (демографической) и медицинской статистике, когда производится сравнение совокупностей с различными Структурами. Стандартизация достигается элиминированием (устранением) влияния различия в структурах совокупностей. Результат сравнения характеризует различие в средних при условии, что структура сравниваемых совокупностей одинакова.

Рассмотрим применение метода стандартизации на примере из медицинской статистики. Имеются данные о двух больницах А и Б по отделениям и в целом.Вариационный ряд - определение и вычисление с примерами решения

Получается парадоксальное положение, при котором по больнице Б итоговая (общая) летальность (8,4%) ниже, чем в больнице А (9,2%), хотя по всем отделениям летальность в больнице Б выше (см. последние две колонки).

Причиной этого парадокса является отличие удельных весов разных отделений в больницах. Доля терапевтического отделения (по числу больных) с самой высокой летальностью составляет в больнице А 60%„ а в больнице Б — 20%, а доля хирургического отделения, с самой низкой летальностью, в больнице А — 20%, а в больнице Б — 60%.

Устраним влияние различия в структурах и стандартизуем распределение больных по отделениям. В качестве стандарта можно взять распределение больных по отделениям в любой больнице или привлечь данные о распределении больных нескольких других больниц. Возьмем за стандарт распределение больных в больнице А. Тогда по больнице А общая летальность (9,2%) останется без изменения. По больнице Б произведем пересчет.Вариационный ряд - определение и вычисление с примерами решения

Находим среднюю стандартизованную летальность больных больницы Б:

Вариационный ряд - определение и вычисление с примерами решения
Таким образом, после стандартизации летальность в больнице Б оказалась значительно выше,, чем в больнице А:
Вариационный ряд - определение и вычисление с примерами решения
Следует иметь в виду, что полученное значение стандартизованной средней может служить только для сравнительных целей, абсолютное же ее значение принимать во внимание не следует.

Если за стандарт принять распределение больных в больнице Б, то получим следующую стандартизованную летальность для больницы А:

Вариационный ряд - определение и вычисление с примерами решения

а отношение стандартизованных средних почти не изменится:

Вариационный ряд - определение и вычисление с примерами решения

Мажорантность средних

Если вычислить различные типы средних для одного и того же вариационного ряда, то численные их значения будут отличаться друг от друга. При этом средние по своей величине расположатся в определенном порядке. Наименьшей из перечисленных средних окажется средняя гармоническая, затем геометрическая и т. д., наибольшей — средняя квадратическая. Порядок возрастания средних при этом определяется показателем степени z в формуле степенной средней и вытекает из «правила мажорантности».

Так,
при z= —1 получаем среднюю гармоническую,

при z= 0    »»    геометрическую,

при z= 1    »»    арифметическую,

при z= 2    »»    квадратическую:

Вариационный ряд - определение и вычисление с примерами решения
Подробное выяснение общего условия мажорантности впервые было произведено А. Я. Боярским, доказавшим, что если две средние должны удовлетворять соответственно уравнениям

Вариационный ряд - определение и вычисление с примерами решения

и    

Вариационный ряд - определение и вычисление с примерами решения
то первая из них Вариационный ряд - определение и вычисление с примерами решения мажорантна в отношении Вариационный ряд - определение и вычисление с примерами решения если при любом значении аргументаВариационный ряд - определение и вычисление с примерами решения

Для степенной средней порядка z имеем:
Вариационный ряд - определение и вычисление с примерами решения
Это отношение для положительных значений с показателем x растет вместе с показателем z.

Пример 24.

Вычислить различные типы средних,по следующим данным (колонки 1 и 2) и убедиться в правильности порядка возрастания средних:Вариационный ряд - определение и вычисление с примерами решения

Заполняем колонки с 3-й по 8-ю и по соответствующим формулам исчисляем средние взвешенные:

Вариационный ряд - определение и вычисление с примерами решения

Порядок средних определился в соответствии с правилом мажорантности:

17,41 < 18,14 < 18,8< 19,37.

Медиана

В качестве характеристики вариационного ряда применяется медиана (Вариационный ряд - определение и вычисление с примерами решения), т. е. такое значение варьирующего признака, которое приходится на середину упорядоченного вариационного ряда. Если в вариационном ряде 2m + 1 случаев, то значение признака у случая m + 1 будет медианным. Если в ряду четное число 2m случаев, то медиана равна средней арифметической из двух срединных значений.

Формулы для исчисления медианы при нечетном и четном числе вариантов:

Вариационный ряд - определение и вычисление с примерами решения

Пример 25.

Дано девять вариантов признака х, расположенных в возрастающем порядке:

Вариационный ряд - определение и вычисление с примерами решения

Вычислить медиану.

Имеем нёчетное число вариантов:

Вариационный ряд - определение и вычисление с примерами решения

Находим медиану

Вариационный ряд - определение и вычисление с примерами решения

Пример 26.

Дано 12 вариантов признака х, расположенных в возрастающем порядке:    

Вариационный ряд - определение и вычисление с примерами решения

Ищем медиану.

Имеем четное число вариантов:

Вариационный ряд - определение и вычисление с примерами решения

При исчислении медианы интервального вариационного ряда сначала находят интервал, содержащий медиану, путем использования накопленных частот или частостей. Медианному интервалу соответствует первая из накопленных частот или частостей, превышающая половину всего объема совокупности.

Для нахождения медианы при постоянстве плотности внутри интервала, содержащего медиану, используют следующую формулу:

Вариационный ряд - определение и вычисление с примерами решения

где Вариационный ряд - определение и вычисление с примерами решения—нижняя граница медианного интервала;

k — интервальная разность;

Вариационный ряд - определение и вычисление с примерами решения— накопленная частота интервала, предшествующего медианному;

Вариационный ряд - определение и вычисление с примерами решения — частота медианного интервала.

Пример 27.

По данным табл. 7 вычислить медиану.

Используем табл. 9, в которой дана колонка накопленных частот. Так как вариационный ряд содержит 200 единиц, то медиана будет 100-й единицей, входящей в интервал 49,938— 49,943 (определяется из колонки 3 табл. 9 по накопленной частоте 121, первой из накопленных частот, которая превышает половину всего объема вариационного ряда). Следовательно:

Вариационный ряд - определение и вычисление с примерами решения
Вычислим медиану:

Вариационный ряд - определение и вычисление с примерами решения

Медиана может быть определена и графически по кумуляте или огиве. Для определения медианы по кумуляте последнюю ординату, пропорциональную сумме всех частот или частостей, делят пополам. Из полученной точки восстанавливают перпендикуляр до пересечения с кумулятой. Абсцисса точки пересечения и дает значение медианы.

П р и м е р 28. По графику 5 определить медиану.

Последняя ордината, как видно из графика, равна 200. Деление этой ординаты пополам дает точку А (100). Перпендикуляр из точки А до пересечения с кумулятой дает точку В. Абсцисса точки В, равная 49,941, и будет медианой.

Медиана обладает тем свойством, что сумма абсолютных величин отклонений вариантов от медианы меньше, чем от любой другой величины (в том числе и от средней арифметической).

Вариационный ряд - определение и вычисление с примерами решения

Доказательство. Допустим, что в упорядоченном вариационном ряду, состоящем из n вариантов, в качестве начала отсчета отклонений взят вариант, расположенный так, что число вариантов меньше его m, а больше n—m.

Найденную сумму абсолютных величин отклонений от этого варианта обозначим Вариационный ряд - определение и вычисление с примерами решения

Если теперь передвинуть начало отсчета на один вариант вверх так, чтобы вариантов, величина которых меньше начала отсчета, было m—1, а больше n—m+1, то при этом сумма абсолютных величин отклонений вариантов меньших, чем начало отсчета, от начала отсчета уменьшится на m • с, где с — разность между старым и новым началами отсчета.

В то же время сумма абсолютных величин отклонений больших вариантов от нового начала отсчета отклонений увеличится на (n—m) • с. Новая сумма абсолютных отклонений окажется равной

Вариационный ряд - определение и вычисление с примерами решения

Следовательно, при таком передвижении начала отсчета вверх новая сумма абсолютных отклонений будет уменьшаться до тех пор, пока  Вариационный ряд - определение и вычисление с примерами решения т. е. пока m больше половины n.

При Вариационный ряд - определение и вычисление с примерами решения сумма абсолютных отклонений будет, следовательно, наименьшей, а затем при дальнейшем передвижении начала отсчета начнет увеличиваться.

Теперь следует учесть, что n-й вариант, расположенный в середине вариационного ряда, и есть медиана.

Таким образом, минимальное свойство медианы будет доказано.

Это свойство медианы может быть использовано при проектировке расположения трамвайных и троллейбусных остановок, бензоколонок, ссыпных пунктов и т. д.

Например, на шоссе длиной 100 км имеется 10 гаражей. Для проектирования строительства бензоколонки были собраны данные о числе предполагаемых ездок на заправку с каждого гаража. Результаты обследования представлены в табл, на стр. 45.

Нужно поставить бензоколонку так, чтобы общий пробег автомашин на заправку был наименьшим.

Решение: Вариант 1. Если бензоколонку поставить на середине шоссе, т. е. на 50-м километре, то пробеги с учетом числа ездок составят:
Вариационный ряд - определение и вычисление с примерами решения

а)    в одном направлении: 43 • 10 + 24 • 15 + 22 • 5 + 13 • 20 +

+ 10-5 + 4-25 = 1310 км;

б)    в противоположном направлении: 10-15 + 28-30 + 36-10 +

+ 42-65 = 4080 км.

Общий пробег в оба направления окажется равным 5390 км.

Вариант 2. Уменьшения пробега можно достигнуть, если бензоколонку поставить на 63,85-м километре (средний участок шоссе с учетом числа ездок).

В этом случае пробеги составят:

а)    в одном направлении: 56,85-10 + 37,85-15 + 35,85-5 + 26,85 -20 + 23,85-5+17,85 • 25 + 3,85 -15 = 2475,75 км;

б)    в противоположном направлении: 14,15-30 + 22,15-10 + 28,15-65 = 2475,75 км.

Общий пробег в оба направления составит 4951,5 км и окажется меньше, чем при первом варианте, на 438,5 км.

Вариант 3. Наилучший результат, т. е. минимальный общий пробег, будет получен в том случае, если мы поставим бензоколонку на 78-м километре, что будет соответствовать медиане.

Тогда пробеги составят:

а) в одном направлении: 71 • 10 + 52 • 15 + 50 • 5 + 41 • 20 + 38-5 + 32-25+ 18-15 = 3820 км;

б) в противоположном направлении: 8 • 10+14 • 65 = 990 км.

Общий пробег равен 4810 км, т. е. он оказался меньше общих пробегов, рассчитанных по предыдущим вариантам.

Мода

Модой (Вариационный ряд - определение и вычисление с примерами решения) называется вариант, наиболее часто, встречающийся в данном вариационном ряду. Для дискретного ряда мода, являющаяся характеристикой вариационного ряда, определяется по частотам вариантов и соответствует варианту  с наибольшей частотой.

         В случае интервального распределения с равными интервалами модальный интервал (т. е. содержащий моду) определяется пр наибольшей частоте, а при неравных интервалах — по наибольшей плотности.

Вычисление моды производится по следующей формуле:
Вариационный ряд - определение и вычисление с примерами решения

где
Вариационный ряд - определение и вычисление с примерами решения— нижняя граница модального интервала;

k—интервальная разность;

Вариационный ряд - определение и вычисление с примерами решения— частота модального интервала;

Вариационный ряд - определение и вычисление с примерами решения — частота интервала, предшествующего модальному;

Вариационный ряд - определение и вычисление с примерами решения — частота интервала, последующего за модальным.

Пример 29.

По данным табл. 7 находим моду.

Наибольшая частота, равная 49 (колонка 2, табл. 7), соответствует интервалу 49,938—49,943, который и будет модальным.

Следовательно:

Вариационный ряд - определение и вычисление с примерами решения

Подставляя в формулу найденные значения, вычислим моду

Вариационный ряд - определение и вычисление с примерами решения

Как видно из разобранного примера и примера 27, для данного вариационного ряда мода и медиана очень близки друг к другу.

Симметричные вариационные ряды

Вариационные ряды, в которых частоты вариантов, равно отстоящих от средней, равны между собой, называются симметричными. Особенностью симметричных вариационных рядов является равенство трех характеристик: средней арифметической, моды и медианы:

Вариационный ряд - определение и вычисление с примерами решения

Этим пользуются для распознания симметричности вариации в тех случаях, когда она затушевана тем, что средняя приходится не на середину интервала и не на границу между двумя интервалами, т. е. в результате сдвига интервалов группировки ряд частот как таковых оказывается не вполне симметричным.

Пример 30.

По данным табл. 7 определить среднюю и сопоставить с модой и медианой, вычисленными по этим же данным в примерах 27 и 29.

Вычисляем среднюю (см. табл. 26):

Вариационный ряд - определение и вычисление с примерами решения
Вариационный ряд - определение и вычисление с примерами решения

Найденную среднюю сопоставляем с модой и медианой, вычисленными ранее:
Вариационный ряд - определение и вычисление с примерами решения (из примера 27);

Вариационный ряд - определение и вычисление с примерами решения (из примера 29);

Вариационный ряд - определение и вычисление с примерами решения

Полученные характеристики по своей величине близки друг к другу, что дает нам основание считать данный вариационный ряд не очень отклоняющимся от симметричного.

Асимметричные вариационные ряды

Вариационные ряды, в которых расположение вариантов вокруг средней неодинаково, т. е. частоты по обе стороны от средней изменяются по-разному, называются асимметричными или скошенными. Различают левостороннюю и правостороннюю асимметрию.

Меры колеблемости (вариации) признака

Средние величины, характеризуя вариационный ряд одним числом, не учитывают вариацию признака, между тем эта вариация существует. Для измерения вариации признака математическая статистика применяет ряд способов.

Вариационный размах (R) (или широта распределения) есть разность между экстремальными (крайними) значениями вариационного ряда. Он представляет собой величину неустойчивую, чрезвычайно зависящую от случайных обстоятельств; применяется в качестве приблизительной оценки вариации.

В последнее время вариационный размах стал применяться в ряде отраслей промышленности при статистическом изучении качества продукции.

Вариационный ряд - определение и вычисление с примерами решения

где Вариационный ряд - определение и вычисление с примерами решения — наибольший вариант вариационного ряда;

Вариационный ряд - определение и вычисление с примерами решения — наименьший вариант вариационного ряда.

Среднее линейное отклонение или простое среднее отклонение (р —ро) представляет собой среднюю арифметическую из абсолютных значений отклонений вариантов от средней.

В зависимости от отсутствия или наличия частот вычисляют среднее линейное отклонение невзвешенное или взвешенное:
Вариационный ряд - определение и вычисление с примерами решения
где прямые скобки, в которых заключены разности между вариантами и средней, показывают, что непосредственное суммирование и суммирование после взвешивания производится без учета знаков.

Средний квадрат отклонения — дисперсия (обычно обозначаемый Вариационный ряд - определение и вычисление с примерами решения или Вариационный ряд - определение и вычисление с примерами решения) наиболее часто применяется и в теории и на практике в качестве меры колеблемости признака. Если дисперсию вычисляют для всей совокупности, то ее обозначают а и называют общей дисперсией:

Вариационный ряд - определение и вычисление с примерами решения

Дисперсия невзвешенная

Вариационный ряд - определение и вычисление с примерами решения

Дисперсия взвешенная

Таким образом, общая дисперсия есть средняя арифметическая из квадратов отклонений вариантов от их средней арифметической.

Среднее квадратическое отклонение (Вариационный ряд - определение и вычисление с примерами решения или Вариационный ряд - определение и вычисление с примерами решения) представляет собой квадратный корень из дисперсии:

Вариационный ряд - определение и вычисление с примерами решения

Среднее квадратическое отклонение невзвешенное

Вариационный ряд - определение и вычисление с примерами решения

Среднее квадратическое отклонение взвешенное

Достоинством этого показателя по сравнению со средним линейным отклонением (Вариационный ряд - определение и вычисление с примерами решения) является то, что при его вычислении никакого условного допущения о необходимости суммирования отклонений вариантов от средней без учета их знаков мы не делаем, а используем формулу средней квадратической (см. формулу на стр. 25), по которой при возведении отклонений в квадрат их знак безразличен.

Учитывая, что среднее линейное отклонение и среднее квадратическое отклонение представляют собой абсолютные величины, выраженные в тех же единицах измерения, что и варианты, для характеристики колеблемости признака используют относительные показатели — коэффициенты вариации (V), представляющие собой отношение среднего линейного отклонения или среднего квадратического отклонения к средней, выраженное в процентах (или в долях единицы):

Вариационный ряд - определение и вычисление с примерами решения

Коэффициент вариации по среднему линейному отклонению

Вариационный ряд - определение и вычисление с примерами решения

Коэффициент вариации по среднему квадратическому отклонению
Видоизмененный показатель коэффициента вариации по среднему линейному отклонению (Вариационный ряд - определение и вычисление с примерами решения) представляет собой показатель неровноты (Н). Он применяется в текстильной промышленности в. качестве меры колеблемости при изучении неровноты пряжи (по толщине, весу и другим показателям)

Вариационный ряд - определение и вычисление с примерами решения

Показатель неровноты невзвешенный

Вариационный ряд - определение и вычисление с примерами решения

Показатель неровноты взвешенный

Вариационный ряд - определение и вычисление с примерами решения — общая средняя;

Вариационный ряд - определение и вычисление с примерами решения — количество вариантов, величина которых меньше, чем общая средняя;

n — объем вариационного ряда;

Вариационный ряд - определение и вычисление с примерами решения—средняя из вариантов меньших, чем общая средняя;

Вариационный ряд - определение и вычисление с примерами решения — сумма частот вариантов, меньших общей средней;

Вариационный ряд - определение и вычисление с примерами решения—сумма частот всех вариантов.

 Доказательство (для показателя неровноты невзвешенного) .

Подставляя в формулу Вариационный ряд - определение и вычисление с примерами решения вместо Вариационный ряд - определение и вычисление с примерами решения его значение  Вариационный ряд - определение и вычисление с примерами решения

получаем:

Вариационный ряд - определение и вычисление с примерами решения (без умножения на 100).

Разделим весь вариационный ряд на две части. Пусть в первую часть включены варианты меньшие, чем общая средняя, а во вторую — большие, чем общая средняя.

Тогда

Вариационный ряд - определение и вычисление с примерами решения

где

Вариационный ряд - определение и вычисление с примерами решения —сумма отклонений вариантов, больших, чем общая средняя, от общей средней дает положительную величину;

Вариационный ряд - определение и вычисление с примерами решения— сумма отклонений вариантов меньших, чем общая средняя, от общей средней дает отрицательную величину.

Но так как Вариационный ряд - определение и вычисление с примерами решения представляет сумму абсолютных значений отклонений, перед вторым слагаемым ставим знак минус. Наос-новании свойства средней арифметической о том, что Вариационный ряд - определение и вычисление с примерами решения 0, делаем вывод, что Вариационный ряд - определение и вычисление с примерами решенияи следовательно,

Вариационный ряд - определение и вычисление с примерами решения

Учитывая, что под знаком суммы слагаемых будет Вариационный ряд - определение и вычисление с примерами решения выносим Вариационный ряд - определение и вычисление с примерами решения из-под знака суммы:

Вариационный ряд - определение и вычисление с примерами решения

Делим и умножаем числитель на Вариационный ряд - определение и вычисление с примерами решения

Вариационный ряд - определение и вычисление с примерами решения

Пример 31.

По данным табл. 27 о крепости одиночной нити (в г) вычислим показатели вариации признака: вариационный размах, показатель неровноты, коэффициенты вариации по среднему линейному отклонению и среднему квадратическому отклонению.

Вычисляем R:

Вариационный ряд - определение и вычисление с примерами решения

Вариационный ряд - определение и вычисление с примерами решения

Находим среднюю: Вариационный ряд - определение и вычисление с примерами решения

Находим Н. Интервал 190—200 расчленяем на две части: 190—192,16 и 192,16—200.
Аналогично поступаем с частотами: так как вся частота данного интервала равна 69, то, предполагая равномерное распределение признака внутри интервала, получим, что на величину, равную единице интервала, приходится 6,9 единицы частот (абсолютная плотность); на новый интервал (190—192,16), в котором интервальная разность равна 2,16, придется 6,9*2,16 = 14,9 единицы частот. Для простоты возьмем 15. Суммируя частоты вариантов, меньших общей средней, получим 255 (см. колонку 5 табл. 27). Суммируя произведения х
Вариационный ряд - определение и вычисление с примерами решения
Вычисляем Вариационный ряд - определение и вычисление с примерами решения и Вариационный ряд - определение и вычисление с примерами решения.

Учитывая одно из свойств средней, а именно, что сумма отклонений от средней, соответствующим образом взвешенных, равна нулю, практически поступают следующим образом. В колонке 7 табл. 27, несмотря на знак прямых скобок, указывающих на абсолютную величину отклонений, для отрицательных отклонений от средней знак минус оставляют и ведут вычисление только до перемены знака на плюс. Взвешивают отрицательные отклонения от средней (колонка 8 табл. 27) и, так как сумма взвешенных положительных отклонений от средней должна быть равна сумме взвешенных отрицательных отклонений от средней, для определения общей суммы взвешенных отклонений найденную сумму удваивают.

Получаем:

Вариационный ряд - определение и вычисление с примерами решения

Вычисляем Вариационный ряд - определение и вычисление с примерами решения

Вариационный ряд - определение и вычисление с примерами решения

Между средним квадратическим отклонением Вариационный ряд - определение и вычисление с примерами решения и средним линейным отклонением Вариационный ряд - определение и вычисление с примерами решения существует определенное соотношение (такое же соотношение, как между Вариационный ряд - определение и вычисление с примерами решения и Вариационный ряд - определение и вычисление с примерами решения). По свойству мажорантности Вариационный ряд - определение и вычисление с примерами решения всегда больше Вариационный ряд - определение и вычисление с примерами решения

Если объем совокупности достаточно большой и распределение признака в вариационном ряде близко к нормальному (см. раздел IV), то связь между Вариационный ряд - определение и вычисление с примерами решения и Вариационный ряд - определение и вычисление с примерами решения определяется по формуле:   Вариационный ряд - определение и вычисление с примерами решения

Отклонения Вариационный ряд - определение и вычисление с примерами решения от 125 в обе стороны зависят от близости распределения к нормальному.

Пример 32.

По данным примера 31. найти соотношение между Вариационный ряд - определение и вычисление с примерами решения и Вариационный ряд - определение и вычисление с примерами решения

Имеем:

Вариационный ряд - определение и вычисление с примерами решения

Это отношение не намного отличается от теоретического (1,25), что косвенно свидетельствует о близости взятого распределения к нормальному.

Свойства дисперсии

Средний квадрат отклонения — дисперсия — обладает рядом свойств, которые позволяют упростить вычисления.

1) Дисперсия постоянной величины равна нулю:

Вариационный ряд - определение и вычисление с примерами решения
где с — постоянная величина;

Вариационный ряд - определение и вычисление с примерами решения— дисперсия постоянной величины.

2) Если все значения вариантов признака х уменьшить на постоянную величину, то дисперсия не изменится. Это позволяет вычислить дисперсию вариационного ряда путем вычитания из вариантов начала отсчета Вариационный ряд - определение и вычисление с примерами решения

Вариационный ряд - определение и вычисление с примерами решения

где Вариационный ряд - определение и вычисление с примерами решения — дисперсия вариантов х;

Вариационный ряд - определение и вычисление с примерами решения—дисперсия вариантов, уменьшенных вычитанием Вариационный ряд - определение и вычисление с примерами решения
 

Доказательство для невзвешенной дисперсии

Имеем: Вариационный ряд - определение и вычисление с примерами решения со средней Вариационный ряд - определение и вычисление с примерами решения Вариационный ряд - определение и вычисление с примерами решениясо средней

Вариационный ряд - определение и вычисление с примерами решения

Тогда 

Вариационный ряд - определение и вычисление с примерами решения
3)    Дисперсия алгебраической суммы независимых случайных величин (см. стр. 115 и далее) равна сумме их дисперсий:

Вариационный ряд - определение и вычисление с примерами решения

4)    Если все значения вариантов х уменьшить в k раз, то дисперсия уменьшится в Вариационный ряд - определение и вычисление с примерами решения раз:

Вариационный ряд - определение и вычисление с примерами решения

где Вариационный ряд - определение и вычисление с примерами решения —дисперсия из частных, полученных в результате деления вариантов на постоянную величину k.
 

Доказательство для невзвешенной дисперсии

Имеем: Вариационный ряд - определение и вычисление с примерами решения со средней Вариационный ряд - определение и вычисление с примерами решенияВариационный ряд - определение и вычисление с примерами решения со средней Вариационный ряд - определение и вычисление с примерами решения Тогда:
   Вариационный ряд - определение и вычисление с примерами решения
Отсюда:    Вариационный ряд - определение и вычисление с примерами решения

5) Дисперсия суммы двух случайных величин, связанных корреляционной зависимостью, равна сумме их дисперсий плюс удвоенное произведение среднеквадратических отклонений на коэффициент корреляции между этими случайными величинами
Вариационный ряд - определение и вычисление с примерами решения
где Вариационный ряд - определение и вычисление с примерами решения — коэффициент корреляции между величинами у и х, определяемый по формуле Вариационный ряд - определение и вычисление с примерами решения

(Значение его как меры тесноты связи см. раздел «Корреляция».)

Пример 33.

Даны случайные величины у и х, связанные корреляционной зависимостью так, что Вариационный ряд - определение и вычисление с примерами решения =0,5.

Вариационный ряд - определение и вычисление с примерами решения

Найти дисперсию суммы этих случайных величин (для простоты дан пример без взвешивания).

Находим средние:Вариационный ряд - определение и вычисление с примерами решения

Определяем дисперсии:

Вариационный ряд - определение и вычисление с примерами решения
Используя рассматриваемую формулу, имеем:
Вариационный ряд - определение и вычисление с примерами решения
Убедимся, что если х + у = z, то получаем три значения z: 4, 8 и 9.
Находим: среднюю
Вариационный ряд - определение и вычисление с примерами решения
дисперсию

Вариационный ряд - определение и вычисление с примерами решения
т. е.

Вариационный ряд - определение и вычисление с примерами решения
Результаты вычисления, произведенные по непосредственным данным и суммированным, совпадают. 

6) Дисперсия суммы двух случайных величин, связанных Линейной функциональной зависимостью (см. раздел «Корреляция»), равна сумме их дисперсий плюс или минус удвоенное произведение среднеквадратических отклонений:

Вариационный ряд - определение и вычисление с примерами решения

В данной формуле знак плюс или минус определяется характером связи. При прямолинейной связи у с х Вариационный ряд - определение и вычисление с примерами решения знак, о котором идет речь, совпадает со знаком Вариационный ряд - определение и вычисление с примерами решения Если Вариационный ряд - определение и вычисление с примерами решения то в формуле берем знак плюс, если Вариационный ряд - определение и вычисление с примерами решения то берем знак минус.

Пример 34.

Даны две случайные величины х и у, связанные уравнением у=2+Зх.Вариационный ряд - определение и вычисление с примерами решения

Найти дисперсию суммы этих случайных величин. Находим средние:

Вариационный ряд - определение и вычисление с примерами решения
Определяем дисперсии по формуле:

Вариационный ряд - определение и вычисление с примерами решения

Используем рассматриваемую формулу. В данном случае берем знак плюс:

Вариационный ряд - определение и вычисление с примерами решения

Убеждаемся, что если х + у = z, то получаем три значения z: 6, 14 и 22.

Находим: среднюю

Вариационный ряд - определение и вычисление с примерами решения
дисперсию

Вариационный ряд - определение и вычисление с примерами решения

т. е.

Вариационный ряд - определение и вычисление с примерами решения

Вычисление дисперсии методом отсчета от условного нуля

Практически расчет дисперсии производят по формуле, упрощающей вычисления. Эта формула получена с учетом свойств дисперсии, а расчет по ней называется отсчетом от условного нуля:
Вариационный ряд - определение и вычисление с примерами решения

Доказательство. Возьмем выражение  Вариационный ряд - определение и вычисление с примерами решения   произведем некоторые преобразования и получим:

Вариационный ряд - определение и вычисление с примерами решения
Так как второе слагаемое в фигурной скобке равно нулю: Вариационный ряд - определение и вычисление с примерами решения то,  продолжая преобразования, получаем:

Вариационный ряд - определение и вычисление с примерами решения
Отсюда:
Вариационный ряд - определение и вычисление с примерами решения

и

Вариационный ряд - определение и вычисление с примерами решения

Пример 35.

По данным табл. 27 (колонки 2 и 3) рассчитать дисперсию, используя формулу, упрощающую вычисления. Располагаем данные, необходимые для ее вычисления, в таблице (см. табл. 30).

Вариационный ряд - определение и вычисление с примерами решения

Вариационный ряд - определение и вычисление с примерами решения

Величина дисперсии совпадает с величиной, полученной в примере 31, но в данном случае вычисления в значительной мере упрощены.

Из формулы Вариационный ряд - определение и вычисление с примерами решения вытекает еще одна формула дисперсии.

При Вариационный ряд - определение и вычисление с примерами решения получаем:

Вариационный ряд - определение и вычисление с примерами решения
или

Вариационный ряд - определение и вычисление с примерами решения
где Вариационный ряд - определение и вычисление с примерами решения — средняя из квадратов вариантов.
Вариационный ряд - определение и вычисление с примерами решения

Вариационный ряд - определение и вычисление с примерами решения — квадрат средней

Вариационный ряд - определение и вычисление с примерами решения
Так, если вычислить дисперсию по данным табл. 27, пользуясь этой формулой, то получим:Вариационный ряд - определение и вычисление с примерами решения

Вариационный ряд - определение и вычисление с примерами решения

Результат совпадает с дисперсией, полученной по этим данным в примере 31.

Частные дисперсии

Для каждой группы вариантов вариационного ряда может быть исчислена наряду с частной средней и дисперсия, которая называется частной дисперсией или внутригрупповой, Вариационный ряд - определение и вычисление с примерами решения

Вариационный ряд - определение и вычисление с примерами решения (невзвешенная);

Вариационный ряд - определение и вычисление с примерами решения (взвешенная),

Где Вариационный ряд - определение и вычисление с примерами решения — частная средняя i-й группы;

Вариационный ряд - определение и вычисление с примерами решения—частная дисперсия i-й группы.

(Вариационный ряд - определение и вычисление с примерами решения означает суммирование по i-й части совокупности).

Средняя из частных дисперсий

Из частных, т. е.

внутригрупповых, дисперсий может быть найдена средняя, которая обозначается Вариационный ряд - определение и вычисление с примерами решения

Вариационный ряд - определение и вычисление с примерами решения
Средняя из частных дисперсий служит для характеристики среднего рассеяния признака внутри групп.

Межгрупповая дисперсия

Частные средние по группам Вариационный ряд - определение и вычисление с примерами решения могут не совпадать с общей средней Вариационный ряд - определение и вычисление с примерами решения Мерой колеблемости частных средних вокруг общей средней является меж-
групповая дисперсия Вариационный ряд - определение и вычисление с примерами решения— дельта квадрат в среднемВариационный ряд - определение и вычисление с примерами решения

Вариационный ряд - определение и вычисление с примерами решения

Правило сложения вариаций

Между общей дисперсией, средней из частных дисперсий и межгрупповой дисперсией «существует такая связь:    

Вариационный ряд - определение и вычисление с примерами решения
Это — правило сложения вариации (или дисперсий).

Доказательство.

Пусть общая совокупность состоит из t групп численностью Вариационный ряд - определение и вычисление с примерами решения и Вариационный ряд - определение и вычисление с примерами решения

Вариационный ряд - определение и вычисление с примерами решения

Частные средние Вариационный ряд - определение и вычисление с примерами решенияобщая средняя Вариационный ряд - определение и вычисление с примерами решения и дисперсия

Вариационный ряд - определение и вычисление с примерами решения

Частные дисперсии можно записать следующим образом.
Вариационный ряд - определение и вычисление с примерами решения
откуда

Вариационный ряд - определение и вычисление с примерами решения

Суммируя Вариационный ряд - определение и вычисление с примерами решения для всей совокупности, получаем: Вариационный ряд - определение и вычисление с примерами решения

Умножим обе части этого равенства на Вариационный ряд - определение и вычисление с примерами решения тогдаВариационный ряд - определение и вычисление с примерами решения

Вычитая из обеих частей равенства Вариационный ряд - определение и вычисление с примерами решения получим:
Вариационный ряд - определение и вычисление с примерами решения
Левая часть равенства представляет собой общую дисперсию, т. е. Вариационный ряд - определение и вычисление с примерами решения. В правой части первое слагаемое есть средняя из частных дисперсий, т. е. Вариационный ряд - определение и вычисление с примерами решения а разность двух последних выражений— межгрупповая дисперсия Вариационный ряд - определение и вычисление с примерами решения Тогда:

Вариационный ряд - определение и вычисление с примерами решения

Пример 36.

Используя данные табл. 27 и расчленяя вариационный ряд на две группы (1-я группа с интервала 120—130 до интервала 190—200 включительно, а 2-я группа с •интервала 200—210 до интервала 260—270), исчислить частные дисперсии, среднюю из частных дисперсий и межгрупповую дисперсию.

Начинаем расчет с 1-й группы (см. табл. 33):

Вариационный ряд - определение и вычисление с примерами решения= 195; k= 10;

Вариационный ряд - определение и вычисление с примерами решения

Вариационный ряд - определение и вычисление с примерами решения
Для 2-й группы получаем (по тем же формулам):

Вариационный ряд - определение и вычисление с примерами решения

Вариационный ряд - определение и вычисление с примерами решения

Вычисляем среднюю из частных дисперсий:

Вариационный ряд - определение и вычисление с примерами решения
Находим межгрупповую дисперсию, используя общую среднюю для всего вариационного ряда, найденную в примере 31 и равную 192,16

Вариационный ряд - определение и вычисление с примерами решения
Для получения общей дисперсии используем правило сложения вариации:

Вариационный ряд - определение и вычисление с примерами решения

Результат совпадает с дисперсией, вычисленной в примере 31 по табл. 27 без расчленения вариационного ряда на две группы.

Вариация альтернативного признака

Наряду с количественной вариацией признака может иметь место и качественная вариация. Если, имеются два взаимно исключающих друг друга варианта, то вариация признака называется альтернативной.

Так, например, рассмотрение выпущенной продукции с точки зрения ее качества, т. е. пригодности к дальнейшему использованию, дает альтернативный признак. Обозначая наличие признака 1, а отсутствие — 0 и долю вариантов, обладающих данным признаком, — р, а долю вариантов, не обладающий им, — q

и замечая, что p + q=1, получаем сначала среднюю: Вариационный ряд - определение и вычисление с примерами решения

Вариационный ряд - определение и вычисление с примерами решения, а затем дисперсию альтернативного признака:

Вариационный ряд - определение и вычисление с примерами решения

Следовательно, Вариационный ряд - определение и вычисление с примерами решения

§ 35. Из дисперсии альтернативного признака извлечением корня находится среднее квадратическое отклонение:

Вариационный ряд - определение и вычисление с примерами решения

Пример 37.

Совокупность состоит из 10000 электрических, лампочек, включающих в свой состав 20 бракованных. Найти дисперсию признака и среднее квадратическое отклонение.

Находим долю брака и долю доброкачественных лампочек:
Вариационный ряд - определение и вычисление с примерами решения
По формуле Вариационный ряд - определение и вычисление с примерами решения вычислим дисперсию:

Вариационный ряд - определение и вычисление с примерами решения

а затем среднее квадратическое отклонение:
Вариационный ряд - определение и вычисление с примерами решения

Попытки измерить колеблемость признака путем нахождения средней арифметической из квадратов разностей вариантов во всех возможных их попарных сочетаниях не вносят-ничего принципиально нового.

Можно доказать, что этот показатель Вариационный ряд - определение и вычисление с примерами решения представляет собой дисперсию, умноженную на 2, т. е.

Вариационный ряд - определение и вычисление с примерами решения

Пусть, например, имеются варианты:

1; 3; 5; 6; 10.

Исчислим среднюю и дисперсию:

Вариационный ряд - определение и вычисление с примерами решения

Вычислим абсолютные разности всех возможных попарных сочетаний, включая и сочетания каждого варианта с ним же:

1)    Разности попарных сочетаний с первым вариантом

1 — 1=0; 3—1=2; 5—1=4; 6—1 = 5; 10—1=9.

2)    Разности попарных сочетаний со вторым вариантом

3 — 3 = 0; 3—1 =2; 3 —5 = 2; 3 — 6 = 3; 3—10 = 7

и далее:

5    —5 = 0; 5—1 =4; 5 —3 = 2; 5 —6= 1; 5—10 = 5;

6    — 6 = 0; 6—1 =5; 6 — 3 = 3; 6 — 5= 1; 6—10 = 4;

10 — 10 = 0; 10 — 1 = 9; 10 —3 = 7; 10 —5 = 5; 10 —6 = 4.

Находим сумму квадратов 25 разностей и делением на 25 — среднюю арифметическую из квадратов разностей:Вариационный ряд - определение и вычисление с примерами решения

Замечаем, что этот же результат можно получить умножением дисперсии (Вариационный ряд - определение и вычисление с примерами решения) на 2:

9,2*2=18,4.

Квартили и децили

Как уже было показано, медиана — это вариант, который делит упорядоченный вариационный ряд на две равные по объему группы. В каждой группе аналогично можно найти также вариант, делящий ее на две подгруппы. Такие варианты называются квартилями.

Различают нижний и верхний квартили. Иногда вычисляют и децили, т.е. такие варианты, которые делят вариационный ряд на 10 равных по объему групп.

При отношении объема двух подгрупп, как Вариационный ряд - определение и вычисление с примерами решения к Вариационный ряд - определение и вычисление с примерами решения имеем нижний квартиль Вариационный ряд - определение и вычисление с примерами решения при отношении объемов подгруппВариационный ряд - определение и вычисление с примерами решения к Вариационный ряд - определение и вычисление с примерами решения  верхний квартиль Вариационный ряд - определение и вычисление с примерами решения а при отношениях объемов групп Вариационный ряд - определение и вычисление с примерами решения к Вариационный ряд - определение и вычисление с примерами решения  Вариационный ряд - определение и вычисление с примерами решения к Вариационный ряд - определение и вычисление с примерами решения и т.д. —децили.
Формулы для расчетов в интервальном ряду:

нижнего квартиля

Вариационный ряд - определение и вычисление с примерами решения
верхнего квартиля
Вариационный ряд - определение и вычисление с примерами решения
где Вариационный ряд - определение и вычисление с примерами решения — минимальная граница интервала, содержащего нижний квартиль (определяется по накопленным частотам);

Вариационный ряд - определение и вычисление с примерами решения —то же, для верхнего квартиля;

k — интервальная разность;

 Вариационный ряд - определение и вычисление с примерами решения—накопленная частота интервала, предшествующего интервалу, содержащему нижний квартиль;

Вариационный ряд - определение и вычисление с примерами решения —то же, для верхнего квартиля;

Вариационный ряд - определение и вычисление с примерами решения —частота интервала, содержащего нижний квартиль;

Вариационный ряд - определение и вычисление с примерами решения —то же, для верхнего квартиля.

Вычисление децилей ничем принципиально не отличается от вычисления медианы и квартилей. Так, первый и второй децили могут быть вычислены по формулам:

Вариационный ряд - определение и вычисление с примерами решения

и т.д.

Пример 38.

По данным табл. 7 вычислить нижний и верхний квартили (рекомендуется предварительно вспомнить вычисление медианы).

Используем табл. 9, в которой дана колонка накопленных частот. Нижний квартиль рассчитывается по соответствующей формуле Вариационный ряд - определение и вычисление с примерами решения Из итога колонки 2 табл. 9 видно, что численность совокупности для этого ряда равна 200 единицам. Следовательно, нижний квартиль соответствует 50-й единице. По колонке накопленных частот (3) видим, что нижний квартиль содержится в интервале 49,933—49,938, потому что первая из накопленных частот, превышающих 50, — это накопленная частота данного интервала.

Следовательно:

Вариационный ряд - определение и вычисление с примерами решения
Находим нижний квартиль:

Вариационный ряд - определение и вычисление с примерами решения

Верхний квартиль отвечает 150-й единице и содержится в интервале 49,943-49,948 (так как первая из накопленных частот, превышающая 150, равна 164 и соответствует данному интервалу).

Находим верхний квартиль:

Вариационный ряд - определение и вычисление с примерами решения

Квартиль

В качестве характеристики колеблемости вариационного ряда применяется относительный показатель, подобный коэффициенту вариации, но для вычисления которого используются нижний и верхний квартили и медиана. Этот показатель называют квартилем Вариационный ряд - определение и вычисление с примерами решения без добавления слова нижний или верхний. Он исчисляется по формуле:
Вариационный ряд - определение и вычисление с примерами решения
где Вариационный ряд - определение и вычисление с примерами решения— половина межквартильного расстояния.

Пример 39.

По результатам исчисления медианы, а также нижнего и верхнего квартилей по табл. 7 (см. примеры 27 и 38) найти квартиль.

Имеем:
Вариационный ряд - определение и вычисление с примерами решения
Интересно, что величина коэффициента вариации, по данным табл. 7, довольно близка к полученной величине квартиля:

Вариационный ряд - определение и вычисление с примерами решения

Моменты распределения

Обобщающими характеристиками вариационных рядов являются моменты распределения. Характер распределения может быть определен с помощью небольшого числа моментов. Способ моментов был разработан русским математиком П. Л. Чебышевым и успешно применен А. А. Марковым для рассмотрения возможностей использования закона нормального распределения при изучении сумм: большого, но конечного числа независимых случайных величин.

Средняя из k-x степеней-отклонений вариантов х от некоторой постоянной величины А называется моментом k-гo порядка:

Вариационный ряд - определение и вычисление с примерами решения

При исчислении средней в качестве весов могут быть использованы частоты, частости или вероятности (см. раздел II). При использовании в качестве весов частот или частостей моменты называются эмпирическими, а при использовании вероятностей — теоретическими.

Порядок момента определяется величиной k. Эмпирический момент k-гo порядка находится как отношение суммы произведений k-x степеней отклонений вариантов от постоянной величины А на частоты к сумме частот:

Вариационный ряд - определение и вычисление с примерами решения
В зависимости от выбора постоянной величины А различают следующие моменты:

1) Если постоянная величина А равна нулю (А=0), то моменты называются начальными. Приводим формулу всех начальных моментов:

Вариационный ряд - определение и вычисление с примерами решения

Тогда:

при k = 0 получаем 

Вариационный ряд - определение и вычисление с примерами решения
при k=1

Вариационный ряд - определение и вычисление с примерами решения
при k=2

Вариационный ряд - определение и вычисление с примерами решения
при k = 3

Вариационный ряд - определение и вычисление с примерами решения
при k = 4
Вариационный ряд - определение и вычисление с примерами решения
и т. д. Практически используют моменты первых четырех порядков.

Пример 40.

Вычислить начальные моменты первых четырех порядков, если варианты х имеют как отрицательные, так и положительные значения.

Располагаем все расчеты в таблицу:Вариационный ряд - определение и вычисление с примерами решения

Вычисляем моменты:
Вариационный ряд - определение и вычисление с примерами решения

Вариационный ряд - определение и вычисление с примерами решения
2) Если А не равно нулю, а некоторой произвольной величине Вариационный ряд - определение и вычисление с примерами решения (начало отсчета), то моменты называются начальными относительно Вариационный ряд - определение и вычисление с примерами решения и обозначаются Вариационный ряд - определение и вычисление с примерами решения

Вариационный ряд - определение и вычисление с примерами решения
При подстановке различных значений k получаем начальные моменты относительно Вариационный ряд - определение и вычисление с примерами решения
при k=0

Вариационный ряд - определение и вычисление с примерами решения
при k=1

Вариационный ряд - определение и вычисление с примерами решения
при k=2

Вариационный ряд - определение и вычисление с примерами решения

при k=3

Вариационный ряд - определение и вычисление с примерами решения

при k=4

Вариационный ряд - определение и вычисление с примерами решения

и т.д.

Из формулы момента первого порядка вытекает, что Вариационный ряд - определение и вычисление с примерами решенияВариационный ряд - определение и вычисление с примерами решения т. е. средняя арифметическая равна началу отсчета плюс начальный момент первого порядка относительно начала отсчета. Если отклонения х от Вариационный ряд - определение и вычисление с примерами решения имеют общий множитель С, то на него можно разделить отклонения, а по окончании вычислений полученный момент умножить на этот множитель в соответствующей степени, т. е.Вариационный ряд - определение и вычисление с примерами решения

Отсюда следует, что Вариационный ряд - определение и вычисление с примерами решения

При сравнении с вычислением средней методом отсчета от условного нуля видно, что Вариационный ряд - определение и вычисление с примерами решения (см. стр. 37) и Вариационный ряд - определение и вычисление с примерами решения тождественны. Поэтому вычисление средней методом отсчета от условного нуля иногда называют методом моментов.

Пример 41.

Вычислить начальные моменты относительно Вариационный ряд - определение и вычисление с примерами решения = 20 первых четырех порядков по данным колонок 1 и 2 табл. 35.

Располагаем все расчеты в таблицу:
Таблица 35
Вариационный ряд - определение и вычисление с примерами решения
Возьмем в качестве Вариационный ряд - определение и вычисление с примерами решения вариант, равный 20, вычислим колонку 3, разделим все отклонения от начала отсчета на общий множитель С, равный 2, и получим значения Вариационный ряд - определение и вычисление с примерами решения в колонке 4, для которых начальные моменты вычислены в примере 40.

Для получения Вариационный ряд - определение и вычисление с примерами решения нужно найденные в примере 40 начальные моменты умножить на С, равное 2, в соответствующей степени:
Вариационный ряд - определение и вычисление с примерами решения
Практически при нахождении начальных моментов относительно Вариационный ряд - определение и вычисление с примерами решения поступают следующим образом:

из всех вариантов вычитают начало отсчета и находят отклонения Вариационный ряд - определение и вычисление с примерами решения
делят эти отклонения на общий множитель Вариационный ряд - определение и вычисление с примерами решения
находят начальные моменты для Вариационный ряд - определение и вычисление с примерами решения

путем умножения найденных начальных моментов на Вариационный ряд - определение и вычисление с примерами решения получают начальные моменты относительно Вариационный ряд - определение и вычисление с примерами решения
3) Если за постоянную величину А взять среднюю Вариационный ряд - определение и вычисление с примерами решения то моменты называются центральными и обозначаются Вариационный ряд - определение и вычисление с примерами решения
Вариационный ряд - определение и вычисление с примерами решения
Тогда:

при k = 0
Вариационный ряд - определение и вычисление с примерами решения
центральный момент нулевого порядка равен единице
при k=1
Вариационный ряд - определение и вычисление с примерами решения
центральный момент первого порядка равен нулю
при k = 2
Вариационный ряд - определение и вычисление с примерами решения
центральный момент второго порядка равен дисперсии и служит мерой колеблемости признака

при k = 3
Вариационный ряд - определение и вычисление с примерами решения
центральный момент третьего порядка служит мерой асимметрии распределения признака. Если распределение симметрично, то Вариационный ряд - определение и вычисление с примерами решения
При k = 4
Вариационный ряд - определение и вычисление с примерами решения
центральный момент четвертого порядка

Пример 42.

Вычислим центральные,моменты первых четырех порядков по данным табл. 36 (колонки 1, 2).

Располагаем все расчеты в таблицу (см. табл. 36). Получаем:

Вариационный ряд - определение и вычисление с примерами решения

Вариационный ряд - определение и вычисление с примерами решения
§ 40. Существует связь между начальными моментами первых четырех порядков вариантов Вариационный ряд - определение и вычисление с примерами решения и начальным моментом 4-го порядка вариантов Вариационный ряд - определение и вычисление с примерами решения для случая, когда варианты Вариационный ряд - определение и вычисление с примерами решения меньше вариантов Вариационный ряд - определение и вычисление с примерами решения на единицу:Вариационный ряд - определение и вычисление с примерами решения

где Вариационный ряд - определение и вычисление с примерами решения — четвертый начальный момент вариантов Вариационный ряд - определение и вычисление с примерами решения

В правой части формулы все начальные моменты (от нулевого порядка до четвертого порядка) вариантов Вариационный ряд - определение и вычисление с примерами решения.

Практически данная формула используется для проверки

вычисления начальных моментов первых четырех порядков вариантов Вариационный ряд - определение и вычисление с примерами решения путем вычисления начального момента 4-го порядка новых вариантов Вариационный ряд - определение и вычисление с примерами решения полученных прибавлением к вариантам Вариационный ряд - определение и вычисление с примерами решения единицы.

Если исчисления Вариационный ряд - определение и вычисление с примерами решения непосредственно из данных по формуле

Вариационный ряд - определение и вычисление с примерами решения

и по формуле связи между моментами дают тождественные результаты, то это свидетельствует о правильности всех начальных моментов первых четырех порядков, вычисленных для вариантов Вариационный ряд - определение и вычисление с примерами решения

Пример 43.

Проверим правильность начальных моментов первых четырех порядков, вычисленных в примере 40.

Располагаем все расчеты в таблицу:Вариационный ряд - определение и вычисление с примерами решения

В колонке 3 записываем новые варианты Вариационный ряд - определение и вычисление с примерами решения путем прибавления к старым вариантам Вариационный ряд - определение и вычисление с примерами решения единицы.

Получаем по формуле:

Вариационный ряд - определение и вычисление с примерами решения

Для расчетов Вариационный ряд - определение и вычисление с примерами решения по формуле связи между моментами привлекаем данные из примера 40:

Вариационный ряд - определение и вычисление с примерами решения
Получаем:

Вариационный ряд - определение и вычисление с примерами решения

Результаты совпадают, следовательно, начальные моменты первых четырех порядков в примере 40 вычислены правильно.

Вычисление центральных моментов, привлекаемых в качестве характеристик вариационного ряда, по формуле

Вариационный ряд - определение и вычисление с примерами решения с точки зрения вычислительной техники довольно громоздко. Поэтому сначала вычисляют начальные моменты-относительно Вариационный ряд - определение и вычисление с примерами решения а для нахождения центральных моментов используют формулу перехода от начальных моментов, вычисленных относительно Вариационный ряд - определение и вычисление с примерами решения к центральным:

Вариационный ряд - определение и вычисление с примерами решения

Знаки в формуле чередуются.

Вариационный ряд - определение и вычисление с примерами решения и т. д. обозначают числа сочетаний из: k по 1; k по 2; k по 3 и т. д.

Полагая в этой формуле k равным 0, 1, 2, 3, 4 и т. д., можем получить центральные моменты различных порядков:

Вариационный ряд - определение и вычисление с примерами решения

Для вычисления центральных моментов высших порядков по найденным центральным моментам низших порядков и начальным моментам относительно Вариационный ряд - определение и вычисление с примерами решения подставляем в формулу третьего центрального момента величину Вариационный ряд - определение и вычисление с примерами решения найденную из формулы второго центрального момента:

Вариационный ряд - определение и вычисление с примерами решения

т. е.

Вариационный ряд - определение и вычисление с примерами решения

Пример 44.

Используя данные примера 41, где вычислены начальные моменты относительно Вариационный ряд - определение и вычисление с примерами решения = 20, вычислим центральные моменты первых четырех порядков по соответствующим формулам и сверим полученные результаты с центральными моментами, вычисленными в примере 42.

Из примера 41 имеем:

Вариационный ряд - определение и вычисление с примерами решения

По формулам центральных моментов получаем, используя начальные моменты:

Вариационный ряд - определение и вычисление с примерами решения

Сравнивая центральные моменты первых четырех порядков, вычисленные по указанным формулам, с центральными моментами, вычисленными в примере 42 непосредственно по формуле Вариационный ряд - определение и вычисление с примерами решения убеждаемся в сравнительной простоте исчисления центральных моментов по приведенным в этом параграфе формулам.

Аналогично используются и формулы центральных моментов высших порядков по центральным моментам низших порядков.

Вычислим третий центральный момент по второму центральному моменту и начальным относительно Вариационный ряд - определение и вычисление с примерами решения моментам:

Вариационный ряд - определение и вычисление с примерами решения

Вычислим и четвертый центральный момент по третьему и второму центральным моментам и начальным относительно Вариационный ряд - определение и вычисление с примерами решения моментам:

Вариационный ряд - определение и вычисление с примерами решения

Исчисление центральных моментов сводится к:

  1. нахождению начальных моментов Вариационный ряд - определение и вычисление с примерами решения и их проверке:
  2. нахождению начальных моментов относительно произвольно выбранного начала отсчета Вариационный ряд - определение и вычисление с примерами решения
  3. использованию формул перехода от начальных моментов относительно произвольно выбранного начала отсчета к центральным моментам Вариационный ряд - определение и вычисление с примерами решения

Пример 45.

По данным табл. 38 (колонки 1, 2 и 3) вычислить центральные моменты первых четырех порядков:
Вариационный ряд - определение и вычисление с примерами решения
Начнем с вычисления начальных моментов. Для этого выбираем Вариационный ряд - определение и вычисление с примерами решения = 44,5, находим отклонения вариантов х от Вариационный ряд - определение и вычисление с примерами решенияи делим эти отклонения на общий множитель с=3.

Все действия производим в табл. 38 и получаем колонку Вариационный ряд - определение и вычисление с примерами решения(колонка 4). Далее, произведя расчеты по формуле  Вариационный ряд - определение и вычисление с примерами решения находим начальные моменты. Для этого рассчитываем колонки 5, 6, 7 и 8.

Для простоты расчета числа колонки 5 получают перемножением чисел, расположенных в колонках 2 и 4, числа колонки 6 получают перемножением чисел колонок 4 и 5, числа колонки 7— перемножением чисел колонок 4 и 6 и т. д.
Вариационный ряд - определение и вычисление с примерами решения

Вариационный ряд - определение и вычисление с примерами решения
Проверяем вычисление начальных моментов первых четырех порядков. Для этого вычисляем колонки 9 и 10.

Числа колонки 9 получают прибавлением к числам колонки 4 единицы. Числа колонки 10 (а можно и 8) получают, используя таблицу, имеющую следующий вид:

Вариационный ряд - определение и вычисление с примерами решения
В колонке 1 таблицы указаны частоты (m) от 1 до 50, а в верхнем заголовке — числа х’ или х». Произведения Вариационный ряд - определение и вычисление с примерами решения или Вариационный ряд - определение и вычисление с примерами решения находятся на пересечении соответствующей строки и столбца.

Так, если Вариационный ряд - определение и вычисление с примерами решения

если Вариационный ряд - определение и вычисление с примерами решения

и т. д. (см. приложение VII).

Используя формулу Вариационный ряд - определение и вычисление с примерами решения получаем:

Вариационный ряд - определение и вычисление с примерами решения

Исчисляя Вариационный ряд - определение и вычисление с примерами решения непосредственно по формуле Вариационный ряд - определение и вычисление с примерами решения получаем:

Вариационный ряд - определение и вычисление с примерами решения
Результаты вычисления Вариационный ряд - определение и вычисление с примерами решения по двум формулам совпадают, что свидетельствует о правильности расчета первых четырех начальных моментов.

Находим начальные моменты первых четырех порядков относительно выбранного начала отсчета 44,5 по формулеВариационный ряд - определение и вычисление с примерами решения

Находим центральные моменты, используя формулы перехода от начальных моментов, вычисленных относительно Вариационный ряд - определение и вычисление с примерами решения

Вариационный ряд - определение и вычисление с примерами решения

Вычисление моментов способом сумм

Вычисление моментов при равно отстоящих значениях признака может производиться двумя способами: 1) способом произведений, использованным нами ранее во всех случаях вычислений моментов, и 2) способом сумм, являющимся более упрощенным.

Таблица, в которой производятся все подготовительные расчеты для вычисления начальных четырех моментов, включает в себя колонки х и m и, кроме этого, 4 нумерованные колонки.

Рассмотрим пример вычисления начальных моментов способом сумм по данным табл. 38 (см. табл. 40).

Вся таблица делится на две части чертой, проведенной против частости, соответствующей Вариационный ряд - определение и вычисление с примерами решения В каждой части таблицы суммирование частот производится отдельно. Для верхней части таблицы в колонке 1 идут накопленные частоты начиная сверху, а для нижней части таблицы — начиная снизу. В остальных колонках накопление производится так же и заканчивается на одну клетку раньше, чем в предыдущей колонке.

Для получения Вариационный ряд - определение и вычисление с примерами решения( —) суммируются числа верхней части таблицы, а для Вариационный ряд - определение и вычисление с примерами решения( + ) —нижней части таблицы.

Величины S и D получаются сложением и вычитаниемВариационный ряд - определение и вычисление с примерами решения(—) и Вариационный ряд - определение и вычисление с примерами решения ( + ). Так: S =Вариационный ряд - определение и вычисление с примерами решения(-) + Вариационный ряд - определение и вычисление с примерами решения ( + ), a D =Вариационный ряд - определение и вычисление с примерами решения (—) — Вариационный ряд - определение и вычисление с примерами решения ( + ).

Вариационный ряд - определение и вычисление с примерами решения

Для вычисления начальных моментов по способу сумм используют следующие формулы:

Вариационный ряд - определение и вычисление с примерами решения
Как видим, результаты вычислений по способу сумм совпадают с результатами примера 45.

Нормированные моменты

Второй центральный момент равен дисперсии, т. е. Вариационный ряд - определение и вычисление с примерами решения Если среднее квадратическое отклонение Вариационный ряд - определение и вычисление с примерами решения т. е. корень из дисперсии, иначе говоря, корень из второго центрального момента Вариационный ряд - определение и вычисление с примерами решенияпринять за стандарт, то отношение центрального момента k-гo порядка к стандарту в k-й степени сбудет называться нормированным моментом и обозначаться Вариационный ряд - определение и вычисление с примерами решения

Вариационный ряд - определение и вычисление с примерами решения
Пример 46. По найденным в примере 45 центральным моментам найти нормированные моменты первых четырех порядков.

Из примера 45 имеем:

Вариационный ряд - определение и вычисление с примерами решения

Находим сначала стандарт:

Вариационный ряд - определение и вычисление с примерами решения

а затем нормированные моменты:

Вариационный ряд - определение и вычисление с примерами решения

Использование нормированных моментов

Нормированные моменты используются при изучении вариационных рядов. Третий нормированный момент Вариационный ряд - определение и вычисление с примерами решения называется мерой или. косости вариационного ряда.Знак перед Вариационный ряд - определение и вычисление с примерами решения указывает на направление асимметрии ряда. Если Вариационный ряд - определение и вычисление с примерами решения то вариационный ряд будет с левосторонней скошенностью, а если Вариационный ряд - определение и вычисление с примерами решения — с правосторонней скошенностью. В симметричном ряде Вариационный ряд - определение и вычисление с примерами решения

Четвертый нормированный момент Вариационный ряд - определение и вычисление с примерами решения называется мерой крутости.

Если Вариационный ряд - определение и вычисление с примерами решения то распределение высоковершинное, если Вариационный ряд - определение и вычисление с примерами решения то распределение низковершинное, если Вариационный ряд - определение и вычисление с примерами решения то распределение близко к нормальному (см. раздел IV).

По результатам вычисления нормированных моментов в примере 46 видно, что Вариационный ряд - определение и вычисление с примерами решения отрицателен (—0,81), т. е. распределение с незначительной правосторонней скошенностью, а Вариационный ряд - определение и вычисление с примерами решения больше 3. Это указывает на высоковершинность данного распределения. В целом данное распределение не очень сильно отличается от нормального.

Коэффициент асимметрии

В качестве показателя отклонения вариационного ряда от симметрии применяется простой эмпирический коэффициент асимметрии Вариационный ряд - определение и вычисление с примерами решения представляющий собой отношение разности между средней арифметической и модой к среднему квадратическому отклонению:

Вариационный ряд - определение и вычисление с примерами решения
Если Вариационный ряд - определение и вычисление с примерами решения то скошенность левосторонняя;

если Вариационный ряд - определение и вычисление с примерами решения то скошенность правосторонняя;

если Вариационный ряд - определение и вычисление с примерами решения то вариационный ряд симметричен.

Пример 47.

По данным примера 31 (табл. 27) вычислим коэффициент асимметрии.

Имеем: Вариационный ряд - определение и вычисление с примерами решения

Вычислим моду по формулеВариационный ряд - определение и вычисление с примерами решения

В данном случае асимметрия небольшая и скошенность левосторонняя.

  • Законы распределения случайных величин
  • Дисперсионный анализ
  • Математическая обработка динамических рядов 
  • Корреляция — определение и вычисление
  • Статистическая проверка гипотез
  • Статистические оценки
  • Теория статистической проверки гипотез
  • Линейный регрессионный анализ

Аннотация: Для получения более полной характеристики вариационного ряда помимо средней величины рассчитываются так называемые структурные показатели. К ним относятся мода, медиана, квартили, децили, перцентили, квартильные и децильные коэффициенты.

8.1. Мода

Мода (Мо) — это наиболее часто встречающееся значение признака, или иначе говоря, значение варианты с наибольшей частотой. В дискретных и интервальных рядах моду рассчитывают по-разному.

8.1.1. Определение моды в дискретных вариационных рядах

В дискретных вариационных рядах для определения моды не требуется специальных вычислений: значение признака, которому соответствует наибольшая частота, и будет значением моды.

Пример 8.1. По представленным ниже результатам проведения контрольной работы по статистике определим моду.

Здесь наибольшая частота — 10, она принадлежит варианте со значением 3, значит, Мо = 3. Таким образом, самой распространенной оценкой, полученной студентами за контрольную работу, была «тройка».

8.1.2. Определение моды в интервальных вариационных рядах с равными интервалами

Для определения моды в интервальных вариационных рядах с равными интервалами сначала находят модальный интервал, которым является интервал с наибольшей частотой, а затем ведут расчет по формуле

где хМо — нижняя граница модального интервала;

d — величина интервала;

fMo — частота модального интервала;

fMo — 1 — частота интервала, предшествующего модальному;

fMo + 1 — частота интервала, следующего за модальным.

Пример 8.2. Имеются данные по группе банков.

Таблица
8.1.

Сумма выданных кредитов, млн ден. ед. Количество банков
До 40 8
40-60 15
60-80 21
80-100 12
100-120 9
120-140 7
140 и выше 4
Итого 77

Определим модальный размер выданных кредитов:

  1. модальным является интервал 60-80, так как ему соответствует наибольшая частота (21);
  2. нижняя граница модального интервала xМо = 60; величина интервала d = 20 (80 — 60 = 20);
  3. частота модального интервала fМо = 21; частота интервала, предшествующего модальному, fМо — 1 = 15; частота интервала, следующего за модальным, fМо + 1 = 12.

Подставив в формулу соответствующие величины, получим

Определить модальное значение признака можно и по графику. Для этого в случае дискретных вариационных рядов строится полигон распределения. Напомним, что у него на оси абсцисс помещаются значения признака (варианты), а на оси ординат — соответствующие им частоты. Значение абсциссы, соответствующее наибольшей вершине полигона, будет значением моды.

Пример 8.3. По результатам проведения контрольной работы по статистике, приведенным в примере 8.1, определим моду графическим способом.

Для этого построим полигон распределения и найдем абсциссу его вершины (рис. 8.1).

Определение моды по полигону распределения

Рис.
8.1.
Определение моды по полигону распределения

Если имеется интервальный вариационный ряд с равными интервалами, то для определения моды строится гистограмма, у которой на оси абсцисс находятся значения границ интервалов, а на оси ординат — соответствующие интервалам частоты. На гистограмме модальный интервал будет иметь наибольшую высоту столбца. Затем надо провести линии, соединяющие вершины модального столбца с прилегающими вершинами соседних столбцов. Для нахождения значения моды из точки пересечения проведенных линий на ось абсцисс опускают перпендикуляр. Абсцисса точки пересечения будет значением моды. Продемонстрируем это на примере.

Пример 8.4. По данным о распределении банков по сумме выданных кредитов, приведенным в примере 8.2, определим моду графическим способом (рис. 8.2).

Определение моды по гистограмме распределения

Рис.
8.2.
Определение моды по гистограмме распределения

Вариационный ряд может содержать несколько модальных значений. Чаще всего это происходит, когда в один ряд объединяют разнородные единицы наблюдения, которые желательно разделить на подгруппы и анализировать по отдельности. Вариационный ряд, имеющий одну моду, называется унимодальным, две — бимодальным, три и более — мультимодальным.

Глава. 3 Описательная статистика. Средние величины и

критерии разнообразия вариационного ряда

Введение

Оценить размер признака в совокупности (например, роста детей разного возраста, скорости оседания эритроцитов при разных заболеваниях,

нагрузки врачей разных специальностей и др.) позволяют его обобщающие характеристики, называемые средними величинами.

Для более детального анализа изучаемой совокупности по какому-либо признаку помимо средней величины необходимо также вычислить критерии разнообразия признака, которые позволяют оценить, насколько типична для данной совокупности ее обобщающая характеристика.

Цель изучения темы

Уметь использовать методы вариационной статистики для оценки и анализа статистической совокупности при изучении общественного здоровья и деятельности медицинских организаций.

По окончании изучения данной темы студент должен:

Знать:

основные понятия темы («вариационный ряд», «средняя величина», «среднее арифметическое», «мода», «медиана», «среднеквадратическое отклонение», «коэффициент вариации», «квартиль»);

методику расчета средних величин и критериев разнообразия вариационного ряда ( , СV) и правила их применения;

методику анализа средних величин: значение среднеквадратического отклонения и коэффициента разнообразия для оценки вариабельности изучаемого признака и типичности средней величины;

виды распределения вариационного ряда и их значение для выбора методов статистического анализа.

Уметь:

61

выявлять основные закономерности изучаемого признака путем вычисления средних величин;

правильно выбирать среднюю величину для характеристики центральной тенденции вариационного ряда;

обосновывать методику применения критериев разнообразия вариационного ряда;

давать характеристику разнообразия вариационного ряда;

делать выводы о типичности обобщающей характеристики признака в изучаемой совокупности.

Задания для самостоятельной работы студента

1. Изучить материалы обязательной и рекомендуемой литературы,

данного раздела учебного пособия.

2.Разобрать задачу-эталон.

3.Ответить на контрольные вопросы и тестовые задания в данном учебном пособии.

4.Решить ситуационные задачи.

Блок информации

Для получения представления о размерах изучаемых количественных признаков, чтобы судить об особенностях и закономерностях изучаемых явлений, необходимо узнать их обобщающие характеристики в виде средних величин и критериев разнообразия. Однако сначала имеющиеся данные требуется систематизировать, сделать более доступными для последующих вычислений, т.е. нужно представить полученные данные в виде вариационного ряда.

Вариационный ряд – ряд числовых измерений какого-либо признака,

отличающихся друг от друга по своей величине и расположенных в определенном порядке (возрастания или убывания).

Каждое числовое значение в вариационном ряду называют вариантой

( ). При большой численности наблюдений некоторые варианты

повторяются. В связи с этим в вариационном ряду принято выделять

62

частоты (р). Частота данной варианты – это количество элементов совокупности, имеющих одинаковое числовое значение. Общее число вариант в вариационном ряду обычно обозначают n.

Виды вариационных рядов:

1.В зависимости от вида величины:

дискретный – содержит варианты, представленные только целыми значениями чисел (например: число рецидивов, число детей в семье, число заболеваний у одного больного, число выкуриваемых сигарет, число вызовов бригад скорой помощи;

непрерывный – может содержать любое значение на непрерывной шкале измерения признака (например: масса тела, рост, температура,

биохимические показатели крови).

2.В зависимости от частоты, с которой каждая варианта встречается в вариационном ряду:

простой – это ряд, в котором каждая варианта встречается по одному разу (р=1);

взвешенный (р>1) – ряд, в котором отдельные варианты встречаются неоднократно (с разной частотой).

3.В зависимости от группировки вариант:

несгруппированный – содержащий все значения отдельных вариант;

сгруппированный – представлен интервалами значений вариант и частотой вариант, входящих в каждый из них. Как правило,

сгруппированный вариационный ряд может применяться при большом числе наблюдений.

После того как вариационный ряд построен, приступают к его обработке. Она заключается в нахождении средней величины и параметров разброса.

Средняя величина – это обобщающий показатель статистической совокупности, который погашает индивидуальные различия значений статистических величин, позволяя сравнивать разные совокупности между

63

собой. Она позволяет одним числом дать представление о всей совокупности однородных значений признаков. Средняя величина позволяет описать результаты исследования, дает общую меру изучаемого признака,

показывает то типичное, что характерно для всей совокупности.

В зависимости от характера задачи пользуются тем или иным видом средних величин. К ним принадлежат среднее арифметическое, мода,

медиана, реже используются степенные средние (среднее гармоническое,

среднее геометрическое и т.п.).

Среднее арифметическое (М) представляет собой сумму значений всех вариант, деленное на их общее количество. С его помощью можно получить представление о наиболее общих особенностях всех вариант изучаемой группы, одним числом количественно охарактеризовать качественно однородную совокупность.

Если имеется n объектов, для которых измерена некоторая характеристика, и получены значения 1, 2, …, , среднее арифметическое

(простое) этих n значений определяется как

= 1+ 2+ +

это также может быть записано следующим образом:

=

Если речь идет о значительном числе наблюдений, отдельные значения которых встречаются неоднократно, значения вариант домножают на их частоты (взвешенное среднее арифметическое):

=

∑ р

Взвешенное среднее арифметическое может применяться при расчётах в сгруппированных вариационных рядах, когда ряд разбит на отдельные интервалы и есть данные о частоте каждого из них, но не представлены значения отдельных вариант. В этом случае за варианту принимается середина каждого интервала.

64

Таблица 1

Пример вычисления взвешенного среднего арифметического в

сгруппированном вариационном ряду

Масса тела

Количество

Центральная

обследованных

варианта

обследованных

р

мужчин, кг

(середина

(p)

(интервалы)

интервала v)

66-70,9

11

68,5

753,5

71-75,9

18

73,5

1323

76-80,9

24

78,5

1884

81-85,9

14

83,5

1169

Всего

67

5129,5

=

∑ р

=

5129,5

= 76,6 кг

67

Медиана (Ме) – это значение, делящее вариационный ряд пополам, так что справа и слева от него находится одинаковое количество вариант. В

результате, количество элементов совокупности, имеющих значение признака, меньшее медианы, равно количеству элементов со значением признака, большим медианы.

При нахождении медианы следует различать два случая:

1)объем совокупности нечетный;

2)объем совокупности четный.

Если объем совокупности нечетный, и варианты размещены в порядке

возрастания их значений:

, , … ,

,

,

, … ,

1 2

х

х+1

х+2

2х+1

х значений

х значений

то = х+1. То есть

присутствует

варианта, занимающая в ряду

центральное положение. Ее порядковый номер может быть найден по формуле (n+1)/2, где n – общее число вариант в вариационном ряду

Если же количество элементов четное, то нет варианты, которая бы делила совокупность на две равные по объему части:

65

, , … , ,

, … ,

1 2

х

х+1

х значений

х значений

поэтому в качестве медианы условно берется полусумма вариант,

находящихся в середине вариационного ряда:

= х + х+1. 2

Медиана обладает важными свойствами, которые в некоторых случаях дают ей преимущество перед другими средними величинами. Например, если при упорядоченном размещении некоторого признака «крайние» значения резко отличаются от основной массы данных, то в качестве меры центральной тенденции целесообразно использовать медиану. Это связано с тем, что на ее величину эти «крайние» значения никакого влияния не оказывают, а в то же время они могут существенным образом повлиять на значение среднего арифметического.

Мода (Мо) – это такое значение признака, которое встречается наиболее часто. В случае дискретных рядов вычислить моду нетрудно.

Достаточно найти варианту, которая имеет наибольшую частоту, это и будет мода. Если все значения в вариационном ряде встречаются одинаково часто,

то считают, что этот ряд не имеет моды.

Если два соседних значения вариационного ряда имеют одинаковую частоту и она больше частоты любого другого значения, то считают, что мода равняется среднему арифметическому этих двух значений.

Если два не соседних значения вариационного ряда имеют одинаковую частоту и она больше частоты любого другого значения, то считают, что вариационный ряд имеет две моды.

Пример использования моды в медицинских исследованиях: требуется определить среднюю длительность нетрудоспособности рабочих промышленного предприятия.

Число дней госпитализации

3

4

5

6

7

18

20

25

38

Итого

Число рабочих

3

20

9

7

5

1

1

1

1

48

66

При визуальном анализе графического изображения распределения видно, что значения ряда распределены несимметрично: вершина распределения сдвинута в начало ряда. Если определять среднюю величину на основе среднего арифметического (М), то средняя длительность одной нетрудоспособности составит 5,6 дней. Однако, чаще всего (Мо)

длительность нетрудоспособности составляла 4 дня.

Виды распределений

Чтобы правильного выбрать среднюю величину для наиболее точной характеристики центральной тенденции вариационного ряда и дальнейшего пути статистического анализа, необходимо знать вид распределения изучаемого признака (переменной) в изучаемой совокупности.

Под видом распределения случайной величины понимают соответствие, устанавливаемое между всеми возможными ее числовыми значениями и вероятностями (частотами) их появления в совокупности.

Если выйти на улицу любого города и случайным образом выбранных прохожих спросить о том, какой у них рост, вес, возраст, доход и т.п., а

потом построить график для частот встречаемости любой из этих величин,

то получится функция распределения данной величины. В зависимости от исследуемого признака получаемые графики могут быть различны.

Выделяют несколько видов распределения признака в статистической совокупности. Остановимся на их краткой характеристике:

1)нормальное распределение

2)асимметричное распределение

правостороннее

левостороннее

бимодальное

3)альтернативное распределение

Нормальное (Гауссово, симметричное, колоколообразное)

распределение – одно из самых важных распределений в статистике. Оно характеризуется тем, что наибольшее число наблюдений имеет значение,

67

близкое к среднему, и чем больше значения отличаются от среднего, тем меньше таких наблюдений. Примерами характеристик, подчиняющихся нормальному распределению, являются показатели роста, веса и другие антропометрические параметры взрослых и детей.

Ме = М = Мо

Рисунок 1. Нормальное распределение переменной

На рисунке 1 по оси y обозначены значения, которые принимает признак, по оси х – частота встречаемости значений признака. Чем чаще встречаются данные значения, тем выше кривая. При нормальном распределении наибольшая частота встречаемости приходится на область средних значений признака. Среднее арифметическое, мода и медиана

при нормальном распределении равны и соответствуют вершине

распределения. Обычно для характеристики центральной тенденции в таких случаях принято использовать среднее арифметическое.

Нормальное распределение чаще всего характеризует распределение непрерывных величин и часто встречается в природе, за что и получило название «нормального».

Кривая нормального распределения имеет следующие свойства:

колоколообразна (унимодальна);

симметрична относительно среднего;

сдвигается вправо, если среднее увеличивается, и влево, если среднее уменьшается.

68

Нормальное распределение описывает явления, которые носят вероятностный, случайный характер, а также совместное воздействие на изучаемое явление небольшого числа случайно сочетающихся факторов.

Однако, если какой-либо фактор играет преобладающую роль, то

распределение не будет подчиняться Гауссову закону.

Примером признака с подобным распределением может служить длительность наблюдения пациентов после лечения. На начальных сроках наблюдения пациентов всегда будет больше, а затем их количество уменьшается вследствие потери из наблюдения, смерти и других причин.

Наиболее длительные сроки будет наблюдаться уже гораздо меньшее количество пациентов. Отсюда, кривая распределения данного признака будет ассиметричной, с пиком, смещенным в сторону меньших значений.

При асимметричном распределении данных наиболее полезной мерой центральной тенденции становится медиана. Это связано с тем, что на среднюю арифметическую сильно влияют экстремальные (очень высокие или очень низкие) значения, из-за чего она может стать причиной неверной интерпретации результатов. Медиана же менее подвержена влиянию экстремальных величин (рис. 2).

y

x

Мо Ме М

Рисунок 2. Ассиметричное (правостороннее) распределение переменной

69

Если график распределения имеет правостороннюю асимметрию

(«хвост» вправо), в вариационном ряду преобладают варианты меньших значений, то в этом случае мода размещена левее, а среднее арифметическое

– правее медианы (рис. 2). Обратное расположение имеет место при

левосторонней асимметрии графика. При этом, чем больше асимметричен график, тем больше расстояние между его средними точками. В обоих случаях медиана дает наиболее точную характеристику центральной тенденции вариационного ряда, а среднее арифметическое смещается в сторону «хвоста» распределения и показывает уровень признака, не являющийся типичным в данном вариационном ряду.

Пример: вариационный ряд длительности госпитализации после операции имеет следующий вид – 5,5,5,5,5,5,5,5,6,6,30,80. Среднее арифметическое составляет 13,5 дней, в то время как ни одного больного с таким сроком госпитализации в этом ряду нет. Медиана, равная 5, гораздо точнее характеризует центральную тенденцию признака в данной совокупности.

Бимодальное (двугорбое) распределение наблюдается тогда, когда исследуемый признак анализируется в неоднородной совокупности и,

следовательно, необходимо учитывать два средних значения признака для достоверного анализа.

Пример: при оценке физического развития детей-подростков распределение роста будет иметь два пика (две моды), соответствующие девочкам и мальчикам. Соответственно анализ физического развития следует проводить отдельно для детей каждого пола.

Альтернативное распределение наблюдается в том случае, когда значения исследуемого признака распределяются по принципу: «да/нет», т.е.

взаимоисключают друг друга. Подобное распределение характерно для описания качественных признаков (пример: мужской и женский пол).

Знание характера распределения крайне важно как для правильного представления данных в описательной статистике, так и для правильного

70

выбора методов дальнейшего статистического анализа в соответствии с задачами исследования, которые могут заключаться в сравнении групп между собой по определенным признакам, нахождении взаимосвязей между отдельными признаками, прогнозировании.

Использование средних величин в медицине и здравоохранении:

а) для оценки состояния здоровья – например, параметров физического развития (средний рост, средний вес, средний объем жизненной емкости легких и др.), соматических показателей (средний уровень сахара в крови,

средний пульс, средняя СОЭ и др.);

б) для оценки организации работы медицинских и санитарно-

противоэпидемических организаций а также деятельности отдельных врачей

исредних медицинских работников (средняя длительность пребывания больного на койке, среднее число посещений за 1 час приема в поликлинике

идр.);

Вмедицинских исследованиях из средних величин наиболее часто используется среднее арифметическое. В то же время, значения многих признаков имеют асимметричное распределение ввиду того, что изменяются в сторону увеличения или уменьшения под влиянием тех или иных факторов.

Поэтому для характеристики центральной тенденции их распределения во многих случаях более обоснованным является как раз использование медианы, а не среднего арифметического.

Критерии разнообразия признака в совокупности

Основными критериями разнообразия признака в статистической совокупности являются: лимит, амплитуда, среднее квадратическое отклонение и коэффициент вариации. Необходимость их использования обусловлена тем, что средние величины дают лишь обобщающую характеристику изучаемого признака в совокупности и не учитывают значения отдельных его вариант: минимальное и максимальное значения,

выше среднего, ниже среднего и т.д.

71

Пример. Средние величины двух разных числовых последовательностей: -100; -20; 100; 20 и 0,1; -0,2; 0,1 абсолютно одинаковы и равны О. Однако, диапазоны разброса данных этих последовательностей относительного среднего значения сильно различны.

Определение перечисленных критериев разнообразия признака, прежде всего, осуществляется с учетом его значения у отдельных элементов статистической совокупности.

Показатели измерения вариации признака бывают абсолютные и относительные. К абсолютным показателям вариации относят: размах вариации, лимит, среднее квадратическое отклонение, дисперсию.

Коэффициент вариации относится к относительным показателям вариации.

Лимит (lim) – это критерий, который определяется крайними значениями вариант в вариационном ряду. Другими словами, данный критерий ограничивается минимальной и максимальной величинами признака:

= ÷

Амплитуда (Am), или размах вариации – это разность крайних вариант. Расчет данного критерия осуществляется путем вычитания из максимального значения признака его минимального значения, что позволяет оценить степень разброса вариант:

= −

Недостатком лимита и амплитуды как критериев вариабельности является то, что они полностью зависят от крайних значений признака в вариационном ряду. При этом не учитываются колебания значений признака внутри ряда.

Наиболее полную характеристику разнообразия признака в статистической совокупности дает среднее квадратическое отклонение σ

(сигма), которое является общей мерой отклонения вариант от своей средней величины. Среднее квадратическое отклонение часто называют также

стандартным отклонением.

72

В основе среднего квадратического отклонения лежит сопоставление каждой варианты со среднего арифметического данной совокупности.

Так как в совокупности всегда будут варианты как меньше, так и больше, чем она, то сумма отклонений ( − ), имеющих знак ««, будет погашаться суммой отклонений, имеющих знак «+«, т.е. сумма всех отклонений =1( − ) равна нулю. Для того, чтобы избежать влияния знаков разностей, берут отклонения вариант от среднего арифметического в квадрате, т.е. ( − )2. Сумма квадратов отклонений не равняется нулю.

Чтобы получить коэффициент, способный измерить изменчивость, берут среднее от суммы квадратов – это величина носит название дисперсии:

( − )2

= ∑

=1

По смыслу, дисперсия –

это средний квадрат отклонений

индивидуальных значений признака от его средней величины. Дисперсия квадрат среднего квадратического отклонения 2.

Среднее квадратическое отклонение – квадратный корень из

дисперсии:

( − )2

(

− )2 + (

− )2 + + (

− )2

= √∑

= √

1

2

=1

В том случае, если число элементов совокупности < 30, то при

расчете дисперсии и среднего квадратического отклонения в

знаменателе дроби вместо необходимо ставить ( − ).

Расчет среднего квадратического отклонения можно разбить на шесть

этапов, которые необходимо осуществить в определенной

последовательности:

1.определить среднее арифметическое M имеющейся совокупности

2.рассчитать отклонение каждой варианты от средней величины: =

73

3.каждое отклонение возвести в квадрат: 2

4.посчитать сумму всех di2

5.разделить получившуюся сумму на число элементов совокупности n

6.из полученного результата извлечь квадратный корень

Применение среднеквадратического отклонения:

а) для суждения о степени однородности вариационных рядов и сравнительной оценки типичности (представительности) средних арифметических величин. Это необходимо в дифференциальной диагностике при определении устойчивости признаков.

б) для реконструкции вариационного ряда, т.е. восстановления его частотной характеристики на основе правила «трех сигм». В интервале

(М±3σ) находится 99,7% всех вариант ряда, в интервале (М±2σ) 95,5%

и в интервале (М±1σ) 68,3% вариант ряда (рис. 3).

Рисунок 3. Правило «трех сигм»

в) для выявления «выскакивающих» вариант (вариант, значение которых выходит за границы 3σ от значения среднего арифметического)

г) для определения параметров нормы и патологии с помощью сигмальных оценок

74

д) для расчета коэффициента вариации е) для расчета стандартной ошибки среднего арифметического

величины.

Пример

В педиатрии среднеквадратическое отклонение используется для оценки физического развития детей путем сравнения данных конкретного ребенка с соответствующими стандартными показателями. За стандарт принимаются средние арифметические показатели физического развития здоровых детей. Сравнение показателей со стандартами проводят по специальным таблицам, в которых стандарты приводятся вместе с соответствующими им сигмальными шкалами. Считается, что если показатель физического развития ребенка находится в пределах стандарта

(среднее арифметическое) ±σ, то физическое развитие ребенка (по этому показателю) соответствует норме. Если показатель находится в пределах стандарт ±2σ, то имеется незначительное отклонение от нормы. Если показатель выходит за эти границы, то физическое развитие ребенка резко отличается от нормы (возможна патология).

Для характеристики любой генеральной совокупности, имеющей нормальный тип распределения, достаточно знать два параметра:

среднюю арифметическую и среднее квадратическое отклонение.

Записывается такая характеристика следующим образом.

σ

Кроме показателей вариации, выраженных в абсолютных величинах, в

статистическом исследовании используются показатели вариации,

выраженные в относительных величинах.

Коэффициент вариации это отношение среднего квадратического

отклонения к средней величине признака.

= ∙ 100%

75

Из приведенной формулы видно, что чем больше коэффициент вариации приближен к нулю, тем меньше вариация значений признака. Чем больше CV, тем более изменчив признак.

Коэффициент вариации используется не только для сравнительной оценки вариации, но и для характеристики однородности совокупности.

Совокупность считается однородной, если коэффициент вариации не превышает 33% (для распределений, близких к нормальному).

Полученное значение коэффициента вариации оценивается в соответствии с ориентировочными градациями степени разнообразия признака:

При СV <10 % разнообразие ряда считается слабым, при СV от 10 %

до 20 % – средним, а при СV >20 % – сильным.

Сильное разнообразие ряда свидетельствует о малой представительности (типичности) соответствующей средней величины. Если коэффициент вариации превышает 30%, пользоваться средним арифметическим нецелесообразно.

Использование коэффициента вариации целесообразно в случаях, когда приходится сравнивать признаки разные по своей величине и размерности.

Отличие коэффициента вариации от других критериев разброса наглядно демонстрирует пример:

Таблица 2

Состав работников промышленного предприятия

Среднее

Среднее

Коэффициент

Учетный признак

квадратическое

арифметическое

вариации, %

отклонение σ

Стаж работы (лет)

8,7

2,8

32,1

Возраст (лет)

37,2

4,1

11,0

Образование

9,2

1,1

11,9

(классов)

На основании приведенных в примере статистических характеристик

можно сделать вывод об относительной однородности возрастного состава и

76

образовательного уровня работников предприятия при низкой профессиональной устойчивости обследованного контингента. Нетрудно заметить, что попытка судить об этих социальных тенденциях по среднему квадратическому отклонению привела бы к ошибочному заключению.

Следует помнить, что при распределениях, отличающихся от нормального, правило трех сигм не действует и среднее арифметическое перестает описывать распределение признака.

Медиана и квартили

Для распределений, где критерием середины ряда является медиана,

среднеквадратическое отклонение и дисперсия не могут служить характеристиками рассеяния вариант.

Поэтому для сжатого описания таких распределений, наряду с медианой, используется другой параметр разброса – квартиль (Q),

пригодный для описания порядковых и количественных признаков при любой форме их распределения.

Квартили делят область возможных изменений вариант в вариационном ряду на 4 равных интервала. Нижний квартиль 0,25 отделяет от начала вариационного ряда 25% всех значений. Медиана (квартиль Q0,5) –

это варианта, которая находится в середине вариационного ряда и делит этот ряд пополам, на две равные части. Верхний квартиль 0,75 отделяет от начала вариационного ряда 75% всех вариант. Для расчёта квартилей надо поделить вариационный ряд медианой на две равные части. Если число вариант четное, то просто ряд делим пополам. Если нечетное, то делим ряд на две части, причем медиана входит в каждую часть. Затем необходимо найти медиану для каждой половины. Полученные числа будут являться соответственно верхним и нижним квартилем.

Пример.

Вариационный ряд длительности заболевания в годах:

1, 5, 6, 7, 9, 12, 15, 19, 20

77

Медиана ряда — 9. Число вариант нечетное (9). Таким образом, ряд делим на две половины:

(1, 5, 6, 7, 9) и (9, 12, 15, 19, 20).

Медиана 9 вошла в каждую часть. Далее находим медиану для каждой половины:

(1, 5, 6, 7, 9)

Число вариант нечетное, поэтому медиана этой подвыборки число располагающееся в середине ряда. Соответственно, медиана равна 6. Таким образом, нижний квартиль равен 6.

(9, 12, 15, 19, 20).

Медиана 15. Таким образом, верхний квартиль равен 15. Следовательно, для данного вариационного ряда Ме=9, Q0,25=6, Q0,75=15

В случае асимметричности распределения переменной для ее

характеристики используются медиана и квартили. В этом случае средняя величина отображается как Ме (Q0,25; Q0,75). Такое представление данных дает хорошее представление о центральной тенденции, ширине и асимметрии распределения результатов.

Например, исследуемый признак – «срок, в котором ребенок начал самостоятельно ходить» в исследуемой группе имеет ассиметричное распределение. При этом нижнему квартилю (Q0,25) соответствует срок начала ходьбы – 9,5 месяцев, медиане – 11 месяцев, верхнему квартилю

(Q0,75) – 12 месяцев. Соответственно, характеристика средней тенденции указанного признака будет представлена, как 11 (9,5; 12) месяцев.

Задача-эталон

Условие задачи. В городе N в 2016 году проведено измерение массы тела 7-летних мальчиков (данные представлены в табл. 3). По данным аналогичного исследования, выполненного в городе N в 2006 году, средняя масса тела 7-летних мальчиков составляла 23,8 кг, 3,6 кг.

78

Задание.

1.Вычислить среднюю арифметическую величину (М) и критерии разнообразия вариационного ряда ( , СV).

2.Оценить полученные результаты, сравнить их вариабельность с данными предыдущего исследования, сделать соответствующие выводы.

Таблица 3.

Результаты измерения массы тела 7-летних мальчиков города N в

2016 г.

Середина

Масса

интервала

Число

тела

(централь

мальчиков

Vp

d=(V-M)

d2

d2p

(в кг)

ная

p

V

варианта)

V1

15-18,9

17

16

272

-7

49

784

19 – 22,9

21

27

567

-3

9

243

23

– 26,9

25

32

800

+1

1

32

27

– 30,9

29

16

464

+5

25

400

31

– 34,9

33

9

297

+9

81

729

n = 100

Vp=2400

d2p=2188

Решение задачи

В сгруппированном вариационном ряду центральная варианта рассчитывается как полусумма начальных вариант соседних интервалов;

М = Vp /n = 2400/100 = 24,0 (кг);

= d2p /n = 2188/100 = 4,68 (кг);

CV = ( /М)х100 = (4,68/24,0 х 100)= 19,5 %.

Обратите внимание: ключевой столбец в таблице d=(V-M) именно для него находим общую меру.

Выводы:

1.Средняя масса тела 7-летних мальчиков в г. N составляет 24,0 кг,

2.= 4,68 (кг).

79

3. Величина коэффициента вариации, равная 19,5 % свидетельствует о среднем разнообразии признака (приближающемся к сильному).

Таким образом, можно считать, что полученная средняя величина массы тела является достаточно представительной (типичной). По сравнению с 2006 годом, в 2016 году отмечается более значительная вариабельность массы тела у мальчиков 7 лет ( 4,68 кг против 3,6 кг). Аналогичный вывод вытекает и из сопоставления коэффициентов вариации (CV в 2006 году равен

(3,6 /23,8 х 100 = 15,1 %).

Контрольные вопросы

1.Для чего используется описательная статистика?

2.Что такое вариационный ряд?

3.Для чего используются средние величины?

4.Какие виды средних величин Вам известны?

5.Какие виды распределений Вам известны?

6.По каким критериям можно оценить разнообразие признака?

7.В каких случаях применяют среднеквадратическое отклонение?

8.Как определить медиану и квартили вариационного ряда?

9.Каково назначение коэффициента вариации?

10.Как оценить величину коэффициента вариации?

Тестовые задания

(выберите один вариант ответа)

1.Достоинства средней величины состоят в том, что она

1)позволяет анализировать большое число наблюдений

2)позволяет выявить закономерности при малом числе наблюдений и большом разбросе показателей

3)позволяет с помощью одного числа получить представления о совокупности массовых явлений

4)позволяет с помощью одного числа получить представления о распространенности массовых явлений

80

2.Вариационный ряд – это

1)ряд числовых измерений признака, расположенных в ранговом порядке и характеризующихся определенной частотой

2)ряд цифровых значений различных признаков

3)генеральная совокупность

4)ряд чисел, отражающих частоту (повторяемость) цифровых значений изучаемого признака

3.Среднее арифметическое – это

1)варианта с наибольшей частотой

2)разность между наибольшей и наименьшей величиной

3)обобщающая величина, характеризующая размер варьирующего признака совокупности

4)варианта, находящаяся в середине ряда

4.Медиана – это

1)варианта с наибольшей частотой

2)разность между наибольшей и наименьшей величиной

3)обобщающая величина, характеризующая размер варьирующего признака совокупности

4)варианта, находящаяся в середине ряда

5.Мода – это

1)варианта с наибольшей частотой

2)разность между наибольшей и наименьшей величиной

3)обобщающая величина, характеризующая размер варьирующего признака совокупности

4)варианта, находящаяся в середине ряда

6.Отношение суммы значений всех вариант к общему их количеству – это

1)медиана

2)среднее арифметическое

3)мода

4)среднее квадратическое отклонение

7.Среднее арифметическое применяется в целях

1)обобщения числовых характеристик варьирующего явления при разработке или сводке материала

81

2)обобщения качественных характеристик

3)сравнения и сопоставления явлений

4)разработки нормативов

8.На четыре равные части вариационный ряд разделяют

1)медиана

2)терцили

3)квартили

4)процентили

9.Если два соседних значения вариационного ряда имеют одинаковую частоту, то

1)ряд не имеет моды

2)мода равняется среднему арифметическому этих значений

3)вариационный ряд имеет две моды

4)модой является число, стоящее ближе к середине ряда

10.Если два значения вариационного ряда, не являющиеся соседними, имеют одинаковую частоту, то

1)ряд не имеет моды

2)мода равняется среднему арифметическому этих значений

3)вариационный ряд имеет две моды

4)модой является число, стоящее ближе к середине ряда

11.Разность крайних вариант – это

1)лимит

2)амплитуда

3)среднее квадратическое отклонение

4)коэффициент вариации

12.Отношение среднего квадратического отклонения к средней величине признака – это

1)дисперсия

2)коэффициент вариации

3)коэффициент осцилляции

4)амплитуда

13.Варианта, которая находится в середине вариационного ряда и делит его на две равные части – это

82

1)медиана

2)мода

3)амплитуда

4)лимит

14.Согласно правилу «трех сигм», при нормальном распределении

признака в пределах

M 3

будет находиться

1)68,3% вариант

2)95,5% вариант

3)99,7% вариант

4)50,0% вариант

15.Коэффициент вариации применяется

1)для характеристики нормальности распределения

2)для характеристики однородности совокупности

3)для определения среднего квадратического отклонения

4)для определения необходимого объема выборки

16.Коэффициент вариации выражается

1)в сантиметрах

2)в числе пациентов

3)в числе вариаций

4)в процентах

17.В случае симметричности распределения относительно среднего арифметического для его характеристики используются

1)медиана и процентили

2)лимит и среднее квадратическое отклонение

3)среднее арифметическое и среднего квадратическое отклонение

4)среднее арифметическое и процентили

18.В случае асимметричности распределения относительно среднего арифметического для его характеристики используются

1)медиана и квартили

2)медиана и среднее квадратическое отклонение

3)среднее арифметическое и среднего квадратическое отклонение

4)среднее арифметическое и процентили

83

Варианты для выполнения работы

I. Установление закономерностей, которым подчинены массовые случайные явления, основано на изучении методами теории вероятностей статистических данных — результатов наблюдений.

Почти все встречающиеся в жизни величины (урожайность сельскохозяйственных растений, продуктивности скота, производительность труда и заработная плата рабочих, объем производства продукции и т.д.) принимают неодинаковые значения у различных членов совокупности. Поэтому возникает необходимость в изучении их изменяемости. Это изучение начинается с проведения соответствующих наблюдений, обследований.

В результате наблюдений получают сведения о численной величине изучаемого признака у каждого члена данной совокупности.

Пример. Имеются данные о размере прибыли 100 коммерческих банков. Прибыль, млн. рублей.

30,2 51,9 43,1 58,9 34,1 55,2 47,9 43,7 53,2 34,9
47,8 65,7 37,8 68,6 48,4 67,5 27,3 66,1 52,0 55,6
54,1 26,9 53,6 42,5 59,3 44,8 52,8 42,3 55,9 48,1
44,5 69,8 47,3 35,6 70,1 39,5 70,3 33,7 51,8 56,1
28,4  48,7 41,9 58,1 20,4 56,3 46,5 41,8 59,5 38,1
41,4 70,4 31,4 52,5 45,2 52,3 40,2 60,4 27,6 57,4
29,3 53,8 46,3 40,1 50,3 48,9 35,8 61,7 49,2 45,8
45,3 71,5 35,1 57,8 28,1 57,6 49,6 45,5 36,2 63,2
61,9 25,1 65,1 49,7 62,1 46,1 39,9 62,4 50,1 33,1
33,3 49,8 39,8 45,9 37,3 78,0 64,9 28,8 62,5 58,7

                 
Из данной таблицы видно, что интересующий нас признак (прибыль банков) меняется от одного члена совокупности к другому, варьирует. Варьирование есть изменяемость признака у отдельных членов совокупности.

Вариационным рядом называется последовательность вариант, записанных в возрастающем порядке и соответствующих им частот.

Число, показывающее, сколько раз повторяется в данной совокупности каждое значение признака, называется частотой.

Составим ранжированный вариационный ряд (выпишем варианты в порядке возрастания):

20,4 25,1 26,9 27,3 27,6 28,1 28,4 28,8 29,3 30,2
31,4 33,1 33,3 33,7 34,1 34,9 35,1 35,6 35,8 36,2
37,3 37,8 38,1 39,5 39,8 39,9 40,1 40,2 41,4 41,8
41,9 42,3 42,5 43,1 43,7 44,5 44,8 45,2 45,3 45,5
45,8 45,9 46,1 46,3 46,5 47,3 47,8 47,9 48,1 48,4
48,7 48,9 49,2 49,6 49,7 49,8 50,1 50,3 51,8 51,9
52,0 52,3 52,5 52,8 53,2 53,6 53,8 54,1 55,2 55,6
55,9 56,1 56,3 57,4 57,6 57,8 58,1 58,7 58,9 59,3
59,5 60,4 61,7 61,9 62,1 62,4 62,5 63,2 64,9 65,1
65,7 66,1 67,5 68,6 69,8 70,1 70,3 70,4 71,5 78,0

 В нашем случае каждое значение признака (варианта вариационного ряда) повторилось только один раз, т.е. значение частоты для всех вариант равно единице. Перейдем к интервальному вариационному ряду, так как интересующий нас признак принимает дробные, практически не повторяющиеся значения.

Для этого необходимо определить число интервалов (классов) и длину интервала (классного промежутка), после чего произвести разноску, т.е. подсчитать для каждого интервала число вариант, попавших в него.

Количество классов устанавливают в зависимости от степени точности, с которой ведется обработка, и количества объектов в выборке. Считается удобным при объеме выборки (n) в пределах от 30 до 60 вариант распределять их на 6-7 классов, при n от 60 до 100 вариант — на 7-8 классов, при n от 100 и более вариант — на 9-17 классов.

Нужное количество групп также может быть ориентировочно вычислено по формуле Стерджесса:

    [k=1+3,322lgn]

где k — число групп (классов, интервалов) ряда распределения; n — объем выборки.

Можно также использовать выражение:

    [k=sqrt{n}.]

При nle 70 они дают примерно одинаковые результаты.

В рассматриваемом примере о размере прибыли коммерческих банков, n=100. Применяя формулу Стерджесса, получим:

    [k=1+3,322lg100=1+3,322cdot 2=7,644approx 8.]

Однако sqrt{100}=10. Таким образом, число интервалов может быть равно 8, 9, 10 и т.д.

Нахождение нужного количества групп и их размеров часто бывает взаимообусловлено. Для того, чтобы как-то определиться с числом интервалов, найдем размах вариации — разность между наибольшей и наименьшей вариантой:

    [R=x_{max}-x_{min}]

где R — размах вариации,

x_{max} — наибольшее значение варьирующего признака,

x_{min} — наименьшее значение варьирующего признака.

Найдем размах вариации для рассматриваемой задачи:

    [R=78,0-20,4=57,6]

Для того, чтобы найти длину интервала (величину классового промежутка) необходимо разделить размах вариации на число классов и полученную величину округлить таким образом, чтобы было удобно производить сначала разноску, а затем и различные вычисления. Рекомендую округлять до единиц, до которых округлены варианты в исходной таблице, в нашем случае до десятых.

    [happrox frac{R}{k}]

Согласно формуле получаем

    [happrox frac{57,6}{8}=7,2]

Теперь необходимо определиться с началом первого интервала. Для этого можно использовать формулу:

    [x_1approx x_{min}-frac{h}{2}]

    [x_1approx 20,4-frac{7,2}{2}=16,8.]

Замечание. За начало первого интервала можно принять некоторое значение, несколько меньшее x_{min} или само значение x_{min}. Далее в табличном виде я покажу оба варианта.

Прибавив к началу первого интервала (нижней границе) шаг, получим верхнюю границу первого интервала и одновременно нижнюю границу второго интервала. Выполняя последовательно указанные действия, будем находить границы последующих интервалов до тех пор, пока не будет получено или перекрыто x_{max}.

Таким образом, верхняя граница одного интервала одновременно является нижней границей другого интервала. Чтобы не возникало сомнений, в какой интервал отнести варианту, попавшую на границу, условимся относить ее к верхнему интервалу.

Составим теперь рабочую таблицу для построения интервального вариационного ряда и произведем подсчет частот вариант, попавших в тот или иной интервал.

Как и обещал покажу две таблицы построения ряда:

1. Отсчет ведем от x_{min}, т.е. нижняя граница первого интервала совпадает с x_{min}.

Группы банков по размеру прибыли

(границы интервалов)

Количество банков, принадлежащих данной группе

(частоты, n_i)

Накопленные частоты,

S_i

20,4 — 27,6 4 4
27,6 — 34,8 11 15
34,8 — 42 16 31
42 — 49,2 21 52
49,2 — 56,4 21 73
56,4 — 63,6 15 88
63,6 — 70,8 10 98
70,8 — 78 2 100

2. Начало первого интервала определяем с помощью формулы: x_1approx x_{min}-frac{h}{2}.

Группы банков по размеру прибыли

(границы интервалов)

Количество банков, принадлежащих данной группе

(частоты, n_i)

Накопленные частоты,

S_i

16,8 — 24 1 1
24 — 31,2 9 10
31,2 — 38,4 13 23
38,4 — 45,6 17 40
45,6 — 52,8 23 63
52,8 — 60 18 81
60 — 67,2 11 92
67,2 — 74,4 7 99
74,4 — 81,6 1 100

Как мы видим в 1-м случае у нас получилось восемь интервалов, что полностью совпадает с результатом, который нам дала формула Стерджесса. Во втором случае у нас получилось девять интервалов, так как при поиске начала первого интервала пользовались специальной формулой.

Для дальнейшего исследования я буду пользоваться результатами второй таблицы, так как там ярко выражен модальный интервал (одна мода) и медиана практически точно попадает на середину вариационного ряда.

Мы получили интервальный вариационный ряд — упорядоченную совокупность интервалов варьирования значений случайной величины с соответствующими частотами попаданий в каждый из них значений величины.

II. Графическая интерпретация вариационных рядов.

№ п/п

Границы интервалов,

[x_{i}; x_{i+1})

Середины интервалов,

x_{i}^{*}=frac{x_i+x_{i+1}}{2}

Частоты интервалов,

n_i

Относительные частоты

W_i=frac{n_i}{n}

Плотность относит. частоты

frac{W_i}{h}

Плотность частоты

frac{n_i}{h}

1 16,8 — 24 20,4 1 0,01 0,001 0,139
2 24 — 31,2 27,6 9 0,09 0,013 1,250
3 31,2 — 38,4 34,8 13 0,13 0,018 1,806
4 38,4 — 45,6 42 17 0,17 0,024 2,361
5 45,6 — 52,8 49,2 23 0,23 0,032 3,194
6 52,8 — 60 56,4 18 0,18 0,025 2,500
7 60 — 67,2 63,6 11 0,11 0,015 1,528
8 67,2 — 74,4 70,8 7 0,07 0,010 0,972
9 74,4 — 81,6 78 1 0,01 0,001 0,139
      sum=100 sum=1    

Строим графики:

График гистограммы частот ischanow.com

График гистограммы плотности частот ischanow.com

График гистограммы относительных частот ischanow.com

График гистограммы плотности относительных частот ischanow.com

График полигона частот ischanow.com

Далее найдем моду вариационного ряда:

    [M_o(X)=x_{M_o}+hfrac{(n_2-n_1)}{(n_2-n_1)+(n_2-n_3)}]

где

x_{M_o} — начало модального интервала;

h — длина частичного интервала (шаг);

n_1 — частота предмодального интервала;

n_2 — частота модального интервала;

n_3 — частота послемодального интервала.

Определим модальный интервал — интервал, имеющий наибольшую частоту. Из таблицы видно, что модальным является интервал (45,6 — 52,8).

    [M_o(X)=45,6+7,2frac{(23-17)}{(23-17)+(23-18)}=]

    [=45,6+7,2cdot frac{6}{6+5}=45,6+3,93=49,5]

Медиана

Для интервального ряда медиана находится по формуле:

    [M_e(X)=x_{M_e}+hfrac{0,5n-S_{M_{e}-1}}{n_{M_e}}]

где

x_{M_e} — начало медианного интервала;

h — длина частичного интервала (шаг);

n — объем совокупности;

S_{M_{e}-1} — накопленная частота интервала, предшествующая медианному;

n_{M_e} — частота медианного интервала.

Определим медианный интервал — интервал, в котором впервые накопленная частота превышает половину объема выборки.Так как объем выборки n=100, то n/2=50. По таблице найдем интервал, где впервые накопленные частоты превысят это значение. Таким является интервал (45,6 — 52,8).

Получаем,

    [M_e(X)=45,6+7,2frac{0,5cdot 100-40}{23}approx 48,7.]

III. Расчет сводных характеристик выборки.

Для определения x_B, D_{B}, sigma_{B} составим расчетную таблицу. Для начала определимся с ложным нулем С. В качестве ложного нуля можно принять любую варианту. Максимальная простота вычислений достигается, если выбрать в качестве ложного нуля варианту, которая расположена примерно в середине вариационного ряда (часто такая варианта имеет наибольшую частоту).

Варианте, которая принята в качестве ложного нуля, соответствует условная варианта, равная нулю. В нашем случае С=49,2.

Равноотстоящими называют варианты, которые образуют арифметическую прогрессию с разностью h.

Условными называют варианты, определяемые равенством:

    [U_i=frac{(x_i-C)}{h}]

Произведем расчет условных вариант согласно формуле:

    [U_1=frac{20,4-49,2}{7,2}=-4]

    [U_2=frac{27,6-49,2}{7,2}=-3]

    [U_3=frac{34,8-49,2}{7,2}=-2]

    [U_4=frac{42-49,2}{7,2}=-1]

    [U_5=frac{49,2-49,2}{7,2}=0]

    [U_6=frac{56,4-49,2}{7,2}=1]

    [U_7=frac{63,6-49,2}{7,2}=2]

    [U_8=frac{70,8-49,2}{7,2}=3]

    [U_9=frac{78-49,2}{7,2}=4]

N п/п

Середины интервалов,

x_{i}^{*}

Частоты интервалов,

n_i

Условные варианты,

U_i

Произведения частот и условных вариант,

n_icdot U_i

Произведения частот и условных вариант,

n_icdot U_i^2

Произведения частот и условных вариант,

n_icdot U_i^3

Произведения частот и условных вариант,

n_icdot U_i^4

Произведения частот и условных вариант,  

n_icdot (U_i+1)^2

Произведения частот и условных вариант,

n_icdot(U_i+1)^4

1 20,4 1 -4 -4 16 -64 256 9 81
2 27,6 9 -3 -27 81 -243 729 36 144
3 34,8 13 -2 -26 52 -104 208 13 13
4 42 17 -1 -17 17 -17 17 0 0
5 49,2 23 0 0 0 0 0 23 23
6 56,4 18 1 18 18 18 18 72 288
7 63,6 11 2 22 44 88 176 99 891
8 70,8 7 3 21 63 189 567 112 1792
9 78 1 4 4 16 64 256 25 625
    sum=100   sum n_iU_i=-9 sum n_iU_i^2=307 sum n_icdot U_i^3=-69 sum n_icdot U_i^4=2227 sum n_icdot (U_i+1)^2=389 sum n_icdot(U_i+1)^4=3857

    
Контроль:

    [sum n_i U_i^2 + 2sum n_iU_i+n=sum n_i{(U_i+1)}^2]

    [sum n_i U_i^2 + 2sum n_iU_i+n=307+2cdot (-9)+100=389]

    [sum n_i{(U_i+1)}^2=389]

Контроль:

    [sum n_i U_i^4 + 4sum n_iU_i^3+6sum n_iU_i^2+4sum n_iU_i+n=sum n_i{(U_i+1)}^4]

    [sum n_i U_i^4 + 4sum n_iU_i^3+6sum n_iU_i^2+4sum n_iU_i+n=]

    [=2227+4cdot (-69)+6 cdot 307+4cdot (-9)+100=3857]

    [sum n_i{(U_i+1)}^4=3857]

Равенство выполнено, следовательно вычисления произведены верно.

Вычислим условные моменты 1-го, 2-го, 3-го и 4-го порядков:

    [M_1^{*}=frac{sum n_iU_i}{n}=frac{-9}{100}=-0,09;]

    [M_2^{*}=frac{sum n_iU_i^2}{n}=frac{307}{100}=3,07;]

    [M_3^{*}=frac{sum n_iU_i^3}{n}=frac{-69}{100}=-0,69;]

    [M_4^{*}=frac{sum n_iU_i^4}{n}=frac{2227}{100}=22,27.]

Найдем выборочные среднюю, дисперсию и среднее квадратическое отклонение :

    [x_{B}=M_1^{*}cdot h+C=-0,09cdot 7,2+49,2=48,552;]

    [D_{B}=(M_2^{*}-{(M_1^{*})}^2)h^2=(3,07-{(-0,09)}^2){7,2}^2approx 158,73.]

    [sigma_{B}=sqrt{D_B}=sqrt{158,73}=12,6.]

Также для оценки отклонения эмпирического распределения от нормального используют такие характеристики, как асимметрия и эксцесс.

Асимметрией теоретического распределения называют отношение центрального момента третьего порядка к кубу среднего квадратического отклонения:

    [a_s=frac{m_3}{sigma_B^3}]

Асимметрия положительна, если «длинная часть» кривой распределения расположена справа от математического ожидания; асимметрия отрицательна, если «длинная часть» кривой расположена слева от математического ожидания. Практически определяют знак асимметрии по расположению кривой распределения относительно моды (точки максимума дифференциальной функции): если «длинная часть» кривой расположена правее моды, то асимметрия положительна, если слева — отрицательна.

Эксцесс эмпирического распределения определяется равенством:

    [e_k=frac{m_4}{sigma_B^4}-3]

где m_4 — центральный эмпирический момент четвертого порядка.

Для нормального распределения эксцесс равен нулю. Поэтому если эксцесс некоторого распределения отличен от нуля, то кривая этого распределения отличается от нормальной кривой: если эксцесс положительный, то кривая имеет более высокую и «острую» вершину, чем нормальная кривая; если эксцесс отрицательный, то сравниваемая кривая имеет более низкую и «плоскую» вершину, чем нормальная кривая. При этом предполагается, что нормальное и теоретическое распределения имеют одинаковые математические ожидания и дисперсии.

Вычисляем центральные эмпирические моменты третьего и четвертого порядков:

    [m_3=(M_3^*-3M_1^*M_2^*+2{(M_1^*)}^3)cdot h^3=51,3;]

    [m_4=(M_4^*-4M_3^*M_1^*+6M_2^*{(M_1^*)}^2-3{(M_1^*)}^4)cdot h^4=59580,97;]

Найдем асимметрию и эксцесс:

    [a_s=frac{51,3}{{12,6}^3}=0,026]

    [e_k=frac{59580,97}{{12,6}^4}-3=-0,635]

IV. Проверка гипотезы о нормальном распределении генеральной совокупности. Критерий согласия Пирсона.

Проверим генеральную совокупность значений размера прибыли банков по критерию Пирсона chi^2

Правило. Для того, чтобы при заданном уровне значимости проверить нулевую гипотезу H_o: генеральная совокупность распределена нормально, надо сначала вычислить теоретические частоты, а затем наблюдаемое значение критерия:

    [chi^2_{nabl}=sum frac{ {(n_i-n_i^{'})}^2}{n_i^{'}}]

и по таблице критических точек распределения chi^2, по заданному уровню значимости alpha и числу степеней свободы k=s-3 найти критическую точку chi^2_{kp}(alpha;k), где s — количество интервалов.

Если chi^2_{nabl}<chi^2_{kp} — нет оснований отвергнуть нулевую гипотезу.

Если chi^2_{nabl}>chi^2_{kp} — нулевую гипотезу отвергают.

Найдем теоретические частоты n_i^', для этого составим следующую таблицу.

Середины интервалов,

x_{i}^{*}

Частоты интервалов,

n_i

Произведем расчет,

x_{i}^{*}-x_B

Произведем расчет,

V_i=frac{(x_{i}^{*}-x_B)}{sigma_B}

Значения функции Гаусса,

varphi(V_i)

Произведем расчет,

frac{nh}{sigma_B}

Теоретические частоты,

n_i^{'}=57 cdotvarphi(V_i)

20,4 1 -28,152 -2,23 0,0332 57 2
27,6 9 -20,952 -1,66 0,1006 57 6
34,8 13 -13,752 -1,09 0,2203 57 13
42 17 -6,552 -0,52 0,3485 57 20
49,2 23 0,648 0,05 0,3984 57 23
56,4 18 7,848 0,62 0,3292 57 19
63,6 11 15,048 1,19 0,1965 57 11
70,8 7 22,248 1,77 0,0833 57 5
78 1 29,448 2,34 0,0258 57 1
  n=100         sum n_i^{'}=100

   
Вычислим chi^2_{nabl}, для чего составим расчетную таблицу.

N^0 n_i n_i^{'} n_i-n_i^{'} {(n_i-n_i^{'})}^2 frac{{(n_i-n_i^{'})}^2}{n_i^'} n_i^2 frac{n_i^2}{n_i^{'}}
1 1 2 -1 0,5 1 0,5
2 9 6 3 9 1,5 81 13,5
3 13 13 0 0 0 169 13
4 17 20 -3 9 0,45 289 14,45
5 23 23 0 0 0 529 23
6 18 19 -1 1 0,05 324 17,05
7 11 11 0 0 0 121 11
8 7 5 2 4 0,8 49 9,8
9 1 1 0 0 0 1 1
sum 100 100    

Наблюдаемое значение критерия,

chi^2_{nabl}=3,30

  103,30

Контроль:

    [sumfrac{n_i^2}{n_i^{'}}-n=sum frac{{(n_i-n_i^{'})}^2}{n_i^'}]

    [sumfrac{n_i^2}{n_i'}-n=103,3-100=3,3]

    [sum frac{{(n_i-n_i')}^2}{n_i'}=3,3]

Вычисления произведены правильно.

Найдем число степеней свободы, учитывая, что число групп выборки (число различных вариант) s=9;

    [k=s-3=9-3=6.]

По таблице критических точек распределения chi^2 по уровню значимости alpha = 0,025 и числу степеней свободы k=6 находим chi^2_{kp}(0,025;6)=14,4.

Так как chi^2_{nabl}<chi^2_{kp} — нет оснований отвергнуть нулевую гипотезу. Другими словами, расхождение эмпирических и теоретических частот незначительное. Следовательно, данные наблюдений согласуются с гипотезой о нормальном распределении генеральной совокупности.

На рисунке построены нормальная (теоретическая) кривая по теоретическим частотам (зеленый график) и полигон наблюдаемых частот (коричневый график). Сравнение графиков наглядно показывает, что построенная теоретическая кривая удовлетворительно отражает данные наблюдений.

График нормальной кривой и полигон наблюдаемых частот

V. Интервальные оценки.

Интервальной называют оценку, которая определяется двумя числами — концами интервала, покрывающего оцениваемый параметр.

Доверительным называют интервал, который с заданной надежностью gamma покрывает заданный параметр.

Интервальной оценкой (с надежностью gamma) математического ожидания (а) нормально распределенного количественного признака Х по выборочной средней x_B при известном среднем квадратическом отклонении sigma генеральной совокупности служит доверительный интервал

    [x_B-frac{tsigma}{sqrt{n}}<a<x_B+frac{tsigma}{sqrt{n}},]

где frac{tsigma}{sqrt{n}}=delta — точность оценки, n — объем выборки, t — значение аргумента функции Лапласа phi (t) (см. приложение 2), при котором phi(t)=frac{gamma}{2};

при неизвестном среднем квадратическом отклонении sigma (и объеме выборки n<30)

    [x_B-frac{t_{gamma}cdot S}{sqrt{n}}<a<x_B+frac{t_{gamma}cdot S}{sqrt{n}},]

    [S=sqrt{frac{n}{n-1}D_B}]

где S — исправленное выборочное среднее квадратическое отклонение, t_{gamma} находят по таблице приложения по заданным n и gamma.

В нашем примере среднее квадратическое отклонение известно, sigma_B=12,6. А также x_B=48,55, n=100, gamma=0,95. Поэтому для поиска доверительного интервала используем первую формулу:

    [x_B-frac{tsigma}{sqrt{n}}<a<x_B+frac{tsigma}{sqrt{n}}]

Все величины, кроме t, известны. Найдем t из соотношения phi(t)=frac{0,95}{2}=0,475. По таблице приложения находим t=1,96. Подставив t=1,96, sigma_B=12,6, x_B=48,55, n=100 в формулу, окончательно получим искомый доверительный интервал:

    [48,55-frac{1,96cdot 12,6}{10}<a<48,55+frac{1,96cdot 12,6}{10}]

    [48,55-2,47<a<48,55+2,47]

    [46,08<a<51,02]

Интервальной оценкой (с надежностью gamma) среднего квадратического отклонения sigma нормально распределенного количественного признака Х по «исправленному» выборочному среднему квадратическому отклонению S служит доверительный интервал

S(1-q)<sigma<S(1+q),    (при q<1), (*)

0<sigma<S(1+q),      (при q>1),

где q — находят по таблице приложения по заданным n и gamma.

По данным gamma=0,95 и n=100 по таблице приложения 4 найдем q=0,143. Так как q<1, то, подставив S=sqrt{frac{n}{n-1}D_B}=sqrt{frac{100}{99}cdot 158,73}approx 12,66, quad quad q=0,143 в соотношение (*), получим доверительный интервал:

    [12,66(1-0,143)<sigma<12,66(1+0,143)]

    [10,85<sigma<14,47]

Разделы:

Математика

Класс:

9


В школьный курс математики включена новая
содержательная линия – элементы статистики,
комбинаторики и теории вероятностей. Включение в
курс алгебры элементарных сведений из
статистики имеет важное общеобразовательное
значение, так как без этих знаний невозможно
разобраться в разнообразной информации.
Простейшие методы обработки и анализа
статистических данных являются главной целью
урока по теме “Варианты и их кратности”.

Использование информационных технологий на
данном уроке позволило отразить поэтапность
проведения урока, сконцентрировать внимание на
основных моментах и объективно оценить знания
учащихся за более короткий срок.

Цель:

  1. Ввести понятие варианта, показать примеры
    обработки статистических данных, используя
    введенные понятия.
  2. Закрепить навыки решения комбинаторных задач
    простейшего типа;
  3. Повторить понятия и определения комбинаторики.

Девиз урока:

Не нужно нам владеть клинком.
Не ищем славы громкой
Тот побеждает, кто знаком
С искусством мыслить, тонким.

1. Оргмомент.

Сегодня по всей стране проходит “День
здоровья”, поэтому на уроке нам предстоит
выяснить насколько мы выносливы.

2. Разминка.


  1. Исход эксперимента или наблюдения которого при
    реализации данного комплекса условий может
    произойти, а может и не произойти? (случайное
    событие)
  2. Событие, которое при реализации данного
    комплекса условий непременно произойдет?
    (достоверное событие)
  3. Событие, которое заведомо не может произойти
    при реализации данного комплекса условий.
    (невозможное)
  4. Размещения, отличающиеся друг от друга только
    порядком расположения элементов. (перестановки)
  5. Выборки, составляемые из элементов, не
    отличающиеся по своему объему, но отличающиеся
    по составу хотя бы одним элементом. (сочетания с
    повторениями)

3. Проверка домашнего задания.

А) 1 ряд “Ловкачи”: выполняет тест по
вариантам, затем взаимопроверка по готовым
ответам.

Б) 3 ряда “Прыжки в длину”: 2 человека с
работают у доски с домашними задачами,

2 человека работают по карточкам. (задачи), 1
человек на интердоске выполняет задание

Сколькими способами в игре
“Спортлото” можно выбрать шесть номеров из 49?

649=
(49!)/6! (49 – 6)!) = (49!) / (6!43!) = (49 • 48 • 47 • 46 • 45 • 44) / (1 •
2 • 3 • 4 • 5 • 6) = 13 983 816) – сочетания без
повторений

У Робина – Бобина Барабека 40
соседей. Он решил пригласить двоих из них на обед.
Сколько у него способов это сделать

240
= (40!) / (2! (40 – 2) ! ) = (40!) / (2!38!) = (40 • 3) / (1 • 2) = 780) –
сочетания без повторений

В) 2 ряд соревнуются в эстафете 1 вариант и 2
вариант.
(Выбрать капитанов)

1 этап эстафеты: “Бег с препятствиями”

Какие из следующих событий
достоверные:

А – “два попадания при трёх
выстрелах”,

В – “появление не более 18 очков при бросании
трёх игральных костей”,

С – “наугад выбранное трёхзначное число не
больше 1000”,

Д – “наугад выбранное число, составленное из
цифр 1, 2, 3 без повторений, меньше 400”?

(В, С и Д)

Какие из следующих событий
невозможные:

А – “опаздывание ленинградского
экспресса в субботние дни”,

В – “появление 17 очков при бросании 3 игральных
костей”,

С – “появление слова “мама” при случайном
наборе букв а, а, м, м”,

Д – “появление составленного из цифр 1, 2, 3, 7, 8 и
кратного 9 числа при случайном однократном
наборе цифр”

(Д)

2 этап эстафеты: “Состязание капитанов”

О каком событии идёт речь?

1) Измерены длины сторон
треугольника. Оказалось, что длина каждой
стороны меньше суммы длин двух других сторон. (Достоверное
событие)

2) В полночь выпадет снег, а через 24 часа
будет светить солнце (невозможное, т.к. ч/з 24 часа
будет ночь)

1) Произведено три выстрела по
мишени. Произошло пять попаданий. (Невозможное
событие)

2) Завтра будет контрольная по
математике (Случайное, если тема закончилась)

3 этап эстафеты: “Кто быстрее?” (Решить
задачи.)

1) В урне 15 белых и 25 чёрных
шаров. Из урны наугад вынимается один шар. Какова
вероятность того, что он будет белым?

(15/40 = 3/8 = 0,
375)

2) Из слова СОБЫТИЕ случайным образом
выбирается одна буква. Какова вероятность того,
что она окажется гласной?

(4/7 = 0, 571)

3) Одновременно бросают 3 монеты. Сколько
равновозможных исходов у этого эксперимента?

(8)

1) Из русского алфавита
случайным образом выбирается одна буква. Какова
вероятность того, что она окажется гласной?

(10/ 33
= 0, 303)

2) Абонент забыл последнюю цифру телефонного
номера и набрал её на удачу, помня только, что эта
цифра нечётная. Найти вероятность того, что номер
набран правильно.

(5/10 = 1/2 = 0, 5)

3) Одновременно бросают 3 монеты. С какой
вероятностью все монеты выпадут на одну сторону?

(2/8 = 1/4 = 0, 25)

Если выполнили задание 1 ряд, то дополнительно
решить задачи

(Решить задачу.)

Имеется шесть перчаток
различных размеров. Сколькими способами можно
выбрать из них одну перчатку на левую руку и одну
на правую руку так, чтобы эти перчатки были
различных размеров?

(Решается по правилу
произведения 6 • 5 = 30 способов)

Гера, Афина и Афродит попросили
Париса не только назвать самую красивую из них,
но и указать, кто на “втором и третьем месте”.
Сколько есть вариантов ответа?

(Решается по
правилу произведения 3 • 2 • 1 = 6 способов)

4. Подведение итогов, выставление оценок.

5. Изучение нового материала.

Как только человеку в его деятельности
потребовались количественные характеристики, то
есть числа, тут же появилась статистика.

“Статистика знает все”, утверждал Ильф и
Петров в романе “двенадцать стульев”.

Для изучения, обработки и анализа
количественных данных различных массовых
социально-экономических процессов и явлений
проводят статистические исследования.

“Независимо от того, в какой отрасли знания
получены числовые данные, они обладают
определенными свойствами, для выявления которых
может потребоваться особого рода научный метод
обработки. Последний известен как
статистический метод или, короче, статистика.”

Дж.Юз. М. Кендалл. “Теория статистики”.

Каждое статистическое исследование состоит из
сбора и обработки информации. На основе
полученных данных проводятся выработка
различных прогнозов, оценка их достоверности.
Важной задачей, без которой статистические
данные теряют всякий смысл, является обработка
полученных данных.

Предложить учащимся выполнить задание №1.

№1. Посчитайте длины слов (количество букв) в
приведенном ниже отрывке.

Если хочешь быть здоров, закаляйся 4, 6, 4, 6, 9.

Позабудь про докторов 8, 3, 8.

Водой холодной умывайся. 5, 8, 8.

После его выполнения учащимся задаются
вопросы:

– Что вы сейчас делали? (собирали информацию)

– Какие выводы можно сделать? (можно вычислить
самое длинное слово, самую длинную строку, самую
распространенную букву и т. д.)

Займемся статистическим методами обработки
информации. Для этого нужны новые термины,
принятые в статистике.

Учащимся предлагается раздаточный материал.

1) Все понятно 2) Почти понятно 3) Ничего не понятно

Новый термин

Простое описание

Более научный
термин

Определение

Общий ряд данных То, откуда выбирают Генеральная
совокупность
Множество всех в
принципе возможных данных измерения
Выборка То, что выбрали Статистическая выборка,
статистический ряд
Множество данных, реально
полученных в данном измерении.
Варианта Значение одного из
результатов измерения
Варианта Одно из значений
элементов выборки
Ряд данных Значение всех результатов
измерения, перечисленных по порядку
Вариационный ряд Упорядоченное множество всех
вариант
Кратность варианты     Это сколько раз
каждая варианта из ряда данных наблюдается в
выборке.

Объем выборки

Если сложить все кратности   Количество всех произведенных
при выборке измерений
Частота варианты     Отношение кратности
варианты к объему выборки

№2.

30 абитуриентов на четырех
вступительных экзаменах набрали в сумме такое
количество баллов (оценки на экзаменах
выставлялись по 5 бальной системе):

20; 19; 12; 13; 16; 17; 15; 14; 16; 20; 15; 19; 20; 20;15; 13; 19; 14;
18; 17; 12; 14; 12; 17; 18; 17; 20; 17; 16; 17.

Составить общий ряд данных выборки.
Выборку из результатов, стоящих на четных местах
и соответствующий ряд данных.

Решение:

После получения 2 дальнейшие экзамены не
сдаются, поэтому сумма баллов не может быть
меньше 12(12 – это 4”тройки”)

Общий ряд данных – все реальные данные
измерения, выписанные в определенном порядке без
повторений. Значит, общий ряд данных состоит из
чисел.

Общий ряд данных: 12; 13; 14; 15; 16; 17; 18; 19; 20.

Выборка из результатов, стоящих на
четных местах состоит из 15 результатов; 19; 13; 17; 14;
20; 19; 20; 13; 14; 17; 14; 17; 17; 17; 17.

Ряд данных – это конечная возрастающая
последовательность: 13; 14; 17; 19; 20.

Перейдём к дальнейшей обработке информации.

Составим таблицу из двух строк. В первой из
которых будет ряд данных.

Каждая варианта из этого ряда какое – то
количество раз наблюдалось в выборке. Это
количество называется кратностью варианты.

Кратность варианты – это сколько
раз каждая варианта из ряда данных наблюдается в
выборке.

Вот и поставим во вторую строку
кратности соответствующих вариант.

Получим таблицу распределения
выборки. Вот как она выглядит.

Варианта 13 14 17 19 20 Всего 5 вариант
Кратность варианты 2 3 6 2 2 Сумма = 15 (объем выборки)

Если сложить все кратности, то
получится количество всех произведенных при
выборке измерений – объем выборки.


В данном случае объем выборки равен 15.

Далее, при общей оценке данных выборки
не очень важно, что, например, варианта 14 имеет
кратность 3 из общего объема в 15 данных. Удобнее
сказать, что эта варианта составляет или 20% числа
всех измерений. Так и поступают, т.е. делят
кратности вариант на объем выборки и получаем частоты
вариант
.

Частотность варианты = КРАТНОСТЬ И
ВАРИАНТЫ

Частоты всех вариант удобно приписывать
третьей строкой уже составленной таблице. Новую
трехстрочную таблицу называют таблицей
распределения частот выборки.

Таблица распределения частот выборки:

Варианта 13 14 17 19 20 Всего: 5 вариант
Кратность варианты 2 3 6 2 2 Сумма = 15 (объем выборки)
Частота варианты           Сумма = 1
  13,33% 20% 40% 13,33% 13,33%  

Обратите внимание, что сумма частот равна 1, и
так бывает всегда.

Иногда частоты удобно измерять в
процентах от общего объема выборки. Тогда
таблицу распределения дополняют еще частотой
частот в процентах. Она получается из предыдущей
строки умножением на 100%.

6. Закрепление

Решить задачу.

№1

После группировки данных эксперимента
получилась такая таблица их распределения:

Варианта -3 0 4 5 9 11 12 15 20
Кратность варианты 12 9 1 64 34 56 7 8 9

а) Определите объем выборки.

б) Найдите наиболее часто встретившуюся
варианту.

в) Допишите к таблице третью и четвертую строки
из частот и процентных частот вариант.

г) Найдите сумму чисел в третьей и четвертой
строках.

Решение:

Варианта

-3

0

4

5

9

11

12

15

20

Всего 9 вариант
Кратность варианты

12

9

1

64

34

56

7

8

9

200

Частота варианты

Сумма 1

Частота варианты в %

6

4,5

0,5

32

17

28

3,5

4

4,5

100

а) Объем выборки 200; б) 5.

Работа в парах.

Задача № 2

1 ряд. Для выборочной переписи
населения в 20 квартирах были получены следующие
сведения о годах рождения их жильцов (первые две
цифры 1 и 9 не пишутся):

30

56

98

77

93

31

61

80

87

52

56

32

87

73

93

81

57

52

61

89

90

92

85

87

70

61

93

87

52

53

40

56

48

51

61

87

88

90

52

60

22

34

48

52

88

87

91

62

63

87

39

40

52

87

99

91

87

65

61

55

а) Составьте ряд данных.

б) Найдите кратность и частоту вариант 61 и 87.

в) Составьте таблицу кратностей, разбив данные
на интервалы по годам:

№1-от 22 до 30; №2 –от 31 до40;

№3-от 41 до 50; № 4 –от 51 до 60;

№5-от 61 до 70; № 6 – от 71 до 80;

№7 – от 81 до 90; №8 -от 91 до 99.
Решение:


а) 30, 31, 32, 34, 40, 48, 51, 52, 53, 55, 56, 57, 60, 61, 62, 63, 65, 70, 73, 77, 80,
81, 85, 87, 88, 90, 91, 92, 93, 98, 99.

б)

Варианта

61

87

Кратность варианты

5

9

Частота варианты

в)

Варианта 22– 30 31-40 41 -50 51-60 61-70 71-80 81-90 91-99  
Кратность варианты

2

6

2

14

9

3

16

8

Сумма 60

Частота варианты                 1
Частота варианты в % 3,3% 10% 3,3% 23,3% 15% 5% 26.6 % 13,3% 100%

Самостоятельно определить частоту варианты и
частоту варианты в %

3 ряд. Предлагает задачу Морева С.

Проводя исследование
“Использование статистических методов при
изучении отношения школьников к математике.”

С этой целью был составлен тест,
содержащий 9 заданий. Работу выполняли учащиеся 9
А класса (23 человек). При проверке каждой работы
учитель математики отмечала число верно
выполненных заданий. Я приняла участие в анализе
данных по ее просьбе.

В результате был составлен такой ряд
чисел:

6, 5, 5, 7, 9, 6, 8, 7, 9, 8, 6, 7, 5, 7, 6, 4, 5, 8, 6, 7, 9, 9, 6.

а) Составьте ряд данных.

б) Найдите кратность и частоту вариант 5 и 9.

в) Составьте таблицу кратностей;

г) найдите частоту варианты и частоту варианты
в процентах.

Для того чтобы удобно было
анализировать полученные данные, упорядочим
этот ряд:

4

5, 5, 5, 5

6, 6, 6, 6, 6, 6

7, 7, 7, 7, 7

8, 8, 8

9, 9, 9, 9.

Представим полученные данные в виде
таблицы, в которой для каждого числа верно
выполненных заданий, записанного в верхней
строке, укажем в нижней строке количество
появлений этого ила в ряду, т.е. частоту:

Число верно
выполненных заданий

4

5

6

7

8

9

Кратность варианты

1

4

6

5

3

4

Частота варианты

Частота варианты в %

4,3

17,4

26,1

21,7

13,1

17,4

В рассмотренном примере сумма частот
равна общему числу проверяемых работ, т.е. 23.

2 ряду предлагает задачу Ланцова
Татьяна

“Подтверждение статистических характеристик
на примере 7А класса МСОШ №1”

Мне стало интересно, какой средний
рост моих одноклассников. Я провела среди них
опрос, и в результате моего исследования
выяснилось следующее:

143, 157, 165,148, 168,161,159, 157, 164, 167,153, 170,159,158,167,166, 168,168, 173,
169,169,170, 168,

а) Составьте ряд данных.

б) Найдите кратность и частоту вариант 171 и 167.

в) Составьте таблицу кратностей, разбив данные
на интервалы по росту:

№1-от 143 до 149; №2 –от 150 до 155; №3-от 156 до 160; № 4
–от 161 до 165;

№5-от 166 до 170, №6 – от 171 до 175.

Рост, см

Частота,
чел.

Середина
интервала, см

143-149

2

144,5

150-155

1

153,5

156-160

5

157,5

161-165

3

163,5

166-170

11

167,5

171-175

1

173,5

7. Домашнее задание:

Решить задачи: № 1; 2.

Задача № 1

В вашем классе соберите данные о месяцах
рождения учеников. Месяца удобнее перечислять по
порядковому номеру.

а) Выпишите ряд данных полученной вами выборки;
б) составьте таблицу распределения из четырех
строк: варианты, кратности, частоты, частоты в
процентах;
в) укажите наиболее и наименее часто
встретившуюся варианту.

Задача № 2

Выборка состоит из всех букв, входящих в
двустишье

“… Это дерево – сосна,
И судьба сосны ясна…”

а) выпишите ряд данных выборки;
б) найдите объем выборки;
в) определите кратность и частоту варианты “о”;
г) какова “наибольшая процентная частота
вариант выборки”.

Конспект.

8. Стадия рефлексии. Подводя итог урока,
необходимо добиться понимания учащимися
следующих важных положений:

На этапе рефлексии учащимся предлагается
составить синквейн и в поэтической форме
выразить свое отношение к изученном материалу.

Справка: СИНКВЕЙН – приём технологии
развития критического мышления, на стадии
рефлексии.

Это короткое литературное произведение,
характеризующее предмет (тему), состоящее из пяти
строк, которое пишется по определённому плану.
Слово “синквейн” происходит от французского
слова “пять”.

ПРАВИЛА НАПИСАНИЯ СИНКВЕЙНА

1 строчка – одно слово – название
стихотворения, тема, обычно существительное.

2 строчка – два слова (прилагательные или
причастия). Описание темы, слова можно соединять
союзами и предлогами.

3 строчка – три слова (глаголы). Действия,
относящиеся к теме.

4 строчка – четыре слова – предложение.
Фраза, которая показывает отношение автора к
теме в 1-ой строчке.

5 строчка – одно слово – ассоциация,
синоним, который повторяет суть темы в 1-ой
строчке, обычно существительное.

Пример синквейна:

Статистика
Ускользающая, непознанная.
Осознать, изучить, понять
Статистика есть дизайн информации.
Реальность.

9. Завершение урока

Завершить урок хочется такой историей.

– Доктор, – спрашивает пациент – пойдут ли у
меня дела на поправку?

– Несомненно, – отвечает врач, – потому что
статистика говорит, что один из ста
выздоравливает при этой болезни.

– Но почему же при этом именно я должен
выздороветь?

– Потому что вы как раз и есть мой сотый
пациент.

Презентация

Приложение

18.02.2010

Понравилась статья? Поделить с друзьями:
  • Как найти продольную силу сопромат
  • Шуруповерт уходит в защиту как исправить
  • Как составить колесо жизненного баланса пошагово
  • Ошибка с вопросительными знаками как исправить
  • Как найти сбежавшего насильника