Как составить ранжированный ряд распределения

Ранжированный ряд распределения —
расположение единиц совокупности в
порядке возрастания или убывания
выбранного признака.

Ранжированный ряд распределения
строится, прежде всего, по количественному
признаку. Но может также строиться по
качественному признаку, если он может
устанавливаться в определенной
последовательности.

Ранжированный ряд может строиться по
3м формам:

1. Натуральная (солдатский строй).

2. Табличная — состоит из 2х строк: 1) № в
ранжированном ряду; 2) значение признака.

№ 1 — min значение

№ 2 — max значение, или
наоборот.

Несколько единиц имеют одно и то же
значение признака — номера «не
останавливаются»; нескольким номерам
соответствует одно и то же значение.

3. Графическая (Огива распределения/
Огива Гальтона).

7. Анализ ранжированного ряда распределения.

На основе табличного и графического
ранжированного ряда можно сделать
следующие выводы:

1. Каков характер изменения признака:

Он может быть двояким:

1) плавный или постепенный (больше
характерно для непрерывных признаков).

2. скачкообразный (дискретные признаки).

2. Скорость (интенсивность) изменения
признака совокупности.

О скорости можно судить по углу наклона
Огивы:

45º — средняя интенсивность;

<45º — слабая интенсивность;

>45º — высокая интенсивность.

3. Вывод о наличии/ отсутствии в совокупности
резко выделяющихся значений признака
(на концах ранжированного ряда).

На начальном этапе исследования единиц
наличие таких единиц оценивается
визуально (субъективно).

Следующим этапом познания статистических
совокупностей является построение
вариационных рядов распределения.

8. Вариационный ряд распределения, техника построения для дискретного признака.

В случае дискретного признака табличная
форма вариационного ряда распределения
состоит из 2х колонок.

Значение признака

Частота

xi

ni

Значение признака в порядке возрастания
или убывания (1 раз — каждое значение)

0

1

12

12

27

5

Итого:

125 = ∑ ni

Графически вариационный ряд распределения
отражается в виде полегона распределения:

9. Интервальный вариационный ряд распределения, техника его построения.

Принципиальные отличия:

1. В левой колонке таблицы записываются
не отдельные значения признака, а
интервалы.

2. В правой колонке — сколько единиц имеют
значения признака в пределах обозначенного
интервала значения.

Интервалы значений

Частоты интервала

Для непрерывных признаков мы вынуждены
строить именно интервальные ряды
распределения, т.к. каждое отдельное
значение встречается 1 раз.

К интервальному ряду мы вынуждены также
обратится, если дискретный признак
меняет свою величину в очень широком
диапазоне (Число жителей — 1/ 1050).

Техника построения интервального
вариационного ряда распределения:

1. Устанавливается число интервалов
(групп), на которые должна быть разбита
совоупность.

m — число интервалов

N — общая численность
совокупности.

Получается примерно одно и то же число,
если число единиц в пределах численной
совокупности:

100 1000

10 31

8 10.

Если совокупность находится в пределах
100 ед., то можно воспользоваться любой
из формул.

Если совокупность содержит большее
число единиц, то необходимо воспользоваться
2ой формулой.

2. Определить шаг интервала (от … до …).

xmax
— xmin
— размах вариации.

1) Шаг интервала яда распределения
рассчитывается с точностью, с которой
представлены данные.

2) Если для определения шага интервала
с заданной точностью потребляется
округление, то округление всегда в
большую сторону.

100 … 200

3. Установление границ интервала.

Интервал

Частота интервала

xmax
— xmin
+ а

160 — 164

10

164 — 168

12

168 — 172

172 — 176

176 — 180

180 — 184

184 — 188

188 — 192

192 — 196

196 — 200

Итого:

4. Посчитаем число единиц, имеющих
значение признака в пределах каждого
интервала.

Единицу, имеющую значение признака,
равное границам интервала, можно относить
как в предыдущий, так и в следующий
интервал, по усмотрению исследователя,
использую при этом 2 принципа:

1) включительный (в предыдущий интервал);

2) исключительный (в последующий интервал).

Графическим отображением интервального
вариационного ряда распределения
является гистограмма распределения:

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

  • #
  • #
  • #
  • #
  • #
  • #
  • #
  • #
  • #
  • #

    15.09.2019359.28 Кб11.docx

  • #

Варианты для выполнения работы

I. Установление закономерностей, которым подчинены массовые случайные явления, основано на изучении методами теории вероятностей статистических данных — результатов наблюдений.

Почти все встречающиеся в жизни величины (урожайность сельскохозяйственных растений, продуктивности скота, производительность труда и заработная плата рабочих, объем производства продукции и т.д.) принимают неодинаковые значения у различных членов совокупности. Поэтому возникает необходимость в изучении их изменяемости. Это изучение начинается с проведения соответствующих наблюдений, обследований.

В результате наблюдений получают сведения о численной величине изучаемого признака у каждого члена данной совокупности.

Пример. Имеются данные о размере прибыли 100 коммерческих банков. Прибыль, млн. рублей.

30,2 51,9 43,1 58,9 34,1 55,2 47,9 43,7 53,2 34,9
47,8 65,7 37,8 68,6 48,4 67,5 27,3 66,1 52,0 55,6
54,1 26,9 53,6 42,5 59,3 44,8 52,8 42,3 55,9 48,1
44,5 69,8 47,3 35,6 70,1 39,5 70,3 33,7 51,8 56,1
28,4  48,7 41,9 58,1 20,4 56,3 46,5 41,8 59,5 38,1
41,4 70,4 31,4 52,5 45,2 52,3 40,2 60,4 27,6 57,4
29,3 53,8 46,3 40,1 50,3 48,9 35,8 61,7 49,2 45,8
45,3 71,5 35,1 57,8 28,1 57,6 49,6 45,5 36,2 63,2
61,9 25,1 65,1 49,7 62,1 46,1 39,9 62,4 50,1 33,1
33,3 49,8 39,8 45,9 37,3 78,0 64,9 28,8 62,5 58,7

                 
Из данной таблицы видно, что интересующий нас признак (прибыль банков) меняется от одного члена совокупности к другому, варьирует. Варьирование есть изменяемость признака у отдельных членов совокупности.

Вариационным рядом называется последовательность вариант, записанных в возрастающем порядке и соответствующих им частот.

Число, показывающее, сколько раз повторяется в данной совокупности каждое значение признака, называется частотой.

Составим ранжированный вариационный ряд (выпишем варианты в порядке возрастания):

20,4 25,1 26,9 27,3 27,6 28,1 28,4 28,8 29,3 30,2
31,4 33,1 33,3 33,7 34,1 34,9 35,1 35,6 35,8 36,2
37,3 37,8 38,1 39,5 39,8 39,9 40,1 40,2 41,4 41,8
41,9 42,3 42,5 43,1 43,7 44,5 44,8 45,2 45,3 45,5
45,8 45,9 46,1 46,3 46,5 47,3 47,8 47,9 48,1 48,4
48,7 48,9 49,2 49,6 49,7 49,8 50,1 50,3 51,8 51,9
52,0 52,3 52,5 52,8 53,2 53,6 53,8 54,1 55,2 55,6
55,9 56,1 56,3 57,4 57,6 57,8 58,1 58,7 58,9 59,3
59,5 60,4 61,7 61,9 62,1 62,4 62,5 63,2 64,9 65,1
65,7 66,1 67,5 68,6 69,8 70,1 70,3 70,4 71,5 78,0

 В нашем случае каждое значение признака (варианта вариационного ряда) повторилось только один раз, т.е. значение частоты для всех вариант равно единице. Перейдем к интервальному вариационному ряду, так как интересующий нас признак принимает дробные, практически не повторяющиеся значения.

Для этого необходимо определить число интервалов (классов) и длину интервала (классного промежутка), после чего произвести разноску, т.е. подсчитать для каждого интервала число вариант, попавших в него.

Количество классов устанавливают в зависимости от степени точности, с которой ведется обработка, и количества объектов в выборке. Считается удобным при объеме выборки (n) в пределах от 30 до 60 вариант распределять их на 6-7 классов, при n от 60 до 100 вариант — на 7-8 классов, при n от 100 и более вариант — на 9-17 классов.

Нужное количество групп также может быть ориентировочно вычислено по формуле Стерджесса:

    [k=1+3,322lgn]

где k — число групп (классов, интервалов) ряда распределения; n — объем выборки.

Можно также использовать выражение:

    [k=sqrt{n}.]

При nle 70 они дают примерно одинаковые результаты.

В рассматриваемом примере о размере прибыли коммерческих банков, n=100. Применяя формулу Стерджесса, получим:

    [k=1+3,322lg100=1+3,322cdot 2=7,644approx 8.]

Однако sqrt{100}=10. Таким образом, число интервалов может быть равно 8, 9, 10 и т.д.

Нахождение нужного количества групп и их размеров часто бывает взаимообусловлено. Для того, чтобы как-то определиться с числом интервалов, найдем размах вариации — разность между наибольшей и наименьшей вариантой:

    [R=x_{max}-x_{min}]

где R — размах вариации,

x_{max} — наибольшее значение варьирующего признака,

x_{min} — наименьшее значение варьирующего признака.

Найдем размах вариации для рассматриваемой задачи:

    [R=78,0-20,4=57,6]

Для того, чтобы найти длину интервала (величину классового промежутка) необходимо разделить размах вариации на число классов и полученную величину округлить таким образом, чтобы было удобно производить сначала разноску, а затем и различные вычисления. Рекомендую округлять до единиц, до которых округлены варианты в исходной таблице, в нашем случае до десятых.

    [happrox frac{R}{k}]

Согласно формуле получаем

    [happrox frac{57,6}{8}=7,2]

Теперь необходимо определиться с началом первого интервала. Для этого можно использовать формулу:

    [x_1approx x_{min}-frac{h}{2}]

    [x_1approx 20,4-frac{7,2}{2}=16,8.]

Замечание. За начало первого интервала можно принять некоторое значение, несколько меньшее x_{min} или само значение x_{min}. Далее в табличном виде я покажу оба варианта.

Прибавив к началу первого интервала (нижней границе) шаг, получим верхнюю границу первого интервала и одновременно нижнюю границу второго интервала. Выполняя последовательно указанные действия, будем находить границы последующих интервалов до тех пор, пока не будет получено или перекрыто x_{max}.

Таким образом, верхняя граница одного интервала одновременно является нижней границей другого интервала. Чтобы не возникало сомнений, в какой интервал отнести варианту, попавшую на границу, условимся относить ее к верхнему интервалу.

Составим теперь рабочую таблицу для построения интервального вариационного ряда и произведем подсчет частот вариант, попавших в тот или иной интервал.

Как и обещал покажу две таблицы построения ряда:

1. Отсчет ведем от x_{min}, т.е. нижняя граница первого интервала совпадает с x_{min}.

Группы банков по размеру прибыли

(границы интервалов)

Количество банков, принадлежащих данной группе

(частоты, n_i)

Накопленные частоты,

S_i

20,4 — 27,6 4 4
27,6 — 34,8 11 15
34,8 — 42 16 31
42 — 49,2 21 52
49,2 — 56,4 21 73
56,4 — 63,6 15 88
63,6 — 70,8 10 98
70,8 — 78 2 100

2. Начало первого интервала определяем с помощью формулы: x_1approx x_{min}-frac{h}{2}.

Группы банков по размеру прибыли

(границы интервалов)

Количество банков, принадлежащих данной группе

(частоты, n_i)

Накопленные частоты,

S_i

16,8 — 24 1 1
24 — 31,2 9 10
31,2 — 38,4 13 23
38,4 — 45,6 17 40
45,6 — 52,8 23 63
52,8 — 60 18 81
60 — 67,2 11 92
67,2 — 74,4 7 99
74,4 — 81,6 1 100

Как мы видим в 1-м случае у нас получилось восемь интервалов, что полностью совпадает с результатом, который нам дала формула Стерджесса. Во втором случае у нас получилось девять интервалов, так как при поиске начала первого интервала пользовались специальной формулой.

Для дальнейшего исследования я буду пользоваться результатами второй таблицы, так как там ярко выражен модальный интервал (одна мода) и медиана практически точно попадает на середину вариационного ряда.

Мы получили интервальный вариационный ряд — упорядоченную совокупность интервалов варьирования значений случайной величины с соответствующими частотами попаданий в каждый из них значений величины.

II. Графическая интерпретация вариационных рядов.

№ п/п

Границы интервалов,

[x_{i}; x_{i+1})

Середины интервалов,

x_{i}^{*}=frac{x_i+x_{i+1}}{2}

Частоты интервалов,

n_i

Относительные частоты

W_i=frac{n_i}{n}

Плотность относит. частоты

frac{W_i}{h}

Плотность частоты

frac{n_i}{h}

1 16,8 — 24 20,4 1 0,01 0,001 0,139
2 24 — 31,2 27,6 9 0,09 0,013 1,250
3 31,2 — 38,4 34,8 13 0,13 0,018 1,806
4 38,4 — 45,6 42 17 0,17 0,024 2,361
5 45,6 — 52,8 49,2 23 0,23 0,032 3,194
6 52,8 — 60 56,4 18 0,18 0,025 2,500
7 60 — 67,2 63,6 11 0,11 0,015 1,528
8 67,2 — 74,4 70,8 7 0,07 0,010 0,972
9 74,4 — 81,6 78 1 0,01 0,001 0,139
      sum=100 sum=1    

Строим графики:

График гистограммы частот ischanow.com

График гистограммы плотности частот ischanow.com

График гистограммы относительных частот ischanow.com

График гистограммы плотности относительных частот ischanow.com

График полигона частот ischanow.com

Далее найдем моду вариационного ряда:

    [M_o(X)=x_{M_o}+hfrac{(n_2-n_1)}{(n_2-n_1)+(n_2-n_3)}]

где

x_{M_o} — начало модального интервала;

h — длина частичного интервала (шаг);

n_1 — частота предмодального интервала;

n_2 — частота модального интервала;

n_3 — частота послемодального интервала.

Определим модальный интервал — интервал, имеющий наибольшую частоту. Из таблицы видно, что модальным является интервал (45,6 — 52,8).

    [M_o(X)=45,6+7,2frac{(23-17)}{(23-17)+(23-18)}=]

    [=45,6+7,2cdot frac{6}{6+5}=45,6+3,93=49,5]

Медиана

Для интервального ряда медиана находится по формуле:

    [M_e(X)=x_{M_e}+hfrac{0,5n-S_{M_{e}-1}}{n_{M_e}}]

где

x_{M_e} — начало медианного интервала;

h — длина частичного интервала (шаг);

n — объем совокупности;

S_{M_{e}-1} — накопленная частота интервала, предшествующая медианному;

n_{M_e} — частота медианного интервала.

Определим медианный интервал — интервал, в котором впервые накопленная частота превышает половину объема выборки.Так как объем выборки n=100, то n/2=50. По таблице найдем интервал, где впервые накопленные частоты превысят это значение. Таким является интервал (45,6 — 52,8).

Получаем,

    [M_e(X)=45,6+7,2frac{0,5cdot 100-40}{23}approx 48,7.]

III. Расчет сводных характеристик выборки.

Для определения x_B, D_{B}, sigma_{B} составим расчетную таблицу. Для начала определимся с ложным нулем С. В качестве ложного нуля можно принять любую варианту. Максимальная простота вычислений достигается, если выбрать в качестве ложного нуля варианту, которая расположена примерно в середине вариационного ряда (часто такая варианта имеет наибольшую частоту).

Варианте, которая принята в качестве ложного нуля, соответствует условная варианта, равная нулю. В нашем случае С=49,2.

Равноотстоящими называют варианты, которые образуют арифметическую прогрессию с разностью h.

Условными называют варианты, определяемые равенством:

    [U_i=frac{(x_i-C)}{h}]

Произведем расчет условных вариант согласно формуле:

    [U_1=frac{20,4-49,2}{7,2}=-4]

    [U_2=frac{27,6-49,2}{7,2}=-3]

    [U_3=frac{34,8-49,2}{7,2}=-2]

    [U_4=frac{42-49,2}{7,2}=-1]

    [U_5=frac{49,2-49,2}{7,2}=0]

    [U_6=frac{56,4-49,2}{7,2}=1]

    [U_7=frac{63,6-49,2}{7,2}=2]

    [U_8=frac{70,8-49,2}{7,2}=3]

    [U_9=frac{78-49,2}{7,2}=4]

N п/п

Середины интервалов,

x_{i}^{*}

Частоты интервалов,

n_i

Условные варианты,

U_i

Произведения частот и условных вариант,

n_icdot U_i

Произведения частот и условных вариант,

n_icdot U_i^2

Произведения частот и условных вариант,

n_icdot U_i^3

Произведения частот и условных вариант,

n_icdot U_i^4

Произведения частот и условных вариант,  

n_icdot (U_i+1)^2

Произведения частот и условных вариант,

n_icdot(U_i+1)^4

1 20,4 1 -4 -4 16 -64 256 9 81
2 27,6 9 -3 -27 81 -243 729 36 144
3 34,8 13 -2 -26 52 -104 208 13 13
4 42 17 -1 -17 17 -17 17 0 0
5 49,2 23 0 0 0 0 0 23 23
6 56,4 18 1 18 18 18 18 72 288
7 63,6 11 2 22 44 88 176 99 891
8 70,8 7 3 21 63 189 567 112 1792
9 78 1 4 4 16 64 256 25 625
    sum=100   sum n_iU_i=-9 sum n_iU_i^2=307 sum n_icdot U_i^3=-69 sum n_icdot U_i^4=2227 sum n_icdot (U_i+1)^2=389 sum n_icdot(U_i+1)^4=3857

    
Контроль:

    [sum n_i U_i^2 + 2sum n_iU_i+n=sum n_i{(U_i+1)}^2]

    [sum n_i U_i^2 + 2sum n_iU_i+n=307+2cdot (-9)+100=389]

    [sum n_i{(U_i+1)}^2=389]

Контроль:

    [sum n_i U_i^4 + 4sum n_iU_i^3+6sum n_iU_i^2+4sum n_iU_i+n=sum n_i{(U_i+1)}^4]

    [sum n_i U_i^4 + 4sum n_iU_i^3+6sum n_iU_i^2+4sum n_iU_i+n=]

    [=2227+4cdot (-69)+6 cdot 307+4cdot (-9)+100=3857]

    [sum n_i{(U_i+1)}^4=3857]

Равенство выполнено, следовательно вычисления произведены верно.

Вычислим условные моменты 1-го, 2-го, 3-го и 4-го порядков:

    [M_1^{*}=frac{sum n_iU_i}{n}=frac{-9}{100}=-0,09;]

    [M_2^{*}=frac{sum n_iU_i^2}{n}=frac{307}{100}=3,07;]

    [M_3^{*}=frac{sum n_iU_i^3}{n}=frac{-69}{100}=-0,69;]

    [M_4^{*}=frac{sum n_iU_i^4}{n}=frac{2227}{100}=22,27.]

Найдем выборочные среднюю, дисперсию и среднее квадратическое отклонение :

    [x_{B}=M_1^{*}cdot h+C=-0,09cdot 7,2+49,2=48,552;]

    [D_{B}=(M_2^{*}-{(M_1^{*})}^2)h^2=(3,07-{(-0,09)}^2){7,2}^2approx 158,73.]

    [sigma_{B}=sqrt{D_B}=sqrt{158,73}=12,6.]

Также для оценки отклонения эмпирического распределения от нормального используют такие характеристики, как асимметрия и эксцесс.

Асимметрией теоретического распределения называют отношение центрального момента третьего порядка к кубу среднего квадратического отклонения:

    [a_s=frac{m_3}{sigma_B^3}]

Асимметрия положительна, если «длинная часть» кривой распределения расположена справа от математического ожидания; асимметрия отрицательна, если «длинная часть» кривой расположена слева от математического ожидания. Практически определяют знак асимметрии по расположению кривой распределения относительно моды (точки максимума дифференциальной функции): если «длинная часть» кривой расположена правее моды, то асимметрия положительна, если слева — отрицательна.

Эксцесс эмпирического распределения определяется равенством:

    [e_k=frac{m_4}{sigma_B^4}-3]

где m_4 — центральный эмпирический момент четвертого порядка.

Для нормального распределения эксцесс равен нулю. Поэтому если эксцесс некоторого распределения отличен от нуля, то кривая этого распределения отличается от нормальной кривой: если эксцесс положительный, то кривая имеет более высокую и «острую» вершину, чем нормальная кривая; если эксцесс отрицательный, то сравниваемая кривая имеет более низкую и «плоскую» вершину, чем нормальная кривая. При этом предполагается, что нормальное и теоретическое распределения имеют одинаковые математические ожидания и дисперсии.

Вычисляем центральные эмпирические моменты третьего и четвертого порядков:

    [m_3=(M_3^*-3M_1^*M_2^*+2{(M_1^*)}^3)cdot h^3=51,3;]

    [m_4=(M_4^*-4M_3^*M_1^*+6M_2^*{(M_1^*)}^2-3{(M_1^*)}^4)cdot h^4=59580,97;]

Найдем асимметрию и эксцесс:

    [a_s=frac{51,3}{{12,6}^3}=0,026]

    [e_k=frac{59580,97}{{12,6}^4}-3=-0,635]

IV. Проверка гипотезы о нормальном распределении генеральной совокупности. Критерий согласия Пирсона.

Проверим генеральную совокупность значений размера прибыли банков по критерию Пирсона chi^2

Правило. Для того, чтобы при заданном уровне значимости проверить нулевую гипотезу H_o: генеральная совокупность распределена нормально, надо сначала вычислить теоретические частоты, а затем наблюдаемое значение критерия:

    [chi^2_{nabl}=sum frac{ {(n_i-n_i^{'})}^2}{n_i^{'}}]

и по таблице критических точек распределения chi^2, по заданному уровню значимости alpha и числу степеней свободы k=s-3 найти критическую точку chi^2_{kp}(alpha;k), где s — количество интервалов.

Если chi^2_{nabl}<chi^2_{kp} — нет оснований отвергнуть нулевую гипотезу.

Если chi^2_{nabl}>chi^2_{kp} — нулевую гипотезу отвергают.

Найдем теоретические частоты n_i^', для этого составим следующую таблицу.

Середины интервалов,

x_{i}^{*}

Частоты интервалов,

n_i

Произведем расчет,

x_{i}^{*}-x_B

Произведем расчет,

V_i=frac{(x_{i}^{*}-x_B)}{sigma_B}

Значения функции Гаусса,

varphi(V_i)

Произведем расчет,

frac{nh}{sigma_B}

Теоретические частоты,

n_i^{'}=57 cdotvarphi(V_i)

20,4 1 -28,152 -2,23 0,0332 57 2
27,6 9 -20,952 -1,66 0,1006 57 6
34,8 13 -13,752 -1,09 0,2203 57 13
42 17 -6,552 -0,52 0,3485 57 20
49,2 23 0,648 0,05 0,3984 57 23
56,4 18 7,848 0,62 0,3292 57 19
63,6 11 15,048 1,19 0,1965 57 11
70,8 7 22,248 1,77 0,0833 57 5
78 1 29,448 2,34 0,0258 57 1
  n=100         sum n_i^{'}=100

   
Вычислим chi^2_{nabl}, для чего составим расчетную таблицу.

N^0 n_i n_i^{'} n_i-n_i^{'} {(n_i-n_i^{'})}^2 frac{{(n_i-n_i^{'})}^2}{n_i^'} n_i^2 frac{n_i^2}{n_i^{'}}
1 1 2 -1 0,5 1 0,5
2 9 6 3 9 1,5 81 13,5
3 13 13 0 0 0 169 13
4 17 20 -3 9 0,45 289 14,45
5 23 23 0 0 0 529 23
6 18 19 -1 1 0,05 324 17,05
7 11 11 0 0 0 121 11
8 7 5 2 4 0,8 49 9,8
9 1 1 0 0 0 1 1
sum 100 100    

Наблюдаемое значение критерия,

chi^2_{nabl}=3,30

  103,30

Контроль:

    [sumfrac{n_i^2}{n_i^{'}}-n=sum frac{{(n_i-n_i^{'})}^2}{n_i^'}]

    [sumfrac{n_i^2}{n_i'}-n=103,3-100=3,3]

    [sum frac{{(n_i-n_i')}^2}{n_i'}=3,3]

Вычисления произведены правильно.

Найдем число степеней свободы, учитывая, что число групп выборки (число различных вариант) s=9;

    [k=s-3=9-3=6.]

По таблице критических точек распределения chi^2 по уровню значимости alpha = 0,025 и числу степеней свободы k=6 находим chi^2_{kp}(0,025;6)=14,4.

Так как chi^2_{nabl}<chi^2_{kp} — нет оснований отвергнуть нулевую гипотезу. Другими словами, расхождение эмпирических и теоретических частот незначительное. Следовательно, данные наблюдений согласуются с гипотезой о нормальном распределении генеральной совокупности.

На рисунке построены нормальная (теоретическая) кривая по теоретическим частотам (зеленый график) и полигон наблюдаемых частот (коричневый график). Сравнение графиков наглядно показывает, что построенная теоретическая кривая удовлетворительно отражает данные наблюдений.

График нормальной кривой и полигон наблюдаемых частот

V. Интервальные оценки.

Интервальной называют оценку, которая определяется двумя числами — концами интервала, покрывающего оцениваемый параметр.

Доверительным называют интервал, который с заданной надежностью gamma покрывает заданный параметр.

Интервальной оценкой (с надежностью gamma) математического ожидания (а) нормально распределенного количественного признака Х по выборочной средней x_B при известном среднем квадратическом отклонении sigma генеральной совокупности служит доверительный интервал

    [x_B-frac{tsigma}{sqrt{n}}<a<x_B+frac{tsigma}{sqrt{n}},]

где frac{tsigma}{sqrt{n}}=delta — точность оценки, n — объем выборки, t — значение аргумента функции Лапласа phi (t) (см. приложение 2), при котором phi(t)=frac{gamma}{2};

при неизвестном среднем квадратическом отклонении sigma (и объеме выборки n<30)

    [x_B-frac{t_{gamma}cdot S}{sqrt{n}}<a<x_B+frac{t_{gamma}cdot S}{sqrt{n}},]

    [S=sqrt{frac{n}{n-1}D_B}]

где S — исправленное выборочное среднее квадратическое отклонение, t_{gamma} находят по таблице приложения по заданным n и gamma.

В нашем примере среднее квадратическое отклонение известно, sigma_B=12,6. А также x_B=48,55, n=100, gamma=0,95. Поэтому для поиска доверительного интервала используем первую формулу:

    [x_B-frac{tsigma}{sqrt{n}}<a<x_B+frac{tsigma}{sqrt{n}}]

Все величины, кроме t, известны. Найдем t из соотношения phi(t)=frac{0,95}{2}=0,475. По таблице приложения находим t=1,96. Подставив t=1,96, sigma_B=12,6, x_B=48,55, n=100 в формулу, окончательно получим искомый доверительный интервал:

    [48,55-frac{1,96cdot 12,6}{10}<a<48,55+frac{1,96cdot 12,6}{10}]

    [48,55-2,47<a<48,55+2,47]

    [46,08<a<51,02]

Интервальной оценкой (с надежностью gamma) среднего квадратического отклонения sigma нормально распределенного количественного признака Х по «исправленному» выборочному среднему квадратическому отклонению S служит доверительный интервал

S(1-q)<sigma<S(1+q),    (при q<1), (*)

0<sigma<S(1+q),      (при q>1),

где q — находят по таблице приложения по заданным n и gamma.

По данным gamma=0,95 и n=100 по таблице приложения 4 найдем q=0,143. Так как q<1, то, подставив S=sqrt{frac{n}{n-1}D_B}=sqrt{frac{100}{99}cdot 158,73}approx 12,66, quad quad q=0,143 в соотношение (*), получим доверительный интервал:

    [12,66(1-0,143)<sigma<12,66(1+0,143)]

    [10,85<sigma<14,47]

Вариационный ряд  может быть:

  • дискретным, когда изучаемый признак характеризуется определенным числом (как правило целым).
  •  интервальным, когда определены границы «от» и «до» для непрерывно варьируемого признака. Интервальный ряд также строят если множество значений дискретно варьируемого признака велико.

Рассмотрим пример построения дискретного вариационного ряда.

Пример 1. Имеются данные о количественном составе 60 семей.

Как сделать ранжированный ряд в excel?

  • Построить вариационный ряд и полигон распределения
  • Решение.
  • Алгоритм построения вариационного ряда:
  • Откроем таблицы Excel.

Введем массив данных в диапазон А1:L5. Если вы изучаете документ в электронной форме (в формате Word, например), для этого достаточно выделить таблицу с данными и скопировать ее в буфер, затем выделить ячейку А1 и вставить данные – они автоматически займут подходящий диапазон.

Подсчитаем объем выборки n – число выборочных данных, для этого в ячейку В7 введем формулу =СЧЁТ(А1:L5). Заметим, что для того, чтобы в формулу ввести нужный диапазон, необязательно вводить его обозначение с клавиатуры, достаточно его выделить.

Определим минимальное и максимальное значение в выборке, введя в ячейку В8 формулу =МИН(А1:L5), и в ячейку В9: =МАКС(А1:L5).

Рис.1.1 Пример 1. Первичная обработка статистических данных в таблицах Excel

Как сделать ранжированный ряд в excel?

Далее, подготовим таблицу для построения вариационного ряда, введя названия для столбца  интервалов (значений варианты) и столбца частот. В столбец интервалов введем значения признака от минимального (1) до максимального (6), заняв диапазон  В12:В17.

Выделим столбец частот, введем формулу =ЧАСТОТА(А1:L5;В12:В17) и нажмем сочетание клавиш CTRL+SHIFT+ENTER

Рис.1.2 Пример 1. Построение вариационного ряда

Как сделать ранжированный ряд в excel?

Для контроля вычислим сумму частот при помощи функции СУММ (значок функции S в группе «Редактирование» на вкладке «Главная»), вычисленная сумма должна совпасть с ранее вычисленным объемом выборки в ячейке В7.

Построим полигон:

выделив полученный диапазон частот, выберем команду «График» на вкладке «Вставка». По умолчанию значениями на горизонтальной оси будут порядковые числа — в нашем случае от 1 до 6, что совпадает со значениями варианты (номерами тарифных разрядов).

Название ряда диаграммы «ряд 1» можно либо изменить, воспользовавшись той же опцией «выбрать данные» вкладки «Конструктор», либо просто удалить.

Пример 1. Построение полигона частот

Как сделать ранжированный ряд в excel?

Примечание: можно скачать готовый шаблон построение дискретного вариационного ряда в Excel

Следующая тема: Построение интервального вариационного ряда в Excel.

Источник: http://www.reshim.su/blog/variacionnyj_rjad/2014-08-23-500

Как сортировать данные в таблицах Excel (правильный способ)

Итак, нам вручили электронную таблицу Excel с тысячами строк внутри нее и вы понимаете, что все данные в неправильном порядке. Возможно, вам придется сортировать её на основе имен столбцов или путем сортировки данных от большего к меньшему.

На первый взгляд, сортировка данных в Excel задача простая, и приложение, безусловно, упрощает сортировку.  Однако, более важно то, как вы можете отсортировать и изменить порядок данных в ваших листах. Вот три метода сортировки данных Excel, о которых вы узнаете в этом уроке:

  1. Сортировка данных всего в несколько кликов
  2. Установка нескольких, ступенчатых правил сортировки, таких как сортировка по алфавиту по состоянию, а затем по всё вместе.
  3. Создать полностью свои настройки сортировки, чтобы отсортировать данные с помощью любого установленного вами правила.

Сортировка данных иногда может казаться опасной; что, если вы отсортируете только один столбец и данные будут смещены? Я покажу вам, как избежать этого. Давайте начнем.

Как сортировать данные в электронной таблице Excel (короткое видео)

Этот скринкаст охватывает несколько методов сортировки ваших данных. Просмотрите этот трехминутный видеоролик, чтобы быстро изучить эти профессиональные техники работы Excel. Мы начнем с простой сортировки и перейдем к более продвинутым методам, чтобы вы всегда смогли отсортировать данные так, как вам нужно.

Читайте дальше пошаговое руководство по сортировке данных в электронных таблицах Excel с использованием простых и передовых методов.

Примеры данных (бесплатная загрузка рабочей книги Excel)

В рамках этого урока я создал книгу, с которой вы можете работать, изучая сортировку данных. Загрузите книгу бесплатно и используйте её во время изучения сортировки в Excel.

1. Простая сортировка в Excel

Сортировка может быть очень простой, всего пара кликов для перестановки данных в ваших таблицах. Давайте узнаем как.

В книге Excel, начните с нажатия на ячейку столбца, который вы хотите отсортировать. Теперь, убедитесь, что вы находитесь на вкладке Главная на ленте Excel’я и найдите кнопку Сортировка и фильтр на самой правой стороне этой панели.

Кнопка Сортировка и фильтр обитает в самой правый части вкладки Главная.

Заметьте, что в вариантах сортировки, вы можете отсортировать текст «А до Я» или «Я до А». Эти простые варианты помогут отсортировать данные в Excel В алфавитном или обратным порядках, в зависимости от того что вы выбрали.

Когда вы сортируете данные в Excel, сортируется вся строка. По сути, выбранный вами столбец будет «ключом», который Excel использует, чтобы решить, как сортировать данные, но каждая строка это запись, которая должна оставаться сгруппированной вместе.

В зависимости от данных, которые вы выбрали, можете произвести сортировку по алфавитному или числовому порядку. Если столбцы содержат числовые данные, вы можете отсортировать в порядке от малого к большому числу, текстовые данные сортируются в алфавитном порядке.

В примере выше, варианты сортировки изменились, потому что я выбрал столбец с цифрами.

Выполнить обычную сортировку на самом деле так просто. Просто кликните по данным, выберите вариант сортировки и Excel перестроит данные в таблице.

Я отсортировал данные в этой таблице на основе клиента всего в несколько кликов.

Дельный совет: попробуйте также сортировать, щелкнув правой кнопкой мыши внутри столбца и выбрав Сортировка, а затем указать способ сортировки исходных данных.

2. Как НЕ нужно сортировать данные в Excel

Не менее важно узнать, о самом опасном способе сортировки данных в Excel, такой метод может испортить ваши исходные данные.

Проблема возникает если в таблице много данных, а вы случайно отсортировали только один столбец данных. Каждая строка с данными в Microsoft Excel действительно похоже на запись, которая должна быть такой же по всей строке.

На изображении ниже, Я раскрасил строки, таким образом опасное место с сортировкой только одного столбца данных, будет выделено.

Я задал цвета строкам в этом примере, чтобы мы могли убедиться, что наши данные отсортированы правильно. Цвета должны проходить полностью через каждую строку без перерывов, если данные сортируются правильно.

Большая ошибка пользователей Excel заключается в выборе только одного столбца при сортировке и выборе неправильного параметра в следующем окне.

Excel даже пытается предупредить нас, показывая окно Обнаруженны данные вне указанного диапазона. Во всплывающем окне можно выбрать автоматически расширить выделенный диапазон (выберите это!) и сортировать в пределах указанного выделения.

Я всегда думал, что варианты, которые дает вам это окно, не совсем ясны. Просто знайте, что вы захотите использовать автоматически расширить выделенный диапазон, чтобы убедиться, что Excel затронет все столбцы при сортировке данных.

Для тестирования давайте посмотрим, что произойдет, если мы выберем один столбец и выберем тип сортировки сортировать в пределах указанного выделения.

Использование вариант сортировать в приделах указанного диапазона сортирует только один столбец данных, который обязательно разрушит вашу исходную электронную таблицу.

На скриншоте ниже вы можете видеть, насколько проблематичен этот тип сортировки. Так как столбец Amount Billed был отсортирован от наименьшего до наибольшего, все остальные столбцы остались на месте. Это означает, что наши данные больше не верны.

Как вы видите из несоответствия цветов, были отсортированы только данные в столбце Amount Billed, поэтому теперь таблица некорректна.

Таким образом, при сортировке данных есть два ключевых «НЕ»:

  1. Не начинайте, выделив один столбец в своей электронной таблице.
  2. Не используйте вариант сортировать в приделах указанного диапазона, если вы работаете не с одним столбцом, убедитесь, что вы расширили выделенный диапазон.

3. Расширенная сортировка данных Excel

До сих пор простая сортировка позволяла нам сортировать данные однотипно. Что, если мы хотим два типа данных в нашей сортировке?

Что, если мы хотим…

  • Сортировка в алфавитном порядке по состоянию, а затем по области.
  • Сортировка в алфавитном порядке по имени клиента, а затем по каждому типу проекта, который мы сделали для них.
  • Сортировка клиентов в список по алфавиту, а затем по количеству для каждого отдельного проекта, от наибольшего до наименьшего.

Ответ на всё это — расширенная сортировка, при которой вы можете установить несколько уровней сортировки данных. Давайте рассмотрим последний пример, используя образцы данных.

Чтобы начать работу, щелкните где-нибудь внутри своих данных и найдите параметр Сортировка и фильтр, а затем выберите Настраиваемая сортировка.

Перейдите к расширенным параметрам сортировки, выбрав Сортировка и фильтр > Настраиваемая сортировка.

В этом окне мы можем добавить несколько уровней сортировки. Начните с нажатия на раскрывающийся список рядом с Сортировка и выберите столбец, который вы хотите отсортировать.

В моем случае я выберу Client в раскрывающемся меню и оставлю значение Сортировка  равным Значения, а Порядок — От А до Я. На простом языке это отсортирует электронную таблицу Excel на основе алфавитного порядка.

Теперь давайте нажмем Добавить уровень. Это создаст новую строку в параметрах сортировки и позволит нам добавить второй уровень организации.

Теперь я могу выбрать Amount billed во втором раскрывающемся списке. Комбинация этих двух правил начнется путем сортировки на основе имени клиента, а затем суммы, выставленного счёта за каждый проект.

Вы можете продолжить добавлять столько уровней, сколько хотите в это окно расширенной сортировки. Последовательность строк имеет значение, т.е. вы можете переместить строку вверх для сортировки сначала по выставленному счету, например, а затем по клиенту.

Как только мы нажмем OK, Excel отсортирует таблицу на основе правил, которые мы создали в этом окне.

Совет: Для более продвинутой сортировки попробуйте в раскрывающимся меню Сортировка изменить тип сортировки на расширенные функции, такие как сортировка на основе цвета ячейки.

Расширенная сортировка позволяет создавать два уровня организации данных в вашей таблице. Если сортировки по одному фактору недостаточно, используйте расширенную сортировку, чтобы добавить больше возможностей.

Повторение и продолжение обучения

Сортировка это ещё одно умение, которое нужно держать в готовом виде в своей книге Excel. Когда вам нужно повторно сопоставить данные в электронной таблице, слишком много времени можно потратить для вырезания и вставки строк в определенном порядке, поэтому сортировка является обязательной.

Источник: https://business.tutsplus.com/ru/tutorials/how-to-sort-data-in-excel-spreadsheets—cms-28737

Построить ранжированный ряд пример. Как сделать ранжированный ряд в excel

Задание №1

На основании данных статистического наблюдения, приведенных в таблице построить ранжированный, интервальный и кумулятивный ряды распределения сельскохозяйственных предприятий по факторному признаку, изобразить их графически.

Провести сводку данных. Посредством метода группировок определите зависимость результативного признака в сельскохозяйственных предприятиях от факторного. Построить таблицы и графики зависимости. Вывод.

Решение:

Построение ранжированного ряда распределения предполагает расположение всех вариантов ряда в порядке возрастания изучаемого признака (качества почвы). Проведение сортировки производилось в программе ТП Excel с использованием функции «Сортировка».

Графическое изображение ранжированного ряда распределения

Линия на рис.1 носит название огива Гальтона. Данная огива имеет тенденцию плавного роста с небольшими скачками в некоторых точках. Для преобразования ранжированного ряда в интервальный лучше выполнить разбивку на группы вручную.

Построение интервального ряда распределения предприятий по изучаемому признаку предполагает определение числа групп (интервалов).

  • Для расчета числа групп воспользуемся формулой:
  • n=2 , где N-общее число единиц изучаемой совокупности.

n=2 Ig30 = 2,95424251?3.

Величина равного интервала вычисляется по формуле:

i = = = 16,33333

Кумулятивный ряд — это ряд в котором подсчитываются накопленные частоты. Он показывает, сколько единиц совокупности имеют значение признака не больше, чем данное значение, и вычисляется путем последовательного прибавления к частоте первого интервала частот последующих интервалов.

  1. Интервальный и кумулятивный ряды
  2. частота — число предприятий в группе;
  3. Удельный вес предприятий в группе — находится по формуле:
  4. (число предприятий в группе*100%)/ m, где m-число экспериментальных данных;
  5. Накопленная
    частота — находится по формуле: число предприятий в предедущей  группе+частота данной группы.
  6. Гистограмма частот
  7. Кумулята распределения качества почвы
  8. Сводные показатели
№ группы Число предприятий в группе Урожайность овощей открытого грунта (всего по группам) Качество почвы (всего по группам)
II 61,33333-77,33333
III 77,33333-94,1

Средние характеристики групп

№ Группы Урожайность овощей открытого грунта Качество почвы
II 61,33333-77,33333
III 77,33333-94,1
В среднем по совокупности
  • где, столбец «урожайность овощей» находится по формуле: У
    У (в группе)число предприятий в группе;
  • столбец «Качество почвы» находится по формуле: У Х (в группе)/число предприятий в группе.
  • Зависимость урожайности овощей открытого грунта от качества почвы.
  • В рассматриваемом примере можно сделать вывод: с ростом качества почвы увеличивается урожайность овощей открытого грунта, следовательно можно предположить наличие прямой связи между рассматриваемыми параметрами.

Подобные документы

    Аналитическая группировка по факторному признаку. Построение вариационного частотного и кумулятивного рядов распределения на основе равно интервальной структурной группировки результативного признака – дивидендов, начисленных по результатам деятельности.контрольная работа , добавлен 07.05.2009 Основные показатели численности населения и его размещения по Калужской области. Построение ранжированного и интервального рядов распределения по одному группировочному факторному признаку. Анализ типических групп по показателям в среднем по совокупности.

Источник: https://netdenegnakino.ru/postroit-ranzhirovannyi-ryad-primer-kak-sdelat-ranzhirovannyi-ryad-v.html

Трюки и хитрости в Excel — Подсветка ряда данных в диаграмме. Часть 1

Всем привет! Друзья, случайно нашел в сети один очень интересный способ видопредставления диаграммы с подсветкой определенного значения. Спешу с вами поделиться этим чудом )) Только не буду выкладывать файлик пример, чтобы вы сами своими руками все сделали, так лучше запомнится. Информации будет много, поэтому разобью ее на три статьи, чтобы не было перегруза. Следите за обновлениями.

Недавно, я писал о том как без применения макросов можно настроить автообновление диаграммы. Если интересно, статью можно почитать здесь Как без формул и макросов сделать автообновление диаграммы?

Сегодня я хочу пошагово показать вам как сделать подсветку или выделить один ряд данных от остальных. Не переключайтесь, будет интересно ))

Шаг 1. Строим таблицу

Для начала составим таблицу. В статье про автообновление я строил таблицу по данным посещения игр на Чемпионате мира по футболу в наших городах. Продолжим с ней работать. В большинстве городов сыграно по 5 матчей, поэтому есть отличный повод сравнить среднюю посещаемость на стадионах. Данные я по прежнему брал с сайта Чемпионат.ком

Шаг 2. Выделяем необходимое значение

Затем в таблицу добавим еще один столбец и назовем его Подсветка. В данном столбце во всех строчках нам необходимо прописать функцию «НД()», которая возвращает значение без аргументов, т.е. создает ошибку.

Но в одной строчке, напротив самого большого значения просто скопируем данные. Цвет шрифта сделал светло серым, чтобы было наглядно понятнее. В нашем случае выделяется стадион «Лужники». У него наибольшая средняя посещаемость.

Не зря все таки на него столько денег потратили…..

Шаг 3. Строим диаграмму

Выделим только три столбца с данными которые необходимо нам отобразить. Затем нужно встать на одну из ячеек таблицы, перейти во вкладку Вставка и выбрать команду Гистограмма. В предложенном списке выберем Гистограмму с группировкой.

В результате у нас получается вот такая диаграмма.

Шаг 4. Делаем подсветку

Теперь самое главное. Для того чтобы выделить наш столбец в диаграмме, кликаем правой кнопкой на выделяющийся ряд данных и выбираем в списке контекстного меню «Формат ряда данных» . Затем в открывшемся окне «параметры ряда данных» в «перекрытии рядов» «с зазором» тянем бегунок вправо до 100%.

Нажимаем закрыть. Всё )) Вот так просто у нас получилось выделить «Лужники» из всех остальных стадионов.

На этом у меня всё. В следующей статье расскажу как подсветить ряд в зависимости от выбранного из списка стадиона. Тоже будет интересно и познавательно! Не пропустите!

Если вам понравился сегодняшний трюк, ставьте лайки и подписывайтесь на канал. Если хотите посмотреть еще уроки загляните в СОДЕРЖАНИЕ, обязательно еще что-нибудь присмотрите )) Спасибо!

Источник: https://zen.yandex.ru/media/id/5a25282b7800192677cc044f/5b3c8d32d75f2900a9562e31

Понравилась статья? Поделить с друзьями:
  • Как мне найти туалет
  • Как найти среднюю линию треугольника по клеткам
  • Как можно найди пульт
  • Как найти свой аккаунт на faceit
  • Как найти давление идеального газа через температуру