Как найти общий ряд данных измерения

Светило науки — 1670 ответов — 16730 раз оказано помощи

Ответ:

Общий ряд данных — это упорядоченный ряд всех значений  измерения, заключённых в промежутке от наименьшего  возможного до наибольшего возможного значений.

Пример. Пусть объект измерения знания по четвертным оценкам 3 учеников по пятибалльной системе (1, 2, 3, 4, 5). Тогда наименьшее  возможное значение — это 1, а  наибольшее возможное значение — это 5. Если оценки математике следующие:

4, 3, 5, 4

5, 5, 5, 5

5, 4, 4, 5

То, общим рядом данных измерений следующее:

3, 4, 4, 4, 4, 5, 5, 5, 5, 5, 5, 5

Дата публикации: 09 апреля 2017.

Урок и презентация на тему: «Математическая статистика, элементы статистики»

Дополнительные материалы
Уважаемые пользователи, не забывайте оставлять свои комментарии, отзывы, пожелания! Все материалы проверены антивирусной программой.


Скачать:
Математическая статистика, элементы статистики (PPTX)


Статистика, введение

Темой сегодняшнего урока будет математическая статистика.
Этот предмет занимается статистикой, используя различные математические методы. Математическая статистика — это самостоятельно развивающийся раздел математики, в котором существуют и свои уникальные способы решения различных задач.

Так чем же занимается и для чего нужна математическая статистика?
Предположим, что у учеников девятых классов измерили рост. Как представить полученные данные? Можно записать их в строчку друг за другом, можно разделить данные по классам, можно попробовать создать таблицу. Все эти способы довольно громоздки и неудобны. Будет сложно извлечь информацию из такого набора чисел. А теперь представьте, что измерили рост учеников девятых классов всех школ в городе. Количество измерений может перевалить за тысячу.
Математическая статистика занимается обработкой данных и представлением их в виде удобном для восприятия. Это только одна из задач статистики. Построение прогнозов и оценок; применение различных методов исследования; достоверность проведенных испытаний и многое другое — вот чем занимается статистика.

Как же обрабатывает информацию статистика?

  • Данные измерений упорядочивают и группируют.
  • Составляют таблицы распределений данных.
  • По таблицам строят графики распределений.
  • В итоге создается паспорт измерений, в котором собраны числовые характеристики полученной информации.

Давайте рассмотрим эти пункты.

Упорядочивание и группировка данных

Первое, что необходимо сделать при анализе данных, определить рамки, в которых находится исследователь. Выбираются наименьшее и наибольшее допустимые значения, которые могут не совпадать с полученными данными. Например, при измерении роста учеников, шансов, что кто-то будет ниже 140 сантиметров и выше 200 сантиметров очень мало. Если найдется такой вариант, то данные статистики можно подкорректировать.
При измерении роста могут получиться числа: 140,150,160,170,180,190,200 – это общий ряд данных, которые принято располагать в порядке возрастания. Общий ряд данных может быть и другим, например: 140,145,150,155,160,…,190,195,200. Как представить общий ряд данных зависит от конкретной задачи.

Пример. Составить общий ряд данных, включающих:
а) месяцы рождения одноклассников,
б) годов рождения родственников и друзей,
в) буквы, с которых начинается слово.
Решение.
а) Всего месяцев 12, если их перечислить по цифрам, то получим общий ряд: 1,2,3,4,5,6,7,8,9,10,11,12.
б) Шанс, что кто-то из родственников старше 100 лет — мал, а что, кто-то родился в этом году — есть. Тогда общий ряд годов рождения можно составить так: 1910,1911,1912,…, 2009,2010,2011,2012,2013,2014.
в) Слово может начинаться с любой буквы алфавита, кроме ь, ы, ъ. Тогда возможны 30 вариантов, если их представить численным рядом, то получим: 1,2,3,4,…,28,29,30.

Понятие «общий ряд» не является строгим, в примере б) мы могли начать ряд с 1900 года, ряд так же назывался «общим».

При проведении эксперимента данные из общего ряда могут не встретиться. Вернемся к нашему примеру б) и рассмотрим конкретный случай.
Вова назвал года рождения родственников: 1935,1937,1960,1965,1980,1981,1997,2005.
Общий ряд представлял собой последовательность: 1910,1911,1912,…,2009,2010,2011,2012,2013,2014.
У Вовы встретились конкретные измерения, которые называются «вариантой измерения».
Варианта измерения – это возможный вариант проведенного измерения.
Если все варианты измерений перечислить по порядку, то получится ряд данных измерения.
Для нашего примера составим таблицу:
Статистика

Пример. Выписать ряд, состоящий из букв, которые встречаются в словах: мама, папа, брат, сестра, бабушка, дедушка, тетя, дядя.
Решение. Ряд будет выглядеть так: а, б, д, е, к, м, п, р, с, т, у, ш, я. Встретились 13 букв из 33.
Некоторые буквы встречаются несколько раз, например, буква а – девять раз, другие – реже.

Определение. Если среди всех данных конкретного измерения одна из вариант встретилась ровно к раз, то число к называют кратностью измерения.
В этом примере буква а имеет кратность — 9.
Запишем кратности для каждой из букв:
Статистика

Далее варианты нужно сгруппировать. Создадим сгруппированный ряд данных:
а,а,а,а,а,а,а,а,а,б,б,б,д,д,д,д,е,е,е,к,к,м,м,п,п,р,р,с,с,т,т,т,т,у,у,ш,шя,я,я.
Число повторений каждой варианты равно кратности варианты.

Составление таблицы распределения данных

Таблица

Если сложить все кратности, получится количество всех данных измерения или объем измерения. Объем измерения равен количеству букв встречающихся в наших словах. Для проверки всегда складывают кратности, сумма должна равняться количеству элементов измерения.
Далее вычисляют частоту варианты.

Частота варианты=Кратность варианты/Объем измерения.

Составим таблицу частот измерений:
Частота изменений

Сумма всех частот всегда равна единице, так как это сумма всех дробей с одинаковым знаменателем, а сумма всех числителей как раз и равна знаменателю. Для удобства, часто переводят частоты в проценты от объема измерения. Составим таблицу еще одну таблицу, каждую частоту в новой строке помножим на 100.
Статистика

Графическое представление данных

Давайте построим графики функций распределения по таблицам. Договоримся, что вместо букв будем использовать цифры 1,2,3,…,13.
Тогда наша таблица примет вид:
Статистика

По оси абсцисс отложим цифры, соответствующие буквам, а по оси ординат – значения частот появления варианта. Графическое изображение имеющейся информации – график распределения частот.
Таблица значений:
Статистика
График распределения частот:
Статистика

График распределения частот также называют полигоном распределения.
Давайте построим график распределения частот процентов. Его тоже называют полигоном распределения процентов.
Таблица значений.
Статистика

Полигон распределения процентов:
Статистика

Даже не большая по объему данных задача, представляет собой довольно таки утомительную процедуру подсчета и составления таблиц и графиков распределений.

Числовые характеристики данных измерения

Наши данные обладают уникальными числовыми характеристиками. Давайте определим некоторые из них.

Разность между максимальной и минимальной вариантой называют размахом измерения.

На наших графиках — это область определения (разность крайнего правого значения и крайнего левого значения на оси абсцисс). В нашем примере размах равен $13-1=12$.
Варианта, которая встречается чаще других, называется модой. В нашем примере это буква а или число 1, в зависимости от обозначения.
Если у нас есть таблица распределения частот, то в строчке частот ищем наибольшее число, и смотрим, какому варианту оно соответствует. На графике, это точка в которой достигается максимальное значение.
Наиболее важная характеристика – среднее значение (среднее арифметическое или просто среднее).
Чтобы найти среднее значение нужно:
а) Просуммировать все данные измерения.
б) Полученную сумму разделить на количество вариантов.

Для нашего примера найдем среднее значение:

$frac{1*9+2*3+3*4+4*3+5*2+6*2+7*2+8*2+9*2+10*4+11*2+12*2+13*3}{40}=5,775$.

Среднее значение можно найти другим способом:
а) Каждую варианту умножить на ее частоту.
б) Сложить получившиеся значения.

Подсчитаем этим способом:
Статистика

1*0,225+2*0,075+3*0,1+4*0,075+5*0,05+6*0,05+7*0,05+8*0,05+9*0,05+10*0,1+11*0,05+12*0,05+13*0,075=5,775.

Давайте рассмотрим еще один пример.
На экзамене по математике 25 учеников 9 класса получили такие оценки:
5,4,3,3,5,4,3,3,4,4,5,5,2,2,5,5,5,3,3,4,5,5,4,3,2.
а) Составить общий ряд данных. Упорядочить и сгруппировать.
б) Составить таблицы распределения и распределения частот.
в) Построить графики распределения и распределения частот.
г) Найти среднее, моду, размах.
Решение.
Возможны такие оценки: 1,2,3,4,5 – общий ряд данных.
В нашем примере встречаются оценки: 2,3,4,5 – ряд данных, все числа в ряде – варианты измерений.
Составим сгруппированный ряд: 2,2,2,3,3,3,3,3,3,3,4,4,4,4,4,4,5,5,5,5,5,5,5,5,5.
б) Объем измерения равен 25, так как 25 оценок выставлено.
Составим таблицу:
Статистика

в) Нарисуем графики:
Полигон распределения данных:
Статистика

Полигон распределения частот:
Статистика

Полигон распределения частот процентов:
Статистика

Все графики похожи между собой, различия только в масштабе оси ординат.
г)Найдем среднее значение:
$2*0,12+3*0,28+4*0,24+5*0,36=0,24+0,84+0,96+1,8=3,81$.
Мода: чаще всего встречается оценка пять, она и будет модой.
Размах: $5-2=3$.

Задачи статистики для самостоятельного решения

1.На экзамене по математике 50 учеников 9 класса получили такие оценки:
5,3,4,4,5,4,3,2,4,3,5,1,2,3,5,4,5,3,3,4,5,5,4,3,1,3,4,5,4,3,2,2,1,4,4,5,5,4,4,5,3,3,3,2,1,5,4,3,2,5.
а) Составить общий ряд данных. Упорядочить и сгруппировать.
б) Составить таблицы распределения и распределения частот.
в) Построить графики распределения и распределения частот.
г) Найти среднее, моду, размах.

Общий ряд данных. Измерение. Общий ряд данных. Время проезда (мин). 10, 20, 30,…, 170, 180. Выпишем общий ряд данных в измерениях. 2) Год рождения ваших родственников и знакомых. 1) Месяц рождения учеников нашей школы. 4)Начальные буквы в первой строке стихотворения. 3)Годовой процент начислений по вкладам в банке. 2)1910, 1911, 1912,…, 2008, 2009, 2010, 2011. 1)1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12. 3)0,1; 0,2; 0,3;…;0,9; 1; 2; 3;…;14; 15. 4)1, 2, 3,… 28, 29, 30. Общий ряд данных — это ряд всех значений измерения, заключённых в промежутке от наименьшего возможного до наибольшего возможного значений

summa2.png


3. Графическое представление информации.
Распределение данных измерения рационально задавать в табличном виде. Однако нам известно, что и для функций есть табличный способ их задания. Таблицы являются связующим звеном. С их помощью осуществляется переход от распределения данных к функциям и графикам.

График распределения выборки является графическим представлением информации. Согласно табличным сведениям из примеров выше отметим точки, у которых абсциссы — это номер варианта, а ординаты — кратность. Соединяем отрезками полученные точки:

Пример:

polygon1.png

Получили многоугольник или полигон распределения данных. Собственно, polygon  и переводится как «многоугольник».

Чтобы представить большой объём информации в графическом виде, можно использовать гистограммы или столбчатые диаграммы.

Пример:

diagr_1.png 

gistogramma.png

4. Числовые характеристики данных измерения.

У любого из нас имеются не только данные о рождении, но и ряд иных свойств и качеств.

Такие измерения имеют свои числовые характеристики.

Размах измерения — это разность между максимальной и минимальной вариантами.

Мода измерения — вариант, который в измерении встречался чаще других.

Медиана — число, стоящее в середине сгруппированного ряда.

Среднее значение  — среднее арифметическое, или просто среднее.  Для нахождения среднего значения нужно:

1) вычислить сумму всех данных измерения;

2) полученную сумму разделить на количество данных.

Предыдущую тему
мы закончили обсуждением результатов
большого числа бросаний монеты. Число
бросаний было велико: оно составляло
несколько тысяч и даже десятков тысяч
раз. Выяснили, что с увеличением числа
бросаний монеты частота выпадения
«решки» становится практически
неотличимой от некоторой постоянной
величины – в данном случае, от 0,5.

Здесь мы впервые
встретились с одним из важнейших явлений
окружающей нас действительности –
явлением статистической устойчивости.

6.4.1 Группировка информации в виде таблиц

Знакомство с
элементами статистики начнем с конкретного
примера.

В девятых классах
«А» и «Б» измерили рост 50 учеников.
Получились следующие результаты:

162, 168, 157, 176, 185, 160,
162, 158, 181, 179,

164, 176, 177, 180, 181, 179,
175, 180, 176, 165,

168,
164, 179, 163, 160, 176, 162, 178, 164, 190,

181, 178, 168, 165, 176, 178,
185, 179, 180, 168,

160, 176, 175, 177, 176, 165,
164, 177, 175, 181.

Данные, собранные
в этом списке, являются наиболее полной
информацией о проведенном измерении.
К сожалению, эта информация трудно
«читается». Она не наглядна и занимает
много места. А представьте результаты,
состоящие не из 50 данных, а из 500, 5000 или
из миллионов различных чисел! Например,
число и размеры вкладов в Сбербанке
России за текущий год или данные о
производительности труда на предприятиях
какой-нибудь отрасли по всей стране,
результаты голосования по всем
избирательным пунктам и т. п.

Единственный
разумный выход – каким-то образом
преобразовать
первоначальные
данные, получить сравнительно небольшое
количество характеристик
начальной
информации и в дальнейшем оперировать
именно с этими, как правило, численными
характеристиками.
Одна из основных задач статистики как
раз и состоит в надлежащей обработке
информации.
Конечно,
у статистики есть много других задач:
получение и хранение информации,
выработка различных прогнозов, оценка
их достоверности и т. д. Ни одна из этих
целей не достижима без обработки данных.
Поэтому, первое, чем стоит заняться –
это статистическими методами обработки
информации. Для этого нам будут нужны
новые термины, принятые в статистике.

В
таблице 3 приведены основные термины
статистики. Мы будем использовать
термины из первого столбца. Термины из
третьего столбца могут встретиться вам
в других учебных пособиях или справочниках
по статистике.

Таблица 3

Новый термин

Простое описание

Более научный
термин

Определение

Общий
ряд данных

То,
откуда выбирают

Генеральная
совокупность

Множество
всех в принципе возможных результатов
измерения.

Выборка

То,
что выбрали

Статистическая
выборка, статистический ряд

Множество
результатов, реально полученных в
данном измерении

Варианта

Значение
одного из результатов измерения

Варианта

Одно
из значений элементов выборки

Ряд
данных

Значения
всех результатов измерения, перечисленные
по порядку

Вариационный
ряд

Упорядоченное
множество всех вариант

Вернемся
к примеру с измерением роста. С некоторым
запасом мы можем считать, что рост
девятиклассника находится в пределах
от 140 до 210 см. Значит, числа 140; 141; 142; …;
208; 209; 210 и образуют общий
ряд данных
этого
измерения. Подчеркнем, что определения
в статистике не носят такого же точного
характера, как, скажем, определения в
геометрии или алгебре. Например, от
добавления числа 139 к указанному множеству
оно не перестанет быть общим рядом
данных. Или же, рост можно было, в принципе,
измерять с точностью до миллиметров и
тогда общий ряд данных этого измерения
давали бы числа 140,0; 140,1; 140,2; …; 209,8; 209,9;
210,0.

Выборка
в нашем
случае – это данные реального измерения
роста, выписанные выше, варианта
это любое
из чисел выборки, а ряд
данных –
все
реальные результаты измерения, выписанные
в определенном порядке без повторений,
например, по возрастанию:

157; 158; 160; 162; 163; 164;
165; 168; 175; 176; 177; 178; 179; 180; 181; 185; 190.

Рассмотрим другие
примеры. Допустим, вы записываете номера
месяцев рождения своих однокурсников.
В таком случае общий ряд данных – это
числа от 1 до 12, варианты – это номера
месяцев рождения конкретных студентов
именно вашей группы, а ряд данных – это
все варианты, перечисленные по порядку.
В одной группе ряд данных – это 3, 4, 5, 7,
8, 10, 11. В другой группе может получиться
другой ряд данных. Например, 1, 2, 5, 6, 8, 9,
11, 12 и т. д.

Пример
2.
30 абитуриентов
на четырех вступительных экзаменах
набрали в сумме такие количества баллов
(оценки на экзаменах выставлялись по
пятибалльной системе): 20; 19; 12; 13; 16; 17; 15;
14; 16; 20; 15; 19; 20; 20; 15; 13; 19; 14; 18; 17; 12; 14; 12; 17;
18; 17; 20; 17; 16; 17. Составьте общий ряд данных,
выборку из результатов, стоящих на
четных местах и соответствующий ряд
данных.

Решение.
После получения двойки дальнейшие
экзамены не сдаются, поэтому сумма
баллов не может быть меньше 12 (12 – это
4 «тройки»). Значит, общий ряд данных
состоит из чисел 12; 13; 14; 15; 16; 17; 18; 19; 20.
Выборка состоит из 15 результатов 19; 13;
17; 14; 20; 19; 20; …, расположенных на четных
местах. Ряд данных – это конечная
возрастающая последовательность 13; 14;
17; 19; 20.

Перейдем
к дальнейшей обработке информации.
Составим таблицу из двух строк, в первой
из которых будет ряд данных. Каждая
варианта из этого ряда какое-то количество
раз реально наблюдалась в выборке. Это
количество называют кратностью
варианты.
Вот и поставим во вторую строку кратности
соответствующих вариант. Получим таблицу
распределения
выборки.
Вот как она выглядит в примере 1.

Варианта

13

14

17

19

20

Всего: 5 вариант

Кратность
варианты

2

3

6

2

2

Сумма = 15 (объем
выборки)

Если
сложить все кратности, то получится
количество всех произведенных при
выборке измерений – объем
выборки. В
данном случае объем выборки равен 15.

Далее,
при общей оценке данных выборки не очень
важно, что, например, варианта 14 имеет
кратность 3 из общего объема в 15 данных.
Удобнее сказать, что эта варианта
составляет
или 20% числа всех измерений. Так и
поступают, т. е. делят кратности вариант
на объем выборки и получаютчастоты
вариант.

.

Частоты
всех вариант удобно приписать третьей
строкой к уже составленной таблице.
Новую трехстрочную таблицу называют
таблицей
распределения частот выборки.
Вот
как это выглядит в примере 1. Обратите
внимание, что сумма частот равна 1, и так
бывает всегда.

Варианта

13

14

17

19

20

Всего:
5 вариант

Кратность
варианты

2

3

6

2

2

Сумма
= 15 (объем выборки)

Частота
варианты

Сумма
= 1

Иногда частоты
удобно измерять в процентах от общего
объема выборки. Тогда таблицу распределения
дополняют еще строкой частот в процентах.
Она получается из предыдущей строки
умножением на 100%.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

  • #
  • #
  • #
  • #
  • #
  • #
  • #
  • #
  • #
  • #
  • #

Понравилась статья? Поделить с друзьями:
  • Как найти таз святого yba
  • Как найду жена мусульманка
  • Как составить календарь прививок ребенку до года
  • Как перестать жалеть то чего не исправить
  • Как найти знахаря или знахарку