Как найти моду графика

В статистике есть целый набор показателей, которые характеризуют центральную тенденцию. Выбор того или иного индикатора в основном зависит от характера данных, целей расчетов и его свойств.

Что подразумевается под характером данных? Прежде всего, мы говорим о количественных данных, которые выражены в числах. Но набор числовых данных может иметь разное распределение. Под распределением понимаются частоты отдельных значений. К примеру, в классе из 23 человек 2 школьника написали контрольную работу на двойку, 5 – на тройку, 10 – на четверку и 6 – на пятерку. Это и есть распределение оценок. Распределение очень наглядно можно представить с помощью специальной диаграммы – гистограммы. Для данного примера получится следующая гистограмма.

Распределение оценок

Во многих случаях количество уникальных значений намного больше, а распределение похоже на нормальное. Ниже приведена примерная иллюстрация нормального распределения случайных чисел.

Нормальное распределение чисел

Итак, центральная тенденция. Если частоты анализируемых значений распределены по нормальному закону, то есть симметрично вокруг некоторого центра, то центральная тенденция определяется вполне однозначно – это есть тот самый центр, и математически он соответствует средней арифметической.

Как нетрудно заметить, в этом же центре находится и максимальная частота значений. То есть при нормальном распределении центральная тенденция есть не только средняя арифметическая, но и максимальная частота, которая в статистике называется модой или модальным значением.

Мода и среднее арифметическое при нормальном распределении

На диаграмме оба значения центральной тенденции совпадают и равны 10.

Но такое распределение встречается далеко не всегда, а при малом числе данных – совсем редко. Чаще бывает так, что частоты распределяются асимметрично. Тогда мода и среднее арифметическое не будут совпадать.

Мода и среднее арифметическое не совпадают

На рисунке выше среднее арифметическое по-прежнему составляет 10, а вот мода уже равна 9. Что в таком случае считать значением центральной тенденции? Ответ зависит от поставленных целей анализа. Если интересует уровень, сумма отклонений от которого равна нулю со всеми вытекающим отсюда свойствами и последствиями, то это средняя арифметическая. Если нужно максимально частое значение, то это мода.

Итак, зачем нужна мода? Приведу пару примеров. Экономист планово-экономического отдела обувной фабрики интересуется, какой размер обуви пользуется наибольшим спросом. Средний размер обуви, скорее всего, здесь не подойдет, тем более, что число может получится дробным. А вот мода – как раз нужный показатель.

Расчет моды

Теперь посмотрим, как рассчитать моду. Мода – это то значение в анализируемой совокупности данных, которое встречается чаще других, поэтому нужно посмотреть на частоты значений и отыскать максимальное из них. Например, в наборе данных 3, 4, 6, 7, 3, 5, 3, 4 модой будет значение 3 – повторяется чаще остальных. Это в дискретном ряду, и здесь все просто. Если данных много, то моду легче всего найти с помощью соответствующей гистограммы. Бывает так, что совокупность данных имеет бимодальное распределение.  

Двумодальное распределение

Без диаграммы очень трудно понять, что в данных не один, а два центра. К примеру, на президентских выборах предпочтения сельских и городских жителей могут отличаться. Поэтому распределение доли отданных голосов за конкретного кандидата может быть «двугорбым». Первый «горб» – выбор городского населения, второй – сельского.

Немного сложнее с интервальными данными, когда вместо конкретных значений имеются интервалы. В этом случае говорят о модальном интервале (при анализе доходов населения, например), то есть интервале, частота которого максимальна относительно других интервалов. Однако и здесь можно отыскать конкретное модальное значение, хотя оно будет условным и примерным, так как нет точных исходных данных. Представим, что есть следующая таблица с распределением цен.

Интервальные данные для расчета моды

Для наглядности изобразим соответствующую диаграмму.

Рисунок распределения интервальных данных

Требуется найти модальное значение цены.

Вначале нужно определить модальный интервал, который соответствует интервалу с наибольшей частотой. Найти его так же легко, как и моду в дискретном ряду. В нашем примере это третий интервал с ценой от 301 до 400 руб. На графике – самый высокий столбец. Теперь нужно определить конкретное значение цены, которое соответствует максимальному количеству. Точно и по факту сделать это невозможно, так как нет индивидуальных значений частот для каждой цены. Поэтому делается допущение о том, что интервалы выше и ниже модального в зависимости от своей частоты имеют разные вес и как бы перетягивают моду в свою сторону. Если частота интервала следующего за модальным больше, чем частота интервала перед модальным, то мода будет правее середины модального интервала и наоборот. Давайте еще раз посмотрим на рисунок, чтобы понять формулу, которую я напишу чуть ниже.

Мода на рисунке

На рисунке отчетливо видно, что соотношение высоты столбцов, расположенных слева и справа от модального определяет близость моды к левому или правому краю модального интервала. Задача по расчету модального значения состоит в том, чтобы найти точку пересечения линий, соединяющих модальный столбец с соседними (как показано на рисунке пунктирными линиями) и нахождении соответствующего значения признака (в нашем примере цены). Зная основы геометрии (7-й класс), по данному рисунку нетрудно вывести формулу расчета моды в интервальном ряду.

Формула моды имеет следующий вид.

Формула моды

Где Мо – мода,

x0 – значение начала модального интервала,

h – размер модального интервала,

fМо – частота модального интервала,

fМо-1 – частота интервала, находящего перед модальным,

fМо1 – частота интервала, находящего после модального.

Второе слагаемое формулы моды соответствует длине красной линии на рисунке выше.

Рассчитаем моду для нашего примера.

Расчет моды

Таким образом, мода интервального ряда представляет собой сумму, состоящую из значения начального уровня модального интервала и отрезка, который определяется соотношением частот ближайших интервалов от модального.

Расчет моды в Excel

В настоящее время большинство вычислений делается в MS Excel, где для расчета моды также предусмотрена специальная функция. В Excel 2013 я таких нашел ажно 3 штуки.

Мода в Excel

МОДА – пережиток старых изданий Excel. Функция оставлена для совмещения со старыми версиями.

МОДА.ОДН – рассчитывает моду по заданным значениям. Здесь все просто. Вставили функцию, указали диапазон данных и «Ок».

МОДА.НСК – позволяет рассчитать сразу несколько модальных значений (одинаковых максимальных частот) для одного ряда данных, если они есть. Функцию нужно вводить как формулу массива, перед этим выделив количество ячеек равное количеству требуемых модальных значений. Иногда действительно модальных значений может быть несколько. Однако для этих целей предварительно лучше посмотреть на диаграмму распределения. 

Моду для интервальных данных одной функцией в Excel рассчитать нельзя. То есть такая функция в готовом виде не предусмотрена. Придется прописывать вручную. 

Следующая статья посвящена медиане.

До встречи на statanaliz.info.

Поделиться в социальных сетях:

Точечные графики: как найти среднее значение, медиану и моду

  • Редакция Кодкампа

17 авг. 2022 г.
читать 2 мин


Точечный график — это тип графика, который отображает распределение значений в наборе данных с помощью точек.

По оси X показаны отдельные значения данных, а по оси Y — частота каждого значения.

В этом руководстве объясняется, как рассчитать среднее значение, медиану и режим точечной диаграммы.

Пример. Расчет среднего значения, медианы и режима точечной диаграммы

Предположим, у нас есть следующий точечный график, который показывает распределение значений для данного набора данных:

Чтобы вычислить среднее значение, медиану и моду для этого точечного графика, мы должны сначала записать значения для набора данных.

Например, мы видим, что значение «1» встречается четыре раза, значение «2» встречается три раза, значение «3» встречается один раз и так далее.

Мы можем записать следующие значения для этого набора данных:

Значения: 1, 1, 1, 1, 2, 2, 2, 3, 4, 5, 5, 6, 6, 6, 6, 7, 8, 10

Теперь мы можем вычислить среднее значение, медиану и моду.

Иметь в виду

Чтобы найти среднее значение этого набора данных, мы можем сложить все отдельные значения и разделить на общий размер выборки, равный 18:

Среднее = (1+1+1+1+2+2+2+3+4+5+5+6+6+6+6+7+8+10) / 18 = 4,22 .

Среднее значение получается 4,22.Это среднее значение набора данных.

медиана

Чтобы найти медиану этого набора данных, мы можем выписать все отдельные значения по порядку и определить значение, которое находится прямо посередине:

1, 1, 1, 1, 2, 2, 2, 3, 4 , 5 , 5, 6, 6, 6, 6, 7, 8, 10

Посередине два значения: 4 и 5. Таким образом, медиана — это среднее этих двух значений, равное 4,5.

Таким образом, медиана равна 4,5.Это значение находится прямо в середине набора данных.

Режим

Чтобы найти режим этого набора данных, мы можем определить значения, которые встречаются чаще всего:

1 , 1 , 1 , 1 , 2, 2, 2, 3, 4, 5, 5, 6 , 6 , 6 , 6 , 7, 8, 10

Этот набор данных имеет два режима: 1 и 6.Каждое из этих значений встречается в наборе данных четыре раза.

Дополнительные ресурсы

В следующих учебных пособиях представлена дополнительная информация о точечных диаграммах:

Точечный график и гистограмма: в чем разница?
Как найти центр и распространение точечной диаграммы

В следующих руководствах объясняется, как создавать точечные диаграммы с помощью различных программ:

Как создать точечный график в Google Sheets
Как создать точечный график в Excel
Как создать точечный график в R

Структурные
средние величины

Мода —
это наиболее часто встречающийся вариант
ряда. Мода применяется, например, при
определении размера одежды, обуви,
пользующейся наибольшим спросом у
покупателей. Модой для дискретного ряда
является варианта, обладающая наибольшей
частотой. При вычислении моды для
интервального вариационного ряда
необходимо сначала определить модальный
интервал (по максимальной частоте), а
затем — значение модальной величины
признака по формуле:Кроме степенных
средних в статистике для относительной
характеристики величины варьирующего
признака и внутреннего строения рядов
распределения пользуются структурными
средними, которые представлены ,в
основном, модой и медианой.

где:

 —
значение моды

 —
нижняя граница
модального интервала

 —
величина интервала

 —
частота модального
интервала

 —
частота интервала,
предшествующего модальному

 —
частота интервала,
следующего за модальным

Медиана
— это значение признака, которое
лежит в основе ранжированного ряда и
делит этот ряд на две равные по численности
части.

Для
определения медианы в дискретном
ряду при наличии частот сначала
вычисляют полусумму частот  ,
а затем определяют, какое значение
варианта приходится на нее. (Если
отсортированный ряд содержит нечетное
число признаков, то номер медианы
вычисляют по формуле:

Ме =
(n(число
признаков в совокупности)
 +
1)/2,

в
случае четного числа признаков медиана
будет равна средней из двух признаков
находящихся в середине ряда).

При
вычислении медианы для интервального
вариационного ряда сначала определяют
медианный интервал, в пределах которого
находится медиана, а затем — значение
медианы по формуле:

где:

 —
искомая медиана

 —
нижняя граница
интервала, который содержит медиану

 —
величина интервала

 —
сумма частот или
число членов ряда

 
сумма накопленных частот интервалов,
предшествующих медианному

 —
частота медианного
интервала

Пример.
Найти моду и медиану.

Возрастные
группы

Число
студентов

Сумма
накопленных частот ΣS

До
20 лет

346

346

20 —
25

872

1218

25
— 30

1054

2272

30 —
35

781

3053

35 —
40

212

3265

40 —
45

121

3386

45
лет и более

76

3462

Итого

3462

Решение:
В
данном примере модальный интервал
находится в пределах возрастной группы
25-30 лет, так как на этот интервал приходится
наибольшая частота (1054).

Рассчитаем
величину моды:

Это
значит что модальный возраст студентов
равен 27 годам.

Вычислим
медиану. Медианный интервал находится
в возрастной группе 25-30 лет, так как в
пределах этого интервала расположена
варианта, которая делит совокупность
на две равные части (Σfi/2
= 3462/2 = 1731). Далее подставляем в формулу
необходимые числовые данные и получаем
значение медианы:

Это
значит что одна половина студентов
имеет возраст до 27,4 года, а другая свыше
27,4 года.

Кроме
моды и медианы могут быть использованы
такие показатели, как квартили, делящие
ранжированный ряд на 4 равные части,
децили -10 частей и перцентили — на 100
частей.

Определение
моды и медианы графическим методом

Моду
и медиану в интервальном ряду можно
определить графически
.
Мода определяется по гистограмме
распределения. Для этого выбирается
самый высокий прямоугольник, который
является в данном случае модальным.
Затем правую вершину модального
прямоугольника соединяем с правым
верхним углом предыдущего прямоугольника.
А левую вершину модального прямоугольника
– с левым верхним углом последующего
прямоугольника. Из точки их пересечения
опускаем перпендикуляр на ось абсцисс.
Абсцисса точки пересечения этих прямых
и будет модой распределения (рис.
5.3). 
 
Рис.
5.3. Графическое определение моды по
гистограмме. 
 
Рис.
5.4. Графическое определение медианы по
кумуляте 
Для
определения медианы из точки на шкале
накопленных частот (частостей),
соответствующей 50 %, проводится прямая,
параллельная оси абсцисс до пересечения
с кумулятой. Затем из точки пересечения
опускается перпендикуляр на ось абсцисс.
Абсцисса точки пересечения является
медианой.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

  • #
  • #
  • #
  • #
  • #
  • #
  • #
  • #
  • #
  • #
  • #


Загрузить PDF


Загрузить PDF

В статистике модой во множестве чисел называется число, которое встречается в этом множестве наиболее часто. Мод может быть несколько: если в наборе данных одинаково часто встречаются два или больше разных числа, его называют соответственно бимодальным или мультимодальным — иными словами, все значения, встречающиеся максимальное число раз, образуют моды данного множества. В данной статье описано, как найти моду (моды) множества.

  1. Изображение с названием Find the Mode of a Set of Numbers Step 1

    1

    Запишите числа множества. Моду обычно определяют на наборе статистических данных или множестве численных значений. Таким образом, для нахождения моды вам понадобится набор чисел. Моду сложно определить в уме, если чисел достаточно много, поэтому в большинстве случаев лучше записать все числа или набрать их на компьютере. Если у вас есть карандаш и бумага, достаточно записать все числа. Если же вы работаете за компьютером, удобнее использовать Excel.

    • Метод определения моды легче понять на примере. Рассмотрим в данном разделе следующий набор чисел: {18, 21, 11, 21, 15, 19, 17, 21, 17}. В приведенных ниже шагах мы найдем моду этого множества.
  2. Изображение с названием Find the Mode of a Set of Numbers Step 2

    2

    Расположите числа в порядке возрастания. После того как вы выпишете все числа, полезно переписать их в порядке возрастания. Хотя можно обойтись и без этого, так найти моду будет проще, поскольку одинаковые числа расположатся рядом. Для больших наборов данных это просто необходимо, так как попытка просмотреть неупорядоченный список и подсчитать, сколько раз каждое число появляется в нем, довольно трудоемка и может привести к ошибкам.

    • Если вы используете карандаш и бумагу, переписывание поможет вам сэкономить время в дальнейшем. Просмотрите числа, найдите наименьшее значение, вычеркните его из первоначального множества и занесите в новый список. Повторите то же самое для второго, затем для третьего наименьшего числа и так далее, при этом записывайте каждое число столько раз, сколько оно встречается в исходном наборе данных.
    • Компьютер предоставляет больше возможностей — например, в большинстве программ для работы с электронными таблицами можно упорядочить список значений от наименьшего к наибольшему всего лишь несколькими щелчками мыши.
    • В нашем примере после упорядочения получаем следующую последовательность чисел: {11, 15, 17, 17, 18, 19, 21, 21, 21}.
  3. Изображение с названием Find the Mode of a Set of Numbers Step 3

    3

    Подсчитайте, сколько раз повторяется каждое число. После того как вы перепишете значения в порядке возрастания, подсчитайте, сколько раз встречается каждое число. Поищите число, которое чаще всего попадается в списке. Если чисел сравнительно немного и они расположены в порядке возрастания, это довольно просто: найдите самую большую группу одинаковых значений и подсчитайте, сколько раз они повторяются.

    • Если вы используете карандаш и бумагу, попробуйте записать над каждой группой одинаковых чисел, сколько раз они повторяются. Если вы пользуетесь компьютерной программой для работы с электронными таблицами, можно поступить подобным образом: запишите результаты подсчетов в соседние ячейки или используйте одну из опций для анализа данных.
    • В нашем списке ({11, 15, 17, 17, 18, 19, 21, 21, 21}) 11 и 15 встречаются по одному разу, 17 попадается дважды, 18 и 19 встречаются по одному разу, а 21 встречается три раза. Таким образом, в данном наборе значений чаще всего встречается число 21.
  4. Изображение с названием Find the Mode of a Set of Numbers Step 4

    4

    Определите значение (или значения), которые встречаются наиболее часто. После того как вы подсчитаете, сколько раз встречается каждое число, найдите значения, которые повторяются наибольшее количество раз. Это и есть мода данного множества. Помните, что набор чисел может иметь не одну, а несколько мод. Если в множестве наиболее часто встречаются два числа (то есть они повторяются одинаковое количество раз), такое множество называют бимодальным, если три числа — тримодальным и так далее.

    • В нашем множестве ({11, 15, 17, 17, 18, 19, 21, 21, 21}) наиболее часто встречается значение 21, поэтому 21 является модой.
    • Если бы кроме 21 нашлось еще одно число, которое также встречается три раза, (например, если бы множество включало еще одно число 17), то оно наряду с 21 было бы модой.
  5. Изображение с названием Find the Mode of a Set of Numbers Step 5

    5

    Не путайте моду множества чисел с его средним значением и медианой. При статистическом анализе часто рассматривают вместе такие понятия, как среднее значение, медиана и мода. Их легко спутать, так как они имеют схожие названия и иногда их значения совпадают. Однако независимо от того, совпадает или нет мода множества с его медианой или средним значением, следует помнить, что это три абсолютно разных понятия (смотрите ниже).

    • Чтобы найти среднее значение множества, следует сложить все числа и поделить на их количество. Для нашего примера ({11, 15, 17, 17, 18, 19, 21, 21, 21}) среднее значение составляет 11 + 15 + 17 + 17 + 18 + 19 + 21 + 21 + 21 = 160/9 = 17,78. Мы поделили сумму значений на 9, поскольку данное множество состоит из 9 чисел.

      Изображение с названием Find the Mode of a Set of Numbers Step 5Bullet1

    • Медиана представляет собой «среднее число», которое разделяет меньшие и бо́льшие значения множества на две равные половины. Например, для нашего набора значений ({11, 15, 17, 17, 18, 19, 21, 21, 21}) медианой является число 18, так как слева и справа от него стоит по четыре числа. Учтите, что если множество содержит четное количество чисел, оно не имеет единственной медианы. В этом случае медианой обычно считают среднее значение тех двух чисел, которые расположены посередине.

      Изображение с названием Find the Mode of a Set of Numbers Step 5Bullet2

    Реклама

  1. Изображение с названием Find the Mode of a Set of Numbers Step 6

    1

    Множество не имеет моды, если каждое значение встречается в нем одинаковое число раз. Если все значения в данном наборе чисел попадаются одинаковое количество раз, то у этого множества нет моды, поскольку ни одно число не встречается чаще, чем любое другое. Например, моды не имеют те множества, в которые каждое число входит по одному разу. Это же касается тех множеств, в которых каждое число встречается дважды, трижды и так далее.

    • Если мы изменим набор чисел в нашем примере на {11, 15, 17, 18, 19, 21}, так чтобы каждое значение встречалось лишь один раз, то он не будет иметь моды. То же верно и для множества, в котором все числа встречаются дважды, например {11, 11, 15, 15, 17, 17, 18, 18, 19, 19, 21, 21}.
  2. Изображение с названием Find the Mode of a Set of Numbers Step 7

    2

    Помните, что моду нечислового набора данных можно определить точно так же, как для числовых множеств. Как правило, большинство наборов данных являются «количественными», то есть содержат данные в виде чисел. Тем не менее встречаются и такие множества, члены которых выражены не в виде чисел. В таких случаях можно сказать, что «мода» — это то значение, которое встречается чаще всего в наборе данных (как и для числовых множеств).[1]
    При этом определить моду будет возможно, в то время как медиану или среднее значение — нельзя.

    • Предположим, при осмотре небольшого участка земли определили вид каждого растущего на нем дерева. Получился следующий список: {кедр, ольха, кедр, сосна, кедр, кедр, ольха, ольха, сосна, кедр}. Такой набор данных называют номинальным, поскольку входящие в него члены представляют собой названия. В этом случае модой является кедр, так как данное слово встречается чаще других (пять раз), в то время как ольха и сосна встречаются соответственно три и два раза.
    • В рассмотренном выше примере невозможно найти среднее значение и медиану, так как набор данных содержит не числа, а названия.
  3. Изображение с названием Find the Mode of a Set of Numbers Step 8

    3

    При одномодальном симметричном распределении мода, среднее значение и медиана совпадают. Как отмечалось выше, в некоторых случаях мода, медиана и/или среднее значение могут совпадать. В частности, если плотность распределения того или иного набора данных образует идеально симметричную кривую с одной модой (например, гауссиану или колоколообразную кривую), мода, среднее значение и медиана равны друг другу. Плотность распределения отображает относительную частоту определенных значений, поэтому мода будет находиться точно посередине симметричной кривой распределения, так как эта самая высокая точка на графике соответствует наиболее распространенному значению. Поскольку набор данных симметричен, эта точка на графике будет соответствовать также медиане (центральной точке в наборе данных) и среднему значению.

    • В качестве примера рассмотрим набор чисел {1, 2, 2, 3, 3, 3, 4, 4, 5}. Если мы отложим эти значения на графике, то получим симметричную кривую, которая достигает максимальной высоты 3 при x = 3 и опускается до 1 при x = 1 и x = 5. Значение 3 встречается чаще всего, поэтому оно является модой. Так как 3 расположено в центре и по обе стороны от него находится четыре числа, оно является также медианой. И наконец, среднее значение данного множества составляет 1 + 2 + 2 + 3 + 3 + 3 + 4 + 4 + 5 = 27/9 = 3, то есть число 3 является также средним значением.
    • Исключение из этого правила составляют симметричные множества с более чем одной модой — они имеют по одной медиане и среднему значению, с которыми не совпадают несколько мод.

    Реклама

Советы

  • Набор данных может иметь несколько мод.
  • Если все числа встречаются лишь по одному разу, множество не имеет моды.

Реклама

Что вам понадобится

  • Бумага, карандаш и ластик

Об этой статье

Эту страницу просматривали 47 353 раза.

Была ли эта статья полезной?

Понравилась статья? Поделить с друзьями:
  • Как найти молярную массу смеси двух газов
  • Как найти красивую девушку вконтакте
  • Как найти разрешения приложений на айфон
  • Как найти ходячий сундук
  • Как составить план конспект домашней работы