Медианный представитель в статистике как найти

Содержание

  1. Медиана в статистике: понятие, свойства и расчет
  2. Глава 8. Статистика и вероятность (стр. 2 )
  3. 6 1O+m 15 12
  4. Средний банповсний процент
  5. Медиана
  6. После:
  7. Медиана в статистике: понятие, свойства и расчет
  8. Среднее значение
  9. Пример из практики
  10. Медиана
  11. Пример из практики
  12. Пример из практики
  13. Подробнее о среднем значении
  14. Связанные понятия
  15. Упоминания в литературе
  16. Формула медианы
  17. Расчет медианы в Excel
  18. Определение моды и медианы по несгруппированным данным
  19. Определение моды по дискретному вариационному ряду
  20. Определение моды и медианы графическим методом
  21. Неуникальность значения
  22. Как найти медиану чисел
  23. Область применения медианы
  24. Пример использования
  25. Неуникальность значения
  26. Советы

Для того чтобы иметь представление о том или ином явлении, мы часто используем средние величины. Их применяют для того, чтобы сравнивать уровень зарплат в различных отраслях экономики, температуру и уровень осадков на одной и той же территории за сопоставимые периоды времени, урожайность выращиваемых культур в разных географических регионах и т. д. Впрочем, средняя является отнюдь не единственным обобщающим показателем – в ряде случае для более точной оценки подходит такая величина как медиана. В статистике она широко применяется в качестве вспомогательной описательной характеристики распределения какого-либо признака в отдельно взятой совокупности. Давайте разберемся, чем она отличается от средней, а также чем вызвана необходимость ее использования.

Медиана в статистике: определение и свойства

Представьте себе следующую ситуацию: на фирме вместе с директором работают 10 человек. Простые работники получают по 1000 грн., а их руководитель, который, к тому же, является собственником, — 10000 грн. Если вычислить среднее арифметическое, то получится, что в среднем зарплата на данном предприятии равна 1900 грн. Будет ли справедливым данное утверждение? Или возьмем такой пример, в одной и той же больничной палате находится девять человек с температурой 36,6 °С, и один человек, у которого она равна 41 °С. Арифметическое среднее в этом случае равно: (36,6*9+41)/10 = 37,04 °С. Но это вовсе не означает, что каждый из присутствующих болен. Все это наталкивает на мысль, что одной средней часто бывает недостаточно, и именно поэтому в дополнение к ней используется медиана. В статистике этим показателем называют вариант, который расположен ровно посередине упорядоченного вариационного ряда. Если посчитать ее для наших примеров, то получится соответственно 1000 грн. и 36,6 °С. Другими словами, медианой в статистике называется значение, которое делит ряд пополам таким образом, что по обе стороны от нее (вниз или вверх) расположено одинаковое число единиц данной совокупности. Из-за этого свойства данный показатель имеет еще несколько названий: 50-й перцентиль или квантиль 0,5.

Как найти медиану в статистике

Способ расчета данной величины во многом зависит от того, какой тип вариационного ряда мы имеем: дискретный или интервальный. В первом случае, медиана в статистике находится довольно просто. Все, что нужно сделать, это найти сумму частот, разделить ее на 2 и затем прибавить к результату ½. Лучше всего будет пояснить принцип расчета на следующем примере. Предположим, у нас есть сгруппированные данные по рождаемости, и требуется выяснить, чему равна медиана.

Источник

Глава 8. Статистика и вероятность (стр. 2 )

Из за большого объема этот материал размещен на нескольких страницах:
1 2 3 4

С помощью среднего арифметического часто удобно ре — шать задачи на концентрации веяких раетворов, етоль нелю — бимые школьниками.

Задача 201. В 6 литров 10-процентного раетвора киелоты до — бавили 15-процентный раетвор той же киелоты. В резуль — тате получился 12-процентный раетвор. Сколько литров второго раетвора добавили?

Решение. Получившаяся концентрация 12% — это среднее арифметичеекое концентраций обоих раетворов. Примем объем второго раствора за т литров. Тогда

6 1O+m 15 12

В числителе — «еумма всех концентраций» . А в знамена — теле — общее число литров. Результат — среднее 12. Оста— лось решить уравнение:

— 6 -10 + z 15 = 12(6 + z); 3z = 12; т = 4.

Средняя спорость (среднее гармоничеспое)

Задаяа 202. Автомобиль проехал от города до деревни со сред — ней скоростью 40 км/ч, а обратный путь он проделал со средней скоростью 60 км/ч. Какова средняя екороеть ав — томобиля?

Ножечонпе. Сначала нужно понять, что мы считаем сред — ней скоростью. Разумно считать средней ту постоянную скорость, при которой автомобиль затратил бы на весь путь то же время, что он затратил в действительности.

іЭта задача вызывает много трудностей. Большинство старшекласеников дают ответ 50 км/ч, хотя в учебниках шестого или седьмого класса такие задачи разбираютея подробно. Забыли?

Решение. Обозначим вееь путь N км. Время, затраченное на

путъ в деревню, равно

Значит, средняя екороеть равна

_ 21 _ 2 = 48 (км/ч).

Как видим, расстояние роли не играет. Но ведь получилось не среднее арифметическое. Число 2 или, что то же

называется средним гармоническим чисел о и

6. Заметим, что ви о, ни b не должвы равняться нулю.

Средний банповсний процент

Банк А обещает 9 процентов годовых (см. главу 2) в пер — вый год, а во второй год, если клиент не забирает вклад, пpo — центная ставка повышается до 11% . Начисление процентов производится раз в год.

Банк Б также начисляет проценты раз в год, но процент- ная ставка по вкладу не меняется — всегда 10% .

Задача 203. В какой банк выгоднее поместить вклад сроком

Решение. Узваем, чему равна средняя ставка в банке А. Первый год вклад умножится на b, = 1,09, а во второй год

на # = 1,11. Значит, за два года вклад вырастет в b-,

= 1,09- 1,11 = 1,2099 раз. іЭто то же самое, как если бы банк А каждый год умножал вклад на 1,23009 = 1,09995, то есть

давал бы ставку 9,995% . іЭто чуть меньше, чем 10% . Та — ким образом, можно немножко выиграть, если положить деньги в бавк Б.

Обратили ли вы внимание на появление среднего значе — ния? Для двух положительных чисел о и b величина ab называется средним геометрическим.

и медианный представитель

Медиана — еще один пример чиелового среднего. Опреде — ление медианы следующее.

Число in называется медиавой числового вабора, если в ваборе хотя бы половина яисел ве мевьвіе in и хотя бы поло — вина яисел ве больте in.

Задача 204. Найти медиану набора 1; 2; 4; 5; 7; 8; 8.

Решение. Чиела уже упорядочены. Beero их 7. Значит, ме — дианой будет +серединное» число 5. Ровно четыре чиела не больше 5 (это чиела 1, 2, 4 и еамо чиело 5). И ровно четыре чиела не меньше 5 (само чиело 5, а также вее поеледующие чиела 7, 8 и 8).

Задаяа 205. Найти медиану набора чиеел —0,3; —2; 1; 0; 0,3;

Решение. Сначала чиела нужно упорядочить:

—1; —2; —0,3; —0,2; 0; 0,1; 0,3; 1; 1,2; 1,2.

Beero чиеел 10. Одного чиела, етоящего посередине, нет. Не беда — возьмем два. ІЗто числа 0 и 0,1 Медианой будет любое из них, а также любое чиело, раеположенвое между ними. Таким образом, медиан может быть мвого. Обычно в качестве медианы берут среднее арифметическое двух ce-

рединных чиеел: 0+0,1 = 0,05.

Но, повторим, можно взять и 0, или 0,1 или 0,03 и т. п.

Статистики — люди с фантазией. Они умеют при необходимости скрещи — вать разные средние между собой. Например, можно брать не медиану — середину упорядоченного ряда, а, скажем, медиану первой половины (пер — вую квартиль). Или третью квартиль. А можно сначала отбросить первую и последнюю четверть значений и взять среднее арифметическое оставшихся значений и т. п.

Медиана выгодно отличается от среднего арифметичеекого тем, что определяетея ередними по величине чиелами в наборе и не зависит от еамых больших и сампіх малпіх. Говорят, что i38

медиана устойчива относительво выбросов. Почему это вы — годно? Потому что самые большие и самые малые числа часто бывают невадежными наблюдевиями. Например, это могут быть ошибочные значения. Или не ошибочные, а просто силь — во выдающиеся.

Задача 206. В таблице представлены данные о среднем pacxo — де (сбросе воды в Мировой океан)’ тринадцатью крупней — шимиреками.

а) Найдите среднее арифметическое данных.

6) Найдите медиану данных.

в) Найдите медианного представителя (реку, соответст — вующую медиане).

г) Какое из этих найденных средних лучше описывает средний расход крупной реки?

Решение. в) Сложим все данные о расходе и разделим на

13. Получим приблизительно 37 646, 15 куб. м/с.

Считается средний объем воды, проходящий за секунду через устье реки в течение периода наблюдений.

6) Упорядочим даннъіе:

13600, 13600, 16000, 16200, ITIOO, 18600, 19200,

Медианой является 7-е по счету значение в этом ряду:

г) Медианный представитель нашелся. Медианный пред — ставитель найдется всегда (ведь мы помним, что медиа — ну можно брать по-разному). А вот «представителя среднего арифметического» в таблице нет. И даже близ — кого ничего нет. Нет реки с расходом, близким к 38 000 куб. м/с. Среднее арифметическое в данном слу — чае ничего не описьtвает. В данном случае это неудач — ный описательный показатель. Пато медиана действи— тельно дает представление о расходе воды в типичной крупной реке.

Ответ: в) 37 646,15; 6) 19 200; в) fiрахмалутра; г) Медиана.

Медиана и среднее в этой задаче сильно отличаются из-за того, что есть выброс — значение, резко отличающееся от ос — тальных. Этo не ошибка. Амазонка действительно в 10 с лиш — ним раз полноводнее самой полноводной из прочих рек. Но это ничего не меняет — Амазонка нетипична. Лучше ее вы— бросить из рассмотрения, если речь идет не о рекордах, а о ти — пичных реках. Среднее арифметическое с этим не справляет — ся. А медиана подходит — она устойчивая.

На свойстве устойчивости медианы основано восстановление старых фото и фильмов. Например, нужно быстро удалить со старой фотографии мно — жество мелких царапин и черных точек. Отсканируем фото, разобьем все изображение на множество маленьких квадратиков и каждому квадратику сопоставим число — степень насыщенности цветом. Например, от 0 (нет цвета) до 255 (полная насыщенность). Теперь если в каждом квадрате за — менить насыщенность медианой насыщенности девяти квадратиков (его самого и восьми соседних), то. повреждения исчезнут. Изображение ста — нет чуть размытым, но целым. Теперь можно попробовать восстановить четкость изображения. Но это уже совсем другая математика.

После:

Рис. Meduoпнoя фклsтрация восстановияа фото кота

Источник

Среднее значение

Часто так называют среднеарифметическое значение выборки (или множества чисел). Это, пожалуй, самый распространенный термин, из вышеперечисленных трех. Хотя бы потому, что почти каждый день мы слышим это слово в СМИ. Значение его тоже объясняет само название. Тем не менее, для тех, кому непонятен смысл этого слова, объясним “на пальцах”.

Это сумма данных чисел, деленное на количество. Если написать в виде формулы, это выглядит так.

Здесь $bar$ – среднее арифметическое значение. Если у Вас имеется $5$ чисел $<10, 12, 5, 20, 8>$, то их сумма будет $10+12+3+20+8=55$ . Так как количество равно $5$, то делим $55:5=11$. Это и есть среднеарифметическое значение.

Пример из практики

Допустим, у вас есть магазин, и вы торгуете чем то. В день, выручка составляет от $600$ до $1,200$ у.е. По итогам месяца вы наторговали на сумму $30,000$ у.е. Если условное количество дней в месяце $30$, значит, ваша средняя ежедневная выручка составляет $1,000$ у.е. ($30000:30 = 1000$).

Медиана – число, характеризующее выборку, т.е. если взять все элементы множества, то это число ровно делит множество пополам. Одна половина множества равна или больше этого число, а другая меньше или равна этому числу.

Объясним это на примере. Допустим, дано следующее множество: $<2, 5, 10, 8, 7>$. Здесь число $7$ делит это множество пополам. $2$ и $5$ меньше, а $10$ и $8$ больше этого числа. Для удобства нахождения медианы сначала нужно отсортировать выборку в возрастающем или убывающем порядке $<2, 5, 7, 8, 10>$. Тогда элемент, стоящий ровно посередине, будет медианой. Как видите, это число $7$.

А как быть, если во множестве четное количество чисел? Например $<2, 5, 6, 8, 10, 15>$. Тогда берем среднеарифметическое значение двух чисел, которые стоят посередине. У нас эти числа $6$ и $8$. Значит $(6+8):2=14:2=7$. Среднее значение этих двух чисел, а значит медиана равна $7$.

Пример из практики

Допустим, в стране $1%$ взрослого населения зарабатывает $1$ млн. у.е. в год (может быть больше, но для примера ограничимся этим числом), $10%$ населения зарабатывает по $20,000$ у.е. в год. Остальные живут за чертой бедности, зарабатывая всего $100$ у.е. в год. Тогда, несмотря на большие заработки $11%$ населения, медиана все равно будет равна $100$ у.е. Потому что подавляющее большинство получает всего $100$ у.е. в год. Теперь вычислим среднее значение.

$1%$ получает $1,000,000$ у.е. = $1 cdot 1,000,000 = 1,000,000$ у.е.
$10%$ получают $20,000$ у.е. = $10 cdot 20,000 = 200,000$ у.е.
$89%$ получают $100$ у.е. = $89 cdot 100 = 8,900$ у.е.

Значит, среднее значение в год составляет

$(1,000,000 + 200,000 + 8,900) : 100 = 1,208,900 : 100 = 12,089$ у.е.

Зная соотношение неработающих людей, на каждого работающего, и поделив полученное на это число, получим доход на душу населения (с учетом детей, стариков и больных без пенсии).

Итак, такая статистика показывает, что народ живет припеваючи, зарабатывая примерно 1,000 у.е. в месяц, а действительность другая. Как раз, так и вычисляется доход на душу населения. Берется национальный доход и делится на численность населения. Теперь вы понимаете, почему в сводках всегда называют эту цифру, потому что она никоим образом не отображает благосостояние большинства, а только является показателем экономического благосостояния страны.

Название этого термина само говорит за себя. Это значение, которое больше всего встречается в выборке. Чего больше, то и “в моде”. Например, посмотрим множество $<5, 3, 1, 3, 7, 5, 3, 10>$. В этом множестве больше всего встречается число $3$. Это число является модой данного множества. Если выборка имеет несколько мод, т.е. несколько часто встречающихся элементов, число повторений которых равно, то эта выборка мультимодальна. Например, рассмотрим множество $<1, 3, 10, 3, 1, 2>$. Здесь числа $1$ и $3$ встречаются больше всех. В статистике мода применяется больше по отношению к нечисловым данным.

Пример из практики

Если постоять на проспекте и в течение 10 минут и посчитать все проезжающие автомобили и классифицировать их по цветам, то можно определить моду для цвета автомобилей этого города. Допустим, насчитали 95 белых, 45 черных, 12 красных, 38 серых и 70 других цветов. Значит, модой в этом городе являются автомобили белого цвета. Это хорошая информация для дистрибьюторов автомобилей.

Подробнее о среднем значении

Иногда вычисляют среднее значение для группы данных. Тогда значения разбивают на группы и вычисляют серединную точку каждой группы. Затем эти значения умножают на количество членов каждой группы (на частотность) и складывают. А результат делят на общее количество. Такое значение называют средним значением группы. Посмотрите на этот пример:

Группа Частота Середина
1-20 5 10.5
21-40 25 30.5
41-60 37 50.5
61-80 23 70.5

Здесь середина вычисляется таким образом: $(20+1):2 = 10.5, (40+21):2 = 30.5$, и т.д.

Умножаем эти значения на частоты и складываем, затем делим на общее количество:

Как уже показали на примере с доходом населения, экстремумы сильно влияют на среднеарифметическое значение, поэтому иногда полезно их отбрасывать. Тогда среднее значение называется урезанным средним.

Иногда среднее значение вычисляется для дихотомных данных (когда члены множества принимают два значения) используя $0-1$ кодировку. Например, если из $10$ людей $6$ мужчин и $4$ женщины, то обозначив мужчин числом $1$, а женщин числом $0$, можно найти процент мужчин, вычисляя среднее значение.

В симметричном распределении (типа нормального распределения ) среднее значение, медиана и мода равны или близки друг другу. В асимметричном же, они отличаются, и число, на которое отличаются эти показатели, дают информацию о “скошенности” распределения относительно нормального.

Надеемся, что нам удалось “на пальцах” объяснить значение терминов среднеарифметическое значение, медиана и мода.

Связанные понятия

Упоминания в литературе

Формула медианы в статистике для дискретных данных чем-то напоминает формулу моды. А именно тем, что формулы как таковой нет. Медианное значение выбирают из имеющихся данных и только, если это невозможно, проводят несложный расчет.

Первым делом данные ранжируют (сортируют по убыванию). Далее есть два варианта. Если количество значений нечетно, то медиана будет соответствовать центральному значению ряда, номер которого можно определить по формуле:

Me – номер значения, соответствующего медиане,

N – количество значений в совокупности данных.

Тогда медиана обозначается, как

Это первый вариант, когда в данных есть одно центральное значение. Второй вариант наступает тогда, когда количество данных четно, то есть вместо одного есть два центральных значения. Выход прост: берется средняя арифметическая из двух центральных значений:

В интервальных данных выбрать конкретное значение не представляется возможным. Медиану рассчитывают по определенному правилу.

Для начала (после ранжирования данных) находят медианный интервал. Это такой интервал, через который проходит искомое медианное значение. Определяется с помощью накопленной доли ранжированных интервалов. Где накопленная доля впервые перевалила через 50% всех значений, там и медианный интервал.

Не знаю, кто придумал формулу медианы, но исходили явно из того предположения, что распределение данных внутри медианного интервала равномерное (т.е. 30% ширины интервала – это 30% значений, 80% ширины – 80% значений и т.д.). Отсюда, зная количество значений от начала медианного интервала до 50% всех значений совокупности (разница между половиной количества всех значений и накопленной частотой предмедианного интервала), можно найти, какую долю они занимают во всем медианном интервале. Вот эта доля аккурат переносится на ширину медианного интервала, указывая на конкретное значение, именуемое впоследствии медианой.

Обратимся к наглядной схеме.

Немного громоздко получилось, но теперь, надеюсь, все наглядно и понятно. Чтобы при расчете каждый раз не рисовать такой график, можно воспользоваться готовой формулой. Формула медианы имеет следующий вид:

где xMe — нижняя граница медианного интервала;

iMe — ширина медианного интервала;

∑f/2 — количество всех значений, деленное на 2 (два);

S(Me-1)— суммарное количество наблюдений, которое было накоплено до начала медианного интервала, т.е. накопленная частота предмедианного интервала;

fMe — число наблюдений в медианном интервале.

Как нетрудно заметить, формула медианы состоит из двух слагаемых: 1 – значение начала медианного интервала и 2 – та самая часть, которая пропорциональна недостающей накопленной доли до 50%.

Для примера рассчитаем медиану по следующим данным.

Требуется найти медианную цену, то есть ту цену, дешевле и дороже которой по половине количества товаров. Для начала произведем вспомогательные расчеты накопленной частоты, накопленной доли, общего количества товаров.

По последней колонке «Накопленная доля» определяем медианный интервал – 300-400 руб (накопленная доля впервые более 50%). Ширина интервала – 100 руб. Теперь остается подставить данные в приведенную выше формулу и рассчитать медиану.

То есть у одной половины товаров цена ниже, чем 350 руб., у другой половины – выше. Все просто. Средняя арифметическая, рассчитанная по этим же данным, равна 355 руб. Отличие не значительное, но оно есть.

Медиану для числовых данных легко найти, используя функцию Excel, которая так и называется — МЕДИАНА. Другое дело интервальные данные. Соответствующей функции в Excel нет. Поэтому нужно задействовать приведенную выше формулу. Что поделаешь? Но это не очень трагично, так как расчет медианы по интервальным данным – редкий случай. Можно и на калькуляторе разок посчитать.

Напоследок предлагаю задачку. Имеется набор данных. 15, 5, 20, 5, 10. Каково среднее значение? Четыре варианта:

Мода, медиана и среднее значение выборки – это разный способ определить центральную тенденцию в выборке.

Рассмотрим определение моды и медианы по несгруппированным данным. Предположим, рабочие бригады, состоящей из 9 человек, имеют следующие тарифные разряды: 4 3 4 5 3 3 6 2 6 . Так как в данной бригаде больше всего рабочих 3-го разряда, этот тарифный разряд будет модальным. Mo = 3.
Для определения медианы необходимо провести ранжирование: 2 3 3 3 4 4 5 6 6 . Центральным в этом ряду является рабочий 4-го разряда, следовательно, данный разряд и будет медианным. Если ранжированный ряд включает четное число единиц, то медиана определяется как средняя из двух центральных значений.
Если мода отражает наиболее распространенный вариант значения признака, то медиана практически выполняет функции средней для неоднородной, не подчиняющейся нормальному закону распределения совокупности. Проиллюстрируем ее познавательное значение следующим примером.
Допустим, нам необходимо дать характеристику среднего дохода группы людей, насчитывающей 100 человек, из которых 99 имеют доходы в интервале от 100 до 200 долларов в месяц, а месячные доходы последнего составляют 50000 долларов (табл. 1).
Таблица 1 – Месячные доходы исследуемой группы людей.

N п/п 1 2 3 4 50 51 99 100
Доход, долл. 100 104 104 107 162 164 100 50 000

Если воспользоваться средней арифметической, то получим средний доход, равный примерно 600 – 700 долларов, который имеет мало общего с доходами основной части группы. Медиана же, равная в данном случае Me = 163 доллара, позволит дать объективную характеристику уровня доходов 99 % данной группы людей.
Рассмотрим определение моды и медианы по сгруппированным данным (рядам распределения).
Предположим, распределение рабочих всего предприятия в целом по тарифному разряду имеет следующий вид (табл. 2).
Таблица 2 – Распределение рабочих предприятия по тарифному разряду

Тарифный разряд Численность рабочих, человек
2 12
3 48
4 56
5 60
6 14
ВСЕГО 190

Определение моды по дискретному вариационному ряду

Используется построенный ранее ряд значений признака, отсортированных по величине. Если объем выборки нечетный, берем центральное значение; если объем выборки четный, берем среднее арифметическое двух центральных значений.
Определение моды по дискретному вариационному ряду: наибольшую частоту (60 человек) имеет 5-й тарифный разряд, следовательно, он и является модальным. Mo = 5.
Для определения медианного значения признака по следующей формуле находят номер медианной единицы ряда (NMe): , где n – объем совокупности.
В нашем случае: , где n – объем совокупности.
В нашем случае: .
Полученное дробное значение, всегда имеющее место при четном числе единиц совокупности, указывает, что точная середина находится между 95 и 96 рабочими. Необходимо определить, к какой группе относятся рабочие с этими порядковыми номерами. Это можно сделать, рассчитав накопленные частоты. Рабочих с этими номерами нет в первой группе, где всего лишь 12 человек, нет их и во второй группе (12+48=60). 95-й и 96-й рабочие находятся в третьей группе (12+48+56=116), следовательно, медианным является 4-й тарифный разряд.

Моду и медиану в интервальном ряду можно определить графически. Мода определяется по гистограмме распределения. Для этого выбирается самый высокий прямоугольник, который является в данном случае модальным. Затем правую вершину модального прямоугольника соединяем с правым верхним углом предыдущего прямоугольника. А левую вершину модального прямоугольника – с левым верхним углом последующего прямоугольника. Из точки их пересечения опускаем перпендикуляр на ось абсцисс. Абсцисса точки пересечения этих прямых и будет модой распределения (рис. 3).

Рис. 3. Графическое определение моды по гистограмме.

Рис. 3. Графическое определение моды по гистограмме.

Рис. 4. Графическое определение медианы по кумуляте
Для определения медианы из точки на шкале накопленных частот (частостей), соответствующей 50 %, проводится прямая, параллельная оси абсцисс до пересечения с кумулятой. Затем из точки пересечения опускается перпендикуляр на ось абсцисс. Абсцисса точки пересечения является медианой.

Неуникальность значения

Если имеется чётное количество случаев и два средних значения различаются, то медианой, по определению, может служить любое число между ними (например, в выборке <1, 2, 3, 4>медианой, по определению, может служить любое число из интервала (2,3)). На практике в этом случае чаще всего используют среднее арифметическое двух средних значений.

Лучше рассмотреть процесс вычисления медианы на примере. Пусть у нас есть ряд чисел: 13 19 24 17 15 11. Для удобства числа будет записывать через пробел. Найдем его медиану. Для начала необходимо расположить числа в порядке возрастания. Эта процедура называется сортировкой. Получим новый ряд: 11 13 15 17 19 24. Так как количество чисел в ряду равно 6, а число 6 четное, то середина ряда будет между числами 15 и 17. Найдем среднее этих двух чисел: (15 + 17) / 2 = 16. Это и будет медианой ряда. Не стоит путать медиану, среднее гармоническое и среднее арифметическое — это принципиально разные понятия.

Рассмотрим другой пример, когда количество чисел в ряду нечетное. Есть такой ряд: 18 46 10 5 38. Найдем медиану набора этих чисел. Отсортируем ряд по возрастанию и получим ряд: 5 10 18 38 48. Так как количество чисел в этом ряду 5, то у него есть середина — это элемент с номером 2. Значит медиана этого ряда равна элементу с номером 2. Получаем ответ 18.

И еще пример — найдем медиану чисел 158 166 134 130 132. Отсортируем и получим ряд 130 132 134 158 166. Количество чисел нечетное и равно 5, значит средний элемент имеет номер 3. Третий элемент нашего отсортированного ряда — число 134. Это и есть медиана.

При вычислении типичного признака неоднородных рядов, имеющих «выбросы» – значения во много раз отличающиеся от других значений ряда.

Пример использования

Предположим, что в одной комнате оказалось 19 бедняков и один миллионер. У каждого бедняка есть 5 ₽, а у миллионера — 1 млн ₽ (10 6 ). В сумме получается 1 000 095 ₽. Если мы разделим деньги равными долями на 20 человек, то получим 50 004,75 ₽. Это будет среднее арифметическое значение суммы денег, которая была у всех 20 человек в этой комнате.

Медиана в этом случае будет равна 5 ₽ (полусумма десятого и одиннадцатого, срединных значений ранжированного ряда). Можно интерпретировать это следующим образом. Разделив всю компанию на две равные группы по 10 человек, мы можем утверждать, что в первой группе у каждого не больше 5 ₽, во второй же — не меньше 5 ₽. В общем случае можно сказать, что медиана — это то, сколько принёс с собой «средний» человек. Наоборот, среднее арифметическое — неподходящая характеристика, так как оно значительно превышает сумму наличных, имеющуюся у среднего человека.

Неуникальность значения

Если имеется чётное количество случаев и два средних значения различаются, то медианой, по определению, может служить любое число между ними (например, в выборке <1, 3, 5, 7>медианой может служить любое число из интервала (3,5)). На практике в этом случае чаще всего используют среднее арифметическое двух средних значений (в примере выше это число (3+5)/2=4). Для выборок с чётным числом элементов можно также ввести понятие «нижней медианы» (элемент с номером n/2 в упорядоченном ряду из элементов; в примере выше это число 3) и «верхней медианы» (элемент с номером (n+2)/2; в примере выше это число 5). Эти понятия определены не только для числовых данных, но и для любой порядковой шкалы.

Советы

Вам будет легче найти моду и медиану, если вы запишете числа в порядке возрастания.

Источник

Центральную тенденцию данных можно рассматривать не только, как значение с нулевым суммарным отклонением (среднее арифметическое) или максимальную частоту (мода), но и как некоторую отметку (значение в совокупности), делящую ранжированные данные (отсортированные по возрастанию или убыванию) на две равные части. Половина исходных данных меньше этой отметки, а половина – больше. Это и есть медиана

Итак, медиана в статистике – это уровень показателя, который делит набор данных на две равные половины. Значения в одной половине меньше, а в другой больше медианы. В качестве примера обратимся к набору нормально распределенных случайных чисел.

Симметричное распределение с медианой и средней арифметической

Очевидно, что при симметричном распределении середина, делящая совокупность пополам, будет находиться в самом центре – там же, где средняя арифметическая (и мода). Это, так сказать, идеальная ситуация, когда мода, медиана и средняя арифметическая совпадают и все их свойства приходятся на одну точку – максимальная частота, деление пополам, нулевая сумма отклонений – все в одном месте. Однако, жизнь не так симметрична, как нормальное распределение. 

Допустим, мы имеем дело с техническими замерами отклонений от ожидаемой величины чего-нибудь (содержания элементов, расстояния, уровня, массы и т.д. и т.п.). Если все ОК, то отклонения, скорее всего, будут распределены по закону, близкому к нормальному, примерно, как на рисунке выше. Но если в процессе присутствует важный и неконтролируемый фактор, то могут появиться аномальные значения, которые в значительной мере повлияют на среднюю арифметическую, но при этом почти не затронут медиану.

Медиана и среднее при наличие аномальных отклонений

Медиана выборки – это альтернатива средней арифметической, т.к. она устойчива к аномальным отклонениям (выбросам). 

Математическим свойством медианы является то, что сумма абсолютных (по модулю) отклонений от медианного значения дает минимально возможное значение, если сравнивать с отклонениями от любой другой величины. Даже меньше, чем от средней арифметической, о как! Данный факт находит свое применение, например, при решении транспортных задач, когда нужно рассчитать место строительства объектов около дороги таким образом, чтобы суммарная длина рейсов до него из разных мест была минимальной (остановки, заправки, склады и т.д. и т.п.). 

Формула медианы

Формула медианы в статистике для дискретных данных чем-то напоминает формулу моды. А именно тем, что формулы как таковой нет. Медианное значение выбирают из имеющихся данных и только, если это невозможно, проводят несложный расчет.

Первым делом данные ранжируют (сортируют по убыванию). Далее есть два варианта. Если количество значений нечетно, то медиана будет соответствовать центральному значению ряда, номер которого можно определить по формуле:

Определение порядка центрального значения

где

Me – номер значения, соответствующего медиане,

N – количество значений в совокупности данных.

Тогда медиана обозначается, как

Определение медианы по центральному значению

Это первый вариант, когда в данных есть одно центральное значение. Второй вариант наступает тогда, когда количество данных четно, то есть вместо одного есть два центральных значения. Выход прост: берется средняя арифметическая из двух центральных значений:

Определение медианы при четном количестве данных

В интервальных данных выбрать конкретное значение не представляется возможным. Медиану рассчитывают по определенному правилу. 

Для начала (после ранжирования данных) находят медианный интервал. Это такой интервал, через который проходит искомое медианное значение. Определяется с помощью накопленной доли ранжированных интервалов. Где накопленная доля впервые перевалила через 50% всех значений, там и медианный интервал.

Не знаю, кто придумал формулу медианы, но исходили явно из того предположения, что распределение данных внутри медианного интервала равномерное (т.е. 30% ширины интервала – это 30% значений, 80% ширины – 80% значений и т.д.). Отсюда, зная количество значений от начала медианного интервала до 50% всех значений совокупности (разница между половиной количества всех значений и накопленной частотой предмедианного интервала), можно найти, какую долю они занимают во всем медианном интервале. Вот эта доля аккурат переносится на ширину медианного интервала, указывая на конкретное значение, именуемое впоследствии медианой.

Обратимся к наглядной схеме.

Схема нахождения медианного значения

Немного громоздко получилось, но теперь, надеюсь, все наглядно и понятно. Чтобы при расчете каждый раз не рисовать такой график, можно воспользоваться готовой формулой. Формула медианы имеет следующий вид:

Формула медианы

где xMe — нижняя граница медианного интервала;

iMe — ширина медианного интервала;

∑f/2 — количество всех значений, деленное на 2 (два);

S(Me-1)— суммарное количество наблюдений, которое было накоплено до начала медианного интервала, т.е. накопленная частота предмедианного интервала;

fMe — число наблюдений в медианном интервале.

Как нетрудно заметить, формула медианы состоит из двух слагаемых: 1 – значение начала медианного интервала и 2 – та самая часть, которая пропорциональна недостающей накопленной доли до 50%. 

Для примера рассчитаем медиану по следующим данным.

Данные для расчета медианы

Требуется найти медианную цену, то есть ту цену, дешевле и дороже которой по половине количества товаров. Для начала произведем вспомогательные расчеты накопленной частоты, накопленной доли, общего количества товаров.

Расчет медианы

По последней колонке «Накопленная доля» определяем медианный интервал – 300-400 руб (накопленная доля впервые более 50%). Ширина интервала – 100 руб. Теперь остается подставить данные в приведенную выше формулу и рассчитать медиану.

Расчет медианы по формуле

То есть у одной половины товаров цена ниже, чем 350 руб., у другой половины – выше. Все просто. Средняя арифметическая, рассчитанная по этим же данным, равна 355 руб. Отличие не значительное, но оно есть.

Расчет медианы в Excel

Медиану для числовых данных легко найти, используя функцию Excel, которая так и называется — МЕДИАНА. Другое дело интервальные данные. Соответствующей функции в Excel нет. Поэтому нужно задействовать приведенную выше формулу. Что поделаешь? Но это не очень трагично, так как расчет медианы по интервальным данным – редкий случай. Можно и на калькуляторе разок посчитать.

Напоследок предлагаю задачку. Имеется набор данных. 15, 5, 20, 5, 10. Каково среднее значение? Четыре варианта:

а) 11;

б) 5;

в) 10;

г) 5, 10, 11.

Мода, медиана и среднее значение выборки – это разный способ определить центральную тенденцию в выборке.

Ниже видеоролик о том, как рассчитать медиану в Excel.

Поделиться в социальных сетях:

В поисках средних значений: разбираемся со средним арифметическим, медианой и модой

В поисках средних значений: разбираемся со средним арифметическим, медианой и модой

как считать среднее арифметическое чисел

Иногда при работе с данными нужно описать множество значений каким-то одним числом. Например, при исследовании эффективности сотрудников, уровня вовлеченности в аккаунте, KPI или времени ответа на сообщения клиентов. В таких случаях используют меры центральной тенденции. Их можно называть проще — средние значения.

Но в зависимости от вводных данных, находить среднее значение нужно по-разному. Основной набор задач закрывается с использованием среднего арифметического, медианы и моды. Но если выбрать неверный способ — выводы будут необъективны, а результаты исследования нельзя будет признать действительными. Чтобы не допустить ошибку, нужно понимать особенности разных способов нахождения средних значений.

Cтратег, аналитик и контент-продюсер. Работает с агентством «Палиндром».

Как считать среднее арифметическое

Использовать среднее арифметическое стоит тогда, когда множество значений распределяются нормально ― это значит, что значения расположены симметрично относительно центра. Как выглядит нормальное распределение на графике и в таблице, можно посмотреть на примере:

 использование чужих публикаций

Если данные распределяются как в примерах — вам повезло. Можно без лишних заморочек считать среднее арифметическое и быть уверенным, что выводы будут объективны. Однако, нормальное распределение на практике встречается крайне редко, поэтому среднее арифметическое в большинстве случаев лучше не использовать.

Как рассчитать

Сумму значений нужно поделить на их количество. Например, вы хотите узнать средний ER за 4 дня при нормальном распределении значений и без аномальных выбросов. Для этого считаем среднее арифметическое: складываем ER всех дней и делим полученное число на количество дней.

курирование контента

Если хотите автоматизировать вычисления и узнать среднее арифметическое для большого числа показателей — используйте Google Таблицы:

  1. Заполните таблицу данными.
  2. Щелкните по пустой ячейке, в которую хотите записать среднее арифметическое.
  3. Введите «=AVERAGE(» и выделите ряд чисел, для которых нужно вычислить среднее арифметическое. Нажмите «Enter» после ввода формулы.

курирование контента

Когда можно не использовать

Если данные распределены ненормально, то наши расчеты не будут отражать реальную картину. На ненормальность распределения указывают:

  • Отсутствие симметрии в расположении значений.
  • Наличие ярко выраженных выбросов.

Как пример ненормального распределения (с выбросами) можно рассматривать среднее время ответа на комментарии по неделям:

курирование контента

Если посчитать среднее значение для такого набора данных с помощью среднего арифметического, то получится завышенное число. В итоге наши выводы будут более позитивными, чем реальное положение дел. Еще стоит учитывать, что выбросы могут не только завышать среднее значение, но и занижать его. В таком случае вы получите более скромный показатель, который не будет соответствовать реальности.

Например, в группе «Золотое Яблоко» во ВКонтакте иногда публикуют конкурсные посты. Они набирают более высокие показатели вовлеченности чем обычные публикации. Если посчитать средний ER с учетом конкурсов, мы получим 0,37%, а без учета конкурсов — только 0,29%. Аналогичная ситуация с числом комментариев. С конкурсами в среднем получаем 917 комментариев, а без конкурсов — всего лишь 503. Очевидно, что из-за розыгрышей средние показатели вовлеченности завышаются. В этом случае конкурсные посты следует исключить из анализа, чтобы объективно оценить эффективность контента в группе.

курирование контента

Еще часто бывает так, что данных очень много, заметны явные выбросы, но на их обработку и исключение аномальных значений не хватит ни времени, ни терпения. Тем более нет гарантий, что исключив выбросы, вы получите нормальное распределение. В таком случае лучше подсчитать средние значения, используя медиану.

Как найти медиану и когда ее применять

Если вы имеете дело с ненормальным распределением или замечаете значительные выбросы — используйте медиану. Так можно получить более адекватное среднее значение, чем при использовании среднего арифметического. Чтобы понять, как работать с медианой, рассмотрим аналогичный пример с ненормальным распределением времени ответов на комментарии.

курирование контента

Ниже в таблице уже введены данные из графика и рассчитано среднее время ответа с помощью среднего арифметического и медианы. Из расчетов видна наглядная разница между средним арифметическим и медианой ― она составляет 17 минут. Такое различие появляется из-за низкого темпа работы на выходных и в нестандартных ситуациях, когда к ответу на сообщения нужно относиться с особой ответственностью (события конца февраля). Подобные выбросы сильно завышают среднее арифметическое, а вот на медиану они практически не влияют. Поэтому если хотите посчитать среднее значение избегая влияния выбросов, — используйте медиану. Такие данные будут без искажений.

курирование контента

Как рассчитать

Разберем на примере. В аккаунте опубликовали семь постов и они набрали разное количество комментариев: 35, 105, 2, 15, 2, 31, 1. Чтобы вычислить медиану, нужно пройти два этапа:

  • Расположите числа в порядке возрастания. Итоговый ряд будет выглядеть так: 1, 2, 2, 15, 31, 35, 105.
  • Найдите середину сформированного ряда. В центре стоит число 15 — его и нужно считать медианой.

Немного сложнее найти медиану, если вы работаете с четным количеством чисел. Например, вы собрали количество лайков на последних шести постах: 32, 48, 36, 201, 52, 12. Чтобы найти медиану, выполните три действия:

  • Расставьте числа по возрастанию: 12, 32, 36, 48, 52, 201.
  • Возьмите два из них, наиболее близких к центру. В нашем случае — это 36 и 48.
  • Сложите два этих числа и разделите на два: (36 + 48) / 2 = 42. Результат и есть медиана.

Чтобы вычислять медиану быстрее и обрабатывать большие объемы данных — используйте Google Таблицы:

  • Внесите данные в таблицу.
  • Щелкните по свободной ячейке, в которую хотите записать медиану.
  • Введите формулу «=MEDIAN(» и выделите ряд чисел, для которых нужно рассчитать медиану. Нажмите «Enter», чтобы все посчиталось.

курирование контента

Когда можно не использовать

Если данные распределены нормально и вы не видите заметных выбросов — медиану можно не использовать. В этом случае значение среднего арифметического будет очень близким к медиане. Можете выбрать любой способ нахождения среднего, с которым вам работать проще. Результат от этого сильно не изменится.

Что такое мода и где ее использовать

Мода ― это самое популярное/часто встречающееся значение. Например, стоит задача узнать, сколько комментариев чаще всего набирают посты в аккаунте. В этом случае можно не высчитывать среднее арифметическое или медиану ― лучше и проще использовать моду.

Еще пример. Нужно узнать, в какое время аудитория чаще всего взаимодействует с публикациями. Для этого можно посчитать данные вручную или использовать готовую таблицу из LiveDune (вкладка «Вовлеченность» ― таблица «Лучшее время для поста»). По ее данным ― больше всего реакций пользователи оставляют в среду в 16 часов. Это время и есть мода. Таким образом, если вам нужно найти самое популярное значение, а не классическое среднее — проще использовать моду.

курирование контента

Как рассчитать

Чтобы найти наиболее часто встречающееся значение в наборе данных, нужно посмотреть, какое число встречается в ряду чаще всех. Например, для ряда 5, 4, 2, 4, 7 ― модой будет число 4.

Иногда в ряде значений встречается несколько мод. Например, ряду 7, 7, 21, 2, 5, 5 свойственны две моды — 7 и 5. В этом случае совокупность чисел называется мультимодальной. Также поиск моды можно упростить с помощью Google Таблиц:

  • Внесите значения в таблицу.
  • Щелкните по ячейке, в которую хотите записать моду.
  • Введите формулу «=MODE(» и выделите ряд чисел, для которых нужно вычислить моду. Нажмите «Enter».

курирование контента

Однако важно иметь в виду, что табличная функция выдает только самую меньшую моду. Поэтому будьте внимательны — можно упустить из виду несколько мод.

Когда использовать не стоит

Моду нет смысла использовать, если вас не просят найти самое популярное значение. Там, где надо найти классическое среднее значение, про моду лучше забыть.

Памятка по использованию

Среднее арифметическое

Как находим: сумма чисел / количество чисел.
Используем: если данные распределены нормально и нет ярких выбросов.
Не используем: если видим явные выбросы или ненормальное распределение.

Медиана

Как находим: располагаем числа в порядке возрастания и находим середину сформированного ряда.
Используем: если работаем с ненормальным распределением или видим выбросы.
Не используем: если выбросов нет и распределение нормальное.

Мода

Как находим: определяем значение, которое чаще всего встречается в ряду чисел.
Используем: если нужно найти не среднее, а самое популярное значение.
Не используем: если нужно найти классическое среднее значение.

Только важные новости в ежемесячной рассылке

Нажимая на кнопку, вы даете согласие на обработку персональных данных.

Подписывайся сейчас и получи гайд аудита Instagram аккаунта

Маркетинговые продукты LiveDune — 7 дней бесплатно

Наши продукты помогают оптимизировать работу в соцсетях и улучшать аккаунты с помощью глубокой аналитики

Анализ своих и чужих аккаунтов по 50+ метрикам в 6 соцсетях.

Оптимизация обработки сообщений: операторы, статистика, теги и др.

Автоматические отчеты по 6 соцсетям. Выгрузка в PDF, Excel, Google Slides.

Контроль за прогрессом выполнения KPI для аккаунтов Инстаграм.

Аудит Инстаграм аккаунтов с понятными выводами и советами.

Поможем отобрать «чистых» блогеров для эффективного сотрудничества.

8.4. МОДА и МЕДИАНА (структурные средние)

 Мода и медиана наиболее часто используемые в экономической практике структурные средние.


Мода – это величина признака (варианта), который наиболее часто встречается  в данной совокупности, т.e. это варианта, имеющая наибольшую частоту.


В дискретном ряду мода определяется в соответствии с определением, т.е. это одна из вариант признака, которая в ряду распределения имеет наибольшую частоту.


Для интервального ряда моду находим по формуле (8.16), сначала по наибольшей частоте определив модальный интервал:

Статистика Формула Мода для интервального ряда

(8.16 – формула Моды)


где хо – начальная (нижняя) граница модального интервала;

h – величина интервала;

fМо – частота модального интервала;

fМо-1 – частота интервала, предшествующая модальному;

fМо+1– частота интервала следующая за модальным.



Медианой  называется такое значение признака, которое приходится на середину ранжированного ряда, т.е. в ранжированном ряду распределения одна половина ряда имеет значение признака больше медианы, другая – меньше медианы.

В дискретном ряду медиана находится  непосредственно по накопленной частоте, соответствующей номеру медианы.

В случае интервального вариационного ряда медиану определяют по формуле:

Статистика Формула Медиана для интервального ряда                                           (8.17 – формула Медианы)


где хо – нижняя граница медианного интервала;

NМе– порядковый номер медианы (Σf/2);

S Me-1 – накопленная частота до медианного интервала;

fМе –  частота медианного интервала.


Пример вычисления Моды.

Рассчитаем моду и медиану по данным табл. 8.4.

Таблица 8.4 – Распределение семей города N  по размеру среднедушевого дохода в январе 2018 г. руб.(цифры условные)

Группы семей по размеру дохода, руб. Число

семей

Накоп-

ленные частоты

в % к итогу

До 5000 600 600 6
5000-6000 700 1300

(600+700)

13
6000-7000 1700 (fМо-1) 3000 (S Me-1 )

(1300+1700)

30
7000-8000

 (хо)

2500

(fМо)

(fМе)

5500 (S Me) 55
8000-9000 2200 (fМо+1) 7700 77
9000-10000 1500 9200 92
Свыше 10000 800 10000 100
Итого 10000

Пример вычисления Моды. Найдем моду по формуле (8.16) см. обозначения в таблице, а h = 8000-7000=1000, т.е. получаем:

Статистика. Пример расчета Моды (структурные средние)

Пример вычисления Моды


Пример вычисления Медианы интервального вариационного ряда. Рассчитаем медиану по формуле (8.17):

1) сначала находим  порядковый  номер медианы: NМе = Σfi/2= 5000.

2) по накопленным частотам в соответствии с номером медианы определяем, что 5000 находится в интервале (7000 – 8000), далее  значение медианы  определим по формуле (8.17):

Статистика. Пример Медиана

Пример вычисления Медианы


Вывод: по моде – наиболее часто встречается среднедушевой доход в размере 7730 руб., по медиане – что половина семей города имеет среднедушевой доход ниже 7800 руб., остальные семьи – более 7800 руб.


Пример .СРЕДНИЙ, МЕДИАННЫЙ И МОДАЛЬНЫЙ УРОВЕНЬ ДЕНЕЖНЫХ ДОХОДОВ НАСЕЛЕНИЯ  ЦЕЛОМ ПО РОССИИ И ПО СУБЪЕКТАМ РОССИЙСКОЙ ФЕДЕРАЦИИ ЗА 2013 год см. по ссылке. Источник: оценка на основании данных выборочного обследования бюджетов домашних хозяйств и макроэкономического показателя денежных доходов населения


Соотношение моды, медианы и средней арифметической указывает на характер распределения признака в совокупности, позволяет оценить его асимметрию.

Если Мое имеет место правосторонняя асимметрия.

При Х<Мео следует сделать вы­вод о левосторонней асимметрии ряда.


Средние величины (арифметическая, гармоническая, геометрическая, квадратическая) см. по ссылке

Оценка статьи:

Загрузка…

Формула для расчета медианы в статистике

Медианная формула в статистике относится к формуле, используемой для определения среднего числа в заданном наборе данных, расположенном в порядке возрастания. Согласно подсчету формулы количество элементов в наборе данных добавляется к единице. Таким образом, результаты будут разделены на два, чтобы получить место срединного значения, т. е. число, помещенное в идентифицированную позицию, будет средним значением.

Это инструмент для измерения центра набора числовых данных. Он суммирует большие объемы данных в одно значение. Его можно определить как среднее число группы чисел, отсортированных в порядке возрастания. Другими словами, медиана — это число, над которым и под ним будет одинаковое количество чисел в указанной группе данных. Это широко используемая мера наборов данных в статистике. В статистике статистика — это наука, стоящая за выявлением, сбором, организацией и обобщением, анализом, интерпретацией и, наконец, представлением таких данных, как качественных, так и количественных, что помогает принимать более эффективные и эффективные решения с уместностью. читать дальше и теория вероятностей.

Медиана = {(n+1)/2}-й

Медианная формула_1

Где «n» — количество элементов в наборе данных, а «th» означает (n)-е число.

Оглавление

  • Формула для расчета медианы в статистике
    • Расчет медианы (шаг за шагом)
    • Примеры формулы медианы в статистике
      • Пример №1
      • Пример #2
      • Пример №3
    • Актуальность и использование
    • Медианная формула в статистике (с шаблоном Excel)
    • Рекомендуемые статьи

Расчет медианы (шаг за шагом)

Выполните следующие шаги:

  1. Во-первых, отсортируйте числа в порядке возрастания. Числа располагаются по возрастанию при расположении от наименьшего к наибольшему порядку в этой группе.
  2. Метод нахождения медианы нечетных/четных чисел в группе приведен ниже.
  3. Если количество элементов в группе нечетное – Найдите {(n+1)/2}-й член. Значение, соответствующее этому термину, является медианой.
  4. Если количество элементов в группе четное — Найдите {(n+1)/2}-й член в этой группе. Средняя точка между числами по обе стороны от срединной позиции. Например, если имеется восемь наблюдений, медиана равна (8+1)/2-й позиции, то есть можно вычислить 4,5-ю медиану, добавив 4-й и 5-й члены в этой группе, которая затем делится на 2.

Примеры формулы медианы в статистике

.free_excel_div{фон:#d9d9d9;размер шрифта:16px;радиус границы:7px;позиция:относительная;margin:30px;padding:25px 25px 25px 45px}.free_excel_div:before{content:»»;фон:url(центр центр без повтора #207245;ширина:70px;высота:70px;позиция:абсолютная;верх:50%;margin-top:-35px;слева:-35px;граница:5px сплошная #fff;граница-радиус:50%} Вы можете скачать этот шаблон Excel с медианной формулой здесь – Шаблон медианной формулы Excel

Пример №1

Список чисел: 4, 10, 7, 15, 2. Вычислить медиану.

Решение: Расположим числа в порядке возрастания.

В порядке возрастания числа: 2,4,7,10,15.

Всего 5 номеров. Медиана равна (n+1)/2-му значению. Таким образом, медиана равна (5+1)/2-му значению.

Медиана = 3-е значение.

3-е значение в списке 2, 4, 710, 15 равно 7.

Таким образом, медиана равна 7.

Пример #2

Предположим, в организации 10 сотрудников, включая генерального директора. Генеральный директор Адам Смит считает, что зарплата сотрудников высока. Следовательно, он хочет оценить зарплату, получаемую группой, и, следовательно, принимать решения.

Ниже указана заработная плата сотрудников фирмы. Рассчитайте среднюю заработную плату. Заработная плата составляет 5 000 долларов, 6 000 долларов, 4 000 долларов, 7 000 долларов, 8 000 долларов, 7 500 долларов, 10 000 долларов, 12 000 долларов, 4 500 долларов, 10 00 000 долларов.

Решение:

Сначала расположим оклады в порядке возрастания. Заработная плата в порядке возрастания:

4000 долларов, 4500 долларов, 5000 долларов, 6000 долларов, 7000 долларов, 7500 долларов, 8000 долларов, 10000 долларов, 12000 долларов, 1000000 долларов

Медиана, например 2

Таким образом, расчет медианы будет следующим:

Поскольку элементов 10, медиана равна (10+1)/2-му элементу. Медиана = 5,5-й пункт.

Таким образом, медиана — это среднее значение 5-го и 6-го пунктов. Например, 5-й и 6-й предметы стоят 7000 и 7500 долларов.

= (7000 долл. США + 7500 долл. США)/2 = 7250 долл. США.

Таким образом, средняя заработная плата 10 сотрудников составляет 7250 долларов.

Пример №3

Джеффу Смиту, генеральному директору производственной организации, необходимо заменить семь машин новыми. Однако он обеспокоен понесенными затратами и звонит финансовому директору фирмы, чтобы тот помог ему рассчитать медианную стоимость семи новых машин.

Финансовый менеджер предположил, что можно покупать новые машины, если средняя цена машин ниже 85 000 долларов. Затраты следующие: 75 000 долларов, 82 500 долларов, 60 000 долларов, 50 000 долларов, 1 00 000 долларов, 70 000 долларов, 90 000 долларов. Рассчитайте среднюю стоимость машин. Затраты следующие: 75 000 долларов, 82 500 долларов, 60 000 долларов, 50 000 долларов, 1 00 000 долларов, 70 000 долларов, 90 000 долларов.

Решение:

Расположите затраты в порядке возрастания: 50 000 долларов, 60 000 долларов, 70 000 долларов, 75 000 долларов, 82 500 долларов, 90 000 долларов, 1 00 000 долларов.

Таким образом, расчет медианы будет следующим:

Поскольку элементов 7, медиана равна (7+1)/2-й элемент, т. е. 4-й элемент. Следовательно, 4-й предмет стоит 75 000 долларов.

Поскольку медиана ниже 85 000 долларов, можно купить новые машины.

Актуальность и использование

Основное преимущество медианы перед средними заключается в том, что на нее не оказывают чрезмерного влияния крайние значения, которые могут быть очень высокими и очень низкими. Таким образом, это дает человеку лучшее представление о репрезентативной ценности. Например, если вес 5 человек в кг равен 50, 55, 55, 60 и 150. Среднее значение равно (50+55+55+60+150)/5 = 74 кг. Однако 74 кг не является истинным репрезентативным значением, поскольку большинство весов находится в диапазоне от 50 до 60. Вычислим медиану в таком случае. Это будет (5+1)/2-й член = 3-й член. Третий член — 55 кг, что является медианой. Поскольку большинство данных находится в диапазоне от 50 до 60, 55 кг являются истинным репрезентативным значением данных.

Мы должны быть осторожны в интерпретации того, что означает медиана. Например, когда мы говорим, что средний вес составляет 55 кг, не все люди весят 55 кг. Кто-то может весить больше, а кто-то меньше. Однако 55 кг – это хороший показатель веса 5 человек.

В реальном мире, чтобы понять наборы данных, такие как доход домохозяйства или активы домохозяйства, которые сильно различаются, среднее значение может быть искажено небольшим количеством очень больших значений или малых значений. Таким образом, медиана используется, чтобы предположить, каким должно быть типичное значение.

Медианная формула в статистике (с шаблоном Excel)

Билл — владелец обувного магазина. Он хочет знать, какой размер обуви ему следует заказать. Он спрашивает 9 покупателей, какой у них размер обуви. Результатами являются 7, 6, 8, 8, 10, 6, 7, 9 и 6. Вычислите медиану, чтобы помочь Биллу принять решение о заказе.

Решение: Сначала мы должны расположить размеры обуви в порядке возрастания.

Это: 6, 6, 6, 7, 7, 8, 8, 9, 10

Ниже приведены данные для расчета медианы обувного магазина.

Медиана Пример 4

Поэтому вычисление медианы в excelMedian In ExcelMEDIAN в Excel дает медиану заданного набора чисел. МЕДИАНА Определяет положение центра группы чисел в статистическом распределении. Подробнее будет следующим:

Пример 4.1

В Excel можно использовать встроенную формулу для медианы, чтобы вычислить медиану группы чисел. Выберите пустую ячейку и введите это = МЕДИАНА (B2: B10) (B2: B10 указывает диапазон, из которого вы хотите вычислить медиану).

Медиана обувного магазина будет –

ПРИМЕР 4.2

Рекомендуемые статьи

Эта статья была руководством по медианной формуле в статистике. Здесь мы обсуждаем расчет медианы с использованием ее формулы и практических примеров в Excel и загружаемого шаблона Excel. Вы можете узнать больше об Excel из следующих статей: –

  • ФормулаФормулаНормальное распределение – это симметричное распределение, т.е. положительные и отрицательные значения распределения можно разделить на равные половины, и поэтому среднее значение, медиана и мода будут равны. У него два хвоста, один известен как правый хвост, а другой известен как левый хвост. Узнайте больше о нормальном распределении нормального распределения. на равные половины и, следовательно, среднее значение, медиана и мода будут равны. У него два хвоста, один известен как правый хвост, а другой известен как левый хвост.Подробнее
  • Вычислить стандартное нормальное распределениеВычислить стандартное нормальное распределениеСтандартное нормальное распределение — это симметричное распределение вероятностей относительно среднего или среднего значения, показывающее, что данные, близкие к среднему или среднему, встречаются чаще, чем данные, далекие от среднего или нормы. Таким образом, оценка называется «Z-оценка».Подробнее
  • Формула МЕДИАНА в ExcelФормула МЕДИАНА в Excel Функция МЕДИАНА в Excel дает медиану заданного набора чисел. МЕДИАНА Определяет расположение центра группы чисел в статистическом распределении.Подробнее
  • Вычислить среднее значение населенияВычислить среднее значение населенияСреднее значение населения представляет собой среднее значение всех значений в данной совокупности и рассчитывается как сумма всех значений в совокупности, обозначаемая суммой X, деленная на количество значений в совокупности, которое обозначается N. читать далее

Понравилась статья? Поделить с друзьями:
  • Нашел имущество как быть
  • Как найти оракула в бэтмене
  • Как составить службу святому
  • Как составить блок схему для цикла с параметром
  • Как найти мольные доли серной кислоты