Зная медиану как найти среднюю


Загрузить PDF


Загрузить PDF

Среднее значение, медиана и мода — значения, которые часто используются в статистике и математике. Эти значения найти довольно легко, но их легко и перепутать. Мы расскажем, что они из себя представляют и как их найти.

  1. Изображение с названием Find Mean, Median, and Mode Step 1

    1

    Сложите все числа, которые вам даны. Допустим, вам даны числа 2, 3 и 4. Сложим их: 2 + 3 + 4 = 9.

  2. Изображение с названием Find Mean, Median, and Mode Step 2

    2

    Сосчитайте количество чисел. У нас есть три цифры.

  3. Изображение с названием Find Mean, Median, and Mode Step 3

    3

    Разделите сумму чисел на их количество. Берем 9, делим на 3. 9/3 = 3. Среднее значение в данном случае равно 3. Помните, что не всегда получается целое число.

    Реклама

  1. Изображение с названием Find Mean, Median, and Mode Step 4

    1

    Запишите все числа, которые вам даны, в порядке возрастания. Например, нам даны числа: 4, 2, 8, 1, 15. Запишите их от меньшего к большему, вот так: 1, 2, 4, 8, 15.

  2. Изображение с названием Find Mean, Median, and Mode Step 5

    2

    Найдите два средних числа. Мы расскажем, как это сделать, если у вас имеется четное количество чисел, и как это сделать, если количество чисел нечетное:

    • Если у вас нечетное количество чисел, вычеркните левое крайнее число, затем правое крайнее число и так далее. Один оставшийся номер и будет искомой медианой. Если вам дан ряд чисел 4, 7, 8, 11, 21, тогда 8 — медиана, так как 8 стоит посередине.
    • Если у вас четное количество чисел, вычеркните по одному числу с каждой стороны, пока у вас не останется два числа посередине. Сложите их и разделите на два. Это и есть значение медианы. Если вам дан ряд чисел 1, 2, 5, 3, 7, 10, то два средних числа — это 5 и 3. Сложим 5 и 3, получим 8, разделим на два, получим 4. Это и есть медиана.

    Реклама

  1. Изображение с названием Find Mean, Median, and Mode Step 6

    1

    Запишите все числа в ряд. Например, вам даны числа 2, 4, 5, 5, 4 и 5. Запишите их в порядке возрастания.

  2. Изображение с названием Find Mean, Median, and Mode Step 7

    2

    Найдите число, которое чаще всего встречается. В данном случае это 5. Если два числа встречаются одинаково часто, то этот ряд двухвершинный или бимодальный, а если больше — то мультимодальный.

    Реклама

Советы

  • Вам будет легче найти моду и медиану, если вы запишете числа в порядке возрастания.

Реклама

Об этой статье

Эту страницу просматривали 355 996 раз.

Была ли эта статья полезной?

В поисках средних значений: разбираемся со средним арифметическим, медианой и модой

В поисках средних значений: разбираемся со средним арифметическим, медианой и модой

как считать среднее арифметическое чисел

Иногда при работе с данными нужно описать множество значений каким-то одним числом. Например, при исследовании эффективности сотрудников, уровня вовлеченности в аккаунте, KPI или времени ответа на сообщения клиентов. В таких случаях используют меры центральной тенденции. Их можно называть проще — средние значения.

Но в зависимости от вводных данных, находить среднее значение нужно по-разному. Основной набор задач закрывается с использованием среднего арифметического, медианы и моды. Но если выбрать неверный способ — выводы будут необъективны, а результаты исследования нельзя будет признать действительными. Чтобы не допустить ошибку, нужно понимать особенности разных способов нахождения средних значений.

Cтратег, аналитик и контент-продюсер. Работает с агентством «Палиндром».

Как считать среднее арифметическое

Использовать среднее арифметическое стоит тогда, когда множество значений распределяются нормально ― это значит, что значения расположены симметрично относительно центра. Как выглядит нормальное распределение на графике и в таблице, можно посмотреть на примере:

 использование чужих публикаций

Если данные распределяются как в примерах — вам повезло. Можно без лишних заморочек считать среднее арифметическое и быть уверенным, что выводы будут объективны. Однако, нормальное распределение на практике встречается крайне редко, поэтому среднее арифметическое в большинстве случаев лучше не использовать.

Как рассчитать

Сумму значений нужно поделить на их количество. Например, вы хотите узнать средний ER за 4 дня при нормальном распределении значений и без аномальных выбросов. Для этого считаем среднее арифметическое: складываем ER всех дней и делим полученное число на количество дней.

курирование контента

Если хотите автоматизировать вычисления и узнать среднее арифметическое для большого числа показателей — используйте Google Таблицы:

  1. Заполните таблицу данными.
  2. Щелкните по пустой ячейке, в которую хотите записать среднее арифметическое.
  3. Введите «=AVERAGE(» и выделите ряд чисел, для которых нужно вычислить среднее арифметическое. Нажмите «Enter» после ввода формулы.

курирование контента

Когда можно не использовать

Если данные распределены ненормально, то наши расчеты не будут отражать реальную картину. На ненормальность распределения указывают:

  • Отсутствие симметрии в расположении значений.
  • Наличие ярко выраженных выбросов.

Как пример ненормального распределения (с выбросами) можно рассматривать среднее время ответа на комментарии по неделям:

курирование контента

Если посчитать среднее значение для такого набора данных с помощью среднего арифметического, то получится завышенное число. В итоге наши выводы будут более позитивными, чем реальное положение дел. Еще стоит учитывать, что выбросы могут не только завышать среднее значение, но и занижать его. В таком случае вы получите более скромный показатель, который не будет соответствовать реальности.

Например, в группе «Золотое Яблоко» во ВКонтакте иногда публикуют конкурсные посты. Они набирают более высокие показатели вовлеченности чем обычные публикации. Если посчитать средний ER с учетом конкурсов, мы получим 0,37%, а без учета конкурсов — только 0,29%. Аналогичная ситуация с числом комментариев. С конкурсами в среднем получаем 917 комментариев, а без конкурсов — всего лишь 503. Очевидно, что из-за розыгрышей средние показатели вовлеченности завышаются. В этом случае конкурсные посты следует исключить из анализа, чтобы объективно оценить эффективность контента в группе.

курирование контента

Еще часто бывает так, что данных очень много, заметны явные выбросы, но на их обработку и исключение аномальных значений не хватит ни времени, ни терпения. Тем более нет гарантий, что исключив выбросы, вы получите нормальное распределение. В таком случае лучше подсчитать средние значения, используя медиану.

Как найти медиану и когда ее применять

Если вы имеете дело с ненормальным распределением или замечаете значительные выбросы — используйте медиану. Так можно получить более адекватное среднее значение, чем при использовании среднего арифметического. Чтобы понять, как работать с медианой, рассмотрим аналогичный пример с ненормальным распределением времени ответов на комментарии.

курирование контента

Ниже в таблице уже введены данные из графика и рассчитано среднее время ответа с помощью среднего арифметического и медианы. Из расчетов видна наглядная разница между средним арифметическим и медианой ― она составляет 17 минут. Такое различие появляется из-за низкого темпа работы на выходных и в нестандартных ситуациях, когда к ответу на сообщения нужно относиться с особой ответственностью (события конца февраля). Подобные выбросы сильно завышают среднее арифметическое, а вот на медиану они практически не влияют. Поэтому если хотите посчитать среднее значение избегая влияния выбросов, — используйте медиану. Такие данные будут без искажений.

курирование контента

Как рассчитать

Разберем на примере. В аккаунте опубликовали семь постов и они набрали разное количество комментариев: 35, 105, 2, 15, 2, 31, 1. Чтобы вычислить медиану, нужно пройти два этапа:

  • Расположите числа в порядке возрастания. Итоговый ряд будет выглядеть так: 1, 2, 2, 15, 31, 35, 105.
  • Найдите середину сформированного ряда. В центре стоит число 15 — его и нужно считать медианой.

Немного сложнее найти медиану, если вы работаете с четным количеством чисел. Например, вы собрали количество лайков на последних шести постах: 32, 48, 36, 201, 52, 12. Чтобы найти медиану, выполните три действия:

  • Расставьте числа по возрастанию: 12, 32, 36, 48, 52, 201.
  • Возьмите два из них, наиболее близких к центру. В нашем случае — это 36 и 48.
  • Сложите два этих числа и разделите на два: (36 + 48) / 2 = 42. Результат и есть медиана.

Чтобы вычислять медиану быстрее и обрабатывать большие объемы данных — используйте Google Таблицы:

  • Внесите данные в таблицу.
  • Щелкните по свободной ячейке, в которую хотите записать медиану.
  • Введите формулу «=MEDIAN(» и выделите ряд чисел, для которых нужно рассчитать медиану. Нажмите «Enter», чтобы все посчиталось.

курирование контента

Когда можно не использовать

Если данные распределены нормально и вы не видите заметных выбросов — медиану можно не использовать. В этом случае значение среднего арифметического будет очень близким к медиане. Можете выбрать любой способ нахождения среднего, с которым вам работать проще. Результат от этого сильно не изменится.

Что такое мода и где ее использовать

Мода ― это самое популярное/часто встречающееся значение. Например, стоит задача узнать, сколько комментариев чаще всего набирают посты в аккаунте. В этом случае можно не высчитывать среднее арифметическое или медиану ― лучше и проще использовать моду.

Еще пример. Нужно узнать, в какое время аудитория чаще всего взаимодействует с публикациями. Для этого можно посчитать данные вручную или использовать готовую таблицу из LiveDune (вкладка «Вовлеченность» ― таблица «Лучшее время для поста»). По ее данным ― больше всего реакций пользователи оставляют в среду в 16 часов. Это время и есть мода. Таким образом, если вам нужно найти самое популярное значение, а не классическое среднее — проще использовать моду.

курирование контента

Как рассчитать

Чтобы найти наиболее часто встречающееся значение в наборе данных, нужно посмотреть, какое число встречается в ряду чаще всех. Например, для ряда 5, 4, 2, 4, 7 ― модой будет число 4.

Иногда в ряде значений встречается несколько мод. Например, ряду 7, 7, 21, 2, 5, 5 свойственны две моды — 7 и 5. В этом случае совокупность чисел называется мультимодальной. Также поиск моды можно упростить с помощью Google Таблиц:

  • Внесите значения в таблицу.
  • Щелкните по ячейке, в которую хотите записать моду.
  • Введите формулу «=MODE(» и выделите ряд чисел, для которых нужно вычислить моду. Нажмите «Enter».

курирование контента

Однако важно иметь в виду, что табличная функция выдает только самую меньшую моду. Поэтому будьте внимательны — можно упустить из виду несколько мод.

Когда использовать не стоит

Моду нет смысла использовать, если вас не просят найти самое популярное значение. Там, где надо найти классическое среднее значение, про моду лучше забыть.

Памятка по использованию

Среднее арифметическое

Как находим: сумма чисел / количество чисел.
Используем: если данные распределены нормально и нет ярких выбросов.
Не используем: если видим явные выбросы или ненормальное распределение.

Медиана

Как находим: располагаем числа в порядке возрастания и находим середину сформированного ряда.
Используем: если работаем с ненормальным распределением или видим выбросы.
Не используем: если выбросов нет и распределение нормальное.

Мода

Как находим: определяем значение, которое чаще всего встречается в ряду чисел.
Используем: если нужно найти не среднее, а самое популярное значение.
Не используем: если нужно найти классическое среднее значение.

Только важные новости в ежемесячной рассылке

Нажимая на кнопку, вы даете согласие на обработку персональных данных.

Подписывайся сейчас и получи гайд аудита Instagram аккаунта

Маркетинговые продукты LiveDune — 7 дней бесплатно

Наши продукты помогают оптимизировать работу в соцсетях и улучшать аккаунты с помощью глубокой аналитики

Анализ своих и чужих аккаунтов по 50+ метрикам в 6 соцсетях.

Оптимизация обработки сообщений: операторы, статистика, теги и др.

Автоматические отчеты по 6 соцсетям. Выгрузка в PDF, Excel, Google Slides.

Контроль за прогрессом выполнения KPI для аккаунтов Инстаграм.

Аудит Инстаграм аккаунтов с понятными выводами и советами.

Поможем отобрать «чистых» блогеров для эффективного сотрудничества.

Среднее арифметическое, размах, мода и медиана

  1. Алгебра
  2. Среднее арифметическое, размах, мода и медиана
Статистические характеристики

количество чисел

Калькулятор вычислит среднее арифметическое чисел, а также размах ряда чисел, моду ряда
чисел, медиану ряда. Для вычисления укажите количество чисел, добавьте числа и нажмите
рассчитать.

Среднее арифметическое, размах, мода и медиана

Средним арифметическим ряда чисел называется частное от деления суммы этих
чисел на число слагаемых.

Для ряда a1,a1,..,an среднее арифметическое вычисляется по
формуле:

begin{align}
& overline{a}=frac{a_1+a_2+…+a_n}{n}\
end{align}

Найдем среднее арифметическое для чисел 5,24, 6,97, 8,56, 7,32 и 6,23.

begin{align}
& overline{a}=frac{5,24+6,97+8,56+7,32+6,23}{5}=6.864\
end{align}


Размахом ряда чисел называется разность между наибольшим и наименьшим из
этих чисел.

Размах ряда 5,24, 6,97, 8,56, 7,32, 6,23 равен 8,56-5,24=3.32


Модой ряда чисел называется число, которое встречается в данном ряду чаще
других.

Ряд чисел может иметь более одной моды, а может не иметь моды совсем.

Модой ряда 32, 26, 18, 26, 15, 21, 26 является число 26, встречается 3 раза.

В ряду чисел 5,24, 6,97, 8,56, 7,32 и 6,23 моды нет.

Ряд 1, 1, 2, 2, 3 содержит 2 моды: 1 и 2.


Медианой упорядоченного ряда чисел с нечётным числом членов называется
число, записанное посередине, а медианой упорядоченного ряда чисел с чётным
числом членов называется среднее арифметическое двух чисел, записанных посередине.

Медианой произвольного ряда чисел называется медиана соответствующего упорядоченного
ряда.

Медиана ряда 4, 1, 2, 3, 3, 1 равна 2.5.

Примеры

Рассмотрим примеры нахождения среднего арифметического чисел, а также размаха, медианы и моды
ряда.

  1. Среднее арифметическое чисел 30, 5, 23, 5, 28, 30

    begin{align}
    & overline{a}=frac{30+5+23+5+28+30}{6}=20frac{1}{6}\
    end{align}

    Размах ряда: 30-5=25

    Моды ряда: 5 и 30

    Медиана ряда: 25.5

  2. Среднее арифметическое чисел 40, 35, 30, 25, 30, 35

    begin{align}
    & overline{a}=frac{40+35+30+25+30+35}{6}=32frac{1}{2}\
    end{align}

    Размах ряда: 40-25=15

    Моды ряда: 30, 35

    Медиана ряда: 32.5

  3. Среднее арифметическое чисел 21, 18,5, 25,3, 18,5, 17,9

    begin{align}
    & overline{a}=frac{21+18,5+25,3+18,5+17,9}{5}=20,24\
    end{align}

    Размах ряда: 25,3-17,9=7,4

    Мода ряда: 18,5

    Медиана ряда: 18,5

Примеры

Примеры нахождения среднего арифметического отрицательных и вещественных чисел.

  1. Среднее арифметическое чисел 67,1, 68,2, 67,1, 70,4, 68,2

    begin{align}
    & overline{a}=frac{67,1+68,2+67,1+70,4+68,2}{5}=68,2\
    end{align}

    Размах ряда: 70,4-67,1=3,3

    Моды ряда: 67.1, 68.2

    Медиана ряда: 68.2

  2. Среднее арифметическое чисел 0,6, 0,8, 0,5, 0,9, 1,1

    begin{align}
    & overline{a}=frac{0,6+0,8+0,5+0,9+1,1}{5}=0.78\
    end{align}

    Размах ряда: 1,1-0,5=0.6

    Ряд не имеет моды

    Медиана ряда: 0.8

  3. Среднее арифметическое чисел -21, -33, -35, -19, -20, -22

    begin{align}
    & overline{a}=frac{(-21)+(-33)+(-35)+(-19)+(-20)+(-22)}{6}=-25\
    end{align}

    Размах ряда: (-19)-(-35)=16

    Ряд не имеет моды

    Медиана ряда: -21,5

  4. Среднее арифметическое чисел -4, -6, 0, -4, 0, 6, 8, -12

    begin{align}
    & overline{a}=frac{(-4)+(-6)+0+(-4)+0+6+8+(-12)}{8}=-1,5\
    end{align}

    Размах ряда: 8-(-12)=20

    Моды ряда: -4, 0

    Медиана ряда: -2

  5. Среднее арифметическое чисел 275, 286, 250, 290, 296, 315, 325

    begin{align}
    & overline{a}=frac{275+286+250+290+296+315+325}{7}=291\
    end{align}

    Размах ряда: 325-250=75

    Ряд не имеет моды

    Медиана ряда: 290

  6. Среднее арифметическое чисел 38, 42, 36, 45, 48, 45, 45, 42, 40, 47, 39

    begin{align}
    & overline{a}=frac{38+42+36+45+48+45+45+42+40+47+39}{11}=42frac{6}{11}\
    end{align}

    Размах ряда: 48-36=12

    Мода ряда: 45

    Медиана ряда: 42

  7. Среднее арифметическое чисел 3,8, 7,2, 6,4, 6,8, 7,2

    begin{align}
    & overline{a}=frac{3,8+7,2+6,4+6,8+7,2}{5}=6,28\
    end{align}

    Размах ряда: 7,2-3,8=3,4

    Мода ряда: 7,2

    Медиана ряда: 6,8

  8. Среднее арифметическое чисел 21,6, 37,3, 16,4, 12,6

    begin{align}
    & overline{a}=frac{21,6+37,3+16,4+12,6}{4}=21,025\
    end{align}

    Размах ряда: 37,3-12,6=24,7

    Мода ряда: 12,6

    Медиана ряда: 17,1

Средняя зарплата… Средняя продолжительность жизни… Практически каждый день мы с вами слышим эти словосочетания, используемые для описания множества одним единственным числом. Но как ни странно, «среднее значение» — достаточно коварное понятие, часто вводящее в заблуждение обычного, неискушенного в математической статистике, человека.

В чем проблема?

Под средним значением чаще всего подразумевается среднее арифметическое, которое очень сильно варьируется под воздействием единичных фактов или событий. И вы не получите реального представления о том, как именно распределены значения, которые вы изучаете.

Давайте обратимся к классическому примеру со средней зарплатой.

В какой-то абстрактной компании работает десять сотрудников. Девять из них получают зарплату около 50 000 рублей, а один 1 500 000 рублей (по странному совпадению он же является генеральным директором этой компании).

Выборка зарплат

Средним значением в данном случае будет 195 150 рублей, что согласитесь, неправильно.

Какие способы вычисления среднего бывают?

Первым способом является вычисление уже упомянутого среднего арифметического, являющегося суммой всех значений, деленной на их количество.

Формула:

  • x – среднее арифметическое;
  • x– конкретное значение;
  • n – количество значений.

Плюсы:

  • Хорошо работает при нормальном распределении значений в выборке;
  • Легко вычислить;
  • Интуитивно понятно.

Минусы:

  • Не дает реального представления о распределении значений;
  • Неустойчивая величина легко поддающаяся выбросам (как в случае с генеральным директором).

Вторым способом является вычисление моды, то есть наиболее часто встречающегося значения.

Формула:

  • M– мода;
  • x– нижняя граница интервала, который содержит моду;
  • n – величина интервала;
  • fm– частота (сколько раз в ряду встречается то или иное значение);
  • fm-1 – частота интервала предшествующего модальному;
  • fm+1 – частота интервала следующего за модальным.

Плюсы:

  • Прекрасно подходит для получения представления об общественном мнении;
  • Хорошо подходит для нечисловых данных (цвета сезона, хиты продаж, рейтинги);
  • Проста для понимания.

Минусы:

  • Моды может просто не быть (нет повторов);
  • Мод может быть несколько (многомодальное распределение).

Третий способ — это вычисление медианы, то есть значения, которое делит упорядоченную выборку на две половины и находится между ними. А если такого значения нет, то за медиану принимается среднее арифметическое между границами половин выборки.

Формула:

Медиана формула

  • Me – медиана;
  • x– нижняя граница интервала, который содержит медиану;
  • h – величина интервала;
  • f – частота (сколько раз в ряду встречается то или иное значение);
  • Sm-1 – сумма частот интервалов предшествующих медианному;
  • fm – число значений в медианном интервале (его частота).

Плюсы:

  • Дает самую реалистичную и репрезентативную оценку;
  • Устойчива к выбросам.

Минусы:

  • Сложнее вычислить, так как перед вычислением выборку нужно упорядочить.

Мы рассмотрели основные методы нахождения среднего значения, называющиеся мерами центральной тенденции (на самом деле их больше, но это наиболее популярные).

А теперь давайте вернемся к нашему примеру и посчитаем все три варианта среднего при помощи специальных функций Excel:

  • СРЗНАЧ(число1;[число2];…) — функция для определения среднего арифметического;
  • МОДА.ОДН(число1;[число2];...) — функция моды (в более старых версиях Excel использовалась МОДА(число1;[число2];...));
  • МЕДИАНА(число1;[число2];...) — функция для поиска медианы.

И вот какие значения у нас получились:

Расчет среднего арифметического, моды и медианы

В данном случае мода и медиана гораздо лучше характеризуют среднюю зарплату в компании.

Но что делать, когда в выборке не 10 значений, как в примере, а миллионы? В Excel это не посчитать, а вот в базе данных где хранятся ваши данные, без проблем.

Вычисляем среднее арифметическое на SQL

Тут все достаточно просто, так как в SQL предусмотрена специальная агрегатная функция AVG.

И чтобы ее использовать достаточно написать вот такой запрос:

/* Здесь и далее salary - столбец с зарплатами, а employees - таблица сотрудников в нашей базе данных */

SELECT AVG(salary) AS 'Средняя зарплата'
FROM employees

Вычисляем моду на SQL

В SQL нет отдельной функции для нахождения моды, но ее легко и быстро можно написать самостоятельно. Для этого нам необходимо узнать, какая из зарплат чаще всего повторяется и выбрать наиболее популярную.

Напишем запрос:

/* WITH TIES необходимо добавлять к TOP() если множество многомодально, то есть у множества несколько мод */
SELECT TOP(1) WITH TIES salary AS 'Мода зарплаты'
FROM employees
GROUP BY salary
ORDER BY COUNT(*) DESC

Вычисляем медиану на SQL

Как и в случае с модой, в SQL нет встроенной функции для вычисления медианы, зато есть универсальная функция для вычисления процентилей PERCENTILE_CONT.

Выглядит все это так:

/* В данном случае процентиль 0.5 и будет являться медианой */

SELECT TOP(1) PERCENTILE_CONT(0.5)
       WITHIN GROUP (ORDER BY salary)
       OVER() AS 'Медианная зарплата'
FROM employees

Подробнее о работе функции PERCENTILE_CONT лучше почитать в справке Microsoft и Google BigQuery.

Какой способ все-таки использовать?

Из сказанного выше следует, что медиана лучший способ для вычисления среднего значения.

Но это не всегда так. Если вы работаете со средним, то остерегайтесь многомодального распределения:

Бимодальное распределение

На графике представлено бимодальное распределение с двумя пиками. Такая ситуация может возникнуть, например, при голосовании на выборах.

В данном случае среднее арифметическое и медиана — это значения, находящиеся где-то посередине и они ничего не скажут о том, что происходит на самом деле и лучше сразу признать, что вы имеете дело с бимодальным распределением, сообщив о двух модах.

А еще лучше разделить выборку на две группы и собрать статистические данные для каждой.

Вывод:

При выборе метода нахождения среднего нужно учитывать наличие выбросов, а также нормальность распределения значений в выборке.

Окончательный выбор меры центральной тенденции всегда лежит на аналитике.

Полезные ссылки:

  • SQL и теория вероятностей (YouTube)
  • Анализ нормальности распределения данных (YouTube)
  • Меры центральной тенденции
  • Об авторе
  • Свежие записи


The mean of a dataset represents the average value of the dataset. It is calculated as:

Mean = Σxi / n

where:

  • Σ: A symbol that means “sum”
  • xi: The ith observation in a dataset
  • n: The total number of observations in the dataset

The median represents the middle value of a dataset. It is calculated by arranging all of the observations in a dataset from smallest to largest and then identifying the middle value. 

For example, suppose we have the following dataset with 11 observations:

Dataset: 3, 4, 4, 6, 7, 8, 12, 13, 15, 16, 17

The mean of the dataset is calculated as:

Mean = (3+4+4+6+7+8+12+13+15+16+17) / 11 = 9.54

The median of the dataset is the value directly in the middle, which turns out to be 8:

3, 4, 4, 6, 7, 8, 12, 13, 15, 16, 17

Both the mean and the median estimate where the center of a dataset is located. However, depending on the nature of the data, either the mean or the median may be more useful for describing the center of the dataset.

When to Use the Mean

It’s best to use the mean to describe the center of a dataset when the distribution is mostly symmetrical and there are no outliers.

For example, suppose we have the following distribution that shows the salaries of residents in a certain city:

Since this distribution is fairly symmetrical (if you split it down the middle, each half would look roughly equal) and there are no outliers, we can use the mean to describe the center of this dataset.

The mean turns out to be $63,000, which is located approximately in the center of the distribution:

When to Use the Median

It is best to use the median when the distribution is either skewed or there are outliers present.

Skewed Data:

When a distribution is skewed, the median does a better job of describing the center of the distribution than the mean.

For example, consider the following distribution of salaries for residents in a certain city:

The median does a better job of capturing the “typical” salary of a resident than the mean. This is because the large values on the tail end of the distribution tend to pull the mean away from the center and towards the long tail.

In this example, the mean tells us that the typical individual earns about $47,000 per year while the median tells us that the typical individual only earns about $32,000 per year, which is much more representative of the typical individual.

Outliers:

The median also does a better job of capturing the central location of a distribution when there are outliers present in the data. For example, consider the following chart that shows the square footage of houses on a certain street:

When to use the mean vs. the median

The mean is heavily influenced by a couple extremely large houses, while the median is not. Thus, the median does a better job of capturing the “typical” square footage of a house on this street compared to the mean.

Summary

In summary:

  • Both the mean and the median can be used to describe where the “center” of a dataset is located.
  • It’s best to use the mean when the distribution of the data values is symmetrical and there are no clear outliers.
  • It’s best to use the median when the the distribution of data values is skewed or when there are clear outliers.

Additional Resources

How Do Outliers Affect the Mean?
How to Estimate the Mean and Median of Any Histogram
How to Find the Mean & Median of Stem-and-Leaf Plots

Понравилась статья? Поделить с друзьями:
  • Как найти бесплатные книги для чтения
  • Как найти работу для изотермического процесса
  • Ихний номер телефона как можно найти
  • Как можно найти номер телефона по инстаграму
  • Как найти адрес отдела судебных приставов