Как найти среднее значение по выборке

Выборочное среднее

Выборочное
среднее

значение как статистический показатель
представляет
собой среднюю оценку изучаемого в
эксперименте психологического качества.

Эта
оценка характеризует степень его
развития
в целом у той группы испытуемых, которая
была подвергнута
психодиагностическому обследованию.
Сравнивая непосредственно средние
значения двух или нескольких выборок,
мы
можем судить об относительной степени
развития у людей, составляющих эти
выборки, оцениваемого качества.

Выборочное
среднее определяется при помощи следующей
формулы:

где

хср
—выборочная
средняя величина или среднее арифметическое
значение по выборке;

п —
количество
испытуемых в выборке
или частных психодиагностических
показателей, на основе которых
вычисляется средняя величина;

xk
частные
значения показателей
у отдельных испытуемых. Всего таких
показателей п,
поэтому
индекс k
данной
переменной принимает значения от 1 до
п;

∑ — принятый
в математике знак суммирования величин
тех
переменных, которые находятся справа
от этого знака.

Выражение


соответственно означает сумму всех х
с индексом k
от 1 до n.

Пример.
Допустим,
что в результате применения
психодиагностической
методики для оценки некоторого
психологического
свойства у десяти испытуемых мы получили
следующие частные
показатели степени развитости данного
свойства у отдельных
испытуемых: х1=
5,
х2
=
4, х3
=
5,
х4
=
6,
х5
=
7,
х6
=
3,
х7
=
6,
х8=
2,
х9=
8,
х10
=
4. Следовательно, п
=
10,
а индекс k
меняет
свои значения от 1 до 10 в приведенной
выше формуле. Для данной выборки
среднее значение1,
вычисленное по этой формуле, будет
равно:

1
В дальнейшем, как это и принято в
математической статистике, с целью
сокращения
текста мы будем опускать слова «выборочное»
и «арифметическое» и просто говорить
о «среднем» или «среднем значении».

В
психодиагностике и в экспериментальных
психолого-педагогических исследованиях
среднее,
как правило, не вычисля
ется
с точностью, превышающей один, два знака
после запятой, т.е
.
с большей, чем десятые или сотые доли
единицы.

В
психодиагностических обследованиях
большая точность расчетов не требуется
и не имеет смысла, если принять во
внимание приблизительность тех оценок,
которые в них получаются, и достаточность
таких оценок для производства сравнительно
точных расчетов.

Дисперсия

Дисперсия
как статистическая, величина характеризует,
на
сколько
частные значения отклоняются от средней
величины в
данной
выборке.

Чем
больше дисперсия, тем больше отклонения
или разброс данных. Прежде чем представлять
формулу для расчетов
дисперсии, рассмотрим пример. Воспользуемся
теми первичными
данными, которые были приведены ранее
и на основе которых вычислялась в
предыдущем примере средняя величина.
Мы видим, что все они разные и отличаются
не только друг от
друга, но и от средней величины. Меру их
общего отличия от средней
величины и характеризует дисперсия. Ее
определяют для того,
чтобы можно было отличать друг от друга
величины, имеющие
одинаковую среднюю, но разный разброс.

Представим
себе другую, отличную от предыдущей
выборку первичных значений,
например такую: 5, 4, 5, 6, 5, 6, 5, 4, 5, 5. Легко
убедиться в том, что ее средняя величина
также равна 5,0. Но в данной выборке
ее отдельные частные значения отличаются
от средней гораздо
меньше, чем в первой выборке. Выразим
степень этого отличия
при помощи дисперсии, которая определяется
по
следую
щей
формуле:

где

выборочная
дисперсия, или просто дисперсия;


— выражение,
означающее, что для всех xk
от
первого
до последнего в данной выборке необходимо
вычислить разности
между частными и средними значениями,
возвести эти разности
в квадрат и просуммировать;

п —
количество
испытуемых в выборке или первичных
значений,
по которым вычисляется дисперсия.

Заметим,
что во многих изданиях дисперсию принято
обозначать как D(x).

Определим
дисперсии для двух приведенных выше
выборок частных
значений, обозначив эти дисперсии
соответственно индексами
1 и 2:

Мы
видим, что дисперсия по второй выборке
(0,4) значительно меньше дисперсии по
первой выборке (3,0). Если бы не было
дисперсии,
то мы не в состоянии были бы различить
данные выборки.

Соседние файлы в папке МатМетоды в Психологии (литература)

  • #
  • #

    13.02.201616.87 Mб1468Наследов А.Д. IBM SPSS Statistics 20 профессиональный анализ данных.pdf

  • #

План урока:

Понятие выборки и генеральной совокупности

Среднее арифметическое выборки

Упорядоченный ряд и таблица частот

Размах выборки

Мода выборки

Медиана выборки

Ошибки в статистике

Понятие выборки и генеральной совокупности

Слово статистика, образованное от латинского status(состояние дел), появилось только в 1746 году, когда его употребил немец Готфрид Ахенвалль. Однако ещё в Древнем Китае проводились переписи населения, в ходе которых правители собирали информацию о своих владениях и жителях, проживающих в них.

В основе любого статистического исследования лежит массив информации, который называют выборкой данных. Покажем это на примере. Пусть в классе, где учится 20 учеников, проводился тест по математике, содержавший 25 вопросов. В результате учащиеся показали следующие результаты:

1 massiv informacii

Ряд чисел, приведенный во второй строке таблицы (12, 19, 19, 14, 17, 16, 18, 20, 15, 25, 13, 20, 25, 16, 17, 12, 24, 13, 21, 13), будет выборкой. Также ее могут называть рядом данных или выборочной совокупностью.

2 vyborka nabor dannyh

В примере с классом выборка состоит из 20 чисел. Эту величину (количество чисел в ряду) называют объемом выборки. Каждое отдельное число в ряду именуют вариантой выборки.

В примере со школьным классом в выборку попали все его ученики. Это позволяет точно определить, насколько хорошо учащиеся написали математический тест. Однако иногда необходимо проанализировать очень большие группы населения, состоящие из десятков и даже сотен миллионов человек. Например, необходимо узнать, какая часть населения страны курит. Опросить каждого жителя государства невозможно, поэтому в ходе исследования опрашивают лишь его малую часть. В этом случае статистики выделяют понятие генеральная совокупность.

3 generalnaja sovokupnost

Так, если с помощью опроса 10 тысяч человек ученые делают выводы о распространении курения в России, то все российское население будет составлять генеральную совокупность исследования, а опрошенные 10 тысяч людей вместе образуют выборку.

Среднее арифметическое выборки

Сбор информации о выборке является лишь первой стадией статистического исследования. Далее ее необходимо обобщить, то есть получить некоторые цифры, характеризующие выборку. Самой часто используемой статистической характеристикой является среднее арифметическое.

4 srednee arifmeticheskoe vyborki

Другими словами, для подсчета среднего арифметического необходимо просто сложить все числа в ряде данных, а потом поделить получившееся значение на количество чисел в ряде. Так, в примере с тестом по математике (таблица 1) средний балл учащихся составит: (12+19+19+14+17+16+18+20+15+25+13+20+25+16+17+12+24+13+21+13):20=

= 349:20 = 17,45.

Среднее арифметическое позволяет одним числом характеризовать какое-либо качество всех объектов группы. Чем больше средний балл учащихся в классе, тем выше их успеваемость. Чем меньше среднее количество голов, пропускаемых футбольной командой за один матч, тем лучше она играет в обороне. Если средняя зарплата программистов в городе составляет 90 тысяч рублей, а дворников – 25 тысяч рублей, то это значит, что программисты значительно более востребованы на рынке труда, а потому при выборе будущей профессии лучше предпочесть именно эту специальность.

Упорядоченный ряд и таблица частот

В ряде данных в таблице 1 числа приведены в произвольном порядке. Перепишем ряд так, чтобы все числа шли в неубывающем порядке, то есть от самого маленького к самому большому:

12, 12, 13, 13, 13, 14, 15, 16, 16, 17, 17, 18, 19, 19, 20, 20, 21, 24, 25, 25.

Такую запись называют упорядоченным рядом данных.

5 uporjadochennyj rjad dannyh

Его характеристики ничем не отличаются от изначальной выборки, однако с ним удобнее работать. С его помощью можно видеть, что ни одному ученику не удалось набрать 22 или 23 балла на тесте, но сразу двое учащихся дали 25 правильных ответов. На основе упорядоченного ряда данных несложно составить таблицу частот, в которой будет указано, как часто та или иная варианта выборки встречается в ряде. Выглядеть она будет так:

6 kolichestvo balov

При составлении этой таблицы мы исключили из нее те варианты количества набранных баллов, частота которых равна нулю (от 0 до 12, 22 и 23).Заметим, что сумма чисел в нижней строке таблицы частот должна равняться объему выборки. Действительно,

2+3+1+1+2+2+1+2+2+1+1+2 = 20.

С помощью таблицы частот можно быстрее посчитать среднее арифметическое выборки. Для этого каждую варианту надо умножить на ее частоту, после чего сложить полученные результаты и поделить их на объем выборки:

(12•2+13•3+14•1+15•1+16•2+17•2+18•1+19•2+20•2+21•1+24•1+25•2):20 =

(24+39+14+15+32+34+18+38+40+42+24+50):20 = 349:20 = 17,45.

Размах выборки

Следующий важная характеристика ряда данных – это размах выборки.

7 razmah vyborki

Если выборка представлена в виде упорядоченного ряда данных, то достаточно вычесть из последнего числа ряда первое число. Так, размах выборки результатов теста в классе равен:

25 – 12 = 13,

так как самые лучшие ученики смогли решить все 25 заданий, а наихудший учащийся ответил правильно только на 13 вопросов.

Размах выборки характеризует стабильность, однородность исследуемых свойств. Например, пусть два спортсмена-стрелка в ходе соревнований производят по 5 выстрелов по круговой мишени, где за попадание начисляют от 0 до 10 очков. Первый стрелок показал результаты 8, 9, 9, 8, 9 очков. Второй же спортсмен в своих попытках показал результаты 7, 10, 10, 6, 10. Средние арифметические этих рядов равны:

(8+9+9+8+9):5 = 43:5 = 8,6;

(7+10+10+6+10):5 = 43:5 = 8,6.

Получается, что в среднем оба стрелка стреляют одинаково точно, однако первый спортсмен демонстрирует более стабильные результаты. У его выборки размах равен

9 – 8 = 1,

в то время как размах выборки второго спортсмена равен

10 – 6 = 4.

Размах выборки может быть очень важен в метеорологии. Например, в Алма-Ате и Амстердаме средняя температура в течение года почти одинакова и составляет 10°С. Однако в Алма-Ате в январе и феврале иногда фиксируются температуры ниже -30°С, в то время как в Амстердаме за всю историю наблюдений она никогда не падала ниже -20°С.

Мода выборки

Иногда важно знать не среднее арифметическое выборки, а то, какая из ее вариант встречается наиболее часто. Так, при управлении магазином одежды менеджеру не важен средний размер продаваемых футболок, а необходима информация о том, какие размеры наиболее популярны. Для этого используется такой показатель, как мода выборки.

8 moda vyborki

В примере с математическим тестом сразу 3 ученика набрали по 13 баллов, а частота всех других вариант не превысила 2, поэтому мода выборки равна 13. Возможна ситуация, когда в ряде есть сразу две или более вариант, которые встречаются одинаково часто и чаще остальных вариант. Например, в ряде

1, 2, 3, 3, 3, 4, 5, 5, 5

варианты 3 и 5 встречаются по три раза. В таком случае ряд имеет сразу две моды – 3 и 5, а всю выборку именуют мультимодальной. Особо выделяется случай, когда в выборке все варианты встречаются с одинаковой частотой:

6, 6, 7, 7, 8, 8.

Здесь числа 6, 7 и 8 встречаются одинаково часто (по два раза), а другие варианты отсутствуют. В таких случаях говорят, что ряд не имеет моды.

Медиана выборки

Иногда, например, при расчете средней зарплаты, среднее арифметическое не вполне адекватно отражает ситуацию. Это происходит из-за наличия в выборке чисел, очень сильно отличающихся от среднего. Так, из-за огромных зарплат некоторых начальников большинство рядовых сотрудников компаний обнаруживают, что их зарплата ниже средней. В таких случаях целесообразно использовать такую характеристику, как медиану ряда. Это такое значение, которое делит ряд данных пополам. В упорядоченном ряде 2, 3, 6, 8, 8, 12, 15, 15, 18, 19, 25 медианой будет равна 12, так как именно она находится в середине ряда:

9 obem vyborki

Однако таким образом можно найти только медиану ряда, в котором находится нечетное количество чисел. Если же их количество четное, то за медиану условно принимают среднее арифметическое двух средних чисел. Так, для ряда 2, 3, 6, 8, 8, 12, 15, 15, 18, 19, 25, 30, содержащего 12 чисел, медиана будет равна среднему значению 12 и 15, которые занимают 6-ое и 7-ое место в ряду:

10 mediana

11 nechetnoe kolichestvo

Вернемся к примеру с математическим тестом в школе. Так как его сдавали 20 учеников, а 20 – четное число, то для расчета медианы следует найти среднее арифметическое 10-ого и 11-ого числа в упорядоченном ряде

12, 12, 13, 13, 13, 14, 15, 16, 16, 17, 17, 18, 19, 19, 20, 20, 21, 24, 25, 25.

Эти места занимают числа 17 и 17 (выделены жирным шрифтом). Медиана ряда будет равна

(17+17):2 = 34:2 = 17.

Три приведенные основные статистические характеристики выборки, а именно среднее арифметическое, мода и медиана, называются мерами центральной тенденции. Они позволяют одним числом указать значение, относительно которого группируются все числа ряда.

Рассмотрим для наглядности ещё один пример. Врач в ходе диспансеризации измерил вес мальчиков в классе. В результате он получил 10 значений (в кг):

39, 41, 67, 36, 60, 58, 46, 44, 39, 69.

Найдем среднее арифметическое, размах, моду и медиану для этого ряда.

Решение. Сначала перепишем ряд в упорядоченном виде:

36, 39, 39, 41, 44, 46, 58, 60, 67, 69.

Так как в ряде 10 чисел, то объем выборки равен 10. Найдем среднее арифметическое. Для этого сложим все числа в ряде и поделим их на объем выборки (то есть на 10):

(36+39+39+41+44+46+58+60+67+69):10 =

= 499:10 = 49,9 кг.

Размах выборки равен разнице между наибольшей и наименьшей вариантой в ней. Самый тяжелый мальчик весит 69 кг, а самый легкий – 36 кг, а потому размах ряда равен

69 – 36 = 33 кг.

В упорядоченном ряде только одно число, 39, встречается дважды, а все остальные числа встречаются по одному разу. Поэтому мода ряда будет равна 39 кг.

В выборке 10 чисел, а это четное число. Поэтому для нахождения медианы надо найти два средних по счету значение найти их среднее. На 5-ом и 6-ом месте в ряде находятся числа 44 и 46. Их среднее арифметическое равно

(44+46):2 = 90:2 = 45 кг.

Поэтому и медиана ряда будет равна 45 кг.

Ошибки в статистике

Статистика является очень мощным инструментом для исследований во всех областях человеческой деятельности. Однако иногда ее иронично называют самой точной из лженаук. Известно и ещё одно высказывание, приписываемое политику Дизраэли, согласно которому существует просто ложь, наглая ложь и статистика. С чем же связана такая репутация этой дисциплины?

Дело в том, что некоторые люди и организации часто манипулируют данными статистики, чтобы убедить других в своей правоте или преимуществах товара, которые они продают. Требуются определенные навыки, чтобы правильно пользоваться статистикой. Одна из самых распространенных ошибок – это неправильный выбор выборки.

В 1936 году перед президентскими выборами в США был проведен телефонный опрос, который показал, что с большим преимуществом победу должен одержать Альфред Лендон. Однако на выборах Франклин Рузвельт набрал почти вдвое больше голосов. Ошибка была связана с тем, что в те годы телефон могли позволить себе только богатые люди, которые в большинстве своем поддерживали Лендона. Однако бедные люди (а их, конечно же, больше, чем богатых) голосовали за Рузвельта.

Ещё один пример – это агитация в конце XIX века в США к службе на флоте. Пропагандисты в своей рекламе указывали, что, согласно статистике, смертность на флоте во время войны (испано-американской) составляет 0,09%, в то время как среди населения Нью-Йорка она равнялась 0,16%. Получалось, что служить на флоте в военное время безопаснее, чем жить мирной жизнью. Однако на самом деле причина таких цифр заключается в том, что во флот всегда отбирали молодых мужчин с хорошим здоровьем, которые не могли умереть от «старческих» болезней, в то время как в население Нью-Йорка входят больные и старые люди.

При указании среднего значения исследователь может использовать разные характеристики – среднее арифметическое, медиана, мода. При этом почти всегда среднее арифметическое несколько больше медианы. Именно поэтому большинство людей, узнающих о средней зарплате в стране, удивляются, так как они столько не зарабатывают. Правильнее ориентироваться на медианную зарплату.

Ну и наконец, нельзя забывать, что любая статистика может показать только корреляцию между двумя величинами, но это не всегда означает причинно-следственную связь. Так, известно, что чем больше в городе продается мороженого, тем больше в это же время людей тонет на пляжах. Означает ли это, что поедание мороженого увеличивает риск во время плавания? Нет. Дело в том, что оба этих показателя, продажи мороженого и количество утонувших, зависят от третьей величины – температуры в городе. Чем жарче на улице, тем большее количество людей ходят на пляж и тем больше мороженого продается в магазинах.

Автор статьи

Эксперт по предмету «Математика»

Задать вопрос автору статьи

Генеральная средняя

Пусть нам дана генеральная совокупность относительно случайной величины $X$. Для начала напомним следующее определение:

Определение 1

Генеральная совокупность — совокупность случайно отобранных объектов данного вида, над которыми проводят наблюдения с целью получения конкретных значений случайной величины, проводимых в неизменных условиях при изучении одной случайной величины данного вида.

Определение 2

Генеральная средняя — среднее арифметическое значений вариант генеральной совокупности.

Пусть значения вариант $x_1, x_2,dots ,x_k$ имеют, соответственно, частоты $n_1, n_2,dots ,n_k$. Тогда генеральная средняя вычисляется по формуле:

Логотип baranka

Сдай на права пока
учишься в ВУЗе

Вся теория в удобном приложении. Выбери инструктора и начни заниматься!

Получить скидку 3 000 ₽

Рассмотрим частный случай. Пусть все варианты $x_1, x_2,dots ,x_k$ различны. В этом случае $n_1, n_2,dots ,n_k=1$. Получаем, что в этом случае генеральная средняя вычисляется по формуле:

Выборочная средняя

Пусть нам дана выборочная совокупность относительно случайной величины $X$. Для начала напомним следующее определение:

Определение 3

Выборочная совокупность — часть отобранных объектов из генеральной совокупности.

Определение 4

Выборочная средняя — среднее арифметическое значений вариант выборочной совокупности.

Пусть значения вариант $x_1, x_2,dots ,x_k$ имеют, соответственно, частоты $n_1, n_2,dots ,n_k$. Тогда выборочная средняя вычисляется по формуле:

Рассмотрим частный случай. Пусть все варианты $x_1, x_2,dots ,x_k$ различны. В этом случае $n_1, n_2,dots ,n_k=1$. Получаем, что в этом случае выборочная средняя вычисляется по формуле:

«Средняя выборки: генеральная, выборочная» 👇

!!! В случае, когда значение вариант не являются дискретными, а представляют из себя интервалы, то в формулах для вычисления генеральной или выборочной средних значений за значение $x_i$ принимается значение середины интервала, которому принадлежит $x_i.$

Примеры задач на нахождение средней выборки

Пример 1

В магазин завезли 10 видов шоколадных конфет. По ним проведена следующая выборка по цене за килограмм: 70, 65, 97, 83, 120, 107, 77, 88, 100, 86. Построить ряд распределения данной генеральной совокупности и найти её генеральное среднее.

Решение.

Видим, что все значения вариант различны, поэтому частоты равны единице. Ряд распределения можно записать следующим образом, перечислив значения вариант в порядке возрастания:

Рисунок 1.

Так как наша совокупность является генеральной и все варианты различны, то мы будем пользоваться следующей формулой:

[overline{x_г}=frac{sumlimits^k_{i=1}{x_i}}{n}]

Получим:

[overline{x_г}=frac{65+70+77+83+86+88+97+100+107+120}{10}=89,3]

Ответ: 89,3.

Пример 2

Выборочная совокупность задана следующей таблицей распределения:

Рисунок 2.

Найти среднее выборочное данной совокупности.

Решение.

Для нахождения значения выборочной средней будем пользоваться следующей формулой:

[overline{x_в}=frac{sumlimits^k_{i=1}{x_in_i}}{n}]

Обычно, для наглядности и удобности вычислений составляется расчетная таблица, в которую входят необходимые промежуточные вычисления. В нашем случае составим таблицу со следующей «шапкой»:

Рисунок 3.

Внизу таблицы также добавляется строка «итог», в которой подсчитывается сумма по всем значениям столбцов. Проведя необходимые вычисления, получим следующую расчетную таблицу:

Рисунок 4.

Используя формулу, получим:

[overline{x_в}=frac{sumlimits^k_{i=1}{x_in_i}}{n}=frac{305}{20}=15,25]

Ответ: 15,25.

Пример 3

Проводится социальный опрос среди 100 пенсионеров об уровне их пенсии. Получена следующая таблица распределения результатов опроса (размер пенсии указан в тысячах рублей):

Рисунок 5.

Найти среднее выборочное данной совокупности.

Данная совокупность является выборочной, поэтому будем пользоваться следующей формулой:

[overline{x_в}=frac{sumlimits^k_{i=1}{x_in_i}}{n}]

Составим, для начала, расчетную таблицу.

Рисунок 6.

Получаем:

[overline{x_в}=frac{sumlimits^k_{i=1}{x_in_i}}{n}=frac{964}{100}=9,64]

Ответ: 9,64.

Находи статьи и создавай свой список литературы по ГОСТу

Поиск по теме

Меры центральной тенденции.

До сих пор мы обсуждали методы, которые мы можем использовать для организации и представления финансовых данных с целью того, чтобы они были более понятными.

Например, частотное распределение доходности класса активов показывает характер рисков, с которыми инвесторы могут столкнуться в конкретном классе активов. Гистограмма годовой доходности S&P 500 ясно показывает, что большие положительные и отрицательные значения годовой доходности являются обычной ситуацией.

Хотя таблицы частотных распределений и гистограммы предоставляют собой удобный способ обобщить серии наблюдений, эти методы являются лишь первым шагом к описанию финансовых данных.

В этом разделе мы обсудим использование количественных показателей, которые объясняют характеристики данных. Наше внимание сосредоточено на мерах центральной тенденции и других показателях (или параметрах), характеризующих положение данных.

Показатель или мера центральной тенденции (англ. ‘measure of central tendency’) указывает, насколько центрированы финансовые данные.

Меры центральной тенденции, вероятно, используются более широко, чем любые другие статистические показатели, потому что их легко рассчитать и применить. Меры положения (англ. ‘measures of location’) включают в себя не только меры центральной тенденции, но и другие показатели, которые иллюстрируют местоположение или распространение данных в рамках распределения.

Далее мы рассмотрим общепринятые меры центральной тенденции — среднее арифметическое, медиану, моду, взвешенное среднее и среднее геометрическое. Мы также объясняем другие полезные меры положения, включая квартили, квинтили, децили и процентили.

Среднее арифметическое.

Финансовые аналитики и портфельные менеджеры часто хотят получить одно число, которое репрезентативно описывает возможный исход инвестиционного решения. Среднее арифметическое — безусловно, наиболее часто используемая мера середины или центра данных.

Определение среднего арифметического.

Среднее арифметическое (англ. ‘arithmetic mean’) — это сумма наблюдений, деленная на количество наблюдений.

Мы можем вычислить среднее арифметическое как для совокупностей, так и для выборок. Эти показатели известны как среднее по совокупности и выборочное среднее значение соответственно.

Среднее значение для совокупности.

Среднее значение для совокупности (математическое ожидание или среднее по совокупности, от англ. ‘population mean’) — это среднее арифметическое значение, рассчитанное для совокупности.

Если мы можем адекватно определить совокупность, то мы можем рассчитать среднее значение для совокупности как среднее арифметическое всех наблюдений или значений в совокупности.


Например, аналитики, изучающие годовой рост продаж крупных оптовых клубов в США за 2013 финансовый год, могут определить интересующую совокупность, включив в нее только три компании: BJ’s Wholesale Club (частная компания с 2011 г.), Costco Wholesale Corporation. и Sam’s Club, входящую в группу Wal-Mart.

Оптовый клуб (англ. ‘wholesale club’) — это формат магазина, предназначенного в основном для оптовых продаж в торговых точках размером со склад для клиентов, которые платят членские взносы. По состоянию на начало 2010-х годов эти три оптовых клуба доминировали в данном сегменте в Соединенных Штатах.

В качестве другого примера можно привести портфельного менеджера, специализирующегося на индексе Nikkei 225. Интересующая его совокупность включает 225 акций из первой секции Токийской фондовой биржи, которые формируют индекс Nikkei.

Формула среднего значения для совокупности.

Среднее по совокупности, ( bf mu), является средним арифметическим значением совокупности.

Для конечной совокупности используется следующая формула среднего значения:

(large{ mu = {dsum_{i=1}^{N}X_i over N} }) (Формула 2)

где:

  • (N) — количество наблюдений во всей совокупности, а
  • (X_i) — (i)-е наблюдение.

Среднее по совокупности является примером статистического параметра. Среднее значение для совокупности уникально; то есть, данная совокупность имеет только одно среднее значение.


Чтобы проиллюстрировать расчеты по приведенной формуле, мы можем найти среднее по совокупности для доли прибыли в выручке американских компаний, управляющих крупными оптовыми клубами за 2012 год.

В течение года прибыль в процентах от выручки для оптовых клубов BJ, Costco Wholesale Corporation, и Wal-Mart Stores составляли 0,9%, 1,6% и 3,5% соответственно, согласно списку Fortune 500 за 2012 год. Таким образом, среднее значение по совокупности для прибыли в процентах от выручки составило:

(mu) = (0,9 + 1,6 + 3,5)/3 = 6/3 = 2%

Выборочное среднее значение.

Среднее значение по выборке (выборочное среднее или выборочное среднее значение, от англ. ‘sample mean’) — это среднее арифметическое значение, вычисленное для выборки.

Очень часто мы не можем наблюдать каждый элемент множества данных; вместо этого мы наблюдаем подмножество или выборку из генеральной совокупности.

Концепция среднего значения может применяться к наблюдениям в выборке с небольшим изменением обозначений.

Формула выборочного среднего значения.

Выборочное среднее, ( overline{X} ) (читается как «X-bar») — это среднее арифметическое значение по выборке:

(large{ overline{X} = {dsum_{i=1}^{n}X_i over n} }) (Формула 3)

где:

  • (n) — количество наблюдений в выборке.

Формула 3 предписывает суммировать значения наблюдений (X_i) и делить эту сумму на количество наблюдений. Например, если выборка коэффициентов прибыли на акцию (P/E) для шести публичных компаний содержит значения 35, 30, 22, 18, 15 и 12, то среднее значение P/E для выборки будет 132/6 = 22. Среднее значение выборки также называется средним арифметическим (англ. ‘arithmetic average’).

Статистики предпочитают использовать термин «mean», а на «average» (в русском переводе это одно и то же — «среднее»). Некоторые авторы называют все меры центральной тенденции (включая медиану и моду) термином «average». Термин «mean» позволяет избежать любой путаницы.

Как отмечалось ранее, выборочное среднее значение является статистикой (то есть описательной мерой выборки).


Средние значения можно рассчитывать для отдельных статистических единиц или для временного отрезка.

В качестве примера можно привести рентабельность собственного капитала (ROE) за 2013 год для 100 компаний из FTSE Eurotop 100, индексе 100 крупнейших компаний Европы. В этом случае мы рассчитываем среднее значение ROE за 2013 год в среднем по 100 отдельным статистическим единицам (или элементам множества, от англ. ‘statistical unit’ или просто ‘unit’).

Когда мы изучаем характеристики некоторых статистических единиц в определенный момент времени (например, ROE для FTSE Eurotop 100), мы изучаем перекрестные данные (англ. ‘cross-sectional data’). Среднее этих наблюдений называется перекрестным средним значением (англ. ‘cross-sectional mean’).

[см. также: CFA — Временные ряды и перекрестные данные]

С другой стороны, если наша выборка состоит из исторической месячной доходности по FTSE Eurotop 100 за последние 5 лет, то мы имеем дело с данными временного ряда (англ. ‘time-series data’). Среднее значение этих наблюдений называется средним временного ряда (англ. ‘time-series mean’).

Мы рассмотрим специализированные статистические методы, связанные с поведением временных рядов в следующих разделах, посвященных анализу временных рядов.

Ниже мы покажем пример определения выборочной средней доходности для 16 европейских фондовых рынков за 2012 г. В этом случае среднее значение является перекрестным, поскольку мы усредняем доходность по отдельным странам.

Пример вычисления перекрестного среднего значения.

Индекс MSCI EAFE (Европа, Австралия и Дальний Восток) — это индекс рыночной капитализации, скорректированный с учетом свободного обращения акций, предназначенный для оценки акций в развитых странах, за исключением США и Канады.

Термин «скорректированный с учетом свободного обращения акций» (англ. ‘free float-adjusted’) означает, что веса компаний в индексе отражают стоимость акций, фактически доступных для инвестиций.

По состоянию на сентябрь 2013 года EAFE состояла из 22 индексов стран развитых рынков, включая индексы для 16 европейских рынков, 2 австралийских рынков (Австралия и Новая Зеландия), 3 дальневосточных рынков (Гонконг, Япония и Сингапур) и Израиля.

Предположим, что мы заинтересованы в показателях динамики местной валюты на 16 европейских рынках EAFE в 2012 году. Мы хотим найти примерную среднюю общую доходность за 2012 год по этим 16 рынкам.

Ряды ставок доходности, представленные в Таблице 8, приведены в местной валюте (то есть доходность указана для инвесторов, проживающих в стране). Поскольку эта доходность не указывается в валюте каждого отдельного инвестора, она не является доходностью, которую мог бы получить отдельный инвестор. Это, скорее, средняя доходность для местных валют 16 стран.

Таблица 8. Общая доходность европейских фондовых рынков, 2012 г.

Рынок

Общая доходность
в местной валюте (%)

Австрия

20.72

Бельгия

33.99

Дания

28.09

Финляндия

8.27

Франция

15.90

Германия

25.24

Греция

-2.35

Ирландия

2.24

Италия

6.93

Нидерланды

15.36

Норвегия

6.05

Португалия

-2.22

Испания

-4.76

Швеция

12.66

Швейцария

14.83

Великобритания

5.93

Источник: www.msci.com.

Используя данные Таблицы 8, рассчитайте выборочную среднюю доходность для 16 фондовых рынков за 2012 год.


Решение:

При расчете к ставкам доходности применяется Формула 3:

(20,72 + 33,99 + 28,09 + 8,27 + 15,90 + 25,24 — 2,35 + 2,24 + 6,93 + 15,36 + 6,05 — 2,22 — 4,76 + 12,66 + 14,83 + 5,93) / 16 = 186,88 / 16 = 11,68%

Мы можем убедиться, что на 8 рынках доходность была меньше среднего, а на других 8 — выше среднего. Мы не должны ожидать, что какие-либо фактические наблюдения будут равны среднему значению, потому что выборочные средние значения предоставляют только сводку анализируемых данных.

Кроме того, хотя в этом примере число значений ниже среднего равно количеству значений выше среднего, это не обязательно так на самом деле. Как финансовому аналитику, вам часто нужно будет находить несколько показателей, которые описывают характеристики распределения.

Среднее значение — это, как правило, статистика, которую вы будете использовать как показатель типичного результата для распределения. Затем вы можете использовать среднее значение для сравнения динамики двух разных рынков.

Например, вам может быть интересно сравнить показатели фондового рынка стран Азиатско-Тихоокеанского региона с показателями фондового рынка европейских стран. Вы можете использовать среднюю доходность этих рынков, чтобы сравнить результаты инвестиций.

Свойства среднего арифметического.

Среднее арифметическое можно сравнить с центром тяжести объекта. Рисунок 5 выражает эту аналогию графически и представляет собой график девять гипотетических наблюдений.

Девять наблюдений: 2, 4, 4, 6, 10, 10, 12, 12 и 12. Среднее арифметическое составляет 72/9 = 8. Наблюдения наносятся на ось как столбцы с различной высотой в зависимости от их частоты (то есть 2 — высота в одну единицу, 4 — высота в две единицы и т. д.).

Когда ось помещается на точку опоры, она сбалансируется только тогда, когда точка опоры совпадает с отметкой на оси, соответствующей среднему арифметическому значению.

Рисунок 5. Аналогия с центром тяжести для среднего арифметического. Рисунок 5. Аналогия с центром тяжести для среднего арифметического.

Когда точка опоры установлена на отметку 8, ось идеально сбалансирована.


Как финансовые аналитики, мы часто используем среднюю доходность как меру типичного результата для актива. Однако, как и в приведенном выше примере, некоторые результаты оказываются выше среднего, а некоторые — ниже. Мы можем рассчитать расстояние между средним значением и каждым результатом и назвать его отклонением (англ. ‘deviation’).

Математически всегда верно, что сумма отклонений от среднего равна 0. Мы можем убедиться в этом, взяв среднее арифметическое, приведенное в Формуле 3, и умножив обе части уравнения на (n):

({ noverline{X} = dsum_{i=1}^{n}X_i })

Таким образом, сумма отклонений от среднего значения может быть рассчитана следующим образом:

({ begin{align} & sum_{i=1}^{n} (X_i — overline{X}) = \ & sum_{i=1}^{n}X_i — sum_{i=1}^{n} overline{X} = \ & sum_{i=1}^{n}X_i — noverline{X} = 0 end{align} })

Отклонения от среднего арифметического являются важной информацией, поскольку они указывают на риск. Концепция отклонений от среднего значения формирует основу для более сложных понятий дисперсии, асимметрии и эксцесса, которые мы обсудим в следующих разделах.

Преимущества и недостатки среднего арифметического.

Преимущество среднего арифметического над двумя другими мерами центральной тенденции, — медианой и модой, состоит в том, что среднее использует всю информацию о размере и величине наблюдений. Со средним арифметическим также легко работать математически.

Потенциальный недостаток среднего арифметического — это его чувствительность к экстремальным значениям.

Поскольку для вычисления среднего значения используются все наблюдения, среднее арифметическое может резко увеличиваться или уменьшаться за счет чрезвычайно больших или малых наблюдений, соответственно.

Например, предположим, что мы вычисляем среднее арифметическое следующих семи чисел: 1, 2, 3, 4, 5, 6 и 1000.

Среднее значение равно 1,021 / 7 = 145,86 или приблизительно 146. Поскольку величина среднего, 146, намного больше, чем величина большинства наблюдений (первые 6), мы можем задаться вопросом, насколько хорошо она представляет положение данных в распределении.

На практике, хотя экстремальное значение (или выброс, от англ. ‘outlier’) в финансовых данных может быть редким значением в совокупности, оно также может отражать ошибку, допущенную при записи значения наблюдения или ошибку при формировании выборки из совокупности.

В частности, в последних двух случаях среднее арифметическое может вводить в заблуждение. Наиболее распространенный подход в таких случаях — использовать медиану вместо или в дополнение к среднему значению.

Медиана будет рассмотрена далее.


Другие подходы к обработке экстремальных значений включают применение вариаций среднего арифметического.

Усеченное среднее значение (от англ. ‘trimmed mean’ или ‘truncated mean’) вычисляется путем исключения указанного небольшого процента самых низких и самых высоких значений. Затем вычисляется среднее арифметическое из оставшихся значений.

Например, среднее значение, усеченное на 5%, отбрасывает наименьшие 2,5% и наибольшие 2,5% значений и вычисляет среднее из оставшихся 95% значений.

Усеченное среднее значение часто используется в спортивных соревнованиях, когда самые низкие и самые высокие оценки судей отбрасываются при подсчете оценки участника.



3.1. Показатели центральной тенденции

Простейший пример такого показателя нам уже встречался – это среднее арифметическое значение. Но средней

дело не ограничивается, впрочем, обо всём по порядку:

3.1.1. Генеральная и выборочная средняя

Пусть исследуется некоторая генеральная совокупность объёма , а именно её числовая характеристика , не важно, дискретная или непрерывная.

Генеральной средней называют среднее арифметическое всех значений этой совокупности:

Если среди чисел  есть одинаковые (что

характерно для дискретного ряда), то формулу можно записать в более компактном

виде:
, где:
варианта  повторяется  раз;
варианта  –  раз;
варианта  –  раз;

варианта  –  раз.

Живой пример вычисления генеральной средней встретился в Примере 2, но чтобы не занудничать, я даже не буду

напоминать его содержание. Далее.

Как мы помним, обработка всей генеральной совокупности часто затруднена либо невозможна, и поэтому из неё организуют представительную выборку объема , и на основании исследования этой выборки делают вывод обо всей совокупности.

Выборочной средней называется среднее арифметическое всех значений выборки:

и при наличии одинаковых вариант формула запишется компактнее:
 – как сумма произведений вариант  на соответствующие частоты , делённая на объём совокупности .

Выборочная средняя  позволяет достаточно

точно оценить истинное значение , при этом, чем

больше выборка, тем точнее будет эта оценка.

Практику начнём с дискретного вариационного ряда и знакомого условия:

Пример 8

По результатам выборочного исследования  рабочих цеха были установлены их квалификационные разряды: 4, 5, 6, 4, 4, 2, 3, 5, 4,

4, 5, 2, 3, 3, 4, 5, 5, 2, 3, 6, 5, 4, 6, 4, 3.

Это числа из Примера 4, но теперь нам требуется: вычислить выборочную среднюю, и, не отходя от станка, найти моду

и медиану.

Как решать задачу? Если нам даны первичные данные (конкретные варианты ), то их можно тупо просуммировать и разделить результат на объём

выборки:
 – средний квалификационный разряд рабочих

цеха.

Но здесь удобнее составить вариационный ряд:

и использовать «цивилизованную» формулу:

3.1.2. Мода

3. Основные показатели статистической совокупности

| Оглавление |



Понравилась статья? Поделить с друзьями:
  • Скайрим как найти заклинание невидимости
  • Как найти свою родословную по фамилии онлайн
  • Как найти костюм долга
  • Как найти общий язык с шизофреником
  • Как найти произведение векторов если они перпендикулярны