Как найти выборочный коэффициент ранговой корреляции

Решения задач на ранговую корреляцию

В случае, когда силу зависимости между случайными величинами невозможно определить численно при помощи обычного коэффициента корреляции, используют ранговую корреляцию, которая имеет дело не с непосредственными значениями, а с рангами (порядковыми номерами).

Наиболее часто используют коэффициент ранговой корреляции Спирмена, вычисление которого можно разбить на этапы:

  1. Сопоставить каждому из значений признаков свой ранг (для одинаковых значений ранг вычисляется как среднее арифметическое рангов)
  2. Найти сумму квадратов разностей рангов $d_i$ — $sum{d_i^2}$
  3. Вычислить значение коэффициента Спирмена по формуле $rho=1-6sum{d_i^2}/(n^3-n)$
  4. Проверить значимость коэффициента по критерию Стьюдента или установить тесноту связи по шкале Чеддока (0,3 или меньше — слабая связь, 0,4-0,7 — средняя, 0,7-0,9 — высокая теснота, 0,9-1 — крайне высокая).

Помимо коэффициента Спирмена используется также коэффициент ранговой корреляции Кендалла. Примеры вы можете найти ниже.

Спасибо за ваши закладки и рекомендации

Примеры решений на ранговую корреляцию онлайн

Коэффициент ранговой корреляции Спирмена

Пример 1. Тринадцать цветных полос расположены в порядке убывания окраски от темной к светлой и каждой полосе присвоен ранг – порядковый номер A. При проверке способности различать оттенки цветов испытуемый расположил полосы в следующем порядке B:
A 1 2 3 4 5 6 7 8 9 10 11 12 13
B 6 3 4 2 1 10 7 8 9 5 11 13 12
Найти выборочный коэффициент ранговой корреляции Спирмена между «правильными» рангами оттенков A и рангами B, которые им присвоил испытуемый.

Пример 2. Два преподавателя оценили знания 12 учащихся по стобалльной системе и выставили им следующие оценки (в первой строке указано количество баллов, выставленных первым преподавателем, а во второй – вторым):
98 94 88 80 76 70 63 61 60 58 56 51
99 91 93 74 78 65 64 66 52 53 48 62
Найти выборочный коэффициент ранговой корреляции Спирмена между оценками двух преподавателей.

Пример 3. Три арбитра оценили мастерство 10 спортсменов, в итоге были получены три последовательности рангов (в первой строке приведены ранги арбитра А, во второй – ранги арбитра В, в третьей – ранги арбитра С):
1 2 3 4 5 6 7 8 9 10
3 10 7 2 8 5 6 9 1 4
6 2 1 3 9 4 5 7 10 8
Определить пару арбитров, оценки которых наиболее согласуются, используя коэффициент ранговой корреляции Спирмена.

Пример 4. С помощью коэффициента ранговой корреляции установить зависимость между стажем практической работы и временем решения контрольной задачи у 10 программистов на основе следующих данных:

Коэффициент ранговой корреляции Кендалла

Пример 5. Два контролера расположили 10 деталей в порядке ухудшения их качества. В итоге были получены две последовательности рангов:
1 2 3 4 5 6 7 8 9 10
1 2 4 3 6 5 7 10 9 8
Используя коэффициент ранговой корреляции Кендалла, определить, согласуются ли оценки контролеров.

Пример 6. При дегустации 10 сортов продукции двумя специалистами были получены следующие оценки:
I- 3,5,10,5,4,2,3,2,1,7
II- 5,1,9,4,3,1,2,7,8,5
Используя различные показатели тесноты связи установить, есть ли связь между оценками первого и второго специалистов.

Нужно решить задачи на проверку ранговой корреляции?

Полезные ссылки

  • Примеры: Линейная регрессия и коэффициент корреляции
  • Примеры: Метод наименьших квадратов
  • Решение задач на заказ
  • Ссылки на учебники
  • Решенные контрольные


Download Article


Download Article

Spearman’s rank correlation coefficient allows you to identify whether two variables relate in a monotonic function (i.e., that when one number increases, so does the other, or vice versa). To calculate Spearman’s rank correlation coefficient, you’ll need to rank and compare data sets to find Σd2, then plug that value into the standard or simplified version of Spearman’s rank correlation coefficient formula. You can also calculate this coefficient using Excel formulas or R commands.

Things You Should Know

  • Calculate the coefficient by finding Σd2, then plugging that value into the Spearman’s rank correlation coefficient formula.
  • You can also easily calculate this coefficient using Excel.
  • Alternatively, you can find this coefficient using R commands.

Calculation Help

  1. Image titled Table_338

    1

    Draw your data table. This will organize the information you need to calculate Spearman’s Rank Correlation Coefficient. You will need:[1]

    • 6 Columns, with headers as shown below.
    • As many rows as you have pairs of data.
  2. Image titled Table2_983

    2

    Fill in the first two columns with your pairs of data.

    Advertisement

  3. Image titled Table3_206

    3

    In your third column rank the data in your first column from 1 to n (the number of data you have). Give the lowest number a rank of 1, the next lowest number a rank of 2, and so on.

  4. Image titled Table4_228

    4

    In your fourth column do the same as in step 3, but instead rank the second column.

    • Image titled Mean_742

      If two (or more) pieces of data in one column are the same, find the mean of the ranks as if those pieces of data had been ranked normally, then rank the data with this mean.
      In the example at right, there are two 5s that would otherwise have ranks of 2 and 3. Since there are two 5s, take the mean of their ranks. The mean of 2 and 3 is 2.5, so assign the rank 2.5 to both 5s.

  5. Image titled Table5_263

    5

    In the «d» column calculate the difference between the two numbers in each pair of ranks. That is, if one is ranked 1 and the other 3 the difference would be 2. (The sign doesn’t matter, since the next step is to square this number.)[2]

  6. Image titled Table6_205

    6

    Square each of the numbers in the «d» column and write these values in the «d2» column.

  7. 7

    Add up all the data in the «d2» column. This value is Σd2.

    Image titled Step7_812

  8. 8

    Choose one of these formulae:

  9. 9

    Interpret your result. It can vary between -1 and 1.

    • Close to -1 — Negative correlation.
    • Close to 0 — No linear correlation.
    • Close to 1 — Positive correlation.
  10. Advertisement

  1. 1

    Create new columns with the ranks of your existing columns. For example, if your data is in Column A2:A11, you want to use the formula «=RANK(A2,A$2:A$11)», and copy it down and across for all your rows and columns.[4]

  2. 2

    Break ties as described in step 3, 4 method 1.

  3. 3

    In a new cell, do a correlation between the two rank columns with something like «=CORREL(C2:C11,D2:D11)». In this case, C and D would correspond to the rank columns. The correlation cell will have your Spearman’s Rank Correlation.

  4. Advertisement

  1. 1

  2. 2

    Save your data as a CSV file with the data you want to correlate in the first two columns. You can typically do this through the «Save as» menu.

  3. 3

    Open the R editor. If you are on the terminal, simply run R. From the desktop, you want to click on the R logo.

  4. 4

    Type the commands:

    • d <- read.csv(«NAME_OF_YOUR_CSV.csv») and hit enter
    • cor(rank(d[,1]),rank(d[,2]))[5]
  5. Advertisement

Add New Question

  • Question

    How do I find coefficients?

    Community Answer

    The coefficient is next to the variable. With the example, «4pq,» the coefficient is 4.

  • Question

    Is there a correlation between data 1 and data 2?

    Community Answer

    No, there should not be a correlation.

Ask a Question

200 characters left

Include your email address to get a message when this question is answered.

Submit

Advertisement

  • Most data sets should contain at least 5 pairs of data in order to identify a trend (3 were used for the example to make it easier to demonstrate).

Thanks for submitting a tip for review!

Advertisement

  • Spearman’s rank correlation coefficient will only identify the strength of correlation where the data is consistently increasing or decreasing. If a scatter graph of the data any other trend Spearman’s rank will not give an accurate representation of its correlation.

  • This formula is based on the assumption that there are no ties. When there are ties such as in the example one should use the definition: the product moment correlation coefficient based on the ranks.

Advertisement

About This Article

Thanks to all authors for creating a page that has been read 834,460 times.

Did this article help you?


Загрузить PDF


Загрузить PDF

Коэффициент корреляции ранга Спирмена позволяет определить, существует ли между двумя переменными зависимость, выражаемая монотонной функцией (то есть при росте одной переменной увеличивается и вторая, и наоборот). Приведенные в статье простые шаги позволят вам производить расчеты вручную, а также вычислять коэффициент корреляции при помощи программ Excel и R.

  1. Изображение с названием Table_338

    1

    Составьте таблицу данных. Таким образом вы упорядочите информацию, необходимую для расчета коэффициента корреляции ранга Спирмена. При этом вам понадобится:

    • 6 колонок, озаглавленных так, как показано выше на рисунке.
    • Количество строк, соответствующее числу пар переменных.
  2. Изображение с названием Table2_983

    2

    Заполните первые две колонки парами переменных.

  3. Изображение с названием Table3_206

    3

    В третьей колонке запишите номера (ранги) пар переменных от 1 до n (общее число пар). Присвойте номер 1 паре с наименьшим значением в первой колонке, 2 — следующему за ним значению, и так по возрастанию величин переменной из первой колонки.

  4. Изображение с названием Table4_228

    4

    В четвертой колонке сделайте то же, что и в третьей, но на этот раз пронумеруйте пары переменных по второй колонке таблицы.

    • Изображение с названием Mean_742

      Если два (или более) значения переменной в одной колонке одинаковы, расположите их один за другим и найдите среднее значение их номеров, затем пронумеруйте их этим средним значением.
      В приведенном справа примере два значения переменной совпадают и равны 5; в случае нормальной нумерации эти данные получили бы ранги 2 и 3. Поскольку значения одинаковы, находим среднюю величину их рангов. Среднее 2 и 3 равно 2,5, поэтому обеим величинам присваиваем ранг 2,5.

  5. Изображение с названием Table5_263

    5

    В колонке «d» вычислите разность между двумя рангами из предыдущих двух колонок. Например, если ранг в третьей колонке равен 1, а в четвертой – 3, то разница между ними составит 2. Знак не имеет значения, поскольку на следующем шаге эти числа будут возведены в квадрат.

  6. Изображение с названием Table6_205

    6

    Возведите каждое значение из колонки «d» в квадрат и запишите полученные величины в колонку «d2«.

  7. 7

    Просуммируйте все значения из колонки «d2«. Вы определите сумму Σd2.

    Изображение с названием Step7_812

  8. 8

    Воспользуйтесь одной из следующих формул:

  9. 9

    Проанализируйте результат. Полученное значение находится между -1 и 1.

    • Если оно близко к -1, корреляция отрицательна.
    • Если близко к 0, корреляция отсутствует.
    • Если близко к 1, наблюдается положительная корреляция.
    • Не забудьте поделить на сумму переменных и взять корень. После этого поделите на Σd2.
      Изображение с названием Step7_812

    Реклама

  1. 1

    Создайте новые колонки с рангами, соответствующими колонкам данных. Например, если данные внесены в Колонку A2:A11, используйте функцию «=RANK(A2,A$2:A$11)» и занесите результаты для всех строк в новую колонку.

  2. 2

    Найдите ранги для одинаковых величин, как описано в шагах 3 и 4 метода 1.

  3. 3

    В новой ячейке определите корреляцию между двумя колонками рангов с помощью функции «=CORREL(C2:C11,D2:D11)». В данном случае C и D – это колонки, содержащие ранги. Таким образом, в данной ячейке вы получите коэффициент ранговой корреляции Спирмена.

    Реклама

  1. 1

    Если у вас еще нет программы R для обработки статистических данных, приобретите ее (см. http://www.r-project.org).

  2. 2

    Сохраните данные в формате CSV, расположив их в двух колонках, корреляцию между которыми вы собираетесь исследовать. Сохранить файл в данном формате легко посредством опции «Сохранить как».

  3. 3

    Откройте редактор R. Если вы еще не вошли в программу R, просто запустите ее. Для этого достаточно нажать иконку R на рабочем столе.

  4. 4

    Наберите команды:

    • d <- read.csv(«NAME_OF_YOUR_CSV.csv») и нажмите клавишу ввода
    • cor(rank(d[,1]),rank(d[,2]))

    Реклама

Советы

  • Как правило, набор данных должен состоять не менее чем из 5 пар для того, чтобы можно было достоверно установить какую-либо корреляцию (3 пары было использовано в примере выше для простоты).

Реклама

Предупреждения

  • Коэффициент ранговой корреляции Спирмена позволяет установить лишь то, растут ли обе переменные или уменьшаются одновременно. Если разброс данных слишком велик, этот коэффициент не даст точного значения корреляции.
  • Приведенная функция даст верный результат при отсутствии одинаковых значений в массиве данных. Если такие значения существуют, как в рассмотренном нами примере, необходимо использовать следующее определение: коэффициент корреляции, основанный на рангах.

Реклама

Об этой статье

Эту страницу просматривали 68 902 раза.

Была ли эта статья полезной?

Понравилась статья? Поделить с друзьями:
  • Как найти видео поездов
  • Как найти смотрителя в майнкрафт
  • Как исправить понос у ребенка
  • Как можно исправить воронкообразную грудную клетку в 16 лет девушке
  • Как найти mysql ini