Решения задач на ранговую корреляцию
В случае, когда силу зависимости между случайными величинами невозможно определить численно при помощи обычного коэффициента корреляции, используют ранговую корреляцию, которая имеет дело не с непосредственными значениями, а с рангами (порядковыми номерами).
Наиболее часто используют коэффициент ранговой корреляции Спирмена, вычисление которого можно разбить на этапы:
- Сопоставить каждому из значений признаков свой ранг (для одинаковых значений ранг вычисляется как среднее арифметическое рангов)
- Найти сумму квадратов разностей рангов $d_i$ — $sum{d_i^2}$
- Вычислить значение коэффициента Спирмена по формуле $rho=1-6sum{d_i^2}/(n^3-n)$
- Проверить значимость коэффициента по критерию Стьюдента или установить тесноту связи по шкале Чеддока (0,3 или меньше — слабая связь, 0,4-0,7 — средняя, 0,7-0,9 — высокая теснота, 0,9-1 — крайне высокая).
Помимо коэффициента Спирмена используется также коэффициент ранговой корреляции Кендалла. Примеры вы можете найти ниже.
Спасибо за ваши закладки и рекомендации
Примеры решений на ранговую корреляцию онлайн
Коэффициент ранговой корреляции Спирмена
Пример 1. Тринадцать цветных полос расположены в порядке убывания окраски от темной к светлой и каждой полосе присвоен ранг – порядковый номер A. При проверке способности различать оттенки цветов испытуемый расположил полосы в следующем порядке B:
A 1 2 3 4 5 6 7 8 9 10 11 12 13
B 6 3 4 2 1 10 7 8 9 5 11 13 12
Найти выборочный коэффициент ранговой корреляции Спирмена между «правильными» рангами оттенков A и рангами B, которые им присвоил испытуемый.
Пример 2. Два преподавателя оценили знания 12 учащихся по стобалльной системе и выставили им следующие оценки (в первой строке указано количество баллов, выставленных первым преподавателем, а во второй – вторым):
98 94 88 80 76 70 63 61 60 58 56 51
99 91 93 74 78 65 64 66 52 53 48 62
Найти выборочный коэффициент ранговой корреляции Спирмена между оценками двух преподавателей.
Пример 3. Три арбитра оценили мастерство 10 спортсменов, в итоге были получены три последовательности рангов (в первой строке приведены ранги арбитра А, во второй – ранги арбитра В, в третьей – ранги арбитра С):
1 2 3 4 5 6 7 8 9 10
3 10 7 2 8 5 6 9 1 4
6 2 1 3 9 4 5 7 10 8
Определить пару арбитров, оценки которых наиболее согласуются, используя коэффициент ранговой корреляции Спирмена.
Пример 4. С помощью коэффициента ранговой корреляции установить зависимость между стажем практической работы и временем решения контрольной задачи у 10 программистов на основе следующих данных:
Коэффициент ранговой корреляции Кендалла
Пример 5. Два контролера расположили 10 деталей в порядке ухудшения их качества. В итоге были получены две последовательности рангов:
1 2 3 4 5 6 7 8 9 10
1 2 4 3 6 5 7 10 9 8
Используя коэффициент ранговой корреляции Кендалла, определить, согласуются ли оценки контролеров.
Пример 6. При дегустации 10 сортов продукции двумя специалистами были получены следующие оценки:
I- 3,5,10,5,4,2,3,2,1,7
II- 5,1,9,4,3,1,2,7,8,5
Используя различные показатели тесноты связи установить, есть ли связь между оценками первого и второго специалистов.
Нужно решить задачи на проверку ранговой корреляции?
Полезные ссылки
- Примеры: Линейная регрессия и коэффициент корреляции
- Примеры: Метод наименьших квадратов
- Решение задач на заказ
- Ссылки на учебники
- Решенные контрольные
Download Article
Download Article
Spearman’s rank correlation coefficient allows you to identify whether two variables relate in a monotonic function (i.e., that when one number increases, so does the other, or vice versa). To calculate Spearman’s rank correlation coefficient, you’ll need to rank and compare data sets to find Σd2, then plug that value into the standard or simplified version of Spearman’s rank correlation coefficient formula. You can also calculate this coefficient using Excel formulas or R commands.
Things You Should Know
- Calculate the coefficient by finding Σd2, then plugging that value into the Spearman’s rank correlation coefficient formula.
- You can also easily calculate this coefficient using Excel.
- Alternatively, you can find this coefficient using R commands.
Calculation Help
-
1
Draw your data table. This will organize the information you need to calculate Spearman’s Rank Correlation Coefficient. You will need:[1]
- 6 Columns, with headers as shown below.
- As many rows as you have pairs of data.
-
2
Fill in the first two columns with your pairs of data.
Advertisement
-
3
In your third column rank the data in your first column from 1 to n (the number of data you have). Give the lowest number a rank of 1, the next lowest number a rank of 2, and so on.
-
4
In your fourth column do the same as in step 3, but instead rank the second column.
-
If two (or more) pieces of data in one column are the same, find the mean of the ranks as if those pieces of data had been ranked normally, then rank the data with this mean.
In the example at right, there are two 5s that would otherwise have ranks of 2 and 3. Since there are two 5s, take the mean of their ranks. The mean of 2 and 3 is 2.5, so assign the rank 2.5 to both 5s.
-
-
5
In the «d» column calculate the difference between the two numbers in each pair of ranks. That is, if one is ranked 1 and the other 3 the difference would be 2. (The sign doesn’t matter, since the next step is to square this number.)[2]
-
6
Square each of the numbers in the «d» column and write these values in the «d2» column.
-
7
Add up all the data in the «d2» column. This value is Σd2.
-
8
Choose one of these formulae:
-
9
Interpret your result. It can vary between -1 and 1.
- Close to -1 — Negative correlation.
- Close to 0 — No linear correlation.
- Close to 1 — Positive correlation.
Advertisement
-
1
Create new columns with the ranks of your existing columns. For example, if your data is in Column A2:A11, you want to use the formula «=RANK(A2,A$2:A$11)», and copy it down and across for all your rows and columns.[4]
-
2
Break ties as described in step 3, 4 method 1.
-
3
In a new cell, do a correlation between the two rank columns with something like «=CORREL(C2:C11,D2:D11)». In this case, C and D would correspond to the rank columns. The correlation cell will have your Spearman’s Rank Correlation.
Advertisement
-
1
-
2
Save your data as a CSV file with the data you want to correlate in the first two columns. You can typically do this through the «Save as» menu.
-
3
Open the R editor. If you are on the terminal, simply run R. From the desktop, you want to click on the R logo.
-
4
Type the commands:
- d <- read.csv(«NAME_OF_YOUR_CSV.csv») and hit enter
- cor(rank(d[,1]),rank(d[,2]))[5]
Advertisement
Add New Question
-
Question
How do I find coefficients?
The coefficient is next to the variable. With the example, «4pq,» the coefficient is 4.
-
Question
Is there a correlation between data 1 and data 2?
No, there should not be a correlation.
Ask a Question
200 characters left
Include your email address to get a message when this question is answered.
Submit
Advertisement
-
Most data sets should contain at least 5 pairs of data in order to identify a trend (3 were used for the example to make it easier to demonstrate).
Thanks for submitting a tip for review!
Advertisement
-
Spearman’s rank correlation coefficient will only identify the strength of correlation where the data is consistently increasing or decreasing. If a scatter graph of the data any other trend Spearman’s rank will not give an accurate representation of its correlation.
-
This formula is based on the assumption that there are no ties. When there are ties such as in the example one should use the definition: the product moment correlation coefficient based on the ranks.
Advertisement
About This Article
Thanks to all authors for creating a page that has been read 834,460 times.
Did this article help you?
Загрузить PDF
Загрузить PDF
Коэффициент корреляции ранга Спирмена позволяет определить, существует ли между двумя переменными зависимость, выражаемая монотонной функцией (то есть при росте одной переменной увеличивается и вторая, и наоборот). Приведенные в статье простые шаги позволят вам производить расчеты вручную, а также вычислять коэффициент корреляции при помощи программ Excel и R.
-
1
Составьте таблицу данных. Таким образом вы упорядочите информацию, необходимую для расчета коэффициента корреляции ранга Спирмена. При этом вам понадобится:
- 6 колонок, озаглавленных так, как показано выше на рисунке.
- Количество строк, соответствующее числу пар переменных.
-
2
Заполните первые две колонки парами переменных.
-
3
В третьей колонке запишите номера (ранги) пар переменных от 1 до n (общее число пар). Присвойте номер 1 паре с наименьшим значением в первой колонке, 2 — следующему за ним значению, и так по возрастанию величин переменной из первой колонки.
-
4
В четвертой колонке сделайте то же, что и в третьей, но на этот раз пронумеруйте пары переменных по второй колонке таблицы.
-
Если два (или более) значения переменной в одной колонке одинаковы, расположите их один за другим и найдите среднее значение их номеров, затем пронумеруйте их этим средним значением.
В приведенном справа примере два значения переменной совпадают и равны 5; в случае нормальной нумерации эти данные получили бы ранги 2 и 3. Поскольку значения одинаковы, находим среднюю величину их рангов. Среднее 2 и 3 равно 2,5, поэтому обеим величинам присваиваем ранг 2,5.
-
-
5
В колонке «d» вычислите разность между двумя рангами из предыдущих двух колонок. Например, если ранг в третьей колонке равен 1, а в четвертой – 3, то разница между ними составит 2. Знак не имеет значения, поскольку на следующем шаге эти числа будут возведены в квадрат.
-
6
Возведите каждое значение из колонки «d» в квадрат и запишите полученные величины в колонку «d2«.
-
7
Просуммируйте все значения из колонки «d2«. Вы определите сумму Σd2.
-
8
Воспользуйтесь одной из следующих формул:
-
9
Проанализируйте результат. Полученное значение находится между -1 и 1.
- Если оно близко к -1, корреляция отрицательна.
- Если близко к 0, корреляция отсутствует.
- Если близко к 1, наблюдается положительная корреляция.
- Не забудьте поделить на сумму переменных и взять корень. После этого поделите на Σd2.
Реклама
-
1
Создайте новые колонки с рангами, соответствующими колонкам данных. Например, если данные внесены в Колонку A2:A11, используйте функцию «=RANK(A2,A$2:A$11)» и занесите результаты для всех строк в новую колонку.
-
2
Найдите ранги для одинаковых величин, как описано в шагах 3 и 4 метода 1.
-
3
В новой ячейке определите корреляцию между двумя колонками рангов с помощью функции «=CORREL(C2:C11,D2:D11)». В данном случае C и D – это колонки, содержащие ранги. Таким образом, в данной ячейке вы получите коэффициент ранговой корреляции Спирмена.
Реклама
-
1
Если у вас еще нет программы R для обработки статистических данных, приобретите ее (см. http://www.r-project.org).
-
2
Сохраните данные в формате CSV, расположив их в двух колонках, корреляцию между которыми вы собираетесь исследовать. Сохранить файл в данном формате легко посредством опции «Сохранить как».
-
3
Откройте редактор R. Если вы еще не вошли в программу R, просто запустите ее. Для этого достаточно нажать иконку R на рабочем столе.
-
4
Наберите команды:
- d <- read.csv(«NAME_OF_YOUR_CSV.csv») и нажмите клавишу ввода
- cor(rank(d[,1]),rank(d[,2]))
Реклама
Советы
- Как правило, набор данных должен состоять не менее чем из 5 пар для того, чтобы можно было достоверно установить какую-либо корреляцию (3 пары было использовано в примере выше для простоты).
Реклама
Предупреждения
- Коэффициент ранговой корреляции Спирмена позволяет установить лишь то, растут ли обе переменные или уменьшаются одновременно. Если разброс данных слишком велик, этот коэффициент не даст точного значения корреляции.
- Приведенная функция даст верный результат при отсутствии одинаковых значений в массиве данных. Если такие значения существуют, как в рассмотренном нами примере, необходимо использовать следующее определение: коэффициент корреляции, основанный на рангах.
Реклама
Об этой статье
Эту страницу просматривали 68 902 раза.