Содержание
Поиск силы ассоциации между двумя переменными является важным навыком для ученых всех типов. Если две переменные связаны друг с другом, это показывает, что между ними есть связь. Положительная корреляция означает, что когда одна переменная увеличивается, другая тоже увеличивается, а отрицательная корреляция означает, что когда одна переменная увеличивается, другая уменьшается. Корреляции не доказывают причинность, хотя возможно, что дальнейшие тесты докажут причинно-следственную связь между переменными. Коэффициент корреляции р показывает силу взаимосвязи между двумя переменными, и является ли это положительной или отрицательной корреляцией.
TL; DR (слишком долго; не читал)
Вызвать одну переменную Икс и одна переменная Y, Рассчитать стоимость р используя формулу:
R = ÷ √ {}
где N ваш размер выборки.
Составьте таблицу из ваших данных. Это должно включать один столбец для номера участника, один столбец для первой переменной (помечен Икс) и один столбец для второй переменной (помечен Y). Например, если вы хотите увидеть, есть ли корреляция между ростом и размером обуви, один столбец будет идентифицировать каждого человека, которого вы измеряете, один столбец будет показывать рост каждого человека, а другой - их размер обуви. Сделайте три дополнительных столбца, один для хуодин для Икс2 и один для Y2.
Используйте свои данные, чтобы заполнить три дополнительных столбца. Например, представьте, что ваш первый человек имеет рост 75 дюймов и размер 12 футов. Икс (высота) столбец будет показывать 75, а Y (размер обуви) будет отображаться 12. Вам нужно найти ху, Икс2 а также Y2, Итак, используя этот пример:
ху = 75 × 12 = 900
Икс2 = 752 = 5,625
Y2 = 122 = 144
Выполните эти расчеты для каждого человека, для которого у вас есть данные.
Создайте новую строку в нижней части таблицы для сумм каждого столбца. Сложите все Икс ценности, все Y ценности, все ху ценности, все Икс2 ценности и все Y2 значения, а затем поместите результаты в нижней части соответствующего столбца в новой строке. Вы можете пометить новую строку «сумма» или использовать символ сигма (Σ).
Ты находишь р Исходя из ваших данных по формуле:
R = ÷ √ {}
Это выглядит немного устрашающе, так что вы можете разделить его на две части, которые мы назовем s а также T.
s = n (Σxy) - (Σx) (Σy)
t = √ {}
В этих уравнениях N количество участников (ваш размер выборки). Остальные части уравнения - это суммы, которые вы вычислили на последнем шаге. Таким образом, для sумножьте размер вашего образца на сумму ху столбец, а затем вычесть сумму Икс столбец, умноженный на сумму Y колонка из этого.
За TЕсть четыре основных шага. Во-первых, рассчитать N умножается на сумму вашего Икс2 столбец, а затем вычтите сумму вашего Икс квадрат столбца (умноженный на себя) от этого значения. Во-вторых, сделать то же самое, но с суммой Y2 столбец и сумма Y столбец в квадрате вместо Икс части (то есть n × Σy2 -). В-третьих, умножьте эти два результата (для Иксс и Yс) вместе. В-четвертых, возьмите квадратный корень из этого ответа.
Если вы работали по частям, вы можете рассчитать р так же просто R = s ÷ t, Вы получите ответ в диапазоне от -1 до 1. Положительный ответ показывает положительную корреляцию, при этом все, что превышает 0,7, обычно считается сильным отношением. Отрицательный ответ показывает отрицательную корреляцию, причем все, что превышает -0,7, считается сильным отрицательным отношением. Точно так же ± 0,5 считается умеренным отношением и ± 0,3 считается слабым отношением. Все, что близко к 0, показывает отсутствие корреляции.