Корреляция между двумя переменными описывает вероятность того, что изменение одной переменной вызовет пропорциональное изменение другой переменной. Высокая корреляция между двумя переменными говорит о том, что они имеют общую причину, или изменение одной из переменных является прямой причиной изменения другой переменной. Значение Пирсона r используется для количественной оценки корреляции между двумя дискретными переменными.
Пометьте переменную, которая, по вашему мнению, вызывает изменение другой переменной, как x (независимая переменная) и другой переменной y (зависимая переменная).
Постройте таблицу из пяти столбцов и столько строк, сколько есть точек данных для x и y. Пометьте столбцы от A до E слева направо.
Заполните каждую строку следующими значениями для каждой точки данных (x, y) в первом столбце - значение x в столбце A, значение x в квадрате в столбце B, значение y в столбце C, значение Y в квадрате в столбце D и значение х раз у в столбце E.
Сделайте последнюю строку в самом низу таблицы и поместите сумму всех значений каждого столбца в соответствующую ячейку.
Вычислите произведение конечных клеток в столбцах А и С.
Умножьте последнюю ячейку в столбце E на количество точек данных.
Вычтите значение, полученное на шаге 5, из значения, полученного на шаге 6, и подчеркните ответ.
Умножьте последнюю ячейку столбца B на количество точек данных. Вычтите из этого значения квадрат значения последней ячейки столбца А.
Умножьте последнюю ячейку столбца D на количество точек данных и вычтите квадрат значения последней ячейки столбца C.
Умножьте значения, найденные в шагах 8 и 9, и затем возьмите квадратный корень из результата.
Разделите значение, полученное на шаге 7 (оно должно быть подчеркнуто), на значение, полученное на шаге 10. Это Pearsons r, также известный как коэффициент корреляции. Если r близко к 1, существует сильная положительная корреляция. Если r близко к -1, существует сильная отрицательная корреляция. Если r близко к 0, существует слабая корреляция.