Коэффициент корреляции: калькулятор доверительного интервала


Инструкции: Вы можете использовать этот пошаговый калькулятор доверительного интервала для коэффициента корреляции для двух переменных X и Y. Все, что вам нужно сделать, это ввести данные X и Y в таблицу ниже и указать уровень достоверности.

Вы можете вставлять данные непосредственно из Excel, если у вас есть такие данные.

Уровень достоверности (пример: 0,95, 95, 99, 99%) =
Имя переменной X (необязательно)
Имя переменной Y (необязательно)

Доверительный интервал коэффициента корреляции

Коэффициент корреляции представляет собой статистику (подразумевающую, что она рассчитывается на основе выборочных данных), которая представляет собой числовую меру для количественной оценки силы линейной связи между двумя переменными. Значения корреляции по определению могут находиться в диапазоне от -1 до 1.

Корреляция, близкая к 1, предполагает существование сильной положительной линейной связи между двумя переменными, а корреляция, близкая к -1, предполагает наличие сильной отрицательной линейной связи между двумя переменными. Чем ближе корреляция к 1 (или -1), тем сильнее линейная связь.

Как рассчитать коэффициент корреляции

Математически, рассчитывается коэффициент корреляции следующее:

\[r =\frac{n \sum_{i=1}^n x_i y_i - \left(\sum_{i=1}^n x_i \right) \left(\sum_{i=1}^n y_i \right) }{\sqrt{n \sum_{i=1}^n x_i^2 - \left( \sum_{i=1}^n x_i \right)^2} \sqrt{n \sum_{i=1}^n y_i^2 - \left( \sum_{i=1}^n y_i \right)^2} }\]

что удобнее переписать в виде:

\[r = \frac{\sum_{i=1}^n x_i y_i - \frac{1}{n}\left(\sum_{i=1}^n x_i \right) \left(\sum_{i=1}^n y_i \right) }{\sqrt{\sum_{i=1}^n x_i^2 - \frac{1}{n}\left( \sum_{i=1}^n x_i \right)^2} \sqrt{\sum_{i=1}^n y_i^2 - \frac{1}{n}\left( \sum_{i=1}^n y_i \right)^2}} = \frac{SS_{XY}}{\sqrt{SS_{XX}\cdot SS_{YY} }}\]

Обратите внимание, что это подходит только для двух переменных. Всякий раз, когда у вас есть более двух переменных, вы можете использовать наш калькулятор корреляционной матрицы , который предоставит вам матрицу корреляции, представляющую корреляцию между ВСЕМИ парами переменных.

Можете ли вы вычислить доверительный интервал для коэффициента корреляции?

Да! Коэффициент корреляции имеет доверительный интервал. Действительно, коэффициент выборочной корреляции является оценкой истинной корреляции генеральной совокупности, и как таковой он поддается интервальным оценкам. Теперь процедура вычисления доверительного интервала, связанного с выборочной корреляцией, немного сложнее, так как требует использования определенных преобразований.

Как найти коэффициент корреляции и доверительный интервал?

Шаг 1 : Вам необходимо вычислить выборочную корреляцию \(r\) или предоставить ее вам.

Шаг 2 : вычислить преобразование коэффициента корреляции на основе аркгиперболического тангенса, определяемого как \(r' = \tanh^{-1}(r)\). Это будет центр вспомогательного доверительного интервала, который будет использоваться.

Шаг 3 : вычислить стандартную ошибку преобразованной корреляции по следующей формуле:

\[SE = \frac{1}{\sqrt{n-3}}\]

где \(n\) представляет размер выборки.

Шаг 4 : Вычислите следующий вспомогательный доверительный интервал:

\[CI' = (\tanh^{-1}(r) - z_c \times SE, \tanh^{-1}(r) + z_c \times SE)\]

где \(z_c\) представляет собой критическое значение для данного уровня достоверности. Например, для уровня достоверности 95% у нас есть \(z_c = 1.96\).

Шаг 5 : Возводим в степень пределы вспомогательного доверительного интервала CI', чтобы получить интересующий нас доверительный интервал:

\[CI = (\tanh(r' - z_c \times SE), \tanh(r' + z_c \times SE))\]

вот как вы вычисляете доверительный интервал в R.

Доверительный интервал для интерпретации коэффициента корреляции

Интерпретация доверительного интервала для корреляции примерно такая же, как и для других параметров и статистики выборки. Для доверительного интервала с пределами \((r_L, r_U)\) мы можем сказать, что мы уверены (при заданном уровне достоверности), что интервал \((r_L, r_U)\) содержит истинную корреляцию населения.

Точнее, с примером. Предположим, что у вас есть 95% доверительный интервал корреляции с пределами \((0.34, 0.59)\), тогда мы можем сказать, что мы на 95% уверены, что интервал \((0.34, 0.59)\) содержит истинную корреляцию населения.

Войдите в свою учетную запись

У вас нет учетной записи?
зарегистрироваться

Сброс пароля

Вернуться к
авторизоваться

зарегистрироваться