Coeficiente de Correlação: Calculadora de Intervalo de Confiança


Instruções: Pode utilizar esta calculadora passo a passo de intervalo de confiança para o Coeficiente de Correlação para duas variáveis X e Y. Tudo o que tem de fazer é digitar os seus dados X e Y na folha de cálculo abaixo, e especificar o nível de confiança.

Pode colar dados directamente do Excel, se é assim que tem os seus dados.

Nível de confiança (Ex: 0,95, 95, 99, 99%) =
Nome da variável X (opcional)
Nome da variável Y (opcional)

Coeficiente de Correlação Intervalo de Confiança

O coeficiente de correlação é uma estatística (o que implica que é calculado a partir de dados de amostra) que fornece uma medida numérica para quantificar a força da associação linear entre duas variáveis. Os valores de correlação, por definição, podem variar entre -1 e 1.

Uma correlação próxima de 1 sugere a existência de uma forte associação linear positiva entre as duas variáveis, e uma correlação próxima de -1 sugere a existência de uma forte associação linear negativa entre as duas variáveis. Quanto mais próxima a correlação for de 1 (ou -1), mais forte será a associação linear.

Como se calcula o Coeficiente de Correlação

Matematicamente, o o coeficiente de correlação é calculado como se segue:

\[r =\frac{n \sum_{i=1}^n x_i y_i - \left(\sum_{i=1}^n x_i \right) \left(\sum_{i=1}^n y_i \right) }{\sqrt{n \sum_{i=1}^n x_i^2 - \left( \sum_{i=1}^n x_i \right)^2} \sqrt{n \sum_{i=1}^n y_i^2 - \left( \sum_{i=1}^n y_i \right)^2} }\]

que pode ser reescrita de forma mais conveniente:

\[r = \frac{\sum_{i=1}^n x_i y_i - \frac{1}{n}\left(\sum_{i=1}^n x_i \right) \left(\sum_{i=1}^n y_i \right) }{\sqrt{\sum_{i=1}^n x_i^2 - \frac{1}{n}\left( \sum_{i=1}^n x_i \right)^2} \sqrt{\sum_{i=1}^n y_i^2 - \frac{1}{n}\left( \sum_{i=1}^n y_i \right)^2}} = \frac{SS_{XY}}{\sqrt{SS_{XX}\cdot SS_{YY} }}\]

Note-se que isto é adequado apenas para duas variáveis. Sempre que tiver mais de duas variáveis, poderá utilizar o nosso calculadora de matriz de correlação que lhe fornecerá a matriz de correlação, representando a correlação entre TODOS os pares de variáveis.

É possível calcular um intervalo de confiança para um coeficiente de correlação?

Sim! Um coeficiente de correlação tem de facto um intervalo de confiança. De facto, um coeficiente de correlação de amostra é uma estimativa de uma verdadeira correlação populacional, e como tal, é passível de estimativas de intervalo. Agora, o procedimento para calcular o intervalo de confiança associado a uma correlação de amostra é um pouco mais complicado, uma vez que requer a utilização de certas transformações.

Como se encontra o coeficiente de correlação e o intervalo de confiança?

Passo 1 : É necessário calcular a correlação da amostra <\(r\), ou tê-la à sua disposição.

Passo 2 : Calcular uma transformação do coeficiente de correlação, com base na tangente hiperbólica inversa, definida como \(r' = \tanh^{-1}(r)\)>>. Este será o centro de um intervalo de confiança auxiliar que será utilizado.

Etapa 3 : Calcular o erro padrão da correlação transformada utilizando a seguinte fórmula:

\[SE = \frac{1}{\sqrt{n-3}}\]

onde <\(n\) representa o tamanho da amostra.

Passo 4 : Calcular o seguinte intervalo de confiança auxiliar:

\[CI' = (\tanh^{-1}(r) - z_c \times SE, \tanh^{-1}(r) + z_c \times SE)\]

onde <\(z_c\) representa o valor crítico para o nível de confiança dado. Por exemplo, para um nível de confiança de 95%, temos que <\(z_c = 1.96\)>>.

Passo 5 : Exponenciamos os limites do intervalo de confiança auxiliar CI', de modo a obter o intervalo de confiança em que estamos interessados:

\[CI = (\tanh(r' - z_c \times SE), \tanh(r' + z_c \times SE))\]

que é como se calcula o intervalo de confiança em R.

Intervalo de confiança para interpretação do coeficiente de correlação

A interpretação do intervalo de confiança para a correlação é mais ou menos a mesma que para outros parâmetros e estatísticas de amostra. Para um intervalo de confiança com limites <\((r_L, r_U)\), podemos dizer que estamos confiantes (ao nível de confiança dado), que o intervalo \((r_L, r_U)\) contém a verdadeira correlação populacional.

Mais concretamente, com um exemplo. Suponha que tem um intervalo de confiança de 95% com limites \((0.34, 0.59)\), então podemos dizer que estamos 95% confiantes de que o intervalo \((0.34, 0.59)\) contém a verdadeira correlação populacional.

Conecte-se

Não tem uma conta de membro?
inscrever-se

redefinir senha

De volta a
Conecte-se

inscrever-se

De volta a
Conecte-se