Coeficiente de correlación: Calculadora de intervalos de confianza


Instrucciones: Puede utilizar esta calculadora paso a paso del intervalo de confianza para el Coeficiente de Correlación para dos variables X e Y. Todo lo que tiene que hacer es introducir sus datos X e Y en la hoja de cálculo que aparece a continuación, y especificar el nivel de confianza.

Puedes pegar los datos directamente desde Excel, si es así como tienes tus datos.

Nivel de confianza (Ej: 0,95, 95, 99, 99%) =
Nombre de la variable X (opcional)
Nombre de la variable Y (opcional)

Coeficiente de correlación Intervalo de confianza

El coeficiente de correlación es una estadística (lo que implica que se calcula a partir de datos de la muestra) que proporciona una medida numérica para cuantificar la fuerza de la asociación lineal entre dos variables. Los valores de correlación, por definición, pueden oscilar entre -1 y 1.

Una correlación cercana a 1 sugiere la existencia de una fuerte asociación lineal positiva entre las dos variables, y una correlación cercana a -1 sugiere la existencia de una fuerte asociación lineal negativa entre las dos variables. Cuanto más se acerque la correlación a 1 (o -1), más fuerte será la asociación lineal.

¿Cómo se calcula el coeficiente de correlación?

Matemáticamente, el se calcula el coeficiente de correlación de la siguiente manera:

\[r =\frac{n \sum_{i=1}^n x_i y_i - \left(\sum_{i=1}^n x_i \right) \left(\sum_{i=1}^n y_i \right) }{\sqrt{n \sum_{i=1}^n x_i^2 - \left( \sum_{i=1}^n x_i \right)^2} \sqrt{n \sum_{i=1}^n y_i^2 - \left( \sum_{i=1}^n y_i \right)^2} }\]

que se puede reescribir más convenientemente como:

\[r = \frac{\sum_{i=1}^n x_i y_i - \frac{1}{n}\left(\sum_{i=1}^n x_i \right) \left(\sum_{i=1}^n y_i \right) }{\sqrt{\sum_{i=1}^n x_i^2 - \frac{1}{n}\left( \sum_{i=1}^n x_i \right)^2} \sqrt{\sum_{i=1}^n y_i^2 - \frac{1}{n}\left( \sum_{i=1}^n y_i \right)^2}} = \frac{SS_{XY}}{\sqrt{SS_{XX}\cdot SS_{YY} }}\]

Tenga en cuenta que esto es adecuado sólo para dos variables. Si tiene más de dos variables, puede utilizar nuestro calculadora de matrices de correlación que le proporcionará la matriz de correlación, que representa la correlación entre TODOS los pares de variables.

¿Puedes calcular un intervalo de confianza para un coeficiente de correlación?

Sí Un coeficiente de correlación tiene un intervalo de confianza. En efecto, un coeficiente de correlación muestral es una estimación de una correlación poblacional real y, como tal, es susceptible de estimación por intervalos. Ahora bien, el procedimiento para calcular el intervalo de confianza asociado a una correlación muestral es un poco más enrevesado, ya que requiere el uso de ciertas transformaciones.

¿Cómo se encuentra el coeficiente de correlación y el intervalo de confianza?

Paso 1 : Tiene que calcular la correlación de la muestra \(r\), o que se la proporcionen.

Paso 2 : Calcula una transformación del coeficiente de correlación, basada en la tangente hiperbólica inversa, definida como \(r' = \tanh^{-1}(r)\). Este será el centro de un intervalo de confianza auxiliar que se utilizará.

Paso 3 : Calcule el error estándar de la correlación transformada utilizando la siguiente fórmula:

\[SE = \frac{1}{\sqrt{n-3}}\]

donde \(n\) representa el tamaño de la muestra.

Paso 4 : Calcule el siguiente intervalo de confianza auxiliar:

\[CI' = (\tanh^{-1}(r) - z_c \times SE, \tanh^{-1}(r) + z_c \times SE)\]

donde \(z_c\) representa el valor crítico para el nivel de confianza dado. Por ejemplo, para un nivel de confianza del 95%, tenemos que \(z_c = 1.96\).

Paso 5 : Exponenciamos los límites del intervalo de confianza auxiliar CI', para obtener el intervalo de confianza que nos interesa:

\[CI = (\tanh(r' - z_c \times SE), \tanh(r' + z_c \times SE))\]

que es como se calcula el intervalo de confianza en R.

Intervalo de confianza para la interpretación del coeficiente de correlación

La interpretación del intervalo de confianza para la correlación es prácticamente la misma que para otros parámetros y estadísticas muestrales. Para un intervalo de confianza con límites \((r_L, r_U)\), podemos decir que estamos seguros (al nivel de confianza dado), de que el intervalo \((r_L, r_U)\) contiene la verdadera correlación de la población.

Más concretamente, con un ejemplo. Supongamos que tenemos un intervalo de confianza del 95% de la correlación con los límites \((0.34, 0.59)\), por lo que podemos decir que tenemos un 95% de confianza en que el intervalo \((0.34, 0.59)\) contiene la verdadera correlación de la población.

iniciar sesión

No tiene una membresia?
Regístrate

restablecer la contraseña

Regístrate