Calcolo dell'intervallo di confidenza del coefficiente di correlazione: Correlazione data


Istruzioni: È possibile utilizzare questo calcolatore di intervalli di confidenza per il coefficiente di correlazione nel caso in cui si conosca già la correlazione del campione. Quindi, tutto ciò che dovete fare è fornire la correlazione del campione \(r\), la dimensione del campione \(n\) e specificare il livello di confidenza nel modulo sottostante.

Correlazione campione\(r\) (Un numero compreso tra -1 e 1) =
Dimensione del campione \(n\) (numero intero positivo \(n > 3\)) =
Livello di confidenza (es.: 0,95, 95, 99, 99%) =

Coefficiente di correlazione Intervallo di confidenza con una data correlazione

Il procedimento per questa calcolatrice è molto simile a quello della normale calcolatrice calcolo dell'intervallo di confidenza per la correlazione campionaria con l'unica differenza che in questo caso non si dispone di un set di dati campione, ma della correlazione campione stessa.

È sufficiente la correlazione data per ottenere l'intervallo di confidenza?

No, è necessario un po' di più. Avere già fornito la correlazione di esempio è ottimo, perché si può risparmiare il lavoro di calcolo a mano.

Tuttavia, è necessario conoscere anche la dimensione del campione \(n\) utilizzato per calcolare la correlazione campionaria (cioè il numero di coppie X e Y) e, naturalmente, come per tutti gli intervalli di confidenza, è necessario specificare il livello di confidenza.

Il livello di confidenza più comunemente utilizzato è il 95% (o 0,95), ma è possibile utilizzare anche il 90%, il 98%, il 99% e così via, e qualsiasi altro valore intermedio. In altre parole, si forniscono la correlazione e la dimensione del campione e si sceglie il livello di confidenza.

Come si trovano il coefficiente di correlazione e l'intervallo di confidenza, con una data correlazione?

Esattamente come si fa con un set di dati. Una volta ottenuta la correlazione (che ora ci viene fornita), la si trasforma e si calcola una trasformazione speciale della correlazione (basata sulla tangente iperbolica inversa).

Quindi si calcolano i limiti per un intervallo di confidenza per la correlazione trasformata e poi si ritrasformano tali limiti (utilizzando la tangente iperbolica), per ottenere l'intervallo di confidenza desiderato.

Esempio

Si supponga che la correlazione campionaria sia \(r = 0.45\), con una dimensione campionaria di \(n = 18\). Calcolare l'intervallo di confidenza del 99% per il coefficiente di correlazione del campione:

Soluzione:

Sono state fornite le seguenti informazioni:

Sample Correlation \(r\) = \(0.45\)
Sample Size \(n\) = \(18\)
Confidence level = \(99\%\)

Fase 1: Calcolo della trasformazione del coefficiente di correlazione del campione

Il passo successivo consiste nel calcolare la trasformazione (tangente iperbolica inversa) del coefficiente di correlazione del campione che ci è stato fornito.

Quello che si cerca di fare è costruire un intervallo di confidenza ausiliario per una trasformazione della correlazione, che corrisponde alla tangente iperbolica inversa, da cui ricavare un intervallo di confidenza per la correlazione stessa. Si ottiene quanto segue:

\[r' = \tanh^{-1}(r) = \frac{1}{2}\ln\left(\frac{1+r}{1-r}\right) =\frac{1}{2}\ln\left(\frac{1+0.45}{1-0.45}\right) = 0.485\]

Fase 2: Calcolo dell'errore standard

Ora calcoleremo l'errore standard \(SE\) per l'intervallo di confidenza ausiliario, utilizzando la seguente formula:

\[ SE =\frac{1}{\sqrt{n-3}} = \frac{1}{\sqrt{ 18-3}} = 0.258\]

dove \(n = 18\) corrisponde alla dimensione del campione (il numero di coppie).

Fase 3: calcolo dell'intervallo di confidenza ausiliario

Ora dobbiamo calcolare l'intervallo di confidenza ausiliario, che è l'intervallo di confidenza del log della correlazione.

Il livello di confidenza richiesto è \(99\%\), quindi il corrispondente valore z critico è \(z_c = 2.576\), che si ottiene utilizzando una tabella di distribuzione normale (o la calcolatrice). Con queste informazioni calcoliamo i limiti inferiore e superiore dell'intervallo ausiliario:

Con queste informazioni calcoliamo i limiti inferiore e superiore dell'intervallo ausiliario:

\[ L' = r' - z_c \times SE = 0.485 - 2.576 \times 0.258 = -0.18\]

e

\[ U' = r' + z_c \times SE = 0.485 + 2.576 \times 0.258 = 1.15\]

quindi l'intervallo di confidenza ausiliario per la correlazione trasformata è \(CI' = (-0.18, 1.15)\).

Fase 4: Calcolo dell'intervallo di confidenza per la correlazione

Infine, possiamo calcolare la \(99\%\) che stiamo cercando applicando la funzione tangente iperbolica ai limiti dell'intervallo di confidenza ausiliario ottenuto sopra:

\[ L = \tanh(L') = \tanh( -0.18) = -0.178\]\[ U = \tanh(U') = \tanh(1.15) = 0.818\]

Pertanto, sulla base delle informazioni fornite sopra, il coefficiente di correlazione del campione è \(r = 0.45\) e l'intervallo di confidenza \(99\%\) per la correlazione del campione è \(CI = (-0.178, 0.818)\).

Interpretazione: Sulla base dei risultati ottenuti sopra, siamo \(99\%\) sicuri che l'intervallo \((-0.178, 0.818)\) contenga la vera correlazione della popolazione \(\rho\).

Non hai un account di iscrizione?
Iscriviti

Resetta la password

Torna a
accesso

Iscriviti

Torna a
accesso