Tutto quello che devi sapere sul test di ipotesi: i trucchi che devi imparare
Il test di ipotesi può essere un argomento confuso, specialmente se non conosci bene le basi. Imparando un paio di semplici principi, sarai in grado di capire tutto ciò che c'è da sapere sul test di ipotesi.
Cos'è un test di ipotesi?
Questa è la prima domanda che affronteremo. Un test di ipotesi è un file procedura statistica che utilizza dati di esempio per prendere una decisione su una determinata affermazione, che coinvolge un determinato parametro della popolazione. Quindi, gli attori necessari per condurre un test di ipotesi sono:
(1) I dati del campione
(2) Una certa affermazione su un parametro della popolazione
Senza nessuno dei due precedenti, può testare un'ipotesi. Ora andiamo un po 'oltre e spieghiamo quali sono questi due componenti principali
Il campione
Ricordiamo che un campione è un sottoinsieme più piccolo di un'intera popolazione. E una popolazione è l'insieme completo di argomenti su cui si desidera indagare. In genere, le popolazioni sono grandi, quindi se vogliamo fare una dichiarazione su una grande popolazione, proviamo a farlo selezionando un piccolo campione, nella speranza che il campione in qualche modo porti informazioni sull'intera popolazione. Sembra essere un tiro lungo, ma in alcuni casi risulta essere vero.
La nostra speranza è che analizzando un piccolo campione di una popolazione, saremo in grado di sapere molto sulla popolazione. Quando ciò accade, diciamo che il campione è rappresentativo dell'intera popolazione . Ma non va bene solo un campione qualsiasi. Dobbiamo raccogliere qualcosa chiamato a campione casuale . Esistono diverse strategie per la raccolta di campioni casuali, a seconda del tipo e delle dimensioni della popolazione, ma quello che voglio che tu tenga presente ora è che ci sono procedure ragionevoli per produrre campioni casuali, che dovrebbero essere rappresentativi delle loro popolazioni. E, una volta ottenuto un campione casuale, utilizzerai una procedura che utilizza il test di ipotesi che ti aiuterà a ottenere informazioni sull'intera popolazione dal campione.
L'affermazione su un parametro della popolazione
Ora che hai un campione, hai bisogno di una dichiarazione per testare. Ci sono buone e cattive notizie. La buona notizia è che i parametri della popolazione sono numeri semplici, quindi un'affermazione sui parametri della popolazione riguarda semplicemente quale potrebbe essere il valore potenziale di quel parametro della popolazione. Ciò che intendo con questo è che le affermazioni sono molto semplici da un punto di vista strutturale. Ad esempio, supponi di essere una variabile casuale normalmente distribuita, con una media sconosciuta uguale a \(\mu\). Vorremmo prendere un campione di quella popolazione e dire qualcosa su \(\mu\). Le affermazioni su \(\mu\) sono affermazioni sui suoi potenziali valori. Voglio dire, qualcosa come \(\mu =10\) è un'affermazione effettiva o anche \(\mu <10\) è un'affermazione. Qualsiasi cosa che dichiari un possibile insieme di valori per un parametro della popolazione è un'affermazione.
La cattiva notizia è che non possiamo testare qualsiasi affermazione. Per condurre un test di ipotesi e testare un'affermazione su un parametro della popolazione, dobbiamo avere una certa struttura. Vale a dire, possiamo lavorare solo con due tipi di affermazioni, o in questo contesto, dobbiamo definire tra due ipotesi: l'ipotesi nulla e l'ipotesi alternativa. Queste due ipotesi sono entrambe affermazioni su un parametro di popolazione, con particolarità che (a) non devono sovrapporsi e (b) l'ipotesi nulla deve contenere il segno "=" in esso.
Lasciatemi riformulare quello : Se vuoi eseguire un file test di ipotesi devi avere due ipotesi, l'ipotesi nulla e l'ipotesi alternativa. Queste due ipotesi sono entrambe affermazioni che affermano qualcosa sul valore numerico del parametro della popolazione. L'insieme dei valori potenziali del parametro della popolazione che sono dichiarati nell'ipotesi nulla NON PUO 'avere alcun valore in comune con l'insieme dei valori potenziali del parametro della popolazione che sono indicati nell'ipotesi alternativa. Inoltre, l'ipotesi nulla deve contenere il segno "=" nella sua dichiarazione algebrica. Ad esempio, \(\mu =13\) e \(\mu \le 13\) sono esempi di ipotesi nulle, ma \(\mu >10\) non può essere un'ipotesi nulla.
Un'ipotesi nulla viene scritta come \({{H}_{0}}\) e un'ipotesi alternativa è scritta come \({{H}_{A}}\). Un esempio di un insieme di ipotesi adeguatamente definito è
\[\begin{align} & {{H}_{0}}:\mu =10 \\ & {{H}_{A}}:\mu \ne 10 \\ \end{align}\]Ma, ad esempio, questo insieme di ipotesi non è valido:
\[\begin{align} & {{H}_{0}}:\mu =10 \\ & {{H}_{A}}:\mu \ge 10 \\ \end{align}\]Perché il set di cui sopra non è valido? Perché l'insieme di valori possibili dichiarati da \({{H}_{0}}\) e \({{H}_{A}}\) si sovrappongono (vedere che sia l'ipotesi nulla che quella alternativa includono 10 come possibile valore per \(\mu\)).
La meccanica di un test di ipotesi
Ora che hai un campione e hai un'ipotesi nulla e alternativa opportunamente definita, puoi condurre un test di ipotesi. Ora puoi calcolare un file statistica del test , questo è il pezzo centrale dell'intero processo. Una statistica test è semplicemente un valore numerico (casuale) che viene calcolato dai dati del campione e dai valori dichiarati nell'ipotesi. La formula effettiva utilizzata per calcolare una statistica di test dipende dal tipo di parametro che viene stimato (ad esempio, utilizziamo un tipo diverso di statistica di test quando testiamo per una media della popolazione \(\mu\) rispetto a quando stiamo testando una varianza della popolazione \(\sigma\)).
La filosofia, però, per TUTTI i test di ipotesi è LO STESSO. Tienilo a mente: la statistica del test viene calcolata e il suo risultato viene verificato assumendo che l'ipotesi nulla sia vera. Quindi il principio è: se presumo che l'ipotesi nulla \({{H}_{0}}\) sia vera, quanto è improbabile che si ottengano gli stessi risultati? La filosofia è che se i risultati del campione sono improbabili in base al presupposto che \({{H}_{0}}\) è vero, allora scartiamo \({{H}_{0}}\) come opzione plausibile.
La probabilità che i risultati del campione siano estremi almeno quanto quelli osservati può essere tipicamente calcolata (perché di solito assumendo che \({{H}_{0}}\) sia vero determina il valore del parametro sconosciuto che determina la distribuzione della popolazione), e questa probabilità è chiamata valore p .
Un valore p basso indica che i risultati del campione sono insoliti se prendiamo \({{H}_{0}}\) come vero. Ma quanto è basso abbastanza basso? Ebbene, dobbiamo definire una soglia, che chiamiamo livello di significatività o \(\alpha\). Questo valore di \(\alpha\) rappresenta il rischio che siamo disposti a correre di rifiutare un'ipotesi nulla vera.
Risultati di un test di ipotesi
Quindi, infine, come diamo la nostra risposta alle ipotesi? Semplice, se il valore p calcolato è tale che $ p <\ alpha $, allora noi respingere l'ipotesi nulla . Altrimenti, se \(p\ge \alpha\), noi non respingono l'ipotesi nulla. Osserva che non esiste qualcosa come "accettare l'ipotesi nulla". I dati di esempio NON POSSONO dimostrare l'ipotesi nulla a causa del modo fondamentale in cui è costruito.
Se l'ipotesi nulla non viene rifiutata, i dati del campione ci dicono "guarda, non sembra che i dati del campione contraddicono l'ipotesi nulla, quindi conserviamola, almeno per ora".
D'altra parte, se l'ipotesi nulla viene rifiutata, i dati del campione ci dicono "guarda, i dati del campione sembrano essere in conflitto con l'ipotesi nulla, quindi sarebbe saggio controllare la tua ipotesi nulla, perché potrebbe essere disattivata ".
Abbiamo capito bene?
Un malinteso è che un test di ipotesi darà una risposta infallibile. Non può essere più lontano dalla verità. La decisione sul test di ipotesi (o rifiutare Ho OPPURE non rifiutare Ho) può essere effettivamente sbagliata. Affronta il fatto, esaminalo.
Come puoi sbagliarti? In realtà, in due modi: primo, se rifiuti l'ipotesi nulla, affermerai che l'ipotesi nulla non è vera. Quindi, se l'ipotesi nulla è REALMENTE vera, hai commesso un errore. Questo è chiamato errore di tipo I, in cui la tua decisione di rifiutare Ho è sbagliata, perché Ho è effettivamente vero. La probabilità di errore di questo tipo I è \(\alpha\).
Il secondo tipo di errore si verifica quando non si rifiuta di rifiutare l'ipotesi nulla, quindi non si trovano prove sufficienti per affermare che l'ipotesi nulla è falsa. Ma, se risulta che l'ipotesi nulla è REALMENTE falsa, allora hai commesso un errore. Questo è chiamato errore di tipo II, in cui la tua decisione di non rifiutare Ho è sbagliata, perché Ho è effettivamente falso. La probabilità di errore di questo tipo II è denominata \(\beta\).
Per ora è tutto.