Alles, was Sie über das Testen von Hypothesen wissen müssen: Die Tricks, die Sie lernen müssen
Das Testen von Hypothesen kann ein verwirrendes Thema sein, insbesondere wenn Sie die Grundlagen nicht gut kennen. Wenn Sie ein paar einfache Prinzipien lernen, können Sie alles verstehen, was Sie über das Testen von Hypothesen wissen müssen.
Was ist ein Hypothesentest?
Das ist die erste Frage, die wir ansprechen werden. Ein Hypothesentest ist a statistisches Verfahren Dabei werden Beispieldaten verwendet, um eine Entscheidung über einen bestimmten Anspruch zu treffen, der einen bestimmten Populationsparameter umfasst. Die für die Durchführung eines Hypothesentests erforderlichen Akteure sind also:
(1) Die Probendaten
(2) Eine bestimmte Behauptung über einen Populationsparameter
Ohne eine der beiden oben kann eine Hypothese testen. Lassen Sie uns nun etwas weiter gehen und erklären, was diese beiden Hauptkomponenten sind
Die Probe
Erinnern wir uns, dass eine Stichprobe eine kleinere Teilmenge einer gesamten Population ist. Und eine Population ist die vollständige Gruppe von Themen, die Sie untersuchen möchten. In der Regel sind die Populationen groß. Wenn wir also eine Aussage über eine große Population machen möchten, versuchen wir dies, indem wir eine kleine Stichprobe auswählen, in der Hoffnung, dass die Stichprobe irgendwie Informationen über die gesamte Population enthält. Das scheint ein langer Weg zu sein, aber es stellt sich in einigen Fällen als wahr heraus.
Wir hoffen, dass wir durch die Analyse einer kleinen Stichprobe aus einer Population viel über die Bevölkerung wissen können. Wenn das passiert, sagen wir, dass die Probe ist Vertreter der gesamten Bevölkerung . Aber nicht jede Probe reicht aus. Wir müssen etwas sammeln, das a heißt zufällige Probe . Es gibt verschiedene Strategien für die Erhebung von Zufallsstichproben, abhängig von der Art und Größe der Population. Ich möchte jedoch, dass Sie jetzt beibehalten, dass es einigermaßen vernünftige Verfahren zur Erstellung von Zufallsstichproben gibt, von denen erwartet wird, dass sie für ihre Populationen repräsentativ sind. Sobald Sie eine Zufallsstichprobe haben, verwenden Sie ein Verfahren mit Hypothesentests, mit dessen Hilfe Sie Informationen über die gesamte Population aus der Stichprobe erhalten.
Der Anspruch auf einen Populationsparameter
Nachdem Sie eine Probe haben, benötigen Sie einen Testanspruch. Es gibt gute und schlechte Nachrichten. Die gute Nachricht ist, dass Populationsparameter einfache Zahlen sind, so dass eine Behauptung über Populationsparameter einfach darüber handelt, wie hoch der potenzielle Wert dieses Populationsparameters sein könnte. Damit meine ich, dass Ansprüche aus struktureller Sicht sehr einfach sind. Angenommen, Sie haben eine normalverteilte Zufallsvariable mit einem unbekannten Mittelwert von \(\mu\). Wir möchten eine Stichprobe dieser Population nehmen und etwas über \(\mu\) sagen. Die Ansprüche über \(\mu\) sind Ansprüche über seine möglichen Werte. Ich meine, so etwas wie \(\mu =10\) ist eine tatsächliche Behauptung, oder \(\mu <10\) ist auch eine Behauptung. Alles, was einen möglichen Satz von Werten für einen Populationsparameter angibt, ist ein Anspruch.
Die schlechte Nachricht ist, dass wir nicht jeden Anspruch testen können. Um einen Hypothesentest durchzuführen und eine Behauptung über einen Populationsparameter zu testen, benötigen wir eine bestimmte Struktur. Wir können nämlich nur mit zwei Arten von Ansprüchen arbeiten, oder in diesem Zusammenhang müssen wir zwischen zwei Hypothesen definieren: der Nullhypothese und der Alternativhypothese. Diese beiden Hypothesen sind beide Behauptungen über einen Populationsparameter, mit der Besonderheit, dass (a) sie sich nicht überlappen dürfen und (b) die Nullhypothese muss enthalten das "=" Zeichen darin.
Lassen Sie mich das umformulieren : Wenn Sie eine ausführen möchten Hypothesentest Sie müssen zwei Hypothesen haben, die Nullhypothese und die Alternativhypothese. Diese beiden Hypothesen sind beide Behauptungen, die etwas über den numerischen Wert des Populationsparameters aussagen. Die Menge der potenziellen Werte des Populationsparameters, die in der Nullhypothese angegeben sind, KANN KEINEN Wert gemeinsam haben mit der Menge der potenziellen Werte des Populationsparameters, die in der alternativen Hypothese angegeben sind. Außerdem muss die Nullhypothese in ihrer algebraischen Aussage das Vorzeichen "=" enthalten. Beispielsweise sind \(\mu =13\) und \(\mu \le 13\) Beispiele für Nullhypothesen, aber \(\mu >10\) kann keine Nullhypothese sein.
Eine Nullhypothese wird als \({{H}_{0}}\) und eine alternative Hypothese als \({{H}_{A}}\) geschrieben. Ein Beispiel für einen richtig definierten Satz von Hypothesen ist
\[\begin{align} & {{H}_{0}}:\mu =10 \\ & {{H}_{A}}:\mu \ne 10 \\ \end{align}\]Diese Hypothesen sind jedoch beispielsweise nicht gültig:
\[\begin{align} & {{H}_{0}}:\mu =10 \\ & {{H}_{A}}:\mu \ge 10 \\ \end{align}\]Warum ist der obige Satz nicht gültig? Da sich die durch \({{H}_{0}}\) und \({{H}_{A}}\) angegebenen möglichen Werte überschneiden (siehe, dass sowohl Null- als auch Alternativhypothesen 10 als möglichen Wert für \(\mu\) enthalten).
Die Mechanik eines Hypothesentests
Nachdem Sie eine Stichprobe und eine richtig definierte Null- und Alternativhypothese haben, können Sie einen Hypothesentest durchführen. Jetzt können Sie a berechnen Teststatistik , das ist das Herzstück des gesamten Prozesses. Eine Teststatistik ist einfach ein numerischer (zufälliger) Wert, der aus den Probendaten und den in der Hypothese angegebenen Werten berechnet wird. Die tatsächliche Formel zur Berechnung einer Teststatistik hängt von der Art des geschätzten Parameters ab (z. B. verwenden wir beim Testen auf einen Populationsmittelwert \(\mu\) eine andere Art von Teststatistik als beim Testen auf eine Populationsvarianz \(\sigma\)).
Die Philosophie für ALLE Hypothesentests ist jedoch die GLEICHE. Bitte behalten Sie dies im Kopf: Die Teststatistik wird berechnet und ihr Ergebnis unter der Annahme überprüft, dass die Nullhypothese wahr ist. Das Prinzip lautet also: Wenn ich davon ausgehe, dass die Nullhypothese \({{H}_{0}}\) wahr ist, wie unwahrscheinlich sind dieselben Ergebnisse? Die Philosophie ist, dass wir \({{H}_{0}}\) als plausible Option verwerfen, wenn die Stichprobenergebnisse unter der Annahme, dass \({{H}_{0}}\) wahr ist, zu unwahrscheinlich sind.
Die Wahrscheinlichkeit, dass die Stichprobenergebnisse mindestens so extrem sind wie die beobachteten, kann typischerweise berechnet werden (da normalerweise die Annahme, dass \({{H}_{0}}\) wahr ist, den Wert des unbekannten Parameters bestimmt, der die Verteilung der Population bestimmt), und diese Wahrscheinlichkeit wird als bezeichnet p-Wert .
Ein niedriger p-Wert zeigt an, dass die Probenergebnisse ungewöhnlich sind, wenn wir \({{H}_{0}}\) als wahr annehmen. Aber wie niedrig ist niedrig genug? Nun, wir müssen einen Schwellenwert definieren, den wir nennen Signifikanzniveau oder \(\alpha\). Dieser Wert von \(\alpha\) stellt das Risiko dar, das wir eingehen möchten, wenn wir eine echte Nullhypothese ablehnen.
Ergebnisse eines Hypothesentests
Wie geben wir schließlich unsere Antwort auf die Hypothesen? Einfach, wenn der berechnete p-Wert so ist, dass $ p <\ alpha $, dann wir lehne die Nullhypothese ab . Andernfalls, wenn \(p\ge \alpha\), wir die Nullhypothese nicht ablehnen. Beachten Sie, dass es kein "Akzeptieren der Nullhypothese" gibt. Beispieldaten KÖNNEN die Nullhypothese aufgrund ihrer grundlegenden Konstruktion NICHT beweisen.
Wenn die Nullhypothese nicht zurückgewiesen wird, sagen uns die Beispieldaten: "Schauen Sie, es scheint nicht, dass die Beispieldaten der Nullhypothese widersprechen, also lassen Sie uns sie zumindest vorerst beibehalten."
Wenn andererseits die Nullhypothese abgelehnt wird, sagen uns die Beispieldaten: "Schauen Sie, die Beispieldaten scheinen mit der Nullhypothese in Konflikt zu stehen. Es ist daher ratsam, Ihre Nullhypothese zu überprüfen, da sie möglicherweise deaktiviert ist." ".
Haben wir es richtig gemacht?
Ein Missverständnis ist, dass ein Hypothesentest eine unfehlbare Antwort liefert. Es kann nicht weiter von der Wahrheit entfernt sein. Die Entscheidung über den Hypothesentest (entweder Ho ablehnen oder Ho nicht ablehnen) kann tatsächlich falsch sein. Stellen Sie sich der Tatsache, gehen Sie darüber hinweg.
Wie kannst du dich irren? Eigentlich auf zwei Arten: Erstens, wenn Sie die Nullhypothese ablehnen, behaupten Sie, dass die Nullhypothese nicht wahr ist. Wenn also die Nullhypothese WIRKLICH wahr ist, haben Sie einen Fehler gemacht. Dies wird als Fehler vom Typ I bezeichnet, bei dem Ihre Entscheidung, Ho abzulehnen, falsch ist, weil Ho tatsächlich wahr ist. Die Wahrscheinlichkeit dieses Fehlertyps I ist \(\alpha\).
Die zweite Art von Fehler tritt auf, wenn Sie die Nullhypothese nicht ablehnen. Sie finden also nicht genügend Beweise, um zu behaupten, dass die Nullhypothese falsch ist. Wenn sich jedoch herausstellt, dass die Nullhypothese WIRKLICH falsch ist, haben Sie einen Fehler gemacht. Dies wird als Typ-II-Fehler bezeichnet, bei dem Ihre Entscheidung, Ho nicht abzulehnen, falsch ist, weil Ho tatsächlich falsch ist. Die Wahrscheinlichkeit dieses Fehlertyps II wird als \(\beta\) bezeichnet.
Das ist es für jetzt.