Statistik-Tutorials: Der endgültige Leitfaden für Perzentile - Alle Tricks des Buches
Dies ist ein gutes Thema für ein Tutorial, weil das Konzept von Perzentil Dies ist in der Regel verwirrend, da den Schülern manchmal eher verwirrende Informationen zur Verfügung gestellt werden und es viele Konventionen gibt, die manchmal irreführend und sogar einfach falsch sein können. In den folgenden Abschnitten werden wir das Konzept von Perzentil auf präzise Weise, damit Sie genau wissen, wovon wir sprechen.
Kumulative Verteilung
Zunächst müssen wir uns über die Definition des Perzentils im Klaren sein, die mit dem Konzept der kumulativen Verteilung verbunden ist. Für eine Zufallsvariable X ist die zugehörige kumulative Verteilungsfunktion definiert als
\[{{F}_{X}}\left( x \right)=\Pr \left( X\le x \right)\]Dies ist für einen bestimmten Wert x ist die zugehörige kumulative Verteilungsfunktion die Wahrscheinlichkeit, dass die Zufallsvariable kleiner oder gleich ist x . Beachten Sie, dass das Symbol verwendet wird x da das Argument ein generisches Funktionsargument ist. Wenn wir \({{F}_{X}}\left( y \right)\) schreiben, meinen wir die kumulative Verteilung zum Wert von y (Dies entspricht der Wahrscheinlichkeit, dass die Zufallsvariable kleiner oder gleich ist y ), oder wenn wir \({{F}_{X}}\left( 4 \right)\) schreiben, meinen wir die kumulative Verteilung bei 4 (was der Wahrscheinlichkeit entspricht, dass die Zufallsvariable kleiner oder gleich 4 ist).
Mit einer solchen Definition ist klar, dass \({{F}_{X}}\) eine Funktion ist, die Werte von 0 bis 1 annimmt (da sie von einer Wahrscheinlichkeit herrührt) und nicht abnimmt (dies bedeutet, dass sie entweder zunimmt oder konstant bleibt, aber niemals abnimmt). Was aber weniger offensichtlich ist und was aus den Axiomen der Wahrscheinlichkeit bewiesen werden kann, ist, dass sich jede kumulative Verteilungsfunktion \({{F}_{X}}\) recht gut verhält, da sie rechtskontinuierlich ist (was sehr grob bedeutet, dass die Funktion entweder stetig ist oder möglicherweise hat "springt" .... es ist komplizierter als das, aber im Moment kann man so denken). Im Allgemeinen haben Zufallsvariablen, die einen kontinuierlichen Wertebereich annehmen, eine kontinuierliche kumulative Funktion \({{F}_{X}}\), während Zufallsvariablen, die einen diskreten Wertebereich annehmen, "Sprünge" im Diagramm des zugehörigen \({{F}_{X}}\) aufweisen.
Was ist ein Perzentil?
Jetzt können wir ein Perzentil definieren. Für \(\alpha \in \left[ 0,1 \right]\) definieren wir ein \(\alpha\) Perzentil als \({{P}_{\alpha }}\), so dass
\[\Pr \left( X\le {{P}_{\alpha }} \right)=\alpha\]In der menschlichen Sprache ist ein \(\alpha\) -Perzentil ein Punkt, sodass die Wahrscheinlichkeit, dass die Zufallsvariable kleiner oder gleich diesem Punkt ist, genau \(\alpha\) ist. Beispielsweise ist ein 0,10-Perzentil ein Punkt in der Verteilung, sodass die Wahrscheinlichkeit, dass die Zufallsvariable kleiner oder gleich diesem Punkt ist, genau 0,10 beträgt. Anstatt beispielsweise nach dem 0,10-Perzentil zu fragen, werden Sie normalerweise nach dem 10% -Perzentil oder dem 10. Perzentil gefragt. Das sind einfache Notationen, die man beachten sollte.
Ein Perzentil \({{P}_{\alpha }}\) für eine Zufallsvariable X ist gut definiert, wenn die kumulative Verteilungsfunktion \({{F}_{X}}\left( x \right)\) stetig ist. Wenn \({{F}_{X}}\left( x \right)\) "Sprünge" in seinem Diagramm enthält, kann es etwas schwieriger sein, einige Perzentilwerte zu definieren. Aus diesem Grund sind Perzentile für kontinuierliche Zufallsvariablen (wie Normalverteilung, Exponentialverteilung usw.) gut definiert, für diskrete Variablen (wie Poisson, Binomial usw.) kann dies jedoch schwierig sein.
Wie berechnet man ein Perzentil?
Zunächst müssen Sie die kumulative Funktion \({{F}_{X}}\) kennen. Für \(\alpha\) zwischen 0 und 1 müssen wir also nach \(x\) auflösen:
\[\alpha ={{F}_{X}}\left( x \right)\]Beachten Sie, dass das Auflösen der obigen Gleichung für x dasselbe ist wie das Schneiden der Kurve \( F_{X}(x)\) mit der Linie \(y=\alpha\) (die parallel zur x-Achse verläuft). Wenn \({{F}_{X}}\) stetig ist, existiert der Schnittpunkt zwischen der Linie \(y=\alpha\) und \({{F}_{X}}\left( x \right)\), dies gilt jedoch nicht unbedingt für alle Werte von \(\alpha\) für ein nicht kontinuierliches \({{F}_{X}}\left( x \right)\).
Ein Perzentil ist ein Parameter oder eine Statistik?
Für die von uns angegebene Definition ist ein Perzentil ein Populationsparameter, da es streng von der Verteilungsfunktion und nicht von den Probendaten abhängt. Hier entsteht die Verwirrung. Manchmal erhalten die Schüler Beispieldaten und werden gebeten, ein Perzentil zu berechnen. In Wirklichkeit werden sie gebeten, ein Stichprobenperzentil zu berechnen, eine Statistik, die anhand von Beispieldaten berechnet wird und von der wir hoffen, dass sie eine gute Schätzung der entsprechenden Werte darstellt. Bevölkerungsperzentil.