Die Verwendung der Notation in der Basisstatistik - Teil II
Dies ist eine Fortsetzung der Vorherige Sektion , wo die häufigsten Notationen für deskriptive Statistiken vorgestellt wurden. Es ist wichtig zu verstehen, wie Notation verwendet wird, da Notation in Mathematik und Statistik als verwendet wird Verknüpfungen und als solches, wenn Sie ihre Bedeutung nicht verstehen, werden Sie bald verloren sein und WIRKLICH nicht verstehen, worüber gesprochen wird.
In den folgenden Abschnitten werden wir diese Reihe fortsetzen und versuchen, die Verwendung der Notation in der Inferenzstatistik zu verdeutlichen, wo eine umfangreichere und differenziertere Notation verwendet wird. Daher sollten Sie darauf achten, was kommt.
Notation in der Inferenzstatistik
Die folgenden Symbole und Notationen werden häufig bei der Arbeit mit Inferenzstatistiken verwendet. Diese Symbole werden in den meisten Ihrer Statistikklassen weiterhin verwendet.
· \(\mu\): Dies ist das generische Symbol, das den Bevölkerungsdurchschnitt darstellt. Dies ist ein Parameter (da es sich um eine Konstante handelt, die nicht mit Beispielinformationen erstellt wurde). Manchmal wird \(\mu\) mit einem Subindex geliefert, der den Populationsmittelwert der Variablen darstellt, über die wir sprechen. Wenn wir beispielsweise \({{\mu }_{X}}\) sehen, bezieht sich dieses Symbol auf den Populationsmittelwert der Zufallsvariablen \(X\). Wenn \(f\left( x \right)\) die Verteilungs- (Dichte-) Zufallsvariable \(X\) ist, wird im Allgemeinen der Populationsmittelwert mit dem folgenden Ausdruck berechnet:
\[{{\mu }_{X}}=\int\limits_{-\infty }^{\infty }{x\,f\left( x \right)dx}\]
im Fall einer kontinuierlichen Zufallsvariablen oder
\[{{\mu }_{X}}=\sum\limits_{k}{{{x}_{k}}f\left( {{x}_{k}} \right)}\]
für den Fall einer diskreten Verteilung.
Einige Dinge, die Sie beachten sollten: Obwohl \(\mu\) das generische Symbol für den Populationsmittelwert ist, gibt es bestimmte Verteilungen, die üblicherweise unterschiedliche Symbole verwenden. Wenn X beispielsweise eine Poisson-Zufallsvariable ist, wird traditionell \(\lambda\) als Symbol für den Populationsmittelwert verwendet. Das Wichtigste ist, dass es sich nur um eine Notation handelt, dies ist eine Konvention.
· \({{\sigma }^{2}}\): Dies ist die Populationsvarianz, die als berechnet wird
\[{{\sigma }^{2}}=\int\limits_{-\infty }^{\infty }{{{x}^{2}}\,f\left( x \right)dx}-{{\mu }^{2}}=\int\limits_{-\infty }^{\infty }{{{x}^{2}}\,f\left( x \right)dx}-{{\left( \int\limits_{-\infty }^{\infty }{xf\left( x \right)dx} \right)}^{2}}\]
Dies ist ein Populationsparameter, da es sich um eine feste Zahl (keine Zufallsvariable) handelt, die nicht aus Stichprobeninformationen erstellt wird. Wie beim Populationsmittel ist es üblich, einen Subindex hinzuzufügen, um die zugrunde liegende Variable darzustellen. Dies bedeutet, dass \(\sigma _{X}^{2}\) die Populationsvarianz der Zufallsvariablen X darstellt, während \(\sigma _{Y}^{2}\) die Populationsvarianz der Zufallsvariablen Y darstellt.
Wie im vorherigen Fall ist dies auch hier die häufigste NOTATION (oder Abkürzung, wenn Sie so wollen), um die Populationsvarianz zu schreiben. Aber es gibt Fälle, in denen die Tradition darin besteht, etwas anderes zu verwenden. Wenn X beispielsweise eine Poisson-Verteilung hat, haben wir zuvor erwähnt, dass der Populationsmittelwert als \(\lambda\) bezeichnet wird, und es stellt sich heraus, dass bei der Berechnung der Populationsvarianz auch \(\lambda\) gleich ist. In diesem Fall würden wir \(\sigma _{X}^{2}=\lambda\) schreiben. Also, bitte, bitte, verwechseln Sie nicht zwischen einem der Notation Teil von \(\sigma _{X}^{2}=\lambda\) und der Berechnungsteil von \(\sigma _{X}^{2}=\lambda\).
· \(\sigma\): Dies ist die Populationsstandardabweichung, die berechnet wird, indem die Quadratwurzel der Populationsvarianz gezogen wird oder einfach die folgende Formel verwendet wird.
\[\sigma =\sqrt{\int\limits_{-\infty }^{\infty }{{{x}^{2}}\,f\left( x \right)dx}-{{\left( \int\limits_{-\infty }^{\infty }{xf\left( x \right)dx} \right)}^{2}}}\]
Dies ist ein Parameter, da es sich um eine feste Zahl handelt, die nicht aus Beispielinformationen besteht.
· \({{H}_{0}}\): Dies ist die Notation für die Nullhypothese . Beim Testen von Hypothesen ist die Nullhypothese die Hypothese ohne Wirkung
· \({{H}_{A}}\): Dies ist die Notation für die alternative Hypothese . Beim Testen von Hypothesen ist die alternative Hypothese die Hypothese, die bewiesen werden kann, wenn die Probendaten ausreichend unwahrscheinlich sind, wenn die Nullhypothese Ho wahr ist
· \(\Theta\): Dies ist ein weniger häufig verwendetes Symbol und repräsentiert die Menge aller möglichen Werte für den Populationsparameter. Wenn X beispielsweise eine normalverteilte Zufallsvariable mit einer Populationsvarianz von \({{\sigma }^{2}}=1\) und einem unbekannten Populationsmittelwert \(\mu\) ist, ist die Menge aller möglichen Werte, die von \(\mu\) angenommen werden können, die gesamte reelle Linie. Mit anderen Worten, wir hätten in diesem Fall \(\Theta =\left( -\infty ,\infty \right)\).
· \({{\Theta }_{0}}\): Im Kontext des obigen Symbols repräsentiert dieses Symbol die möglichen Werte, die von einem Populationsparameter angenommen werden, wie in der Nullhypothese eines Hypothesentests angegeben. Nehmen wir beispielsweise an, dass X eine normalverteilte Zufallsvariable mit einer Populationsvarianz von \({{\sigma }^{2}}=1\) und einem unbekannten Populationsmittelwert ist, und wir sind daran interessiert, die folgenden Null- und Alternativhypothesen zu testen:
\[\begin{align} & {{H}_{0}}:\mu =0 \\ & {{H}_{A}}:\mu \ne 0 \\ \end{align}\]
In diesem Fall hätten wir das \({{\Theta }_{0}}=\left\{ 0 \right\}\) .
· \({{\Theta }_{A}}\): In Anlehnung an die vorherigen Symbole repräsentiert dieses Symbol die möglichen Werte, die von einem Populationsparameter angenommen werden, wie in der alternativen Hypothese eines Hypothesentests angegeben. Nehmen wir beispielsweise an, dass X eine normalverteilte Zufallsvariable mit einer Populationsvarianz von \({{\sigma }^{2}}=1\) und einem unbekannten Populationsmittelwert ist, und wir sind daran interessiert, die folgenden Null- und Alternativhypothesen zu testen:
\[\begin{align} & {{H}_{0}}:\mu =0 \\ & {{H}_{A}}:\mu \ne 0 \\ \end{align}\]
In diesem Fall hätten wir das \({{\Theta }_{A}}=\left( -\infty ,0 \right)\cup \left( 0,\infty \right)\) . Beachten Sie, dass wir per Definition das \(\Theta ={{\Theta }_{0}}\cup {{\Theta }_{A}}\) haben müssen.
· \(\rho\): Dies entspricht der Populationskorrelation zwischen den Variablen X und Y. Um die beteiligten Variablen genauer zu beschreiben, kann die Notation als \(\rho \left( X,Y \right)\) oder sogar \({{\rho }_{X,Y}}\) geschrieben werden.
· \(\pi\): Obwohl nicht universell, wird dieses Symbol verwendet, um einen Bevölkerungsanteil darzustellen. In diesem Sinne repräsentiert \({{\pi }_{1}}\) den Bevölkerungsanteil (für eine kategoriale Variable) in Bevölkerung 1 usw. Manchmal wird ein einfacher \(p\) verwendet, um einen Bevölkerungsanteil darzustellen, aber ich denke, das ist eine schlechte Idee, obwohl mehr oder weniger \(p\) ist die am häufigsten verwendete Notation zur Darstellung eines Bevölkerungsanteils.
· \(\sim\): Das "Tilde" -Symbol wird verwendet, um darzustellen, dass eine bestimmte Zufallsvariable eine bestimmte Verteilung hat. Wenn wir zum Beispiel sehen: \(X\tilde{\ }Poisson\left( \lambda \right)\), interpretieren wir es als: "X ist eine Zufallsvariable mit einer Poisson-Verteilung mit dem Mittelwert \(\lambda\)".