Alles, was Sie über Dichten und Wahrscheinlichkeitsverteilungen wissen müssen
In diesem Tutorial werden die Schlüsselelemente vorgestellt, die eine Wahrscheinlichkeitsverteilung definieren. Zunächst müssen wir eine breite und allgemeine Definition geben: Eine Wahrscheinlichkeitsverteilung ist eine Funktion, die das Wahrscheinlichkeitsverhalten einer Zufallsvariablen X so beschreibt, dass wir Wahrscheinlichkeiten für das Auftreten aller möglichen ( wohlgeformte) Ereignisse. Mit anderen Worten, eine Wahrscheinlichkeitsfunktion gibt uns einen klaren und eindeutigen Mechanismus zur Berechnung von Wahrscheinlichkeiten, die mit einer bestimmten Zufallsvariablen X verbunden sind. Ich möchte, dass Sie dies vorerst beibehalten und berücksichtigen.
Notation
Lassen Sie uns nun ein wenig über die Notation sprechen. Nehmen wir also an, dass X eine Zufallsvariable ist und wir mit ihrer Verteilung arbeiten. Angenommen, \(f\) ist die Verteilung von X. In der Regel wird daher ein Verweis auf \({{f}_{X}}\) angezeigt, wobei X angezeigt wird speziell dass \(f\) die Verteilung von X ist. Dies geschieht nicht immer so, aber wenn die Verteilungsfunktion einen Index hat, bedeutet dies, dass auf die tatsächliche Zufallsvariable verwiesen wird, der sie entspricht.
Unterscheidung zwischen diskreten und kontinuierlichen Zufallsvariablen
Wir müssen von nun an präzise in Bezug auf die von uns verwendete Notation sein. Der Begriff "Wahrscheinlichkeitsverteilung" ist eine Art Überbegriff, der in vielen Zusammenhängen nachlässig verwendet wird, aber wir werden versuchen, nicht zu locker zu sein, damit wir nicht verwirrt werden. Nehmen wir also Folgendes auf: Wenn eine Zufallsvariable X a ist kontinuierliche Zufallsvariable , dann werden wir a verwenden Dichtefunktion \({{f}_{X}}\), um die damit verbundenen Wahrscheinlichkeiten zu berechnen. Wenn andererseits eine Zufallsvariable Y a ist diskrete Zufallsvariable , dann werden wir a verwenden Wahrscheinlichkeitsfunktion \({{g}_{Y}}\), um die damit verbundenen Wahrscheinlichkeiten zu berechnen. Dichtefunktionen und Wahrscheinlichkeitsfunktionen arbeiten auf unterschiedliche Weise, obwohl sie VOLLSTÄNDIG analog funktionieren. Ich verspreche es.
Denken Sie daran, diskrete Zufallsvariablen zu verwenden Wahrscheinlichkeitsfunktionen und kontinuierliche Zufallsvariablen verwenden Dichtefunktionen . So verwendet beispielsweise eine Poisson-Zufallsvariable eine Wahrscheinlichkeitsfunktion und eine Binomial-Zufallsvariable eine Wahrscheinlichkeitsfunktion. Oder eine normalverteilte Zufallsvariable verwendet eine Dichtefunktion.
Eigenschaften, die von ALLEN Wahrscheinlichkeits- und Dichtefunktionen erfüllt werden müssen
Wir haben versprochen, dass Wahrscheinlichkeitsfunktionen und -dichten auf eine andere, aber völlig analoge Weise funktionieren. Jetzt werden wir sehen warum.
· · Für Dichten
Sehen Sie sich das an: Eine Dichtefunktion \(f\) für eine kontinuierliche Zufallsvariable X erfüllt die beiden folgenden Bedingungen:
(1) \(f\left( x \right)\ge 0\) für alle x in \(\mathbb{R}\).
(2) \(\int\limits_{-\infty }^{\infty }{f\left( x \right)dx} = 1\)
Lassen Sie uns nicht zu sehr über das oben Gesagte aufhängen. Bedingung (1) besagt, dass eine Dichtefunktion zu keinem Zeitpunkt negativ sein kann. Es werden entweder positive Werte oder Null angenommen. Bedingung (2) besagt, dass das Integral einer Dichtefunktion \(f\) über die gesamte reelle Linie 1 sein muss. Für Laien beträgt die Gesamtfläche unter der Kurve 1.
· · Nun zu den Wahrscheinlichkeitsfunktionen
Eine Wahrscheinlichkeitsfunktion \(g\) für eine diskrete Zufallsvariable X erfüllt die beiden folgenden Bedingungen:
(1) \(g\left( x \right)\ge 0\) für alle \(x\in \left\{ {{a}_{1}},{{a}_{2}},....,{{a}_{n}},.... \right\}\).
(2) \(\sum\limits_{i=1}^{\infty }{g\left( {{a}_{i}} \right)} = 1\)
Beachten Sie, dass \(\left\{ {{a}_{1}},{{a}_{2}},....,{{a}_{n}},.... \right\}\) allen möglichen Werten entspricht, die von der Zufallsvariablen \(X\) angenommen werden können (denken Sie daran, dass \(X\) eine diskrete Variable ist). Soweit ich sehen kann, sehen (1) und (2) für Wahrscheinlichkeitsfunktionen für Dichtefunktionen ziemlich gleich aus (1) und (2). In fortgeschritteneren mathematischen Themen konnte man tatsächlich sehen, dass (1) und (2) in beiden Fällen in einem allgemeineren Kontext (Maßtheorie) als exakt gleich angesehen werden können, aber das werden wir hier nicht ansprechen. Ich möchte, dass Sie bedenken, dass ALLE Wahrscheinlichkeitsfunktionen und Dichtefunktionen diese beiden Bedingungen erfüllen.
BEISPIEL 1
Sei X eine Zufallsvariable, die die Werte 1, 2, 3 und 4 annehmen kann
\[ f\left( x \right) =\displaystyle \left\{ \begin{array}{cc} \frac{1}{2 } & \text{ for } x=1, \\ \\ \frac{1}{4} & \text{ for } x=2, \\ \\ \frac{1}{8} & \text{ for } x=3, \\ \\ \frac{1}{8} & \text{ for }x=4 \\ \end{array} \right.\]eine Wahrscheinlichkeitsfunktion für die Zufallsvariable X?
ANTWORTEN:
Let us see, we need to see if conditions (1) and (2) are met. First of all, notice that we have \(f\left( x \right)\ge 0\) for all values {1, 2, 3, 4}, which is the set of all possible values that X can take, since \(f\left( 1 \right)=\frac{1}{2}>\), \(f\left( 2 \right)=\frac{1}{4}>0\), \(f\left( 3 \right)=\frac{1}{8}>0\) and \(f\left( 4 \right)=\frac{1}{8}>0\). Therefore, condition (1) is met.Lassen Sie uns nun sehen, ob Bedingung (2) erfüllt ist: Wir haben das
\[\sum\limits_{i=1}^{4}{f\left( {{x}_{i}} \right)}=f\left( 1 \right)+f\left( 2 \right)+f\left( 3 \right)+f\left( 4 \right)=\frac{1}{2}+\frac{1}{4}+\frac{1}{8}+\frac{1}{8}=1\]
und daher ist auch die Bedingung (2) erfüllt. Die endgültige Antwort lautet also: Ja, \(f\left( x \right)\) ist eine Wahrscheinlichkeitsfunktion für die Zufallsvariable \(X\).
BEISPIEL 2
Betrachten Sie die Funktion \(f\left( x \right)={{x}^{2}}\) auf [0,2], auf 0 an anderer Stelle. Ist \(f\left( x \right)\) eine Dichtefunktion?
ANTWORTEN:
Mal sehen, wir müssen sehen, ob die Bedingungen (1) und (2) erfüllt sind. Beachten Sie zunächst, dass wir \(f\left( x \right)\ge 0\) für alle \(x\) seit \(f\left( x \right)={{x}^{2}}\ge 0\) auf [0, 2] und \(f=0\) an anderer Stelle haben. Dann nimmt die Funktion keine negativen Werte an und von nun an ist die Bedingung (1) erfüllt.
Für Bedingung (2) berechnen wir:
\[\int\limits_{-\infty }^{\infty }{f\left( x \right)dx}=\int\limits_{0}^{2}{{{x}^{2}}dx}=\left. \frac{{{x}^{3}}}{3} \right|_{0}^{2}=\frac{{{2}^{3}}}{3}-\frac{{{0}^{3}}}{3}=\frac{8}{3}>1\]Daher ist die Bedingung (2) nicht erfüllt, und daher ist $ f \ left (x \ right) $ KEINE Dichtefunktion.
Schließlich, wie man Wahrscheinlichkeiten mit Dichten und Wahrscheinlichkeitsfunktionen berechnet?
Dies ist der letzte Schritt, den wir gesucht haben. Warum beschäftigen wir uns überhaupt mit Wahrscheinlichkeits- und Dichtefunktionen? Nun, es gibt einen guten Grund, weil sie uns ein klares, eindeutiges Verfahren zur Berechnung von Wahrscheinlichkeiten ermöglichen. Mit anderen Worten, sobald Sie die entsprechende Dichte (Wahrscheinlichkeitsfunktion) einer Zufallsvariablen kennen, wissen Sie ALLES über eine Zufallsvariable. Es gibt dir die KRAFT.
Schön, aber wie machst du das ??? Einfach. Betrachten wir wie üblich die beiden Fälle für kontinuierliche Zufallsvariablen (unter Verwendung von Dichten) und für diskrete Zufallsvariablen (unter Verwendung von Wahrscheinlichkeitsfunktionen).
Berechnen von Wahrscheinlichkeiten für kontinuierliche Zufallsvariablen
Sei X eine stetige Zufallsvariable. Eine typische Wahrscheinlichkeit wird sogar als \(X\in D\) geschrieben, wobei \(D\subseteq \mathbb{R}\). Ein Ereignis von Interesse könnte beispielsweise sein, dass "X kleiner oder gleich 5, aber größer oder gleich 1 ist". Das ist das gleiche wie \(X\in \left[ 1,5 \right]\), also hätten wir in diesem Fall \(D=\left[ 1,5 \right]\). Mit anderen Worten, Wahrscheinlichkeitsereignisse werden durch Mengen dargestellt (typischerweise Intervalle, aber nicht unbedingt immer).
Die Wahrscheinlichkeit, dass das Ereignis \(X\in D\) auftritt, ist
\[\Pr \left( X\in D \right)=\int\limits_{D}^{{}}{f\left( x \right)dx}\]Zum Beispiel, wenn \(D=\left[ 1,5 \right]\), haben wir
\[\Pr \left( X\in \left[ 1,5 \right] \right)=\Pr \left( 1\le X\le 5 \right)=\int\limits_{1}^{5}{f\left( x \right)dx}\]Es ist also SUPER EINFACH. Wir integrieren die Dichtefunktion über einen Bereich, der durch das Ereignis bestimmt wird, für das wir die Wahrscheinlichkeit berechnen möchten.
Berechnen von Wahrscheinlichkeiten für diskrete Zufallsvariablen
Sei X eine diskrete Zufallsvariable. In diesem Fall wird ein Wahrscheinlichkeitsereignis auch als eine Menge von Werten ausgedrückt, nur dass in diesem Fall ein Ereignis eine Teilmenge von \(\left\{ {{a}_{1}},{{a}_{2}},....,{{a}_{n}},.... \right\}\) ist, der Menge aller möglichen Werte, die von \(X\) angenommen werden können. Lassen Sie also \(D\subseteq \left\{ {{a}_{1}},{{a}_{2}},....,{{a}_{n}},.... \right\}\), die Wahrscheinlichkeit, dass das Ereignis \(X\in D\) auftritt, ist
\[\Pr \left( X\in D \right)=\Pr \left( X\in \left\{ {{b}_{1}},{{b}_{2}},...,{{b}_{k}} \right\} \right)=\sum\limits_{j=1}^{k}{f\left( {{b}_{j}} \right)}\]Angenommen, X ist ein Binom mit den Parametern \(N = 10\) und \(p = 0.5\). Wenn ich dann die Wahrscheinlichkeit berechnen möchte, dass X 1 oder 2 ist, muss ich berechnen
\[\Pr \left( X\in \left\{ 1,2 \right\} \right)=f\left( 1 \right)+f\left( 2 \right)\]
Dabei ist \(f\) die entsprechende Wahrscheinlichkeitsfunktion für eine Binomialverteilung mit den Parametern \(N = 10\) und \(p = 0.5\). Es ist also auch SUPER EINFACH. Wir addieren die Werte der Wahrscheinlichkeitsfunktion, die an den Punkten für den Fall ausgewertet werden, für den wir die Wahrscheinlichkeit berechnen.