كيف نتعامل مع نظرية الحدود المركزية وهل لها علاقة بالتوزيع الطبيعي؟
يجب أن يكون هناك سبب يجعل التوزيع الطبيعي شائعًا جدًا. أعني , إذا اعتبرنا أن التوزيع الطبيعي بمتوسط \(\mu\) والتباين \({{\sigma }^{2}}\) له دالة كثافة مثل تلك الموضحة أدناه
\[f\left( x \right)=\frac{1}{\sqrt{2\pi {{\sigma }^{2}}}}\exp \left( -\frac{{{\left( x-\mu \right)}^{2}}}{2{{\sigma }^{2}}} \right)\]
ثم يجب على المرء أن يعتقد أنه شائع ليس على وجه التحديد بسبب بساطة وظيفة الكثافة الخاصة به.
معالجة التوزيع الطبيعي
في الواقع , يخشى طلاب الإحصائيات من الاضطرار إلى التعامل مع التوزيع الطبيعي فيما يتعلق بالتلاعب الجبري لأنه , من المسلم به , يمكن أن يكون مرهقًا. على سبيل المثال , دالة الكثافة \(f\left( x \right)\) المعروضة أعلاه هي بالفعل كثافة , حيث يمكن إثبات ذلك (على الرغم من أنه ليس من الأساسي القيام بذلك)
\[\int\limits_{-\infty }^{\infty }{\frac{1}{\sqrt{2\pi {{\sigma }^{2}}}}\exp \left( -\frac{{{\left( x-\mu \right)}^{2}}}{2{{\sigma }^{2}}} \right)dx}=1\]
وبما أن هذه الكثافة \(f\left( x \right)\) هي كثافة صالحة , فلا بد أن نحصل عليها
\[\int\limits_{-\infty }^{\infty }{\frac{x}{\sqrt{2\pi {{\sigma }^{2}}}}\exp \left( -\frac{{{\left( x-\mu \right)}^{2}}}{2{{\sigma }^{2}}} \right)dx}=\mu\]
and\[\int\limits_{-\infty }^{\infty }{\frac{{{x}^{2}}}{\sqrt{2\pi {{\sigma }^{2}}}}\exp \left( -\frac{{{\left( x-\mu \right)}^{2}}}{2{{\sigma }^{2}}} \right)dx}={{\mu }^{2}}+{{\sigma }^{2}}\]
التي ليس من السهل إثباتها (خاصةً الأخيرة). لذا , نعم , من الصعب التعامل جبريًا مع التوزيع الطبيعي. ولكن بعد ذلك , لماذا هي شعبية جدا ؟؟
التوزيع الطبيعي القياسي و Z- عشرات
أحد الأسباب الجيدة , والذي ربما يكون سببًا قويًا بدرجة كافية من تلقاء نفسه , هو أنه عبر بسيط للغاية التوحيد عملية , يمكننا تقليل أي توزيع عادي \(N\left( \mu ,{{\sigma }^{2}} \right)\) إلى التوزيع الطبيعي القياسي , مع التوزيع الطبيعي الذي له متوسط صفر وانحراف معياري قدره 1 , أو \(N\left( 0,1 \right)\). يتكون التوحيد من تقليل المتغير X الأصلي إلى عشرات z باستخدام التعبير التالي:
\[Z=\frac{X-\mu }{\sigma }\]
في الواقع , يمكن إثبات أنه إذا كان لدى X توزيع طبيعي بمتوسط \(\mu\) والتباين \({{\sigma }^{2}}\) , \(N\left( \mu ,{{\sigma }^{2}} \right)\) , فعندئذٍ يتم تعريف \(Z\) على أنه
\[Z=\frac{X-\mu }{\sigma}\]
له أيضًا توزيع طبيعي , ولكن مع متوسط 0 وانحراف معياري 1. يتبين أن هذا التخفيض الصغير فعال للغاية , لأنه باستخدام الاستخدام يمكننا تقليل حساب أي احتمالات توزيع عادية لحساب الاحتمالات للتوزيع العادي القياسي. هل تساءلت حتى لماذا يأتي الجزء الخلفي من الكتب المدرسية للإحصائيات مع جداول التوزيع العادية فقط للتوزيع العادي القياسي؟ ذلك لأن جميع التوزيعات العادية يمكن اختزالها إلى التوزيعات العادية القياسية , عبر نقاط z , وسيكون من غير العملي حقًا , أو من المستحيل , طباعة جميع الجداول الممكنة لجميع التوزيعات العادية الممكنة.
مثال: افترض أن متوسط وزن الأطفال في الصف الخامس 72 رطلاً , بانحراف معياري 8 جنيهات , والتوزيع يتبع التوزيع الطبيعي. احسب احتمال أن يزن طفل عشوائي أقل من 75.5 رطلاً.
حل: لاحظ أنه يمكن التعبير عن الحدث \(X<75.5\) بالتساوي كـ
\[X-72<75.5-72\]
لماذا ا؟ لأننا ببساطة طرحنا 72 لكلا طرفي المتباينة , وهذا لا يغير حلول المتباينة. على نفس المنطق , يمكنني قسمة كلا الجانبين على 8 للحصول على حدث مماثل
\[\frac{X-72}{8}<\frac{75.5-72}{8}\]
من فضلك , لا تشغل بالك هنا: كل ما نقوله هو أنه إذا كان X هو حل \(X<75.5\) , إذن X هو أيضًا حل \(X-72<75.5-72\) , ثم X هو أيضًا حل \(\frac{X-72}{8}<\frac{75.5-72}{8}\). وبالعكس , إذا كان X هو حل \(\frac{X-72}{8}<\frac{75.5-72}{8}\) , فإن X هو أيضًا حل \(X-72<75.5-72\) و X هو أيضًا حل \(X<75.5\). هذا ما نعنيه عندما نقول أن الأحداث \(\left\{ X<75.5 \right\}\) و \(\left\{ X-72<75.5-72 \right\}\) و \(\left\{ \frac{X-72}{8}<\frac{75.5-72}{8} \right\}\) تساوي (أي أنها تحدد نفس مجموعة الحلول).
لذلك , في هذا المثال , نحتاج إلى حساب الاحتمال التالي:
\[\Pr \left( X<75.5 \right)=\Pr \left( \frac{X-72}{8}<\frac{75.5-72}{8} \right)=\Pr \left( Z<0.4375 \right)=0.6691\]
كما ترى , بشكل قياسي مع توزيع طبيعي معين , قمت بإجراء التحويل للحصول على حدث مكافئ يتضمن درجة Z , وبعد ذلك يمكنني استخدام أي جدول توزيع عادي قياسي (أو Excel) لحساب الاحتمال النهائي.
نظرية الحدود المركزية (CLT)
إذا لم يكن ما سبق سببًا قويًا بدرجة كافية تجعلك تحب التوزيع الطبيعي (على الرغم من شكله الجبري المرهق) , فسأعطيك سببًا لا يمكنك مقاومته. اتضح أن هناك أنواعًا عديدة من التوزيعات الاحتمالية (أعني , العديد) , يمكن أن يكون لها خصائص مختلفة تمامًا عن التوزيع الطبيعي. ولكن , إذا أخذت تكرار متغير عشوائي , من أي توزيع , وقمت بحساب متوسطها , فستكون هذه المتوسطات (ما رأيك؟) تشبه بشكل خطير التوزيع الطبيعي , خاصةً عندما يكون حجم العينة (عدد التكرارات) كبيرًا .
إذن , عملية أخذ متوسطات عينة من القيم القادمة من أي توزيع احتمالي وتحليل توزيع هذه المتوسطات الآن , نبدأ في رؤية التوزيع الطبيعي (عندما يكون حجم العينة كبيرًا). بطريقة ما , يؤدي أخذ المتوسطات إلى انحناء الشكل الأصلي للتوزيع وتحويله إلى عادي , بغض النظر عن التوزيع الأساسي. هذه الحقيقة هي واحدة من أكثر الاكتشافات المدهشة في الإحصاء , التي قام بها كارل فريدريش جاوس. كلمة تحذير , نظرية الحدود المركزية لها صيغة إحصائية رسمية , والتي لن نقوم بتضمينها هنا , لكنها تنص على أن متوسط العينة CONVERGE إلى التوزيع الطبيعي , بمعنى احتمالي معين. دون الدخول في الكثير من الجوانب الفنية , فهذا يعني أنه في معظم الحالات , يكون لمتوسطات العينة توزيع طبيعي تقريبي لحجم عينة كبير بدرجة كافية. من الشائع جدًا أن يقدم المعلمون أحيانًا تفسيرًا خاطئًا بالقول إن توزيع متوسطات العينة يصبح توزيعًا طبيعيًا , وهذا ليس صحيحًا بشكل عام (في الواقع , يكون هذا صحيحًا فقط عندما يكون التوزيع الأصلي الأساسي طبيعيًا).
لهذا السبب نعتز بالتوزيع الطبيعي: لأنه يحتوي على هذا النوع من خاصية السحر بأخذ متوسطات أي توزيع , سينتهي بك الأمر بشيء يبدو طبيعيًا إلى حد ما , إذا أخذت حجم عينة كبيرًا بدرجة كافية.