केंद्रीय सीमा प्रमेय से कैसे निपटें, और क्या यह सामान्य वितरण से संबंधित है?
एक कारण होना चाहिए कि सामान्य वितरण इतना लोकप्रिय क्यों है। मेरा मतलब है, अगर हम मानते हैं कि \(\mu\) और विचरण \({{\sigma }^{2}}\) के माध्य के साथ एक सामान्य वितरण का घनत्व कार्य है जैसा कि नीचे दिखाया गया है
\[f\left( x \right)=\frac{1}{\sqrt{2\pi {{\sigma }^{2}}}}\exp \left( -\frac{{{\left( x-\mu \right)}^{2}}}{2{{\sigma }^{2}}} \right)\]
तो किसी को यह सोचना चाहिए कि यह अपने घनत्व समारोह की सादगी के कारण लोकप्रिय नहीं है।
सामान्य वितरण में हेरफेर
वास्तव में, Stats के छात्र इसके बीजगणितीय हेरफेर के संबंध में सामान्य वितरण से निपटने से डरते हैं, क्योंकि, यह बोझिल हो सकता है। उदाहरण के लिए, ऊपर प्रस्तुत घनत्व फ़ंक्शन \(f\left( x \right)\) वास्तव में एक घनत्व है, क्योंकि इसे सिद्ध किया जा सकता है (हालांकि ऐसा करना प्राथमिक नहीं है) कि
\[\int\limits_{-\infty }^{\infty }{\frac{1}{\sqrt{2\pi {{\sigma }^{2}}}}\exp \left( -\frac{{{\left( x-\mu \right)}^{2}}}{2{{\sigma }^{2}}} \right)dx}=1\]
और चूंकि यह घनत्व \(f\left( x \right)\) एक वैध घनत्व है, तो हमारे पास वह होना चाहिए
\[\int\limits_{-\infty }^{\infty }{\frac{x}{\sqrt{2\pi {{\sigma }^{2}}}}\exp \left( -\frac{{{\left( x-\mu \right)}^{2}}}{2{{\sigma }^{2}}} \right)dx}=\mu\]
and\[\int\limits_{-\infty }^{\infty }{\frac{{{x}^{2}}}{\sqrt{2\pi {{\sigma }^{2}}}}\exp \left( -\frac{{{\left( x-\mu \right)}^{2}}}{2{{\sigma }^{2}}} \right)dx}={{\mu }^{2}}+{{\sigma }^{2}}\]
जो साबित करने के लिए तुच्छ नहीं हैं (विशेषकर अंतिम)। तो, हाँ, सामान्य वितरण के साथ बीजगणितीय रूप से निपटना कठिन है। लेकिन फिर, यह इतना लोकप्रिय क्यों है ??
मानक सामान्य वितरण और जेड-स्कोर
एक अच्छा कारण, जो शायद अपने आप में एक काफी मजबूत कारण है, वह यह है कि एक बहुत ही सरल मानकीकरण प्रक्रिया, हम किसी भी सामान्य वितरण \(N\left( \mu ,{{\sigma }^{2}} \right)\) को मानक सामान्य वितरण तक कम कर सकते हैं, सामान्य वितरण के साथ जिसका मतलब शून्य है और 1 का मानक विचलन है, या \(N\left( 0,1 \right)\) है। मानकीकरण में मूल चर X को घटाकर . करना शामिल है जेड-स्कोर निम्नलिखित अभिव्यक्ति का उपयोग करना:
\[Z=\frac{X-\mu }{\sigma }\]
वास्तव में, यह सिद्ध किया जा सकता है कि यदि X का माध्य \(\mu\) और विचरण \({{\sigma }^{2}}\), \(N\left( \mu ,{{\sigma }^{2}} \right)\) के साथ एक सामान्य वितरण है, तो \(Z\) के रूप में परिभाषित किया गया है
\[Z=\frac{X-\mu }{\sigma}\]
इसका एक सामान्य वितरण भी है, लेकिन माध्य 0 और मानक विचलन 1 के साथ। यह छोटी कमी बेहद कुशल साबित होती है, क्योंकि इसका उपयोग करके हम किसी भी सामान्य वितरण संभावनाओं की गणना को मानक सामान्य वितरण के लिए संभावनाओं की गणना के लिए कम कर सकते हैं। क्या आपने यह भी सोचा है कि स्टैटिस्टिक्स पाठ्यपुस्तकों के पीछे केवल मानक सामान्य वितरण के लिए सामान्य वितरण तालिकाएँ क्यों आती हैं? ऐसा इसलिए है क्योंकि सभी सामान्य वितरणों को z-स्कोर के माध्यम से मानक सामान्य वितरण में घटाया जा सकता है, और सभी संभावित सामान्य वितरणों के लिए सभी संभावित तालिकाओं को प्रिंट करना वास्तव में अव्यावहारिक या असंभव होगा।
उदाहरण: मान लें कि पांचवीं कक्षा में बच्चों का औसत वजन 72 पाउंड है, जिसमें 8 पाउंड का मानक विचलन है, और वितरण सामान्य वितरण का अनुसरण करता है। इस संभावना की गणना करें कि एक यादृच्छिक बच्चे का वजन 75.5 पाउंड से कम है।
समाधान: ध्यान दें कि घटना \(X<75.5\) को समान रूप से व्यक्त किया जा सकता है
\[X-72<75.5-72\]
क्यों? क्योंकि हमने असमानता के दोनों पक्षों में से केवल 72 को घटाया है, जिससे असमानता के समाधान नहीं बदलते हैं। उसी तर्क के साथ, मैं एक समान घटना प्राप्त करने के लिए दोनों पक्षों को 8 से विभाजित कर सकता हूं
\[\frac{X-72}{8}<\frac{75.5-72}{8}\]
कृपया, यहां भ्रमित न हों: हम केवल इतना कह रहे हैं कि यदि X \(X<75.5\) का समाधान है, तो X भी \(X-72<75.5-72\) का समाधान है, और फिर X भी \(\frac{X-72}{8}<\frac{75.5-72}{8}\) का समाधान है। और इसके विपरीत, यदि एक्स \(\frac{X-72}{8}<\frac{75.5-72}{8}\) का समाधान है, तो एक्स भी \(X-72<75.5-72\) का समाधान है और एक्स भी \(X<75.5\) का समाधान है। हमारा यही मतलब है जब हम कहते हैं कि घटनाएं \(\left\{ X<75.5 \right\}\), \(\left\{ X-72<75.5-72 \right\}\) और \(\left\{ \frac{X-72}{8}<\frac{75.5-72}{8} \right\}\) समान हैं (अर्थात, वे समाधान के समान सेट को परिभाषित करते हैं)।
इसलिए, इस उदाहरण में, हमें निम्नलिखित प्रायिकता की गणना करने की आवश्यकता है:
\[\Pr \left( X<75.5 \right)=\Pr \left( \frac{X-72}{8}<\frac{75.5-72}{8} \right)=\Pr \left( Z<0.4375 \right)=0.6691\]
जैसा कि आप देख सकते हैं, एक निश्चित सामान्य वितरण के साथ मानक, मैंने एक समान घटना प्राप्त करने के लिए परिवर्तन किया जिसमें एक जेड-स्कोर शामिल है, और फिर मैं अंतिम संभावना की गणना करने के लिए किसी भी मानक सामान्य वितरण तालिका (या एक्सेल) का उपयोग कर सकता हूं।
केंद्रीय सीमा प्रमेय (CLT)
यदि उपरोक्त आपके लिए सामान्य वितरण (इसके बोझिल बीजगणितीय आकार के बावजूद) से प्यार करने के लिए पर्याप्त मजबूत कारण नहीं था, तो मैं आपको एक कारण बताऊंगा जिसका आप विरोध नहीं कर सकते। यह पता चला है कि कई प्रकार के संभाव्यता वितरण (मेरा मतलब है, कई) हैं, जिनमें सामान्य वितरण की तुलना में पूरी तरह से अलग गुण हो सकते हैं। लेकिन, यदि आप किसी भी वितरण से यादृच्छिक चर की पुनरावृत्ति लेते हैं, और आप उनके औसत की गणना करते हैं, तो वे औसत (आप क्या सोचते हैं?) खतरनाक रूप से सामान्य वितरण के समान होंगे, खासकर जब नमूना आकार (पुनरावृत्ति की संख्या) बड़ी हो .
तो फिर, किसी भी संभाव्यता वितरण से आने वाले मूल्यों के नमूने का औसत लेने और अब उन औसतों के वितरण का विश्लेषण करने की प्रक्रिया, हम एक सामान्य वितरण (जब नमूना आकार बड़ा है) देखना शुरू करते हैं। किसी तरह, औसत लेना वितरण के मूल आकार को मोड़ देता है और इसे अंतर्निहित वितरण के बावजूद सामान्य में बदल देता है। यह तथ्य कार्ल फ्रेडरिक गॉस द्वारा बनाई गई सांख्यिकी में सबसे आश्चर्यजनक खोजों में से एक है। सावधानी का एक शब्द, केंद्रीय सीमा प्रमेय का एक औपचारिक सांख्यिकीय सूत्रीकरण है, जिसे हम यहां शामिल नहीं करेंगे, लेकिन यह बताता है कि एक निश्चित संभाव्यता अर्थ में नमूना औसत सामान्य वितरण में परिवर्तित होता है। बहुत अधिक तकनीकीताओं में प्रवेश किए बिना, इसका मतलब है कि ज्यादातर मामलों के लिए, नमूना औसत में पर्याप्त रूप से बड़े नमूना आकार के लिए अनुमानित सामान्य वितरण होता है। यह सब बहुत आम है कि कभी-कभी प्रशिक्षक यह कहकर गलत व्याख्या देते हैं कि नमूना औसत का वितरण सामान्य वितरण बन जाता है, जो सामान्य रूप से सच नहीं है (वास्तव में, यह केवल तभी सच होता है जब अंतर्निहित मूल वितरण सामान्य होता है)।
इसलिए सामान्य वितरण को अत्यधिक महत्व दिया जाता है: ऐसा इसलिए है क्योंकि इसमें इस प्रकार का है जादू की संपत्ति कि किसी भी वितरण का औसत लेते हुए, आप कुछ ऐसा प्राप्त करेंगे जो काफी सामान्य दिखता है, यदि आप एक नमूना आकार काफी बड़ा लेते हैं।