सांख्यिकी में अनुभवजन्य नियम और अन्य नियम
किसी भी सांख्यिकी वर्ग में आप अक्सर पाएंगे कि कुछ "नियमों" का आमतौर पर उल्लेख किया जाता है। वे नियम आमतौर पर आपके जीवन को सरल बनाने और कुछ गणनाओं को आसान बनाने में आपकी सहायता करने के लिए होते हैं। लेकिन उन सभी नियमों को समान नहीं बनाया गया है। वास्तव में वे सभी नियम वास्तविक "नियम" नहीं हैं, क्योंकि कुछ केवल सन्निकटन हैं, और इस तरह, केवल कुछ विशिष्ट उपयोग हो सकते हैं, या कभी-कभी सीमित उपयोग भी हो सकते हैं।
निम्नलिखित अनुच्छेदों में हम उन कुछ आँकड़ों के नियमों और अनुमानों पर चर्चा करेंगे जो आमतौर पर उपयोग किए जाते हैं। वे सामान्य तौर पर काफी सरल हैं, लेकिन आपको यह जानने की जरूरत है कि उनका सही तरीके से उपयोग कैसे किया जाए।
सामान्य वितरण के लिए अनुभवजन्य नियम
यह अब तक सांख्यिकी में सबसे व्यापक रूप से ज्ञात "नियम" में से एक है। मैं उद्धरणों के साथ "नियम" लिखता रहता हूं, क्योंकि यह वास्तव में एक नियम नहीं बल्कि एक अनुमान है। अनुभवजन्य नियम में कहा गया है कि यदि एक चर सामान्य रूप से वितरित किया जाता है, तो वितरण का लगभग 68% माध्य के एक मानक विचलन के भीतर होता है, वितरण का 95% माध्य के दो मानक विचलन के भीतर होता है और वितरण का 99.7% तीन के भीतर होता है। माध्य का मानक विचलन।
सबसे पहले, आइए देखें कि यह समझ में क्यों आता है। वह घटना जो उन मानों से मेल खाती है जो माध्य के एक मानक विचलन के भीतर हैं, \(\left\{ \mu -\sigma \le X\le \mu +\sigma \right\}\) है, और यदि हम सामान्यीकृत करते हैं (\(\mu\) से घटाते हैं और \(\sigma\) से विभाजित करते हैं), तो हमें निम्नलिखित समतुल्य घटनाएं मिलती हैं:
\[\left\{ \mu -\sigma \le X\le \mu +\sigma \right\}=\left\{ -\sigma \le X-\mu \le \sigma \right\}=\left\{ -1\le \frac{X-\mu }{\sigma }\le 1 \right\}\]
लेकिन, यदि \(X\) को सामान्य रूप से माध्य \(\mu\) और मानक विचलन \(\sigma\) के साथ वितरित किया जाता है, तो हम जानते हैं कि चर \(\frac{X-\mu }{\sigma}\) का एक मानक सामान्य वितरण है (यह माध्य 0 और मानक विचलन 1 के साथ एक सामान्य वितरण है)। आमतौर पर, चर \(\frac{X-\mu }{\sigma}\) को \(Z\) के रूप में लिखा जाता है, तो हमारे पास क्या है
\[\left\{ \mu -\sigma \le X\le \mu +\sigma \right\}=\left\{ -\sigma \le X-\mu \le \sigma \right\}=\left\{ -1\le \frac{X-\mu }{\sigma }\le 1 \right\}=\left\{ -1\le Z\le 1 \right\}\]जहां \(Z\) का मानक सामान्य वितरण है। यदि हम एक कैलकुलेटर, या एक्सेल जैसे स्प्रेडशीट प्रोग्राम का उपयोग करते हैं, तो हम पाते हैं कि उस घटना की संभावना जो उन मानों से मेल खाती है जो माध्य के एक मानक विचलन के भीतर हैं
\[Pr \left( \mu -\sigma \le X\le \mu +\sigma \right)=\Pr \left( -1\le \frac{X-\mu }{\sigma }\le 1 \right)=\Pr \left( -1\le Z\le 1 \right)\] \[=\Pr \left( Z\le 1 \right)-\Pr \left( Z\le -1 \right)\approx 0.\text{841345}-0.\text{158655}\approx 0.\text{682689}\]तो, माध्य के एक मानक विचलन के भीतर मूल्यों का सही प्रतिशत 68.2689492% जैसा कुछ है, जो अभी भी केवल एक सन्निकटन है, लेकिन यह सन्निकटन अनुभवजन्य नियम द्वारा बताए गए 68% से बहुत बेहतर है।
इसी प्रकार, हम गणना कर सकते हैं कि
\[\Pr \left( \mu -2\sigma \le X\le \mu +2\sigma \right)=\Pr \left( -2\le \frac{X-\mu }{\sigma }\le 2 \right)=\Pr \left( -2\le Z\le 2 \right)\] \[=\Pr \left( Z\le 2 \right)-\Pr \left( Z\le -2 \right)\approx 0.\text{977249868}-0.0\text{2275}0\text{132}\approx 0.\text{9544997}\]तो, माध्य के दो मानक विचलनों के भीतर मूल्यों का सही प्रतिशत 95.4499736% (लगभग) जैसा कुछ है, लेकिन यह अनुमान अनुभवजन्य नियम द्वारा बताए गए 95% से काफी बेहतर है।
अंत में, हम गणना कर सकते हैं कि
\[\Pr \left( \mu -3\sigma \le X\le \mu +3\sigma \right)=\Pr \left( -3\le \frac{X-\mu }{\sigma }\le 3 \right)=\Pr \left( -3\le Z\le 3 \right)\] \[=\Pr \left( Z\le 3 \right)-\Pr \left( Z\le -3 \right)\approx 0.\text{99865}0\text{1}0\text{2}-0.00\text{1349898}\approx 0.\text{9973}00\text{2}\]तो, माध्य के दो मानक विचलन के भीतर मूल्यों का सही प्रतिशत लगभग 99.7300204% जैसा कुछ है, लेकिन यह अनुमान अभी भी अनुभवजन्य नियम द्वारा बताए गए 99.7% से अधिक सटीक है।
सावधानी: कुछ पाठ्यपुस्तकें यह भी नहीं कहेंगे कि यह एक सन्निकटन है, और वे कह सकते हैं कि "68% वितरण माध्य के एक मानक विचलन के भीतर है, वितरण का 95% माध्य के दो मानक विचलन और 99.7% के भीतर है। वितरण माध्य के तीन मानक विचलन के भीतर है", जैसे कि वह एक सटीक संख्या थी। इससे आपको भ्रम हो सकता है क्योंकि जब आप एक्सेल पर गणना करते हैं (या अपनी पुस्तक के पीछे से सामान्य संभाव्यता तालिकाओं का उपयोग करते हैं), तो आप पाएंगे कि 68%, 95% और 99.7% वास्तव में सटीक नहीं हैं। सुनिश्चित करें कि आप इसे अपने परीक्षण या गृहकार्य में ठीक वैसे ही उपयोग करते हैं जैसे आपके प्रशिक्षक ने आपको ऐसा करने के लिए कहा था, लेकिन यह न भूलें कि यह केवल एक अनुमान है।
मानक विचलन के लिए अंगूठे का नियम
यह नियम एक और मोटा सन्निकटन है जिसका उपयोग सीमा का उपयोग करके मानक विचलन का अनुमान लगाने के लिए किया जाता है। नियम कहता है कि मानक विचलन का अनुमान निम्न सूत्र से लगाया जा सकता है:
\[s\approx \frac{Range}{4}\]सरल। कुछ मामलों या एप्लिकेशन में आपके पास स्वयं डेटा तक पहुंच नहीं होगी, लेकिन आपको सीमा का पता चल जाएगा। अगर ऐसा है, तो आपको बस इतना करना है कि एक रेंज लें और 4 से विभाजित करें।
चेबीशेव का नियम
यह बहुत अच्छा नियम है। खैर, यह वास्तव में एक असमानता है। यह किसी प्रकार का अनुभवजन्य नियम है, लेकिन यह सभी वितरणों के लिए लागू होता है (हाँ, आपने सही सुना), न केवल सामान्य वितरण के लिए। चेबीशेव का नियम वितरण के प्रतिशत के लिए निचली सीमा प्रदान करता है जो कि भीतर होगा प्रति माध्य से मानक विचलन। दरअसल, हमारे पास वह है
\[\Pr \left( \mu -k\sigma \le X\le \mu +k\sigma \right)\ge 1-\frac{1}{{{k}^{2}}}\]चेबीशेव का नियम \(k = 2\) के लिए क्या कहता है? इसे कहते हैं
\[\Pr \left( \mu -2\sigma \le X\le \mu +2\sigma \right)\ge 1-\frac{1}{{{2}^{2}}}=0.75\]यह है: वितरण का कम से कम 75% माध्य के 2 मानक विचलन के भीतर है . सही कहा आप। यह किस लिए अच्छा है? आप सोच रहे होंगे कि आप अनुभवजन्य नियम से कुछ बेहतर जानते हैं। हाँ, आप जानते थे कि वितरण का 95% (या लगभग 95%) माध्य के 2 मानक विचलनों के भीतर है। इस बदबूदार 75% का यहाँ क्या कहना है। हाँ, 95% सही है, लेकिन यह केवल सामान्य वितरण के लिए काम करता है। यह कथन कि वितरण का कम से कम 75% सभी वितरणों के लिए चेबीशेव के नियम कार्य के साथ प्राप्त माध्य के 2 मानक विचलनों के भीतर है… बस इतना ही कहा।