चौवेनेट का मानदंड कैलकुलेटर
निर्देश: Z-स्कोर का उपयोग करके आउटलायर्स का पता लगाने के लिए इस चौवेनेट के मानदंड आउटलायर कैलकुलेटर का उपयोग करें। कृपया नमूना डेटा इनपुट करें और यह कैलकुलेटर आपको सभी चरण दिखाएगा:
चौवेनेट मानदंड का उपयोग करके आउटलाइयर का पता लगाना
आउटलायर क्या है और हम उनकी परवाह क्यों करते हैं
आउटलाइर्स डेटासेट में ऐसे मान होते हैं जो डेटासेट में मौजूद अन्य मानों की तुलना में बहुत ज़्यादा लगते हैं। स्वाभाविक रूप से, ऐसी परिभाषा बहुत ढीली है, लेकिन वास्तव में, आउटलाइर्स क्या हैं और उनसे कैसे निपटा जाए, इस बारे में बहुत से अलग-अलग विचार हैं।
फिलहाल, हम इस विचार पर कायम रहेंगे कि आउटलायर्स अक्सर अंतर्निहित जनसंख्या के एक निश्चित व्यवहार का लक्षण होते हैं, और आउटलायर्स की उपस्थिति इस बात का संकेत हो सकती है कि अंतर्निहित जनसंख्या सामान्य रूप से वितरित नहीं है।
चौवेनेट मानदंड की गणना कैसे की जाती है?
अनौपचारिक रूप से, चौवेनेट का मानदंड इस विचार पर आधारित है कि यदि अंतर्निहित जनसंख्या सामान्य रूप से वितरित है, तो वितरण के माध्य के आसपास एक निश्चित "बैंड" के भीतर नमूने के सभी या अधिकांश मूल्यों को खोजना उचित होगा।
अब, इस विचलन को सापेक्ष रूप में मापा जाता है, जिसमें यह गिना जाता है कि नमूना डेटा माध्य से कितने मानक विचलन दूर हैं। दूसरे शब्दों में, हम z-स्कोर के साथ काम कर रहे हैं
गणितीय रूप से, चौवेनेट के मानदंड का उपयोग करते हुए, माध्य के चारों ओर वह बैंड जहाँ "उचित" डेटा मान रहते हैं, \(P = 1- \frac{1}{2n}\) है। तो फिर, कुल क्षेत्र जहाँ आउटलेयर रहते हैं, वह \(\frac{1}{4n}\) है, जो दो पूंछों पर आवंटित है, जहाँ \(n\) नमूना आकार है
दूसरे शब्दों में, हम एक सीमा मान \(D_{max}\) पाते हैं जो निम्नलिखित शर्त को संतुष्ट करता है
\[ \Pr(Z > D_{max}) = \displaystyle \frac{1}{4n}\]और एक मान \(X\) एक आउटलायर होगा यदि उसके एसोसिएशन Z-स्कोर का निरपेक्ष मान \(D_{max}\) से अधिक है, यह \(|Z| > D_{max}\) है।
आउटलायर्स इतने प्रासंगिक क्यों हैं?
जैसा कि हमने पहले उल्लेख किया है, आउटलायर्स सामान्यता की कमी का लक्षण हो सकते हैं, जो यह संकेत देगा कि z-परीक्षण और t-परीक्षण जैसी विभिन्न सांख्यिकीय प्रक्रियाएं अविश्वसनीय निष्कर्ष देंगी।
चौवेनेट मानदंड का उपयोग करना आउटलेयर खोजने का एकमात्र तरीका नहीं है, क्योंकि आप इससे भी लाभ उठा सकते हैं। IQR नियम का उपयोग करके आउटलायर्स का पता लगाएं अब, आउटलेयर का पता लगाना बड़ी योजना का एक हिस्सा है, क्योंकि जब भी आप एक सांख्यिकीय विश्लेषण चलाना चाहते हैं, तो आपको संभवतः पहले एक चलाने की आवश्यकता होगी वर्णनात्मक सांख्यिकी विश्लेषण उपयोग किये गये नमूने के वितरणात्मक गुणों का आकलन करने के लिए।