मूल आंकड़ों में नोटेशन का उपयोग - भाग I
एक चीज जो छात्रों को अक्सर भ्रमित कर देती है, और मैं जरूरी से अधिक कहूंगा, गणितीय नोटेशन का उदार उपयोग है जो मूल स्तर पर भी आंकड़ों में होता है।जितनी अधिक बार वांछित होगा, प्रशिक्षकों ने नोटिस का उपयोग किया कि छात्र इस बारे में अनिश्चित हैं।ठीक है, शिक्षक एक सटीक, असमान, अधिक कॉम्पैक्ट तरीके से विचारों को व्यक्त करने का एक तरीका नोटेशन के उपयोग में देखते हैं।और विचारों के निर्माण के रूप में, नोटेशन का उपयोग अधिक दृढ़ हो सकता है, या छात्रों को भ्रमित करने और धूल को काटने के लिए पर्याप्त रूप से जला सकता है।
निम्नलिखित अनुच्छेदों में हम अधिक परिष्कृत परिकल्पना परीक्षणों में उपयोग की जाने वाली स्थिति के लिए, सबसे मूल वर्णनात्मक आंकड़ों में स्थितियों से, नीचे के आंकड़ों में नोटेशन के उपयोग को स्पष्ट करने का प्रयास करेंगे।
वर्णनात्मक आँकड़ों में संकेतन
वर्णनात्मक आंकड़ों के साथ काम करते समय निम्नलिखित प्रतीकों का आमतौर पर उपयोग किया जाता है।इन प्रतीकों का अभी भी आपके अधिकांश सांख्यिकी वर्ग में उपयोग किया जाता है।
\(\bar{X}\): यह नमूना मतलब है, जो नमूना \({{X}_{1}}\), \({{X}_{2}}\), ..., __ xyz_d__ से मूल्य के अंकगणितीय औसत से मेल खाता है।यह सांख्यिकीय है (क्योंकि यह नमूना जानकारी के साथ बनाया गया है)।कुछ पाठ्यक्रमों में, विशेष रूप से सामाजिक और व्यवहारिक विज्ञान में, वे नमूना मतलब को संदर्भित करने के लिए \(M\) का उपयोग करते हैं।
\({s}^{2}\): यह नमूना भिन्नता है, जिसे गणना की जाती है
\[{{s}^{2}}=\frac{1}{n-1}\left( \sum\limits_{i=1}^{n}{X_{i}^{2}}-\frac{1}{n}{{\left( \sum\limits_{i=1}^{n}{{{X}_{i}}} \right)}^{2}} \right)\]
यह सांख्यिकीय है (क्योंकि यह नमूना जानकारी के साथ बनाया गया है)।उपरोक्त सूत्र के अन्य संस्करण भी हैं, लेकिन वे सभी एक ही संख्यात्मक मूल्य के लिए नेतृत्व करते हैं।
\(s\): यह नमूना मानक विचलन है, जो नमूना भिन्नता के वर्ग रूट को लेकर या केवल उपरोक्त सूत्र का उपयोग करके गणना की जाती है, जिसे नमूना डेटा \({X}_{1}\), \({{X}_{2}}\), ..., __ xyz_d__ से गणना की जाती है।
\[s=\sqrt{\frac{1}{n-1}\left( \sum\limits_{i=1}^{n}{X_{i}^{2}}-\frac{1}{n}{{\left( \sum\limits_{i=1}^{n}{{{X}_{i}}} \right)}^{2}} \right)}\]
यह सांख्यिकीय है (क्योंकि यह नमूना जानकारी के साथ बनाया गया है)।उपरोक्त सूत्र के अन्य संस्करण भी हैं, लेकिन वे सभी एक ही संख्यात्मक मूल्य के लिए नेतृत्व करते हैं।
\(SS\): यह "वर्गों का योग" है।यह आंकड़े नमूना मतलब के संबंध में एक चर \(X\) के वर्ग भिन्नता को मापते हैं।यदि आपके पास नमूना \({{X}_{1}}\), \({X}_{2}\), ..., __ xyz_e__, यह गणना करने के लिए उपयोग किया जाने वाला सूत्र है
\[SS=\sum\limits_{i=1}^{n}{{{\left( {{X}_{i}}-\bar{X} \right)}^{2}}}\]अक्सर बार, एक सबस्क्रिप्ट का उपयोग यह इंगित करने के लिए किया जाता है कि यदि वे स्पष्ट नहीं हैं तो हम किस चर को संदर्भित करते हैं।उदाहरण के लिए, आप verable \(X\) के वर्गों के योग के संदर्भ में \(S{{S}_{X}}\) लिख सकते हैं, या आप वैरिएबल वाई के वर्गों के योग को संदर्भित करने के लिए \(S{{S}_{Y}}\) लिख सकते हैं। सामाजिक और व्यवहारिक विज्ञान में, आप आम तौर पर \(X\) के वर्गों का योग लिखेंगे\(SS_{XX}\) के बजाय \(SS_{X}\) के बजाय लेकिन यह सब कुछ है जो पसंदीदा नोटेशन क्या है जो अधिक समझ में आता है।ऐसे अन्य अभिव्यक्तियां हैं जो वर्गों के योग को व्यक्त करने के बारे में समान होती हैं।उदाहरण के लिए, यहां हमारे पास वर्गों की राशि लिखने के दो वैकल्पिक तरीके हैं:
\[S{{S}_{XX}}=\sum\limits_{i=1}^{n}{{{\left( {{X}_{i}}-\bar{X} \right)}^{2}}}=\sum\limits_{i=1}^{n}{X_{i}^{2}}-\frac{1}{n}{{\left( \sum\limits_{i=1}^{n}{{{X}_{i}}} \right)}^{2}}\]
उपरोक्त के आधार पर, नमूना भिन्नता और वर्गों की राशि के बीच एक स्पष्ट लिंक है:
\[{{s}^{2}}=\frac{S{{S}_{XX}}}{n-1}\]
ध्यान दें कि कभी-कभी नोटेशन अत्यधिक होता है, और कभी-कभी असंगत होता है।दरअसल, यह बताने के लिए कि कौन से चर का जिक्र कर रहे हैं (\(X\)) का जिक्र कर रहे हैं (\(X\)) का जिक्र कर रहे हैं।हालांकि, भिन्नता या मानक विचलन के मामले में उप-सीमाओं का उपयोग कम आम है, हालांकि अभी भी स्वीकार्य है।उदाहरण के लिए, आप चर \(X\) के नमूना मानक विचलन को निर्दिष्ट करने के लिए \({{s}_{X}}\) लिख सकते हैं, या अधिक सटीक रूप से कहा, \({{s}_{X}}\) नमूना \({{X}_{1}}\), \({{X}_{1}}\), \({{X}_{2}}\), ..., __ xyz_f__ से गणना की गई नमूना मानक विचलन को इंगित करता है जो यादृच्छिक परिवर्तनीय \(X\) से आता है।
\(m\): नमूना मंझला।बिंदु (या इंटरपोलेटेड पॉइंट) जो वितरण के बीच में सेट करता है।नमूना मध्ययुगीन \(m\) के रूप में संदर्भित करने के बारे में एक सार्वभौमिक समझौता नहीं है, लेकिन यह एक आम प्रथा है।
\({{Q}_{j}}\): यह जे है वां \(j=1,2,3,4\) के साथ चतुर्थक।ये अंक (या इंटरपोलेटेड पॉइंट) हैं जो वितरण को क्वार्टर में विभाजित करते हैं।ध्यान दें कि \({{Q}_{2}}\) औसत है।
\({{P}_{x}}\): यह \(0\le x\le 100\) के साथ x-th प्रतिशत है।ये अंक (या इंटरपोलेटेड पॉइंट) हैं ताकि वितरण का एक्स प्रतिशत उन बिंदुओं के बाईं ओर है।निरीक्षण करें कि \(m={{Q}_{2}}={{P}_{50}}\)।
IQR: यह है अन्तःचतुर्थक श्रेणी , और इसे \(IQR={{Q}_{3}}-{{Q}_{1}}\) के रूप में परिभाषित किया गया है, जो तीसरी और पहली चतुर्भुज के बीच अंतर है।यह आमतौर पर फैलाव के माप और आउटलेर्स का पता लगाने के रूप में उपयोग किया जाता है।
अन्य वर्णनात्मक आंकड़े: कई सामान्य रूप से उपयोग किए जाने वाले वर्णनात्मक आंकड़े हैं जिनके लिए उपयोग करने के लिए कोई सार्वभौमिक प्रतीक नहीं हैं।उदाहरण के लिए, skewness, kurtorsis, उच्च आदेश के क्षण, आदि, कभी-कभी उपयोग किया जाता है, लेकिन कॉम्पैक्ट प्रतीकों को सार्वभौमिक रूप से उन्हें निरूपित करने के लिए उपयोग किया जाता है।