परिकल्पना परीक्षण के बारे में आपको जो कुछ जानने की आवश्यकता है: ट्रिक्स जो आपको सीखने की आवश्यकता है

परिकल्पना परीक्षण एक भ्रमित करने वाला विषय हो सकता है, खासकर यदि आप नींव को अच्छी तरह से नहीं जानते हैं। कुछ आसान सिद्धांतों को सीखकर, आप उन सभी चीजों को समझने में सक्षम होंगे जो परिकल्पना परीक्षण के बारे में जानना है।

एक परिकल्पना परीक्षण क्या है?

वह पहला प्रश्न जिसे हम संबोधित करेंगे। एक परिकल्पना परीक्षण है a सांख्यिकीय प्रक्रिया जो एक निश्चित दावे के बारे में निर्णय लेने के लिए नमूना डेटा का उपयोग करता है, जिसमें एक निश्चित जनसंख्या पैरामीटर शामिल है। तो, एक परिकल्पना परीक्षण आयोजित करने के लिए आवश्यक अभिनेता हैं:

(1) नमूना डेटा

(2) जनसंख्या पैरामीटर के बारे में एक निश्चित दावा

उपरोक्त दोनों में से किसी के बिना, एक परिकल्पना का परीक्षण कर सकते हैं। आइए अब थोड़ा और आगे बढ़ते हैं और बताते हैं कि वे दो मुख्य घटक क्या हैं

नमूना

आइए याद करें कि एक नमूना पूरी आबादी का एक छोटा उपसमुच्चय है। और, जनसंख्या उन विषयों का पूरा समूह है जिनके बारे में आप जांच करना चाहते हैं। आमतौर पर, आबादी बड़ी होती है, इसलिए यदि हम एक बड़ी आबादी के बारे में एक बयान देना चाहते हैं, तो हम एक छोटे से नमूने का चयन करके ऐसा करने की कोशिश करते हैं, इस उम्मीद में कि नमूना किसी तरह पूरी आबादी के बारे में जानकारी ले जाएगा। यह एक लंबा शॉट लगता है, लेकिन कुछ मामलों में यह सच हो जाता है।

हमारी आशा है कि जनसंख्या से एक छोटे से नमूने का विश्लेषण करके हम जनसंख्या के बारे में बहुत कुछ जान सकेंगे। जब ऐसा होता है, तो हम कहते हैं कि नमूना है पूरी आबादी का प्रतिनिधि . लेकिन सिर्फ कोई नमूना नहीं करेगा। हमें a . नामक कुछ एकत्र करने की आवश्यकता है यादृच्छिक नमूना . जनसंख्या के प्रकार और आकार के आधार पर यादृच्छिक नमूने एकत्र करने के लिए अलग-अलग रणनीतियां हैं, लेकिन मैं जो चाहता हूं कि आप अभी बनाए रखें कि यादृच्छिक नमूने तैयार करने के लिए कुछ उचित प्रक्रियाएं हैं, जो उनकी आबादी के प्रतिनिधि होने की उम्मीद है। और, एक बार आपके पास एक यादृच्छिक नमूना होने के बाद, आप परिकल्पना परीक्षण का उपयोग करके एक प्रक्रिया का उपयोग करेंगे जो आपको नमूने से पूरी आबादी के बारे में जानकारी प्राप्त करने में मदद करेगी।

जनसंख्या पैरामीटर के बारे में दावा

अब जब आपके पास एक नमूना है, तो आपको परीक्षण के लिए दावे की आवश्यकता है। अच्छी और बुरी खबरें हैं। अच्छी खबर यह है कि जनसंख्या पैरामीटर सरल संख्याएं हैं, इसलिए जनसंख्या पैरामीटर के बारे में दावा केवल इस बारे में है कि उस जनसंख्या पैरामीटर का संभावित मूल्य क्या हो सकता है। इससे मेरा तात्पर्य यह है कि संरचनात्मक दृष्टिकोण से दावे बहुत सरल हैं। उदाहरण के लिए, मान लें कि आप एक यादृच्छिक चर हैं जो सामान्य रूप से वितरित किया जाता है, जिसका अज्ञात माध्य $\mu$ के बराबर होता है। हम उस जनसंख्या का एक नमूना लेना चाहते हैं और $\mu$ के बारे में कुछ कहना चाहते हैं। $\mu$ के बारे में दावे इसके संभावित मूल्यों के बारे में दावे हैं। मेरा मतलब है, $\mu =10$ जैसा कुछ वास्तविक दावा है, या $\mu <10$ भी एक दावा है। जनसंख्या पैरामीटर के लिए मूल्यों के संभावित सेट को बताते हुए कुछ भी दावा है।

बुरी खबर यह है कि हम किसी भी दावे का परीक्षण नहीं कर सकते। एक परिकल्पना परीक्षण करने के लिए और एक जनसंख्या पैरामीटर के बारे में एक दावे का परीक्षण करने के लिए, हमें निश्चित संरचना की आवश्यकता है। अर्थात्, हम केवल दो प्रकार के दावों के साथ काम कर सकते हैं, या इस संदर्भ में, हमें दो परिकल्पनाओं के बीच परिभाषित करने की आवश्यकता है: शून्य परिकल्पना और वैकल्पिक परिकल्पना। ये दो परिकल्पनाएं जनसंख्या पैरामीटर के बारे में दोनों दावे हैं, इस विशेषता के साथ कि (ए) उन्हें ओवरलैप नहीं करना चाहिए और (बी) शून्य परिकल्पना शामिल होना चाहिए इसमें "=" साइन इन करें।

मुझे इसे फिर से लिखने दें : यदि आप दौड़ना चाहते हैं परिकल्पना परीक्षण आपके पास दो परिकल्पना होनी चाहिए, शून्य परिकल्पना और वैकल्पिक परिकल्पना। ये दो परिकल्पनाएं दोनों दावे हैं जो जनसंख्या पैरामीटर के संख्यात्मक मूल्य के बारे में कुछ बता रहे हैं। जनसंख्या पैरामीटर के संभावित मूल्यों का सेट जो शून्य परिकल्पना में कहा गया है, वैकल्पिक परिकल्पना में बताए गए जनसंख्या पैरामीटर के संभावित मूल्यों के सेट के साथ कोई भी मूल्य समान नहीं हो सकता है। साथ ही, शून्य परिकल्पना के बीजगणितीय कथन में "=" चिह्न अवश्य होना चाहिए। उदाहरण के लिए, $\mu =13$ और $\mu \le 13$ शून्य परिकल्पना के उदाहरण हैं, लेकिन $\mu >10$ एक शून्य परिकल्पना नहीं हो सकती है।

एक शून्य परिकल्पना को ${{H}_{0}}$ लिखा जाता है और एक वैकल्पिक परिकल्पना को ${{H}_{A}}$ लिखा जाता है। परिकल्पना के उचित रूप से परिभाषित समुच्चय का एक उदाहरण है

\[\begin{align} & {{H}_{0}}:\mu =10 \\ & {{H}_{A}}:\mu \ne 10 \\ \end{align}\]

लेकिन, उदाहरण के लिए, परिकल्पनाओं का यह सेट मान्य नहीं है:

\[\begin{align} & {{H}_{0}}:\mu =10 \\ & {{H}_{A}}:\mu \ge 10 \\ \end{align}\]

उपरोक्त सेट मान्य क्यों नहीं है? क्योंकि ${{H}_{0}}$ और ${{H}_{A}}$ द्वारा बताए गए संभावित मानों का सेट ओवरलैप होता है (देखें कि शून्य और वैकल्पिक दोनों परिकल्पनाओं में $\mu$ के संभावित मान के रूप में 10 शामिल हैं)।

परिकल्पना के एक परीक्षण के यांत्रिकी

अब जब आपके पास एक नमूना है और आपके पास एक ठीक से परिभाषित शून्य और वैकल्पिक परिकल्पना है, तो आप परिकल्पना का परीक्षण कर सकते हैं। अब आप गणना कर सकते हैं a परीक्षण के आंकड़े , यह पूरी प्रक्रिया का केंद्र बिंदु है। एक परीक्षण आँकड़ा केवल एक संख्यात्मक (यादृच्छिक) मान होता है जिसे नमूना डेटा और परिकल्पना में बताए गए मानों से परिकलित किया जाता है। एक परीक्षण आंकड़े की गणना करने के लिए उपयोग किया जाने वाला वास्तविक सूत्र अनुमानित पैरामीटर के प्रकार पर निर्भर करता है (उदाहरण के लिए, जब हम जनसंख्या भिन्नता $\sigma$ के लिए परीक्षण कर रहे होते हैं तो हम जनसंख्या माध्य $\mu$ के लिए परीक्षण करते समय एक अलग प्रकार के परीक्षण आंकड़े का उपयोग करते हैं)।

हालांकि, सभी परिकल्पना परीक्षण के लिए दर्शन समान है। कृपया इसे अपने दिमाग में रखें: परीक्षण आँकड़ों की गणना की जाती है और इसके परिणाम की जाँच यह मानकर की जाती है कि अशक्त परिकल्पना सत्य है। तो सिद्धांत यह है: यदि मैं मान लेता हूं कि शून्य परिकल्पना ${{H}_{0}}$ सत्य है, तो समान परिणाम प्राप्त होने की कितनी संभावना नहीं है? दर्शन यह है कि यदि नमूना परिणाम इस धारणा के तहत असंभव है कि ${{H}_{0}}$ सत्य है, तो हम ${{H}_{0}}$ को एक व्यावहारिक विकल्प के रूप में छोड़ देते हैं।

संभावना है कि नमूना परिणाम कम से कम चरम के रूप में देखे गए हैं, आमतौर पर गणना की जा सकती है (क्योंकि आमतौर पर यह मानते हुए कि ${{H}_{0}}$ सत्य है अज्ञात पैरामीटर का मान निर्धारित करता है जो जनसंख्या के वितरण को निर्धारित करता है), और इस संभावना को कहा जाता है पी-वैल्यू .

कम पी-मान इंगित करता है कि नमूना परिणाम असामान्य हैं यदि हम ${{H}_{0}}$ को सत्य मानते हैं। लेकिन, कितना कम पर्याप्त है? खैर, हमें एक सीमा को परिभाषित करने की आवश्यकता है, जिसे हम महत्व स्तर या $\alpha$ कहते हैं। $\alpha$ का यह मान उस जोखिम का प्रतिनिधित्व करता है जिसे हम एक वास्तविक शून्य परिकल्पना को अस्वीकार करने के लिए तैयार हैं।

एक परिकल्पना परीक्षण के परिणाम

तो अंत में, हम परिकल्पनाओं का उत्तर कैसे देते हैं? सरल, यदि परिकलित p-मान ऐसा है कि $p<\alpha $, तो हम शून्य परिकल्पना को अस्वीकार करें . अन्यथा, यदि $p\ge \alpha$, हम शून्य परिकल्पना को अस्वीकार करने में विफल। ध्यान दें कि "शून्य परिकल्पना को स्वीकार करना" जैसी कोई चीज नहीं है। नमूना डेटा मूल रूप से निर्मित होने के कारण शून्य परिकल्पना को साबित नहीं कर सकता है।

यदि शून्य परिकल्पना को अस्वीकार नहीं किया जाता है, तो नमूना डेटा हमें बता रहा है "देखो, ऐसा नहीं लगता है कि नमूना डेटा शून्य परिकल्पना का खंडन करता है, इसलिए हम इसे कम से कम अभी के लिए बनाए रखें"।

दूसरी ओर, यदि शून्य परिकल्पना को खारिज कर दिया जाता है, तो नमूना डेटा हमें बता रहा है "देखो, नमूना डेटा शून्य परिकल्पना के साथ विरोधाभासी प्रतीत होता है, इसलिए आपकी शून्य परिकल्पना की जांच करना बुद्धिमान होगा, क्योंकि यह बंद हो सकता है ".

क्या हमने इसे सही पाया?

एक गलत धारणा यह है कि एक परिकल्पना परीक्षण एक अचूक उत्तर देगा। यह सच्चाई से आगे नहीं हो सकता। परिकल्पना परीक्षण के बारे में निर्णय (या तो हो को अस्वीकार करें या हो को अस्वीकार न करें) वास्तव में गलत हो सकता है। तथ्य का सामना करो, इसके ऊपर जाओ।

आप गलत कैसे हो सकते हैं? दरअसल, दो तरह से: पहला, यदि आप अशक्त परिकल्पना को अस्वीकार करते हैं तो आप यह दावा कर रहे होंगे कि शून्य परिकल्पना सत्य नहीं है। तो, यदि शून्य परिकल्पना वास्तव में सत्य है, तो आपने एक त्रुटि की है। इसे टाइप I त्रुटि कहा जाता है, जिसमें हो को अस्वीकार करने का आपका निर्णय गलत है, क्योंकि हो वास्तव में सत्य है। इस प्रकार I की त्रुटि की प्रायिकता $\alpha$ है।

दूसरी प्रकार की त्रुटि तब होती है जब आप अशक्त परिकल्पना को अस्वीकार करने में विफल रहते हैं, इसलिए तब आपको यह दावा करने के लिए पर्याप्त सबूत नहीं मिलते हैं कि शून्य परिकल्पना झूठी है। लेकिन, अगर यह पता चलता है कि शून्य परिकल्पना वास्तव में झूठी है, तो आपने एक त्रुटि की है। इसे टाइप II त्रुटि कहा जाता है, जिसमें हो को अस्वीकार न करने का आपका निर्णय गलत है, क्योंकि हो वास्तव में गलत है। इस प्रकार II की त्रुटि की प्रायिकता को $\beta$ नाम दिया गया है।

अभी के लिए इतना ही।

यह सांख्यिकी ट्यूटोरियल आपके लिए लाया गया है MyGeekyTutor.com