रैखिक प्रतिगमन ट्यूटोरियल
इस ट्यूटोरियल में, हम के विषय को कवर करने जा रहे हैं प्रतिगमन विश्लेषण . चरण दर चरण समाधान के साथ प्रासंगिक नमूना समस्याओं की सूची नीचे देखें।
नमूना रैखिक प्रतिगमन समस्याएं
प्रश्न 1: समीकरणों के निकाय को हल करके सबसे छोटी वर्ग रेखा के सूत्र ज्ञात किए गए
\[nb+m\left( \sum{x} \right)=\sum{y}\]
\[b\left( \sum{x} \right)+m\left( \sum{x^2} \right)=\sum{xy}\]
b और m के लिए इन समीकरणों को हल करके दर्शाइए कि
\[\begin{align} & m=\frac{n\left( \sum{xy} \right)-\left( \sum{x} \right)\left( \sum{y} \right)}{n\left(\sum{{{x}^{2}}} \right)-{{\left( \sum{x} \right)}^{2}}} \\ & b=\frac{\sum{y-m\left( \sum{x}\right)}}{n} \\ \end{align}\]
समाधान: से
\[ nb+m\left( \sum{x} \right)=\sum{y}\]
\[b\left( \sum{x} \right)+m\left( \sum{x^2} \right)=\sum{xy}\]
हमारे पास दो समीकरण और दो अज्ञात हैं (एम और बी)
हम पहले समीकरण को \(\left( \sum{x} \right)\) से गुणा करते हैं और दूसरे को -n से गुणा करते हैं
\[\begin{align} & nb\left( \sum{x} \right)+m{{\left( \sum{x} \right)}^{2}}=\left( \sum{y}\right)\left(\sum{x} \right) \\ & -nb\left( \sum{x} \right)-mn\left( {{\sum{x}}^{2}}\right)=n\sum{xy} \\ \end{align}\]
और अब इन्हें जोड़ रहे हैं:
\[m\left( {{\left( \sum{x} \right)}^{2}}-n\left( {{\sum{x}}^{2}} \right) \right)=\left( \sum{x} \right)\left(\sum{y} \right)-n\left( \sum{xy} \right)\]
\[\Rightarrow \,\,\,\,m=\frac{\left( \sum{x} \right)\left( \sum{y} \right)-n\left( \sum{xy} \right)}{{{\left( \sum{x} \right)}^{2}}-n\left( {{\sum{x}}^{2}} \right)}=\frac{n\left( \sum{xy} \right)-\left( \sum{x} \right)\left( \sum{y} \right)}{n\left( {{\sum{x}}^{2}} \right)-{{\left( \sum{x} \right)}^{2}}}\]
अब, इस समीकरण से:
\[nb+m\left( \sum{x} \right)=\left( \sum{y} \right)\]
हम के लिए हल कर सकते हैं बी :
\[nb+m\left( \sum{x} \right)=\left( \sum{y} \right)\,\,\Rightarrow \,\,\,nb=\left( \sum{y} \right)-m\left( \sum{x} \right)\,\Rightarrow \,\,\,b=\frac{\left( \sum{y} \right)-m\left( \sum{x} \right)}{n}\]
प्रश्न 2: सहसंबंध गुणांक निर्धारित करें और डेटा के निम्नलिखित सेट के लिए प्रतिगमन गुणांक के साथ प्रतिगमन रेखा का एक ग्राफ बनाएं।
जंगल की आग और एकड़ जल गया। आग की संख्या और जली हुई एकड़ की संख्या इस प्रकार है
आग (एक्स) |
72 |
69 |
58 |
47 |
84 |
62 |
57 |
45 |
एकड़ (और) |
62 |
41 |
19 |
26 |
51 |
15 |
30 |
15 |
समाधान: (ए) निम्नलिखित स्कैटरप्लॉट प्राप्त होता है:
उपरोक्त स्कैटरप्लॉट के आधार पर, हम देखते हैं कि सकारात्मक रैखिक संघ की मध्यम से मजबूत डिग्री है।
(बी) दूसरी ओर, हमारे पास निम्न तालिका है जो पियर्सन सहसंबंध की गणना के लिए आवश्यक गणना दिखाती है: हम प्राप्त करते हैं
एक्स |
तथा |
X² |
यो |
XY |
|
72 |
62 |
5184 |
3844 |
4464 |
|
69 |
41 |
4761 |
1681 |
2829 |
|
58 |
19 |
3364 |
361 |
1102 |
|
47 |
26 |
2209 |
676 |
1222 |
|
84 |
51 |
7056 |
2601 |
4284 |
|
62 |
15 |
3844 |
225 |
930 |
|
57 |
30 |
3249 |
900 |
1710 |
|
45 |
15 |
2025 |
225 |
675 |
|
योग |
494 |
259 |
31692 |
10513 |
17216 |
पियर्सन सहसंबंध r की गणना इस प्रकार की जाती है
\[r = \frac{n\sum\limits_{i=1}^{n}{{{x}_{i}}{{y}_{i}}}-\left( \sum\limits_{i=1}^{n}{{{x}_{i}}} \right)\left( \sum\limits_{i=1}^{n}{{{y}_{i}}} \right)}{\sqrt{n\left( \sum\limits_{i=1}^{n}{x_{i}^{2}} \right)-{{\left( \sum\limits_{i=1}^{n}{{{x}_{i}}} \right)}^{2}}}\sqrt{n\left( \sum\limits_{i=1}^{n}{y_{i}^{2}} \right)-{{\left( \sum\limits_{i=1}^{n}{{{y}_{i}}} \right)}^{2}}}} = \frac{8 \times {17216}-{494}\times {259}}{\sqrt{8\times {31692}-{494}^{2}}\sqrt{8\times 10513-{259}^{2}}}\]
\[=0.7692\]
(सी) निर्धारण का गुणांक है
\[{{r}^{2}}={0.7692}^{2}= {0.5917}\]
जिसका अर्थ है कि एकड़ (y) में 59.17% भिन्नता को आग (x) द्वारा समझाया गया है।
(डी) प्रतिगमन गुणांक की गणना की जाती है
\[b=\frac{n\left( \sum\limits_{i=1}^{n}{{{x}_{i}}{{y}_{i}}} \right)-\left( \sum\limits_{i=1}^{n}{{{x}_{i}}} \right)\left( \sum\limits_{i=1}^{n}{{{y}_{i}}} \right)}{n\left( \sum\limits_{i=1}^{n}{x_{i}^{2}} \right)-{{\left( \sum\limits_{i=1}^{n}{{{x}_{i}}} \right)}^{2}}}=\frac{8 \times {17216}-{494}\times {259}}{8 \times {31692}-{494}^{2}}= 1.0297\]
and\[a=\bar{y}-b \bar{x}={32.375}{+} {1.0297}\,\cdot \, {61.75} = {-31.208}\]
इसका मतलब है कि प्रतिगमन समीकरण है
\[\hat{y}= {-31.208}{+}{1.0297}\,x\]
Graphically:
प्रश्न 3: आपने यह निर्धारित करने के लिए एक अध्ययन किया है कि क्या प्रत्येक सप्ताह कंप्यूटर प्रयोगशाला में बिताया गया औसत समय और कंप्यूटर पाठ्यक्रम में पाठ्यक्रम ग्रेड सहसंबद्ध थे। नीचे दिए गए आँकड़ों का उपयोग करते हुए, आप इस मुद्दे पर क्या निष्कर्ष निकालना चाहेंगे?
student
|
# hours in lab
|
Course Grade
|
1
|
20
|
96
|
2
|
11
|
51
|
3
|
16
|
62
|
4
|
13
|
58
|
5
|
89
|
|
6
|
15
|
81
|
7
|
10
|
46
|
8
|
10
|
51
|
समाधान: निम्न तालिका पियर्सन की गणना के लिए आवश्यक गणनाओं को दर्शाती है सहसंबंध r : हम पाते हैं
X
|
Y
|
X²
|
Y²
|
X·Y
|
|
20
|
96
|
400
|
9216
|
1920
|
|
11
|
51
|
121
|
2601
|
561
|
|
16
|
62
|
256
|
3844
|
992
|
|
13
|
58
|
169
|
3364
|
754
|
|
17
|
89
|
289
|
7921
|
1513
|
|
15
|
81
|
225
|
6561
|
1215
|
|
10
|
46
|
100
|
2116
|
460
|
|
10
|
51
|
100
|
2601
|
510
|
|
Sum
|
112
|
534
|
1660
|
38224
|
7925
|
पियर्सन सहसंबंध r की गणना इस प्रकार की जाती है
\[r = \frac{n\sum\limits_{i=1}^{n}{{{x}_{i}}{{y}_{i}}}-\left( \sum\limits_{i=1}^{n}{{{x}_{i}}} \right)\left( \sum\limits_{i=1}^{n}{{{y}_{i}}} \right)}{\sqrt{n\left( \sum\limits_{i=1}^{n}{x_{i}^{2}} \right)-{{\left( \sum\limits_{i=1}^{n}{{{x}_{i}}} \right)}^{2}}}\sqrt{n\left( \sum\limits_{i=1}^{n}{y_{i}^{2}} \right)-{{\left( \sum\limits_{i=1}^{n}{{{y}_{i}}} \right)}^{2}}}} = \frac{8 \times {7925}-{112}\times {534}}{\sqrt{8\times {1660}-{112}^{2}}\sqrt{8\times 38224-{534}^{2}}}\]
\[=0.9217\]
हम सहसंबंध गुणांक के महत्व के लिए परीक्षण करना चाहते हैं। अधिक विशेष रूप से, हम परीक्षण करना चाहते हैं
\[\begin{align}{{H}_{0}}:\rho {=} 0 \\ {{H}_{A}}:\rho {\ne} 0 \\ \end{align}\]
शून्य परिकल्पना का परीक्षण करने के लिए, हम टी-परीक्षण का उपयोग करते हैं। टी-सांख्यिकी की गणना इस प्रकार की जाती है
\[t= r \sqrt{\frac{n-2}{1-{{r}^{2}}}}= {0.9217} \times \sqrt{\frac{6}{1-{0.9217}^2}}= {5.8198}\]
इस परीक्षण के लिए दो-पुच्छीय p-मान की गणना इस प्रकार की जाती है
\[p=\Pr \left( |{{t}_{6}}|>5.8198 \right)=0.0011\]
चूंकि \(p = 0.0011 {<} 0.05\) , और इसका मतलब है कि हम अशक्त परिकल्पना H . को अस्वीकार करते हैं 0 .
इसलिए, हमारे पास इस दावे का समर्थन करने के लिए पर्याप्त सबूत हैं कि प्रयोगशाला में घंटों की संख्या और पाठ्यक्रम ग्रेड के बीच संबंध शून्य से काफी अलग है।