रैखिक प्रतिगमन ट्यूटोरियल




नमूना रैखिक प्रतिगमन समस्याएं



प्रश्न 1: समीकरणों के निकाय को हल करके सबसे छोटी वर्ग रेखा के सूत्र ज्ञात किए गए

\[nb+m\left( \sum{x} \right)=\sum{y}\]

\[b\left( \sum{x} \right)+m\left( \sum{x^2} \right)=\sum{xy}\]

b और m के लिए इन समीकरणों को हल करके दर्शाइए कि

\[\begin{align} & m=\frac{n\left( \sum{xy} \right)-\left( \sum{x} \right)\left( \sum{y} \right)}{n\left(\sum{{{x}^{2}}} \right)-{{\left( \sum{x} \right)}^{2}}} \\ & b=\frac{\sum{y-m\left( \sum{x}\right)}}{n} \\ \end{align}\]

समाधान: से

\[ nb+m\left( \sum{x} \right)=\sum{y}\]

\[b\left( \sum{x} \right)+m\left( \sum{x^2} \right)=\sum{xy}\]

हमारे पास दो समीकरण और दो अज्ञात हैं (एम और बी)

हम पहले समीकरण को \(\left( \sum{x} \right)\) से गुणा करते हैं और दूसरे को -n से गुणा करते हैं

\[\begin{align} & nb\left( \sum{x} \right)+m{{\left( \sum{x} \right)}^{2}}=\left( \sum{y}\right)\left(\sum{x} \right) \\ & -nb\left( \sum{x} \right)-mn\left( {{\sum{x}}^{2}}\right)=n\sum{xy} \\ \end{align}\]

और अब इन्हें जोड़ रहे हैं:

\[m\left( {{\left( \sum{x} \right)}^{2}}-n\left( {{\sum{x}}^{2}} \right) \right)=\left( \sum{x} \right)\left(\sum{y} \right)-n\left( \sum{xy} \right)\]

\[\Rightarrow \,\,\,\,m=\frac{\left( \sum{x} \right)\left( \sum{y} \right)-n\left( \sum{xy} \right)}{{{\left( \sum{x} \right)}^{2}}-n\left( {{\sum{x}}^{2}} \right)}=\frac{n\left( \sum{xy} \right)-\left( \sum{x} \right)\left( \sum{y} \right)}{n\left( {{\sum{x}}^{2}} \right)-{{\left( \sum{x} \right)}^{2}}}\]

अब, इस समीकरण से:

\[nb+m\left( \sum{x} \right)=\left( \sum{y} \right)\]

हम के लिए हल कर सकते हैं बी :

\[nb+m\left( \sum{x} \right)=\left( \sum{y} \right)\,\,\Rightarrow \,\,\,nb=\left( \sum{y} \right)-m\left( \sum{x} \right)\,\Rightarrow \,\,\,b=\frac{\left( \sum{y} \right)-m\left( \sum{x} \right)}{n}\]



प्रश्न 2: सहसंबंध गुणांक निर्धारित करें और डेटा के निम्नलिखित सेट के लिए प्रतिगमन गुणांक के साथ प्रतिगमन रेखा का एक ग्राफ बनाएं।

जंगल की आग और एकड़ जल गया। आग की संख्या और जली हुई एकड़ की संख्या इस प्रकार है

आग (एक्स)

72

69

58

47

84

62

57

45

एकड़ (और)

62

41

19

26

51

15

30

15


समाधान: (ए) निम्नलिखित स्कैटरप्लॉट प्राप्त होता है:

उपरोक्त स्कैटरप्लॉट के आधार पर, हम देखते हैं कि सकारात्मक रैखिक संघ की मध्यम से मजबूत डिग्री है।

(बी) दूसरी ओर, हमारे पास निम्न तालिका है जो पियर्सन सहसंबंध की गणना के लिए आवश्यक गणना दिखाती है: हम प्राप्त करते हैं

एक्स

तथा

यो

XY

72

62

5184

3844

4464

69

41

4761

1681

2829

58

19

3364

361

1102

47

26

2209

676

1222

84

51

7056

2601

4284

62

15

3844

225

930

57

30

3249

900

1710

45

15

2025

225

675

योग

494

259

31692

10513

17216

पियर्सन सहसंबंध r की गणना इस प्रकार की जाती है

\[r = \frac{n\sum\limits_{i=1}^{n}{{{x}_{i}}{{y}_{i}}}-\left( \sum\limits_{i=1}^{n}{{{x}_{i}}} \right)\left( \sum\limits_{i=1}^{n}{{{y}_{i}}} \right)}{\sqrt{n\left( \sum\limits_{i=1}^{n}{x_{i}^{2}} \right)-{{\left( \sum\limits_{i=1}^{n}{{{x}_{i}}} \right)}^{2}}}\sqrt{n\left( \sum\limits_{i=1}^{n}{y_{i}^{2}} \right)-{{\left( \sum\limits_{i=1}^{n}{{{y}_{i}}} \right)}^{2}}}} = \frac{8 \times {17216}-{494}\times {259}}{\sqrt{8\times {31692}-{494}^{2}}\sqrt{8\times 10513-{259}^{2}}}\]

\[=0.7692\]

(सी) निर्धारण का गुणांक है

\[{{r}^{2}}={0.7692}^{2}= {0.5917}\]

जिसका अर्थ है कि एकड़ (y) में 59.17% भिन्नता को आग (x) द्वारा समझाया गया है।

(डी) प्रतिगमन गुणांक की गणना की जाती है

\[b=\frac{n\left( \sum\limits_{i=1}^{n}{{{x}_{i}}{{y}_{i}}} \right)-\left( \sum\limits_{i=1}^{n}{{{x}_{i}}} \right)\left( \sum\limits_{i=1}^{n}{{{y}_{i}}} \right)}{n\left( \sum\limits_{i=1}^{n}{x_{i}^{2}} \right)-{{\left( \sum\limits_{i=1}^{n}{{{x}_{i}}} \right)}^{2}}}=\frac{8 \times {17216}-{494}\times {259}}{8 \times {31692}-{494}^{2}}= 1.0297\]

and

\[a=\bar{y}-b \bar{x}={32.375}{+} {1.0297}\,\cdot \, {61.75} = {-31.208}\]

इसका मतलब है कि प्रतिगमन समीकरण है

\[\hat{y}= {-31.208}{+}{1.0297}\,x\]

Graphically:



प्रश्न 3: आपने यह निर्धारित करने के लिए एक अध्ययन किया है कि क्या प्रत्येक सप्ताह कंप्यूटर प्रयोगशाला में बिताया गया औसत समय और कंप्यूटर पाठ्यक्रम में पाठ्यक्रम ग्रेड सहसंबद्ध थे। नीचे दिए गए आँकड़ों का उपयोग करते हुए, आप इस मुद्दे पर क्या निष्कर्ष निकालना चाहेंगे?

student
# hours in lab
Course Grade
1
20
96
2
11
51
3
16
62
4
13
58
5
89
6
15
81
7
10
46
8
10
51

समाधान: निम्न तालिका पियर्सन की गणना के लिए आवश्यक गणनाओं को दर्शाती है सहसंबंध r : हम पाते हैं

X
Y


X·Y
20
96
400
9216
1920
11
51
121
2601
561
16
62
256
3844
992
13
58
169
3364
754
17
89
289
7921
1513
15
81
225
6561
1215
10
46
100
2116
460
10
51
100
2601
510
Sum
112
534
1660
38224
7925

पियर्सन सहसंबंध r की गणना इस प्रकार की जाती है

\[r = \frac{n\sum\limits_{i=1}^{n}{{{x}_{i}}{{y}_{i}}}-\left( \sum\limits_{i=1}^{n}{{{x}_{i}}} \right)\left( \sum\limits_{i=1}^{n}{{{y}_{i}}} \right)}{\sqrt{n\left( \sum\limits_{i=1}^{n}{x_{i}^{2}} \right)-{{\left( \sum\limits_{i=1}^{n}{{{x}_{i}}} \right)}^{2}}}\sqrt{n\left( \sum\limits_{i=1}^{n}{y_{i}^{2}} \right)-{{\left( \sum\limits_{i=1}^{n}{{{y}_{i}}} \right)}^{2}}}} = \frac{8 \times {7925}-{112}\times {534}}{\sqrt{8\times {1660}-{112}^{2}}\sqrt{8\times 38224-{534}^{2}}}\]

\[=0.9217\]

हम सहसंबंध गुणांक के महत्व के लिए परीक्षण करना चाहते हैं। अधिक विशेष रूप से, हम परीक्षण करना चाहते हैं

\[\begin{align}{{H}_{0}}:\rho {=} 0 \\ {{H}_{A}}:\rho {\ne} 0 \\ \end{align}\]

शून्य परिकल्पना का परीक्षण करने के लिए, हम टी-परीक्षण का उपयोग करते हैं। टी-सांख्यिकी की गणना इस प्रकार की जाती है



\[t= r \sqrt{\frac{n-2}{1-{{r}^{2}}}}= {0.9217} \times \sqrt{\frac{6}{1-{0.9217}^2}}= {5.8198}\]

इस परीक्षण के लिए दो-पुच्छीय p-मान की गणना इस प्रकार की जाती है

\[p=\Pr \left( |{{t}_{6}}|>5.8198 \right)=0.0011\]

चूंकि \(p = 0.0011 {<} 0.05\) , और इसका मतलब है कि हम अशक्त परिकल्पना H . को अस्वीकार करते हैं 0 .

इसलिए, हमारे पास इस दावे का समर्थन करने के लिए पर्याप्त सबूत हैं कि प्रयोगशाला में घंटों की संख्या और पाठ्यक्रम ग्रेड के बीच संबंध शून्य से काफी अलग है।

अपने खाते में लॉग इन करें

Don't have a membership account?
sign up

पासवर्ड रीसेट

साइन अप करें