जानें कि सरल रैखिक प्रतिगमन क्या है और यह कैसे काम करता है

मात्रात्मक डेटा का विश्लेषण करने के लिए एक बुनियादी सांख्यिकी दृष्टिकोण

सौजन्य कॉलिन ब्रौग, फोटोग्राफर। © 10 जून, 2010 Stock.xchng

रैखिक प्रतिगमन मॉडल का उपयोग दो चर या कारकों के बीच संबंध दिखाने या भविष्यवाणी करने के लिए किया जाता है । भविष्यवाणी की जा रही कारक (समीकरण जो हल करता है ) को कहा जाता है निर्भर चर। आश्रित चर के मूल्य की भविष्यवाणी करने के लिए उपयोग किए जाने वाले कारकों को स्वतंत्र चर कहा जाता है।

अच्छा डेटा हमेशा पूरी कहानी नहीं बताता है। रिग्रेशन विश्लेषण आमतौर पर शोध में प्रयोग किया जाता है क्योंकि यह स्थापित करता है कि चर के बीच एक सहसंबंध मौजूद है।

लेकिन सहसंबंध कारण के समान नहीं है । यहां तक ​​कि एक साधारण रैखिक प्रतिगमन में एक पंक्ति जो डेटा बिंदुओं को अच्छी तरह से फिट करती है, एक कारण और प्रभाव संबंध के बारे में कुछ निश्चित नहीं कह सकती है।

सरल रैखिक प्रतिगमन में, प्रत्येक अवलोकन में दो मान होते हैं। एक मान निर्भर चर के लिए है और एक मान स्वतंत्र चर के लिए है।

सरल रैखिक रिग्रेशन मॉडल

सरल रैखिक प्रतिगमन मॉडल इस तरह प्रस्तुत किया जाता है: y = ( β 0 + β 1 + Ε

गणितीय सम्मेलन के अनुसार, एक साधारण रैखिक प्रतिगमन विश्लेषण में शामिल दो कारक x और y नामित हैं।

समीकरण जो वर्णन करता है कि वाई x से कैसे संबंधित है उसे रिग्रेशन मॉडल के रूप में जाना जाता है। रैखिक प्रतिगमन मॉडल में एक त्रुटि शब्द भी होता है जिसे Ε , या ग्रीक अक्षर ईपीएसलॉन द्वारा दर्शाया जाता है। त्रुटि शब्द का उपयोग y में भिन्नता के लिए किया जाता है जिसे x और y के बीच रैखिक संबंध द्वारा समझाया नहीं जा सकता है।

ऐसे पैरामीटर भी हैं जो अध्ययन की जा रही आबादी का प्रतिनिधित्व करते हैं। मॉडल के इन पैरामीटर जिन्हें ( β 0+ β 1 x ) द्वारा दर्शाया जाता है।

सरल रैखिक रिग्रेशन मॉडल

सरल रैखिक प्रतिगमन समीकरण इस तरह दर्शाया गया है : Ε ( y ) = ( β 0 + β 1 x )।

सरल रैखिक प्रतिगमन समीकरण एक सीधी रेखा के रूप में graphed है।

( β 0 रीग्रेशन लाइन के वाई अवरोध है।

β 1 ढलान है।

Ε ( y ) एक्स के दिए गए मान के लिए वाई का औसत या अपेक्षित मान है।

एक प्रतिगमन रेखा सकारात्मक रैखिक संबंध, एक नकारात्मक रैखिक संबंध, या कोई संबंध नहीं दिखा सकता है। यदि एक साधारण रैखिक प्रतिगमन में घिरा हुआ रेखा फ्लैट (ढीला नहीं) है, तो दो चर के बीच कोई संबंध नहीं है। यदि ग्राफ़ के वाई इंटरसेप्ट (अक्ष) पर लाइन के निचले सिरे के साथ रेग्रेशन लाइन ऊपर की ओर बढ़ती है, और ग्राफ़ फ़ील्ड में ऊपर की ओर बढ़ने वाली रेखा के ऊपरी छोर को एक्स इंटरसेप्ट (अक्ष) से ​​दूर एक सकारात्मक रैखिक संबंध मौजूद है । यदि ग्राफ़ के वाई इंटरसेप्ट (अक्ष) पर लाइन के ऊपरी छोर के साथ रेग्रेशन लाइन नीचे की ओर ढलती है, और एक्स इंटरसेप्ट (अक्ष) की ओर, ग्राफ़ फ़ील्ड में नीचे की ओर बढ़ने वाली रेखा के निचले सिरे को नकारात्मक रैखिक संबंध मौजूद है।

अनुमानित रैखिक रिग्रेशन समीकरण

यदि जनसंख्या के मानकों को ज्ञात किया गया था, तो सरल रैखिक प्रतिगमन समीकरण (नीचे दिखाया गया) का उपयोग x के ज्ञात मान के लिए y के औसत मान की गणना करने के लिए किया जा सकता है।

Ε ( वाई ) = ( β 0 + β 1 x )।

हालांकि, व्यावहारिक रूप से, पैरामीटर मान ज्ञात नहीं हैं, इसलिए जनसंख्या के नमूने से डेटा का उपयोग करके उनका अनुमान लगाया जाना चाहिए। जनसंख्या मानकों का नमूना आंकड़ों का उपयोग करके अनुमान लगाया जाता हैनमूना आंकड़े बी 0 + बी 1 द्वारा दर्शाए जाते हैं। जब आबादी के मानकों के लिए नमूना आंकड़े प्रतिस्थापित किए जाते हैं, अनुमानित प्रतिगमन समीकरण बनता है।

अनुमानित प्रतिगमन समीकरण नीचे दिखाया गया है।

( ŷ ) = ( β 0 + β 1 एक्स

( ŷ ) y टोपी कहा जाता है

अनुमानित सरल प्रतिगमन समीकरण का ग्राफ अनुमानित प्रतिगमन रेखा कहा जाता है।

बी 0 वाई अवरोध है।

बी 1 ढलान है।

Ŷ ) एक्स के दिए गए मान के लिए वाई का अनुमानित मूल्य है।

महत्वपूर्ण नोट: चर के बीच कारण और प्रभाव संबंधों को समझने के लिए रिग्रेशन विश्लेषण का उपयोग नहीं किया जाता है। हालांकि, रिग्रेशन विश्लेषण यह इंगित कर सकता है कि चर कैसे संबंधित हैं या किस हद तक चर एक दूसरे के साथ जुड़े हुए हैं।

ऐसा करने में, प्रतिगमन विश्लेषण मुख्य संबंध बनाने के लिए होता है जो एक जानकार शोधकर्ता को नज़दीकी रूप से देखने के लिए वारंट करता है।

इसके रूप में भी जाना जाता है: बिवारिएट रिग्रेशन, रिग्रेशन विश्लेषण

उदाहरण: कम स्क्वायर विधि अनुमानित प्रतिगमन समीकरण के मूल्य को खोजने के लिए नमूना डेटा का उपयोग करने के लिए एक सांख्यिकीय प्रक्रिया है। कास्ट फ्रेडरिक गॉस ने लीस्ट स्क्वायर विधि का प्रस्ताव दिया था, जिसका जन्म 1777 में हुआ था और 1855 में उनकी मृत्यु हो गई थी। कम स्क्वायर विधि अभी भी व्यापक रूप से उपयोग की जाती है।

सूत्रों का कहना है:

एंडरसन, डीआर, स्वीनी, डीजे, और विलियम्स, टीए (2003)। बिजनेस एंड इकोनॉमिक्स के लिए सांख्यिकी के अनिवार्य (तीसरे संस्करण) मेसन, ओहियो: साउथवेस्टर्न, थॉम्पसन लर्निंग।

______। (2010)। समझाया गया: रिग्रेशन विश्लेषण। एमआईटी समाचार।

मैकइन्टेरे, एल। (1 99 4)। एकाधिक रिग्रेशन के परिचय के लिए सिगरेट डेटा का उपयोग करना। सांख्यिकी शिक्षा जर्नल, 2 (1)।

मेंडेनहॉल, डब्ल्यू, और सिन्सीच, टी। (1 99 2)। इंजीनियरिंग और विज्ञान के लिए सांख्यिकी (तीसरा संस्करण), न्यूयॉर्क, एनवाई: डेलन प्रकाशन कं

Panchenko, डी 18.443 अनुप्रयोगों के लिए सांख्यिकी, पतन 2006, धारा 14, सरल रैखिक रिग्रेशन। (मैसाचुसेट्स प्रौद्योगिकी संस्थान: एमआईटी ओपनकोर्सवेयर)