लेखक:
Robert Simon
निर्मितीची तारीख:
21 जून 2021
अद्यतन तारीख:
1 जुलै 2024
सामग्री
भिन्नता डेटा सेटचे फैलाव मोजते. सांख्यिकीय मॉडेल्स तयार करण्यात हे खूप उपयुक्त आहे: डेटामध्ये मूलभूत संबंधांऐवजी आपण यादृच्छिक त्रुटी किंवा आवाजाचे वर्णन करीत असल्याचे कमी भिन्नता हे सूचित केले जाऊ शकते. या लेखासह, विकी भिन्नतेची गणना कशी करावी हे शिकवते.
पायर्या
पद्धत 1 पैकी 2: नमुन्याच्या भिन्नतेची गणना करा
- आपला नमुना डेटा सेट लिहा. बहुतेक प्रकरणांमध्ये, सांख्यिकीशास्त्रज्ञांकडे फक्त नमूना किंवा ती शिकत असलेल्या लोकसंख्येच्या उपसेटवरच माहिती असते. उदाहरणार्थ, "जर्मनीमधील प्रत्येक कारची किंमत" याचे सामान्य विश्लेषण करण्याऐवजी सांख्यिकीशास्त्रज्ञांना काही हजार कारच्या यादृच्छिक नमुनाची किंमत सापडेल. जर्मनीतील मोटारींच्या किंमतींचा चांगला अंदाज मिळण्यासाठी सांख्यिकीशास्त्रज्ञ या नमुन्याचा वापर करू शकतात. तथापि, हे वास्तविक संख्यांशी अचूक जुळत नाही अशी अधिक शक्यता आहे.
- उदाहरणार्थ: कॉफी शॉपवर दररोज विकल्या जाणा m्या मफिनच्या संख्येचे विश्लेषण करताना आपण यादृच्छिकपणे सहा दिवसांचा नमुना घेतला आणि खालील परिणाम मिळाले: 38, 37, 36, 28, 18, 14, 12, 11, 10.7, 9.9. हे एक नमुना आहे, लोकसंख्या नाही, कारण आपल्याकडे दररोज स्टोअर खुला आहे असा डेटा नाही.
- तर प्रत्येक मास्टर मधील डेटा पॉइंट्स, कृपया खाली दिलेल्या पद्धतीवर जा.
नमुना रूपांतर सूत्र लिहा. डेटा सेटचे रूपांतर डेटा बिंदूंच्या प्रसाराची डिग्री दर्शविते. भिन्नता शून्याइतकी जितकी जवळ असेल तितके डेटा पॉईंट्सचे गटबद्ध केले जाते. नमुना डेटा सेटसह कार्य करत असताना, भिन्नता मोजण्यासाठी खालील सूत्र वापरा:- = /(एन - 1)
- फरक आहे. चौरस युनिट्समध्ये नेहमीच भिन्नता मोजली जाते.
- आपल्या डेटा सेटमधील मूल्य दर्शवते.
- Sum, "बेरीज" म्हणजे प्रत्येक मूल्यासाठी खालील पॅरामीटर्सची गणना करण्यास आणि नंतर त्यांना एकत्रित करण्यास सांगते.
- x̅ नमुन्याचा मध्यभागी आहे.
- n डेटा बिंदूंची संख्या आहे.
नमुन्याच्या मध्यभागी गणना करा. नमुनाचा मध्य दर्शविण्यासाठी x̅ किंवा "x-क्षैतिज" चिन्ह वापरले जाते. आपण सरासरीप्रमाणे गणना करा: सर्व डेटा पॉइंट्स जोडा आणि गुणांच्या संख्येनुसार विभाजित करा.- उदाहरणार्थ: प्रथम, आपले डेटा बिंदू जोडा: 17 + 15 + 23 + 7 + 9 + 13 = 84
पुढे, डेटा पॉईंट्सच्या संख्येनुसार निकाल विभाजित करा, या प्रकरणात सहा: 84 ÷ 6 = 14.
नमुना म्हणजे = x̅ = 14. - आपण डेटाचा "सेंटर पॉईंट" म्हणून मध्यभागी विचार करू शकता. जर डेटा मध्यभागी केंद्रित असेल तर भिन्नता कमी असेल. जर ते मध्यभागी दूर पसरले तर भिन्नता जास्त आहे.
- उदाहरणार्थ: प्रथम, आपले डेटा बिंदू जोडा: 17 + 15 + 23 + 7 + 9 + 13 = 84
प्रत्येक डेटा पॉईंटवरून क्षुद्र वजा करा. आता गणना करण्याची वेळ आली आहे - x̅, जेथे आपल्या डेटा सेटमधील प्रत्येक बिंदू असतो. प्रत्येक परिणाम प्रत्येक संबंधित बिंदूच्या मधोमधुन विचलन दर्शवितो किंवा त्यास सोप्या शब्दात सांगायचे तर त्यापासून अगदी अंतर आहे.- उदाहरणार्थ:
- x̅ = 17 - 14 = 3
- x̅ = 15 - 14 = 1
- x̅ = 23 - 14 = 9
- x̅ = 7 - 14 = -7
- x̅ = 9 - 14 = -5
- x̅ = 13 - 14 = -1 - आपली गणना तपासणे खूप सोपे आहे, कारण निकाल शून्य असणे आवश्यक आहे.हे कारण, नकारात्मक परिणामाच्या परिभाषा (न्यूनतम ते लहान संख्येचे अंतर) आहे. सकारात्मक परिणाम (मध्यम ते मोठ्या संख्येसाठी अंतर) पूर्णपणे काढून टाकले जातात.
- उदाहरणार्थ:
- सर्व परिणामांचा वर्ग द्या. वर नमूद केल्याप्रमाणे सद्य विचलनाच्या यादीमध्ये (- x̅) शून्य बेरीज आहे. याचा अर्थ असा आहे की "सरासरी विचलन" देखील नेहमी शून्य असेल आणि डेटाच्या फैलावण्याबद्दल काहीही सांगितले जाऊ शकत नाही. या समस्येचे निराकरण करण्यासाठी, आम्हाला प्रत्येक विचलनाचा स्क्वेअर सापडतो. परिणामी, सर्व सकारात्मक संख्या, नकारात्मक मूल्ये आणि सकारात्मक मूल्ये यापुढे एकमेकांना रद्द करत नाहीत आणि बेरीज शून्य देतात.
- उदाहरणार्थ:
(- x̅)
- x̅)
9 = 81
(-7) = 49
(-5) = 25
(-1) = 1 - नमुन्यातील प्रत्येक डेटा पॉईंटसाठी आपल्याकडे आता (- x̅) आहे.
- उदाहरणार्थ:
- चौरस मूल्यांची बेरीज शोधा. सूत्रांच्या संपूर्ण अंकाची गणना करण्याची वेळ आली आहे: ∑. मोठ्या सायक्लो, ∑, साठी आपण प्रत्येक मूल्यासाठी खालील घटक मूल्य जोडणे आवश्यक आहे. आपण नमुन्यातील प्रत्येक मूल्यासाठी (- x̅) गणना केली आहे, जेणेकरून आपल्याला फक्त इतके परिणाम एकत्र जोडले पाहिजे.
- उदाहरणार्थ: 9 + 1 + 81 + 49 + 25 + 1 = 166.
- N - 1 ने भाग घ्या जेथे n हा डेटा बिंदूंची संख्या आहे. खूप पूर्वी, नमुना भिन्नतेची गणना करताना, संख्याशास्त्रज्ञ केवळ एन ने विभाजित केले. तो विभाग आपल्याला चौरस विचलनाचा अर्थ देईल, जो त्या नमुन्याच्या भिन्नतेशी अचूकपणे जुळतो. तथापि, हे लक्षात ठेवा की नमुना हा केवळ मोठ्या लोकसंख्येचा अंदाज आहे. आपण दुसरा यादृच्छिक नमुना घेतल्यास आणि समान गणना केल्यास आपल्याला एक भिन्न परिणाम मिळेल. हे जसे दिसून आले आहे की n ऐवजी n -1 ने भागाकार केल्याने आपल्याला मोठ्या लोकसंख्येच्या भिन्नतेचा अधिक चांगला अंदाज येतो - ज्याची आपल्याला खरोखर काळजी आहे. ही दुरुस्ती इतकी सामान्य आहे की ती आता नमुना भिन्नतेची स्वीकारलेली व्याख्या आहे.
- उदाहरणार्थ: नमुन्यात सहा डेटा पॉइंट्स आहेत, म्हणून एन = 6.
नमुना भिन्नता = 33,2
- उदाहरणार्थ: नमुन्यात सहा डेटा पॉइंट्स आहेत, म्हणून एन = 6.
- भिन्नता आणि प्रमाण विचलन समजून घ्या. लक्षात घ्या की सूत्रामध्ये शक्ती असल्याने मूळ डेटाच्या युनिट्सच्या चौरसामध्ये भिन्नता मोजली जाते. हे दृश्यमानपणे गोंधळात टाकणारे आहे. त्याऐवजी, बर्याचदा मानक विचलन बरेच उपयोगी होते. परंतु कोणत्याही प्रयत्नांना वाया घालवायचा अर्थ नाही, कारण प्रमाणातील विचलन भिन्नतेच्या चौरस मुळे निर्धारित केले जाते. म्हणूनच नमुना प्रकार भिन्नपणे लिहिलेले आहे आणि नमुनाचे प्रमाणित विचलन आहे.
- उदाहरणार्थ, वरील नमुन्यांची मानक विचलन = s = √33.2 = 5.76.
पद्धत 2 पैकी 2: लोकसंख्येच्या भिन्नतेची गणना करा
- मास्टर डेटा सेटसह प्रारंभ करीत आहे. "लोकसंख्या" हा शब्द सर्व संबंधित निरीक्षणे संदर्भित करण्यासाठी वापरला जातो. उदाहरणार्थ, आपण हनोईच्या रहिवाशांच्या वयाचे संशोधन करीत असल्यास, आपल्या एकूण लोकसंख्येमध्ये हनोईमध्ये राहणा all्या सर्व व्यक्तींच्या वयोगटाचा समावेश असेल. सामान्यत: आपण यासारख्या मोठ्या डेटा सेटसाठी एक स्प्रेडशीट तयार कराल परंतु येथे एक लहान उदाहरण डेटा सेट आहे:
- उदाहरणार्थ: एक्वैरियमच्या खोलीत, सहा मत्स्यालय आहेत. या सहा टाक्यांमध्ये माशांची पुढील संख्या आहे:
- उदाहरणार्थ: एक्वैरियमच्या खोलीत, सहा मत्स्यालय आहेत. या सहा टाक्यांमध्ये माशांची पुढील संख्या आहे:
- एकूणच भिन्नतेचे सूत्र लिहा. लोकसंख्येमध्ये आम्हाला आवश्यक असलेला सर्व डेटा असल्याने हे सूत्र आम्हाला लोकसंख्येचे अचूक फरक देते. नमुना भिन्नतेपासून ते वेगळे करण्यासाठी (जे केवळ एक अंदाज आहे), सांख्यिकीशास्त्रज्ञ इतर चल वापरतात:
- σ = /एन
- sample = नमुना फरक. हे सामान्यतः स्क्वेअर सॉसेज असते. चौरस युनिटमध्ये भिन्नता मोजली जाते.
- आपल्या डेटा सेटमधील घटक दर्शवते.
- Value मधील घटकांची गणना प्रत्येक मूल्यासाठी केली जाते आणि नंतर जोडली जाते.
- μ एकूणच क्षुद्र आहे.
- n ही लोकसंख्या मधील डेटा पॉइंट्सची संख्या आहे.
- लोकसंख्येचा मध्य शोधा. लोकसंख्येचे विश्लेषण करताना, चिन्ह μ ("mu") अंकगणित माध्यमाचे प्रतिनिधित्व करते. अर्थ शोधण्यासाठी, सर्व डेटा पॉइंट्स जोडा, त्यानंतर गुणांच्या संख्येनुसार विभाजित करा.
- आपण सरासरी "औसत" म्हणून विचार करू शकता परंतु सावधगिरी बाळगा, कारण या शब्दाला अनेक गणितीय परिभाषा आहेत.
- उदाहरणार्थ: मूळ मूल्य = μ = = 10,5
- प्रत्येक डेटा पॉईंटवरून क्षुद्र वजा करा. शब्दाच्या जवळील डेटा बिंदूंमध्ये शून्याशी फरक असतो. सर्व डेटा पॉइंट्ससाठी वजाबाकीची समस्या पुन्हा करा आणि आपल्याला कदाचित डेटाचे फैलाव जाणवू लागेल.
- उदाहरणार्थ:
- μ = 5 – 10,5 = -5,5
- μ = 5 – 10,5 = -5,5
- μ = 8 – 10,5 = -2,5
- μ = 12 - 10., = 1,5
- μ = 15 – 10,5 = 4,5
- μ = 18 – 10,5 = 7,5
- उदाहरणार्थ:
- प्रत्येक चिन्ह चौरस. या टप्प्यावर, मागील चरणातून प्राप्त केलेले काही निकाल नकारात्मक असतील तर काही सकारात्मक असतील.आपण एखाद्या आइसोर्मिक लाईनवरील डेटा व्हिज्युअल केल्यास, या दोन आयटम डाव्या आणि डाव्या बाजूच्या संख्येचे प्रतिनिधित्व करतात. भिन्नतेची गणना करण्यात याचा काही उपयोग होणार नाही कारण हे दोन गट एकमेकांना रद्द करतील. त्याऐवजी त्या सर्वांना वर्ग द्या जेणेकरून ते सर्व सकारात्मक आहेत.
- उदाहरणार्थ:
(- μ) च्या प्रत्येक मूल्यासाठी मी 1 ते 6 पर्यंत चालते:
(-5,5) = 30,25
(-5,5) = 30,25
(-2,5) = 6,25
(1,5) = 2,25
(4,5) = 20,25
(7,5) = 56,25
- उदाहरणार्थ:
- आपल्या निकालांची सरासरी शोधा. आपल्याकडे आता प्रत्येक डेटा पॉईंटसाठी मूल्य आहे, ते संबंधित (थेट नाही) डेटा पॉइंट अगदी किती दूर आहे ते संबंधित. त्यांना एकत्रित करुन आणि आपल्याकडे असलेल्या मूल्यांच्या संख्येनुसार विभाजन करून सरासरी.
- उदाहरणार्थ:
एकंदरीत भिन्नता = 24,25
- उदाहरणार्थ:
- संपर्क कृती. जर आपल्याला याची खात्री नसेल तर या पद्धतीच्या सुरूवातीस दिलेल्या सूत्रात हे कसे बसते, तर संपूर्ण समस्या हाताने लिहा आणि संक्षेप नका:
- क्षुद्र आणि स्क्वेअरिंगमधील फरक शोधल्यानंतर आपल्याला (- μ), (- μ) आणि इतकेच मिळते (- μ) पर्यंत, शेवटचा डेटा पॉइंट कोठे आहे? डेटा सेटमध्ये.
- या मूल्यांची सरासरी शोधण्यासाठी, त्यांना एकत्र जोडा आणि n: ((- μ) + (- μ) + ... + (- - μ)) / n ने विभाजित करा
- सिग्मॉइड संकेतासह अंश पुन्हा लिहिल्यानंतर, आपल्याकडे /एन, सूत्र भिन्नता.
सल्ला
- कारण भिन्नतेचे स्पष्टीकरण करणे कठिण आहे, बहुतेक वेळा हे मूल्य मानक विचलन शोधण्यासाठी सुरूवात म्हणून मोजले जाते.
- डिनोमिनेटरमध्ये "एन" ऐवजी "एन -1" वापरणे बेसल सुधार म्हणतात. नमुना ही संपूर्ण लोकसंख्येचा अंदाज आहे आणि त्या अंदाजाशी जुळण्यासाठी नमुन्याच्या मध्यभागी एक विशिष्ट पूर्वाग्रह असतो. हे सुधारणे वरील पूर्वाग्रह दूर करते. हे एकदा की एन - 1 डेटा पॉइंट्सची नोंद केली गेली की शेवटचा व्या बिंदू आहे एन स्थिर होते, कारण भिन्नतेच्या सूत्रामधील नमुन्याच्या (x̅) मधे मोजण्यासाठी केवळ काही मूल्ये वापरली जात होती.