उत्सर्जनाची गणना कशी करावी

लेखक: Janice Evans
निर्मितीची तारीख: 23 जुलै 2021
अद्यतन तारीख: 1 जुलै 2024
Anonim
Excel मध्ये मोबाईलवर विद्यार्थ्यांची श्रेणी कशी काढावी?(excel madhye  vidyarthyanchi shreni kadhane
व्हिडिओ: Excel मध्ये मोबाईलवर विद्यार्थ्यांची श्रेणी कशी काढावी?(excel madhye vidyarthyanchi shreni kadhane

सामग्री

आकडेवारीमध्ये, आउटलायर्स ही मूल्ये आहेत जी एकत्रित केलेल्या डेटासेटमधील इतर मूल्यांपेक्षा वेगळी असतात. आऊटलीयर डेटा वितरण किंवा मापन त्रुटींमधील विसंगती दर्शवू शकतो, म्हणून डेटाबाहेर बहुतेकदा आउटलेटर्स वगळले जातात. डेटासेटमधून बाहेरचे लोक काढून टाकून, आपण अनपेक्षित किंवा अधिक अचूक निष्कर्षांवर येऊ शकता. म्हणूनच, आकडेवारीची योग्य समज सुनिश्चित करण्यासाठी बाहेरच्या लोकांची गणना आणि अंदाज लावण्यास सक्षम असणे आवश्यक आहे.

पावले

  1. 1 संभाव्य बाहेरील लोकांना ओळखायला शिका. डेटासेटमधून आउटलायर्स वगळण्यापूर्वी संभाव्य आउटलायर्स ओळखले जावेत. आउटलायर्स ही मूल्ये आहेत जी डेटासेटमधील बहुतेक मूल्यांपेक्षा खूप वेगळी असतात; दुसऱ्या शब्दांत, आउटलायर्स बहुतेक मूल्यांच्या प्रवृत्तीच्या बाहेर आहेत. मूल्यांच्या तक्त्यांमध्ये किंवा (विशेषतः) आलेखांमध्ये हे शोधणे सोपे आहे. जर डेटासेटमधील मूल्ये प्लॉट केली गेली तर, आउटलायर्स इतर बहुतेक मूल्यांपासून दूर असतील. जर, उदाहरणार्थ, बहुतेक मूल्ये एका सरळ रेषेवर पडतात, तर बाह्यरेखा अशा सरळ रेषेच्या दोन्ही बाजूंना असतात.
    • उदाहरणार्थ, एका खोलीत 12 वेगवेगळ्या वस्तूंचे तापमान दर्शवणाऱ्या डेटासेटचा विचार करा. जर 11 वस्तू अंदाजे 70 अंश असतील, परंतु बारावी ऑब्जेक्ट (शक्यतो भट्टी) 300 अंश असेल, तर मूल्यांवर एक द्रुत नजर टाकल्यास हे सूचित होऊ शकते की भट्टी संभाव्य उडाणे आहे.
  2. 2 चढत्या क्रमाने डेटाची क्रमवारी लावा. बाह्यरेखा ठरवण्याची पहिली पायरी म्हणजे डेटासेटच्या मध्यकाची गणना करणे. जर डेटासेटमधील मूल्ये चढत्या क्रमाने (सर्वात लहान ते सर्वात मोठ्या) क्रमाने मांडली गेली तर हे कार्य मोठ्या प्रमाणात सुलभ केले आहे.
    • वरील उदाहरणासह पुढे जात, खालील डेटासेटचा विचार करा जे अनेक वस्तूंचे तापमान दर्शवते: {71, 70, 73, 70, 70, 69, 70, 72, 71, 300, 71, 69}. या संचाचा क्रम खालीलप्रमाणे असावा: {69, 69, 70, 70, 70, 70, 71, 71, 71, 72, 73, 300}.
  3. 3 डेटासेटच्या मध्यकाची गणना करा. डेटासेटचे मध्यक म्हणजे डेटासेटच्या मध्यभागी असलेले मूल्य. जर डेटासेटमध्ये मूल्यांची विषम संख्या असेल, तर मध्यमान हे आधी आणि नंतरचे मूल्य आहे जे डेटासेटमध्ये समान मूल्ये आहेत. परंतु जर डेटासेटमध्ये मूल्यांची सम संख्या असेल तर आपल्याला दोन माध्यमांचे अंकगणित माध्य शोधण्याची आवश्यकता आहे. लक्षात घ्या की आउटलायर्सची गणना करताना, सामान्यत: क्यू 2 असे म्हटले जाते, कारण ते क्यू 1 आणि क्यू 3, खालच्या आणि वरच्या चतुर्थांश दरम्यान असते, जे आम्ही नंतर परिभाषित करू.
    • मूल्यांच्या सम संख्या असलेल्या डेटासेटसह काम करण्यास घाबरू नका- दोन माध्यमांचा अंकगणित अर्थ डेटासेटमध्ये नसलेली संख्या असेल; हे सामान्य आहे. परंतु जर दोन सरासरी मूल्ये समान संख्या असतील तर अंकगणित माध्य या संख्येच्या बरोबरीचे असेल; हे गोष्टींच्या क्रमाने देखील आहे.
    • वरील उदाहरणामध्ये, मध्य 2 मूल्ये 70 आणि 71 आहेत, म्हणून मध्य ((70 + 71) / 2) = 70.5 आहे.
  4. 4 तळाच्या चतुर्थांशांची गणना करा. हे मूल्य, Q1 म्हणून ओळखले जाते, ज्याच्या खाली 25% डेटा सेट मूल्ये असतात. दुसर्या शब्दात, हे सरासरी पर्यंतच्या मूल्यांचे अर्धे आहे. जर माध्यमाच्या आधी डेटासेट मधून सम संख्येची संख्या असेल तर, Q1 ची गणना करण्यासाठी आपल्याला दोन माध्यमांचे अंकगणित माध्य शोधणे आवश्यक आहे (हे मध्यकाची गणना करण्यासारखे आहे).
    • आमच्या उदाहरणामध्ये, 6 मूल्ये मध्यंतरानंतर आणि 6 मूल्ये- त्यापूर्वी आहेत. याचा अर्थ असा की खालच्या चतुर्थांशांची गणना करण्यासाठी, आपल्याला मध्यस्थीच्या आधी असलेल्या सहा मूल्यांच्या दोन माध्यमांचे अंकगणित माध्य शोधणे आवश्यक आहे. येथे सरासरी मूल्ये 70 आणि 70 आहेत. अशा प्रकारे, Q1 = ((70 + 70) / 2) = 70.
  5. 5 वरच्या चतुर्थांशांची गणना करा. हे मूल्य, ज्याला Q3 म्हणून संबोधले जाते, त्यापेक्षा जास्त 25% डेटा सेट मूल्ये असतात. Q3 ची गणना करण्याची प्रक्रिया Q1 ची गणना करण्याच्या प्रक्रियेसारखीच आहे, परंतु येथे मध्यकानंतरची मूल्ये विचारात घेतली जातात.
    • वरील उदाहरणात, सरासरीनंतर सहाची दोन सरासरी 71 आणि 72 आहेत. तर Q3 = ((71 + 72) / 2) = 71.5.
  6. 6 अंतर्बाह्य श्रेणीची गणना करा. Q1 आणि Q3 ची गणना केल्यावर, या मूल्यांमधील अंतर शोधणे आवश्यक आहे. हे करण्यासाठी, Q3 मधून Q1 वजा करा. अंतर्बाह्य श्रेणीचे मूल्य हे मूल्य नसलेल्या मूल्यांच्या सीमा निश्चित करण्यासाठी अत्यंत महत्वाचे आहे.
    • आमच्या उदाहरणात, Q1 = 70 आणि Q3 = 71.5. अंतर्बाह्य श्रेणी 71.5 - 70 = 1.5 आहे.
    • लक्षात घ्या की हे नकारात्मक Q1 आणि Q3 मूल्यांवर देखील लागू होते. उदाहरणार्थ, जर Q1 = -70, तर अंतर्बाह्य श्रेणी 71.5 -(-70) = 141.5 आहे.
  7. 7 डेटासेटमधील मूल्यांच्या "आतील सीमा" शोधा. मूल्यांचे विश्लेषण करून आउटलायर्स निर्धारित केले जातात- ते तथाकथित "अंतर्गत सीमा" आणि "बाह्य सीमा" मध्ये येतात की नाही. "आतील सीमा" च्या बाहेरचे मूल्य "किरकोळ बाह्य" म्हणून वर्गीकृत केले जाते, तर "बाह्य सीमा" च्या बाहेरचे मूल्य "महत्त्वपूर्ण बाह्य" म्हणून वर्गीकृत केले जाते. आतील सीमा शोधण्यासाठी, आपल्याला अंतर्बाह्य श्रेणी 1.5 ने गुणाकार करणे आवश्यक आहे; परिणाम Q3 मध्ये जोडला पाहिजे आणि Q1 मधून वजा केला पाहिजे. सापडलेल्या दोन संख्या डेटासेटच्या आतील सीमा आहेत.
    • आमच्या उदाहरणात, अंतर्बाह्य श्रेणी (71.5 - 70) = 1.5 आहे. पुढे: 1.5 * 1.5 = 2.25. ही संख्या Q3 मध्ये जोडली जाणे आणि आतील सीमा शोधण्यासाठी Q1 मधून वजा करणे आवश्यक आहे:
      • 71,5 + 2,25 = 73,75
      • 70 - 2,25 = 67,75
      • अशा प्रकारे, अंतर्गत सीमा 67.75 आणि 73.75 आहेत.
    • आमच्या उदाहरणामध्ये, फक्त भट्टीचे तापमान - 300 अंश - या मर्यादांच्या बाहेर आहे आणि ते एक क्षुल्लक उत्सर्जन मानले जाऊ शकते. परंतु निष्कर्षावर जाऊ नका - हे तापमान लक्षणीय बाह्य आहे का हे आम्हाला ठरवावे लागेल.
  8. 8 डेटासेटच्या "बाह्य सीमा" शोधा. हे आंतरिक सीमांप्रमाणेच केले जाते, वगळता इंटरक्वार्टाइल श्रेणी 1.5 च्या ऐवजी 3 ने गुणाकार केली जाते. परिणाम Q3 मध्ये जोडला जाणे आणि Q1 मधून वजा करणे आवश्यक आहे. सापडलेल्या दोन संख्या डेटासेटच्या बाह्य सीमा आहेत.
    • आमच्या उदाहरणात, इंटरक्वार्टाइल श्रेणी 3: 1.5 * 3 = 4.5 ने गुणाकार करा. बाह्य सीमांची गणना करा:
      • 71,5 + 4,5 = 76
      • 70 - 4,5 = 65,5
      • तर बाह्य सीमा 65.5 आणि 76 आहेत.
    • बाह्य सीमांच्या बाहेर पडणारी कोणतीही मूल्ये महत्त्वपूर्ण उत्सर्जन मानली जातात. आमच्या उदाहरणामध्ये, भट्टीचे तापमान 300 अंश एक महत्त्वपूर्ण धक्का मानले जाते.
  9. 9 डेटासेटमधून बाहेरच्या लोकांना वगळले पाहिजे की नाही हे निर्धारित करण्यासाठी गुणात्मक अंदाज वापरा. वर वर्णन केलेली पद्धत आपल्याला काही मूल्ये बाह्य (किरकोळ किंवा महत्त्वपूर्ण) आहेत हे निर्धारित करण्याची परवानगी देते. कोणतीही चूक करू नका, तथापि - बाह्य मूल्य म्हणून वर्गीकृत केलेले मूल्य अपवादांसाठी केवळ "उमेदवार" आहे, याचा अर्थ आपल्याला ते वगळण्याची गरज नाही. बाहेरील व्यक्तीचे कारण हे बाह्य घटक वगळण्याच्या निर्णयावर परिणाम करणारे मुख्य घटक आहे. नियमानुसार, त्रुटींमुळे (मोजमाप, रेकॉर्डिंग इत्यादी) उद्भवणारे बाह्य घटक वगळण्यात आले आहेत. दुसरीकडे, त्रुटींशी नसून नवीन माहिती किंवा ट्रेंडशी संबंधित आउटलायर्स सहसा डेटासेटमध्ये सोडले जातात.
    • डेटासेटच्या मध्यभागी आउटलायर्सच्या परिणामाचे मूल्यांकन करणे तितकेच महत्वाचे आहे (ते ते विकृत करतात की नाही). जेव्हा आपण डेटासेटच्या मध्यकावरून निष्कर्ष काढता तेव्हा हे विशेषतः महत्वाचे असते.
    • आमच्या उदाहरणामध्ये, ओव्हन 300 अंशांच्या तापमानापर्यंत गरम होण्याची शक्यता नाही (आम्ही नैसर्गिक विसंगती लक्षात घेतल्याशिवाय). म्हणून, असा निष्कर्ष काढला जाऊ शकतो (उच्च प्रमाणात निश्चिततेसह) की असे तापमान मापन त्रुटी आहे ज्याला डेटासेटमधून वगळणे आवश्यक आहे. शिवाय, जर तुम्ही बाह्य गोष्टींना नकार दिला नाही तर डेटासेटचे मध्य (69 + 69 + 70 + 70 + 70 + 70 + 71 + 71 + 71 + 72 + 73 + 300) / 12 = 89.67 अंश असेल, परंतु जर तुम्ही बाह्यरेखा वगळली तर मध्य (69 + 69 + 70 + 70 + 70 + 70 + 70 + 71 + 71 + 71 + 72 + 73) / 11 = 70.55 अंश असेल.
      • आऊटलायर्स सामान्यत: मानवी त्रुटीचा परिणाम असतात, म्हणून आउटलायर्सना डेटासेटमधून वगळणे आवश्यक आहे.
  10. 10 डेटासेटमध्ये (कधीकधी) बाहेर पडलेल्यांचे महत्त्व समजून घ्या. काही बाह्य लोकांना डेटासेटमधून वगळले पाहिजे कारण ते त्रुटी आणि तांत्रिक समस्यांमुळे आहेत; इतर आउटलायर्स डेटासेटमध्ये सोडले पाहिजेत. जर, उदाहरणार्थ, बाहेरील त्रुटीचा परिणाम नाही आणि / किंवा चाचणी अंतर्गत घटनेची नवीन समज प्रदान करते, तर ते डेटासेटमध्ये सोडले पाहिजे. वैज्ञानिक प्रयोग विशेषतः बाहेरील लोकांसाठी संवेदनशील असतात - चुकून एखाद्या बाह्य व्यक्तीला काढून टाकल्यास, आपण काही नवीन कल किंवा शोध गमावत असाल.
    • उदाहरणार्थ, मत्स्यपालनात माशांचा आकार वाढवण्यासाठी आम्ही एक नवीन औषध विकसित करत आहोत. आम्ही जुना डेटासेट वापरू ({71, 70, 73, 70, 70, 69, 70, 72, 71, 300, 71, 69}), परंतु यावेळी प्रत्येक मूल्य माशाचे वजन दर्शवेल (ग्रॅममध्ये) प्रायोगिक औषध घेतल्यानंतर. दुसऱ्या शब्दांत, पहिल्या औषधामुळे माशांचे वजन 71 ग्रॅम पर्यंत वाढते, दुसरे औषध - 70 ग्रॅम पर्यंत, आणि असेच. या परिस्थितीत, 300 एक महत्त्वपूर्ण बाह्य आहे, परंतु आपण ते नाकारू नये; जर आपण असे गृहीत धरले की मोजमापाच्या चुका नव्हत्या, तर अशा बाहेरील प्रयोगात महत्त्वपूर्ण यश आहे. माशाचे वजन 300 ग्रॅम पर्यंत वाढवणारे औषध इतर औषधांपेक्षा खूप चांगले काम करते; अशा प्रकारे डेटासेटमध्ये 300 हे सर्वात महत्वाचे मूल्य आहे.

टिपा

  • जेव्हा आउटलायर्स सापडतात, तेव्हा त्यांना डेटासेटमधून वगळण्यापूर्वी त्यांची उपस्थिती स्पष्ट करण्याचा प्रयत्न करा. ते मापन त्रुटी किंवा वितरण विसंगती सूचित करू शकतात.

आपल्याला काय आवश्यक आहे

  • कॅल्क्युलेटर