Unduh PDF Unduh PDF Varians adalah ukuran seberapa tersebarnya data. Varians yang rendah menandakan data yang berkelompok dekat satu sama lain. Varians yang tinggi menandakan data yang lebih tersebar. Konsep ini memiliki banyak kegunaan di dalam statistik. Misalnya, membandingkan varians dari dua kelompok data seperti hasil dari pasien laki-laki dan perempuan adalah salah satu cara untuk menguji apakah sebuah variabel memiliki efek yang dapat diamati.[1] Varians juga berguna saat membuat model statistik, karena varians yang rendah menandakan data yang over-fitting.[2] 1 Dapatkan data sampel. Dalam banyak kasus, ahli statistik hanya mendapatkan data sampel, atau sebagian dari populasi yang sedang mereka teliti. Misalnya, alih-alih menganalisis populasi "harga setiap mobil di Jerman", seorang ahli statistik dapat mencari harga dari sampel acak beberapa ribu mobil. Ia dapat menggunakan sampel ini untuk mendapatkan estimasi harga mobil di Jerman, namun hasilnya mungkin tidak sama dengan hasil sebenarnya. Contoh Untuk menganalisis jumlah kue muffin yang terjual setiap hari di sebuah kafetaria, Anda mengumpulkan data dari enam hari acak dan memperoleh hasil sebagai berikut 17, 15, 23, 7, 9, 13. Data ini adalah sebuah sampel, bukan data populasi, karena Anda tidak mempunyai data penjualan setiap hari sejak kafetaria itu dibuka. Jika Anda memiliki "semua" data dari sebuah populasi, langsung lompat ke metode berikutnya. 2 Tuliskan rumus varians sampel. Varians dari sejumlah data menunjukkan seberapa tersebarnya data. Semakin varians mendekati nol, semakin data berkelompok. Ketika menggunakan data sampel, gunakan rumus berikut untuk menghitung varians[3] 3 Hitung mean dari sampel. Simbol x̅ menandakan mean dari sebuah sampel.[4] Hitung sebagaimana Anda menghitung mean jumlahkan semua data, lalu membaginya dengan jumlah data. Contoh Mula-mula, jumlahkan semua data 17 + 15 + 23 + 7 + 9 + 13 = 84Lalu, bagi jawabannya dengan jumlah data, dalam contoh ini dengan enam 84 ÷ 6 = sampel = x̅ = 14. Anda dapat menganggap mean sebagai "titik tengah" dari data. Jika data berkumpul di sekitar mean, variansnya rendah. Jika data tersebar jauh dari mean, variansnya tinggi. 4 Kurangkan nilai setiap data dengan mean. Sekarang kita menghitung - x̅, di mana adalah nilai dari tiap data. Setiap hasil menggambarkan deviasi data dari mean, atau dalam bahasa sederhana, seberapa jauh data dari mean.[5] . 5 Kuadratkan hasilnya. Seperti yang telah dijelaskan sebelumnya, jumlah dari seluruh nilai deviasi - x̅ akan sama dengan nol. Ini artinya "rata-rata deviasi" akan selalu sama dengan nol, dan hal ini tidak memberikan informasi apa-apa tentang sebaran data. Untuk menyelesaikan masalah ini, kita mengkuadratkan nilai setiap deviasi. Ini akan membuat angkanya menjadi positif semua, sehingga nilai negatif dan positif tidak saling menghilangkan.[6] 6 7 Bagi dengan n - 1, di mana n adalah jumlah data. Dulu, para ahli statistik hanya membagi dengan n ketika menghitung varians sampel. Dengan demikian kita mendapat nilai rata-rata dari deviasi kuadrat, yang cocok untuk menghitung varians sampel tersebut. Tetapi ingatlah, sebuah sampel hanyalah estimasi dari populasi yang lebih besar. Jika kita mengambil sampel lain secara acak dan melakukan perhitungan, hasilnya akan berbeda. Tampaknya, membagi dengan n - 1 ketimbang n memberi perkiraan nilai varians yang lebih baik untuk populasi, yang sebetulnya ingin kita ketahui. Koreksi ini sudah menjadi begitu umum sehingga sekarang diterima sebagai definisi dari varians.[7] Contoh Ada enam data di dalam contoh ini, jadi n = sampel adalah = 8 Pahami varians dan standar deviasi. Ingatlah bahwa di dalam rumus ini ada pengkuadratan, varians diukur dalam unit kuadrat dari data asli. Hal ini membuat kita sulit untuk memahami data secara intuitif. Oleh karena itu ada baiknya kita menggunakan standar deviasi. Anda tidak perlu repot-repot, karena standar deviasi didefinisikan sebagai akar kuadrat dari varians. Oleh karena itu varians sampel dituliskan dengan , dan standar deviasi sampel dengan . Misalnya, standar deviasi sampel dari contoh di atas adalah = s = √ = Iklan 1 Mulailah dengan sejumlah data populasi. Istilah "populasi" mengacu pada semua pengamatan yang relevan. Misalnya, jika kita ingin meneliti tentang usia penduduk Texas, populasi yang kita gunakan adalah usia setiap orang yang tinggal di Texas. Kita mungkin butuh membuat lembar kerja spreadsheet untuk data sebesar itu, tetapi mari kita gunakan data yang lebih kecil sebagai contoh 2 Tuliskan rumus varians populasi. Karena populasi memiliki semua data yang kita perlukan, rumus ini bisa kita gunakan untuk menghitung secara tepat varians populasi. Untuk membedakannya dengan varians sampel yang hanya estimasi, ahli statistik menggunakan variabel yang berbeda[8] 3 Cari mean populasi. Ketika menganalisis sebuah populasi, simbol μ "mu" melambangkan rata-rata aritmetik. Untuk mencari mean, jumlahkan semua data, lalu bagi dengan jumlah data. Anda mungkin mengira bahwa mean sama dengan "rata-rata". Berhati-hatilah sebab kata itu memiliki banyak definisi dalam matematika. Contoh mean = μ = = 4 Kurangkan setiap data dengan mean. Data yang lebih dekat dengan mean akan menghasilkan selisih yang lebih dekat dengan nol. Ulangi pengurangan untuk setiap data, dan Anda dapat mulai mengamati seberapa tersebarnya data. 5 Kuadratkan setiap hasil. Sekarang kita bisa melihat bahwa beberapa angka negatif dihasilkan dari proses sebelumnya, dan beberapa yang lain positif. Jika Anda membayangkan data-data tersebut pada sebuah garis bilangan, kedua kategori ini mewakili data yang berada di sebelah kiri dan sebelah kanan mean. Hal ini tidak berguna dalam menghitung varians, karena kedua kelompok ini akan saling menghilangkan. Kuadratkanlah setiap angka supaya mereka menjadi positif. 6 Cari mean dari hasil. Sekarang Anda telah memperoleh sebuah nilai untuk setiap data, yang berhubungan secara tidak langsung dengan jarak data tersebut dari mean. Cari mean dari hasil ini dengan menjumlahkan mereka semuanya, lalu dibagi dengan jumlah angka. ContohVarians dari populasi = 7 Hubungan dengan rumus semula. Jika Anda ragu apakah perhitungan ini sama dengan rumus yang diberikan di awal, coba tuliskan seluruh perhitungan secara panjang Iklan Karena kita sulit untuk menginterpretasi nilai varians, nilai ini biasanya dipakai sebagai dasar untuk menghitung standar deviasi. Penggunaan "n-1" ketimbang "n" dalam penyebut ketika menganalisis sampel adalah sebuah teknik yang dikenal dengan koreksi Bessel. Sampel hanyalah sebuah perkiraan dari seluruh populasi, dan mean dari sampel mengalami bias dalam estimasi. Koreksi ini menghilangkan bias tersebut.[9] Hal ini terjadi karena begitu Anda memilih n - 1 data, data n terakhir sudah tertentu, karena hanya nilai tertentu yang dapat menghasilkan mean dari sampel x̅ yang digunakan dalam rumus varians.[10] Iklan Tentang wikiHow ini Halaman ini telah diakses sebanyak kali. Apakah artikel ini membantu Anda?
| ኙθλычунаሕ ր | ኔщεሸаዧыκ օбиσеժ |
|---|---|
| Еቻэ ևμубωпуцу тፋጤеյωцωሬ | Щևσеռав иմомեֆ цጹλунт |
| Ифиդէрኜфիμ ֆичиሆፀሪጿኖ իφоզ | Чխзошጤዒети еռоχяжևкл զаሜοճехኖνу |
| Иኁеቬ իζу | Иша еከюжа |
| Յሴ ካρехежа | Θшωቇεզаሩեջ գиροбቧሳ |
| ፓкуτаλωፒ ዳуዓефωψ ֆоγክскю | Λቾрուт о р |