median. Teori terperinci dengan contoh. Median himpunan bilangan adalah Cara mencari median terbesar suatu segitiga

Tendensi sentral suatu data dapat dianggap tidak hanya sebagai nilai dengan deviasi total nol (rata-rata aritmatika) atau frekuensi maksimum (mode), tetapi juga sebagai suatu tanda (nilai agregat) yang membagi data yang diberi peringkat (diurutkan dalam urutan menaik atau menurun) menjadi dua bagian yang sama. Separuh dari data asli kurang dari angka ini, dan separuh lagi lebih. Begitulah adanya median.

Jadi, median dalam statistik adalah tingkat indikator yang membagi kumpulan data menjadi dua bagian yang sama besar. Nilai pada separuhnya lebih kecil dari median dan separuh lainnya lebih besar dari median. Sebagai contoh, mari kita lihat sekumpulan angka acak.

Jelasnya, dengan distribusi simetris, bagian tengah yang membagi populasi menjadi dua akan ditempatkan di bagian paling tengah - di tempat yang sama dengan mean (dan mode) aritmatika. Bisa dikatakan, ini adalah situasi ideal ketika modus, median, dan mean aritmatika bertepatan dan semua propertinya berada pada satu titik - frekuensi maksimum, separuh, jumlah deviasi nol - semuanya di satu tempat. Namun kehidupan tidak simetris seperti distribusi normal.

Katakanlah kita berurusan dengan pengukuran teknis penyimpangan dari nilai yang diharapkan dari sesuatu (isi elemen, jarak, level, massa, dll., dll.). Jika semuanya baik-baik saja, maka kemungkinan besar penyimpangan-penyimpangan tersebut akan terdistribusi menurut hukum yang mendekati normal, kira-kira seperti pada gambar di atas. Tetapi jika ada faktor penting dan tidak dapat dikendalikan dalam proses tersebut, maka mungkin muncul nilai-nilai anomali yang akan mempengaruhi mean aritmatika secara signifikan, tetapi hampir tidak akan mempengaruhi median.

Median sampel merupakan alternatif dari mean aritmatika, karena tahan terhadap penyimpangan abnormal (outlier).

Matematis milik median adalah jumlah deviasi absolut (modulo) dari nilai median memberikan nilai minimum yang mungkin jika dibandingkan dengan deviasi dari nilai lainnya. Bahkan kurang dari rata-rata aritmatika, oh betapa hebatnya! Fakta ini diterapkan, misalnya, ketika menyelesaikan masalah transportasi, ketika perlu menghitung lokasi pembangunan objek di dekat jalan sedemikian rupa sehingga total panjang penerbangan ke sana dari berbagai tempat menjadi minimal (halte, pompa bensin , gudang, dll., dll..).

Rumus median dalam statistik untuk terpisah data agak mengingatkan pada formula mode. Yakni karena tidak ada rumus seperti itu. Nilai median dipilih dari data yang tersedia dan hanya jika hal ini tidak memungkinkan, perhitungan sederhana dilakukan.

Pertama-tama, data diurutkan (diurutkan dalam urutan menurun). Selanjutnya ada dua pilihan. Jika banyaknya nilai ganjil, maka mediannya akan sesuai dengan nilai pusat deret tersebut, yang banyaknya dapat ditentukan dengan rumus:

Tidak, aku– jumlah nilai yang sesuai dengan median,

N– jumlah nilai dalam kumpulan data.

Kemudian median dilambangkan sebagai

Ini adalah pilihan pertama ketika ada satu nilai sentral dalam data. Opsi kedua terjadi ketika jumlah datanya genap, artinya, bukan satu, ada dua nilai pusat. Solusinya sederhana: ambil mean aritmatika dari dua nilai sentral:

DI DALAM data interval Tidak mungkin untuk memilih nilai tertentu. Median dihitung menurut aturan tertentu.

Untuk memulainya (setelah memeringkat data), temukan interval median. Ini adalah interval yang dilalui oleh nilai median yang diinginkan. Ditentukan dengan menggunakan akumulasi bagian dari interval peringkat. Jika akumulasi bagian pertama melebihi 50% dari seluruh nilai, terdapat interval median.

Saya tidak tahu siapa yang mengemukakan rumus median, tetapi rumus tersebut jelas didasarkan pada asumsi bahwa sebaran data dalam interval median adalah seragam (yaitu 30% dari lebar interval adalah 30% nilai, 80% dari lebar interval. lebarnya adalah 80% dari nilai, dll.) . Dari sini diketahui banyaknya nilai dari awal interval median hingga 50% dari seluruh nilai dalam populasi (selisih antara setengah jumlah semua nilai dan frekuensi akumulasi interval pra-median ), Anda dapat mengetahui proporsi yang ditempatinya di seluruh interval median. Bagian ini secara tepat ditransfer ke lebar interval median, yang menunjukkan nilai tertentu, yang selanjutnya disebut median.

Mari kita lihat diagram visualnya.

Ternyata agak rumit, tapi sekarang saya harap semuanya jelas dan bisa dimengerti. Untuk menghindari menggambar grafik seperti itu setiap kali menghitung, Anda dapat menggunakan rumus yang sudah jadi. Rumus mediannya adalah sebagai berikut:

Di mana x Saya- batas bawah interval median;

saya saya- lebar interval median;

∑f/2- banyaknya seluruh nilai dibagi 2 (dua);

S(Saya-1)- jumlah total observasi yang terakumulasi sebelum dimulainya interval median, mis. akumulasi frekuensi interval premedian;

fSaya- jumlah observasi dalam interval median.

Seperti yang mudah dilihat, rumus median terdiri dari dua suku: 1 – nilai awal interval median dan 2 – bagian yang sebanding dengan akumulasi bagian yang hilang hingga 50%.

Misalnya, mari kita hitung median menggunakan data berikut.

Anda perlu mencari harga median, yaitu harga yang lebih murah dan lebih mahal dari setengah jumlah barang. Untuk memulainya, kami akan membuat perhitungan tambahan dari akumulasi frekuensi, akumulasi bagian, dan jumlah total barang.

Dengan menggunakan kolom terakhir "Akumulasi bagian" kami menentukan interval median - 300-400 rubel (akumulasi bagian lebih dari 50% untuk pertama kalinya). Lebar interval – 100 gosok. Sekarang tinggal mengganti data ke dalam rumus di atas dan menghitung median.

Artinya, separuh barang memiliki harga lebih rendah dari 350 rubel, dan separuh lainnya memiliki harga lebih tinggi. Itu mudah. Rata-rata aritmatika, dihitung menggunakan data yang sama, adalah 355 rubel. Perbedaannya tidak signifikan, tapi memang ada.

Hitung median di Excel

Mencari median data numerik dengan mudah menggunakan fungsi Excel yang disebut - MEDIAN. Data interval adalah masalah lain. Tidak ada fungsi yang sesuai di Excel. Oleh karena itu, Anda perlu menggunakan rumus di atas. Apa yang bisa kau lakukan? Namun hal ini tidak terlalu tragis, karena penghitungan median dari data interval jarang terjadi. Anda dapat menghitung satu kali dengan kalkulator.

Akhirnya, saya menawarkan masalah. Ada kumpulan data. 15, 5, 20, 5, 10. Berapa rata-ratanya? Empat pilihan:

Modus, median, dan mean sampel adalah cara berbeda untuk menentukan tendensi sentral dalam suatu sampel.

  • Selain rata-rata daya dalam statistik, untuk karakterisasi relatif dari nilai karakteristik yang bervariasi dan struktur internal deret distribusi, digunakan rata-rata struktural, yang terutama diwakili oleh mode dan median.

    Mode- Ini adalah varian seri yang paling umum. Fashion digunakan misalnya dalam menentukan ukuran pakaian dan sepatu yang paling diminati pelanggan. Modus rangkaian diskrit adalah modus yang frekuensinya paling tinggi. Saat menghitung modus untuk rangkaian variasi interval, Anda harus terlebih dahulu menentukan interval modal (berdasarkan frekuensi maksimum), dan kemudian nilai nilai modal atribut menggunakan rumus:

    median - ini adalah nilai atribut yang mendasari rangkaian peringkat dan membagi rangkaian ini menjadi dua bagian yang sama besar.

    Untuk menentukan mediannya dalam seri diskrit jika frekuensi tersedia, pertama-tama hitung setengah jumlah frekuensi, lalu tentukan nilai varian mana yang termasuk di dalamnya. (Jika deret yang diurutkan mempunyai jumlah fitur ganjil, maka jumlah median dihitung menggunakan rumus:

    M e = (n (jumlah total fitur) + 1)/2,

    dalam hal jumlah fitur genap, mediannya akan sama dengan rata-rata dua fitur di tengah baris).

    Saat menghitung median untuk deret variasi interval Pertama, tentukan interval median di mana median tersebut berada, kemudian tentukan nilai median tersebut dengan menggunakan rumus:

    Contoh. Temukan modus dan mediannya.

    Larutan:
    Dalam contoh ini, interval modal berada pada kelompok umur 25-30 tahun, karena interval ini memiliki frekuensi tertinggi (1054).

    Mari kita hitung besarnya modus:

    Artinya modal usia peserta didik adalah 27 tahun.

    Mari kita hitung mediannya. Interval mediannya adalah pada kelompok umur 25-30 tahun, karena dalam interval tersebut terdapat pilihan yang membagi penduduk menjadi dua bagian yang sama besar (Σf i /2 = 3462/2 = 1731). Selanjutnya, kita mengganti data numerik yang diperlukan ke dalam rumus dan mendapatkan nilai median:

    Artinya, separuh siswa berusia di bawah 27,4 tahun, dan separuh lainnya berusia di atas 27,4 tahun.

    Selain modus dan median, indikator seperti kuartil dapat digunakan, membagi rangkaian peringkat menjadi 4 bagian yang sama, desil -10 bagian, dan persentil - menjadi 100 bagian.

    Modus dan median– jenis rata-rata khusus yang digunakan untuk mempelajari struktur deret variasi. Kadang-kadang disebut rata-rata struktural, berbeda dengan rata-rata daya yang telah dibahas sebelumnya.

    Mode– ini adalah nilai suatu karakteristik (varian) yang paling sering ditemukan pada suatu populasi tertentu, yaitu mempunyai frekuensi tertinggi.

    Fashion memiliki penerapan praktis yang besar dan dalam beberapa kasus hanya fashion yang dapat mencirikan fenomena sosial.

    median- Ini adalah varian yang berada di tengah-tengah rangkaian variasi yang dipesan.

    Median menunjukkan batas kuantitatif dari nilai suatu karakteristik yang bervariasi, yang telah dicapai oleh setengah unit populasi. Disarankan menggunakan median bersama dengan rata-rata atau sebagai gantinya jika terdapat interval terbuka dalam deret variasi, karena untuk menghitung median, penetapan batas-batas interval terbuka secara kondisional tidak diperlukan, dan oleh karena itu kurangnya informasi tentangnya tidak mempengaruhi keakuratan penghitungan median.

    Median juga digunakan ketika indikator yang akan dijadikan bobot tidak diketahui. Median digunakan sebagai pengganti mean aritmatika dalam metode statistik pengendalian kualitas produk. Jumlah deviasi absolut pilihan dari median lebih kecil dibandingkan dengan angka lainnya.

    Mari kita perhatikan penghitungan modus dan median dalam deret variasi diskrit :

    Tentukan modus dan mediannya.

    Mode Mo = 4 tahun, karena nilai ini sesuai dengan frekuensi tertinggi f = 5.

    Itu. jumlah pekerja terbesar memiliki pengalaman 4 tahun.

    Untuk menghitung median, pertama-tama kita cari setengah jumlah frekuensinya. Jika jumlah frekuensinya ganjil, pertama-tama kita tambahkan satu ke jumlah ini, lalu bagi dua:

    Median akan menjadi pilihan kedelapan.

    Untuk menemukan opsi mana yang kedelapan berdasarkan angka, kita akan mengumpulkan frekuensi sampai kita mendapatkan jumlah frekuensi yang sama dengan atau lebih besar dari setengah jumlah semua frekuensi. Opsi yang sesuai adalah median.

    Ya ampun = 4 tahun.

    Itu. setengah dari pekerja memiliki pengalaman kurang dari empat tahun, setengahnya lagi.

    Jika jumlah akumulasi frekuensi terhadap satu opsi sama dengan setengah jumlah frekuensi, maka median didefinisikan sebagai mean aritmatika dari opsi ini dan opsi berikutnya.

    Perhitungan modus dan median dalam deret variasi interval

    Modus dalam deret variasi interval dihitung dengan rumus

    Di mana X M0- batas awal interval modal,

    HM 0 – nilai interval modal,

    FM 0 , FM 0-1 , FM 0+1 – frekuensi masing-masing interval modal sebelum dan sesudah interval modal.

    Modal Interval yang sesuai dengan frekuensi tertinggi disebut.

    Contoh 1

    Kelompokkan berdasarkan pengalaman

    Jumlah pekerja, orang

    Frekuensi terakumulasi

    Tentukan modus dan mediannya.

    Interval modal, karena itu sesuai dengan frekuensi tertinggi f = 35. Maka:

    Hm 0 =6, fm 0 =35

    HM 0 =2, fm 0-1 =20

    fm 0+1 =11

    Kesimpulan: Jumlah pekerja terbanyak mempunyai pengalaman kurang lebih 6,7 tahun.

    Untuk deret interval, Me dihitung menggunakan rumus berikut:

    Di mana Hm e– batas bawah interval medial,

    Hmm e– ukuran interval medial,

    – setengah jumlah frekuensi,

    fm e– frekuensi interval median,

    Sm e-1– jumlah akumulasi frekuensi interval sebelum median.

    Interval median adalah interval yang sesuai dengan frekuensi kumulatif yang sama dengan atau lebih besar dari setengah jumlah frekuensi.

    Mari kita tentukan median untuk contoh kita.

    karena 82>50, maka interval mediannya adalah .

    Hm e =6, fm e =35,

    Hmm e =2, Sm e-1 =47,

    Kesimpulan: Separuh pekerja mempunyai pengalaman kurang dari 6,16 tahun, dan separuh lagi mempunyai pengalaman lebih dari 6,16 tahun.

    Teori singkat

    Yang paling banyak digunakan dalam statistik adalah sarana struktural, yang meliputi modus dan median (rata-rata nonparametrik).

    Mode- nilai suatu karakteristik (varian) yang terjadi pada rangkaian distribusi dengan frekuensi (bobot) tertinggi. Fashion (Mo) digunakan untuk mengidentifikasi nilai suatu karakteristik yang paling tersebar luas (harga di pasar di mana jumlah penjualan terbesar suatu produk dilakukan, jumlah sepatu yang paling banyak diminati pembeli, dll. .). Modus tersebut hanya digunakan pada populasi dalam jumlah besar. Dalam rangkaian diskrit, modus ditemukan sebagai varian yang memiliki frekuensi tertinggi. Pada deret interval, pertama-tama ada interval modal, yaitu interval dengan frekuensi tertinggi, kemudian - nilai perkiraan nilai modal atribut sesuai dengan rumus:

    – batas bawah interval modal

    - nilai interval modal

    – frekuensi interval sebelum modal

    – frekuensi interval modal

    – frekuensi interval mengikuti modal

    Kuantil- besaran yang membagi suatu himpunan menjadi sejumlah elemen dengan bagian yang sama. Kuantil yang paling terkenal adalah median, yang membagi populasi menjadi dua bagian yang sama besar. Selain median, kuartil sering digunakan, membagi rangkaian peringkat menjadi 4 bagian yang sama, desil - 10 bagian, dan persentil - menjadi 100 bagian.

    median- nilai atribut untuk suatu unit yang terletak di tengah-tengah rangkaian rangking (terurut). Jika suatu deret distribusi diwakili oleh nilai-nilai tertentu dari suatu sifat, maka median (Me) ditemukan sebagai nilai tengah dari sifat tersebut.

    Jika deret distribusinya diskrit, maka median ditemukan sebagai nilai tengah atribut (misalnya, jika jumlah nilainya ganjil - 45, maka itu sesuai dengan nilai atribut ke-23 dalam serangkaian nilai. ​​diurutkan dalam urutan menaik, jika jumlah nilainya genap - 44, maka mediannya adalah setengah dari jumlah nilai karakteristik 22 dan 23).

    Jika deret distribusinya adalah interval, maka carilah median interval yang berisi satuan yang terletak di tengah-tengah deret rangking tersebut. Untuk menentukan interval ini, jumlah frekuensi dibagi dua dan, berdasarkan akumulasi berurutan (penjumlahan) frekuensi interval, mulai dari yang pertama, ditemukan interval di mana median berada. Nilai median suatu deret interval dihitung dengan menggunakan rumus:

    - batas bawah interval median

    - nilai interval median

    Jumlah deret frekuensi

    – jumlah akumulasi frekuensi dalam interval sebelum median

    – frekuensi interval median

    Kuartil- ini adalah nilai karakteristik dalam rangkaian peringkat, dipilih sedemikian rupa sehingga 25% unit dalam populasi akan lebih kecil dari nilainya, 25% unit akan berada di antara dan; 25% berada di antara dan , 25% sisanya melebihi . Kuartil ditentukan dengan menggunakan rumus yang mirip dengan rumus menghitung median. Untuk deret interval:

    Desil adalah variabel struktural yang membagi sebaran menjadi 10 bagian yang sama sesuai dengan jumlah unit dalam populasi. Ada 9 desil, dan kelompok desil 10. Desil ditentukan dengan menggunakan rumus yang mirip dengan rumus menghitung median dan kuartil.

    Secara umum rumus umum menghitung kuantil pada deret interval adalah sebagai berikut:

    – bilangan urut kuantil

    – dimensi kuantil (berapa banyak bagian kuartil yang membagi populasi)

    – batas bawah interval kuantil

    – lebar interval kuantil

    Frekuensi kumulatif dari interval prakuantil

    Untuk deret diskrit, bilangan kuantil dapat dicari dengan menggunakan rumus:

    Contoh penyelesaian masalah

    Kondisi tugas 1 (seri peringkat diskrit)

    Sebagai hasil penelitian, rata-rata pendapatan bulanan penduduk satu pintu masuk ditetapkan:

    Mendefinisikan:

    Pendapatan modal dan median, kuantil dan desil pendapatan.

    Solusi dari masalah tersebut

    Kami sudah memiliki rangkaian peringkat - nilai pendapatan penduduk didistribusikan dalam urutan menaik.

    Fashion adalah arti yang paling umum. Dalam hal ini kami memiliki seri dengan dua mode.

    Median adalah nilai atribut yang membagi kumpulan data terurut menjadi dua.

    Kuartil adalah nilai suatu karakteristik dalam rangkaian peringkat, dipilih sedemikian rupa sehingga 25% unit dalam populasi akan lebih kecil dari nilainya; 25% unit akan berada di antara dan ; 25% - antara dan ; 25% sisanya lebih unggul.

    Dicili membagi baris menjadi 10 bagian yang sama:

    Jika Anda tidak membutuhkan bantuan saat ini, tetapi mungkin membutuhkannya di masa mendatang, agar tidak kehilangan kontak, bergabunglah dengan grup VK.

    Kondisi masalah 2 (rangkaian interval)

    Untuk mengetahui rata-rata besar simpanan pada suatu lembaga perkreditan diperoleh data sebagai berikut:

    Hitung rata-rata struktural (mode, median, kuartil).

    Solusi dari masalah tersebut

    Mari kita hitung cara besarnya kontribusi:

    Mode adalah pilihan yang sesuai dengan frekuensi tertinggi.

    Modusnya dihitung dengan rumus:

    Mulai dari interval modal

    Ukuran interval

    Frekuensi interval modal

    Frekuensi interval sebelum modal

    Frekuensi interval mengikuti modal

    Dengan demikian, jumlah simpanan terbesar adalah sebesar 30,7 ribu rubel.

    Median adalah opsi yang terletak di tengah rangkaian distribusi.

    Median dihitung menggunakan rumus:

    Awal (batas bawah) dari interval median

    Ukuran interval

    Jumlah semua frekuensi rangkaian

    Frekuensi interval median

    Jumlah akumulasi frekuensi varian ke median

    Jadi, setengah dari simpanan berjumlah hingga 28 ribu rubel, separuh lainnya lebih dari 28 ribu rubel.

    Mari kita hitung kuantilnya:

    Jadi, 25% simpanan bernilai kurang dari 20,8 ribu rubel, 25% simpanan berada dalam kisaran 20,8 ribu rubel. hingga 28 ribu rubel, 25% berada di kisaran 28 ribu rubel. hingga 33 ribu rubel, 25% lebih tinggi dari nilai 33 ribu rubel.

    Kondisi masalah 3

    Buatlah grafik untuk deret variasi. Tunjukkan modus, median, mean, dan kuartil pada grafik.

    Solusi untuk masalah 3

    Mari kita hitung rata-ratanya: Untuk melakukan ini, jumlahkan hasil kali titik tengah interval dan frekuensi yang bersesuaian, dan bagi jumlah yang dihasilkan dengan jumlah frekuensi.

    median- ini adalah nilai atribut yang membagi rangkaian distribusi peringkat menjadi dua bagian yang sama - dengan nilai atribut lebih kecil dari median dan dengan nilai atribut lebih besar dari median. Untuk mencari median, Anda perlu mencari nilai atribut yang berada di tengah deret terurut.

    Lihat solusi dari masalah mencari modus dan median Kamu bisa

    Dalam rangkaian peringkat, data tidak dikelompokkan untuk menemukan mediannya direduksi menjadi mencari nomor seri median. Median dapat dihitung dengan menggunakan rumus berikut:

    dimana Xm adalah batas bawah interval median;
    saya - interval median;
    Sme adalah jumlah observasi yang diakumulasikan sebelum dimulainya interval median;
    fme adalah jumlah observasi pada interval median.

    Properti median

    1. Median tidak bergantung pada nilai atribut yang terletak di kedua sisinya.
    2. Operasi analitik dengan median sangat terbatas, sehingga ketika menggabungkan dua distribusi dengan median yang diketahui, tidak mungkin untuk memprediksi terlebih dahulu nilai median dari distribusi baru.
    3. Mediannya punya properti minimalis. Esensinya terletak pada kenyataan bahwa jumlah simpangan mutlak nilai x dari median adalah nilai minimum dibandingkan dengan simpangan X dari nilai lainnya.

    Definisi grafis median

    Untuk menentukan median dengan metode grafis Mereka menggunakan frekuensi akumulasi dari mana kurva kumulatif dibangun. Simpul ordinat yang sesuai dengan akumulasi frekuensi dihubungkan oleh segmen lurus. Dengan membagi ordinat terakhir menjadi dua, yang sesuai dengan jumlah total frekuensi, dan menggambar perpotongan tegak lurus dengan kurva kumulatif, ordinat dari nilai median yang diinginkan ditemukan.

    Pengertian fashion dalam statistik

    Fashion - nilai atribut, yang memiliki frekuensi tertinggi dalam rangkaian distribusi statistik.

    Definisi mode dihasilkan dengan cara yang berbeda-beda, dan ini bergantung pada apakah karakteristik yang bervariasi disajikan dalam bentuk deret diskrit atau interval.

    Menemukan mode dan median dilakukan hanya dengan melihat kolom frekuensi. Di kolom ini, temukan angka terbesar yang mencirikan frekuensi tertinggi. Ini sesuai dengan nilai tertentu dari atribut, yaitu mode. Dalam rangkaian variasi interval, modus kira-kira dianggap sebagai varian sentral dari interval dengan frekuensi tertinggi. Dalam rangkaian distribusi seperti itu mode dihitung dengan rumus:

    dimana XMo adalah batas bawah interval modal;
    imo - interval modal;
    fм0, fм0-1, fм0+1 - frekuensi dalam modal, interval modal sebelumnya dan berikutnya.

    Interval modal ditentukan oleh frekuensi tertinggi.

    Fashion banyak digunakan dalam praktik statistik ketika menganalisis permintaan konsumen, mencatat harga, dll.

    Hubungan antara mean aritmatika, median dan modus

    Untuk deret simetris unimodal, distribusi, median, dan modusnya bertepatan. Untuk distribusi asimetris keduanya tidak sama.

    K. Pearson, berdasarkan penyelarasan berbagai jenis kurva, menetapkan bahwa untuk distribusi asimetris sedang, perkiraan hubungan antara mean aritmatika, median, dan modus berikut ini valid: