Simpangan baku

Ti Wikipédia, énsiklopédia bébas
Luncat ka: pituduh, sungsi

Dina probabilitas jeung statistika, simpangan baku biasa digunakeun keur ngukur statistical dispersion. Simpangan baku diartikeun ogé akar kuadrat tina varian. Hal ieu dimaksudkeun keur ngukur "dispersi" nyaéta 1) angka non-négatif; jeung 2) miboga unit nu sarua jeung datana.

Bisa dibédakeun antara simpangan baku σ (sigma) tina populasi atawa variabel acak, jeung simpangan baku s tina sampel. Rumusna dijelaskeun di handap.

Watesan simpangan baku dina statistik mimiti dikenalkeun ku Karl Pearson (On the dissection of asymmetrical frequency curves, 1894).

Interprétasi jeung Pamakéan[édit | sunting sumber]

Sacara gampang, simpangan baku nyebutkeun sabaraha jauh unggal anggota sampel atawa populasi tina nilai mean sampel atawa populasi. Nilai simpangan baku anu gede nunjukkeun yen anggota anggota nu dimaksud jauh tina mean. Nilai simpangan baku leutik nunjukkeun yen anggota nu dimaksud raket atawa aya sabudeureun mean.

Conto, susunan {0,5,9,14} jeung {5,6,8,9} ngabogaan nilai mean 7, tapi nilai susunan data nu kadua ngabogaan nilai simpangan baku anu leuwih leutik.

Simpangan baku oge biasa dipake keur ngukur kateupastian. Conto dina elmu fisika, waktu ngalakukeun "pengulangan" measurements simpangan baku tina pengukuran nyaeta precision tina eta pengukuran. Waktu keur mutuskeun yen ukuran sarua jeung prediksi, ukuran simpangan baku ngarupakeun hal anu kacida pentingna: lamun ukuran kacida jauhna tina prediksi (ku jarak ukuran simpangan baku), bisa dianggap yen ukuran patojaiah jeung prediksi. Hal ieu ngajadikeun pamikiran yen rentang nilaina kaluar tina anu diperkirakeun lamun prediksina bener. Tempo prediction interval.

Harti jeung cara pondok ngukur simpangan baku[édit | sunting sumber]

Anggap nilai tina hiji populasi x1,...,xN (nu ngarupakeun wilangan riil). Mean populasi dirumuskeun ku

\overline{x}=\frac{1}{N}\sum_{i=1}^N x_i

(tempo kumpulan notasi) sarta simpangan baku populasi dirumuskeun ku

\sigma = \sqrt{\frac{1}{N} \sum_{i=1}^N (x_i - \overline{x})^2}

Cara gampang ngitung simpangan baku dina jumlah nu sarua dirumuskeun ku

\sigma = \sqrt{{\sum_{i=1}^N{{x_i}^2}\over{N}}-\left({\sum_{i=1}^N{x_i}\over{N}}\right)^2}

Simpangan baku variabel acak X diartikeun ku

\sigma = \sqrt{\operatorname{E}((X-\operatorname{E}X)^2)} = \sqrt{\operatorname{E}(X^2) - (\operatorname{E}(X))^2}

Catetan yen teu sakabeh variabel random mibanda simpangan baku, lamun nilai ekspektasi euweuh. Lamun variabel random X dicokot tina nilai x1,...,xN ku probabiliti nu sarua, simpangan baku bisa diitung make rumus samemehna.

Dina kaayan nilai sampel x1,...,xn ti populasi nu gede, sababaraha pangarang ngartikeun sampel simpangan baku ku


s = \sqrt{\frac{1}{n-1} \sum_{i=1}^N (x_i - \overline{x})^2}

Alesan keur harti ieu yen s2 ngarupakeun unbiased estimator keur varian σ2 ti populasi. Catetan s sorangan lain unbiased estimator keur simpangan baku σ; hal ieu cenderung underestimate ti populasi simpangan baku.

Aturan keur data sebaran normal[édit | sunting sumber]

Dina praktekna, biasa diasumsikeun yen data ngabogaaan sebaran normal. Lamun asumsi ieu bisa diyakinkeun, mangka nilai 68% dina 1 simpangan baku jauh tina mean, nilai 95% dina dua simpangan baku jauh tina mean, sarta nilai 99.7% nutupan dijero 3 simpangan baku tina mean. Ieu dikanyahokeun salaku "aturan 68-95-99.7".

Hubungan simpangan baku jeung mean[édit | sunting sumber]

Mean jeung simpangan baku tina susunan data ngarupakeun hal nu raket sarta umumna ditulis babarengan. Hal nu penting, simpangan baku nyaeta ukuran "alami" dispersi statistik lamun pusat data diukur ku mean. Rumus pastina nyaeta: suppose x1,...,xN are real numbers and define the function

\sigma(r) = \sqrt{\frac{1}{N} \sum_{i=1}^N (x_i - r)^2}

Ngagunakeun kalkulus, teu hese keur nembongkeun yen σ(r) mibanda unique minimum keur

r = \overline{x}

Interpretasi geometrik[édit | sunting sumber]

Keur ngarti geometri leuwih jentre, urang mimitian ku populasi tina tilu nilai, x1,x2,x3. Hartina yen titik P= (x1,x2,x3) aya dina R3. Anggap garis L = {(r,r,r) : r aya dina R}. Ieu ngarupakeun "diagonal utama" nu ngaliwatan aslina. Lamun tilu nilai tadi sarua, mangka simpangan baku sarua jeung nol sarta P bakal nutupan L. Mangka taya alesan ke nganggap simpangan baku pakait jeung jarak P ka L. Ieu ngarupakeun kasus nu bener. Pindah ortogonalitas ti P kana garis L, salah sahiji titik sasaran

R = (\overline{x},\overline{x},\overline{x})

numana kordinat nilai mean dimimitian. Aljabar sederhana nunjukeun yen jarak antara P jeung R (hartina sarua jeung jarak antara P jeung garis L) dirumuskeun ku σ√3. Rumus analogna (3 digantikeun ku N) oge valid keur populasi nilai N values; mangka saterusna dinaRN.

Simpangan baku salaku tingkat kapercayaan[édit | sunting sumber]

Dina percobaan ilmiah, hiji kapercayaan tina ukuran kajadian ngarupakeun hasil tina signal tinimbang ngan sakadar tina ramalan statistik. Mangka luhurna tingkat kapercayaan, ngarupakeun ukuran kajadian tinimbang ramalan.

Artikel pakait[édit | sunting sumber]