Interval kapercayaan

Ti Wikipédia, énsiklopédia bébas
Luncat ka: pituduh, sungsi

Dina statistik, interval kapercayaan (en:Confidence interval) nyaéta wangun anu ilahar tina interval estimasi. Lamun U jeung V ngarupakeun statistik (i.e., variabel acak nu "bisa diobservasi" ) numana sebaran kamungkinan gumantung kana sababaraha parameter θ nu teu katalungtik, jeung hubunganna

P(U<\theta<V)=0.9

saterusna random interval (U,V) nyaeta "90% interval kapercayaan keur θ".

Kumaha bisa salah harti interval kapercayaan[édit | sunting sumber]

Hal nu matak kataji dina kasalahan nangtukeun kaputusan saperti nu bakal dijelaskeun. Urang ngagunakeun hurup gede U jeung V keur variabel acak; ilaharna ngagunakeun hurup leutik u jeung v keur nilai nu ka observasi. Salah harti dina nyimpulkeun nyaeta yen

P(u<\theta<v)=0.9,

sanggeus data di-observasi, sebaran probabiliti kondisional θ, tina data nu diberekeun dijadikeun kasimpulan. Conto, anggap X kasebar normal mibanda nilai ekspektasi θ sarta varian 1. (Jelas pisan yen teu realistik keur nangtukeun nilai varian, sedengkeun nilai ekspektasi kudu disimpulkeun tina data, tapi ieu ngan sakadar keur conto nu basajan). Variabel acak X ka-observasi. (Variabel acak X − θ salah sahiji conto nu teu ka-observasi, nilaina gumantung kana θ.) Mangka X - θ kasebar normal mibanda nilai ekspektasi 0 sarta varian 1; saterusna

P(-1.645<X-\theta<1.645)=0.9.

Akibatna

P(X-1.645<\theta<X+1.645)=0.9,

mangka interval ti X − 1.645 nepi ka X + 1.645 mibanda interval kapercayaan 90% keur θ. Tapi waktu X = 82 ka-observasi, naha bisa disebutkeun yen

P(82-1.645<\theta<82+1.645)=0.9\  \mbox{?}

Kasimpulan eta teu nuturkeun hukum probabiliti sabab θ lain "variabel acak"; i.e., taya sebaran probabiliti nu nangtukeun hal eta. Interval kapercayaan sacara umum mangrupa metoda frekuensi, i.e., dipake ku anu naksir "probabilti 90%" salaku "90% kajadian dina sakabeh kasus". Conto, θ sarua jeung massa planet Neptunus, sarta sacara acak urang ngukur kasalahan rata-rata 90% tina waktu tetapan mangka massa tina wilangan ieu jeung wilangan nu bakal aya ngarupakeun nilai nu bener. Massa lain ngarupakeun hal nu acak. Sanajan kitu, mun urang boga nilai ukuran 82 satuan, urang teu bisa nyebutkeun yen hal eta aya dina 90% keur sakabeh kasus, massa antara 82 − 1.645 jeung 82 + 1.645.

Tapi lamun probabiliti ditaksir salaku tingkat kapercayaan tinimbang frekuensi relatif dina kajadian variabel acak, i.e., dina hal ieu make Bayesians tinimbang frekuensi, bisa disebutkeun yen urang yakin 90% massa antara 82 − 1.645 jeung 82 + 1.645? Loba jawaban keur hal ieu anu diusulkeun sarta sacara filosofi kontroversial. Jawaban lain dumasar kana teorema matematik, tapi kana filosofi.

Keur nu nganut metoda frekuensi, cara ngajelaskeun interval kapercayaan saperti kieu: "Interval kapercayaan ngagambarkeun nilai keur parameter populasi keur ngabedakeun antara estimasi parameter jeung observasi taya hartina sacara statistik dina tingkat 10%". Kritik metoda frekuensi nyaeta nyumputkeun kaayaan nu sabenerna sarta pamahaman kana ieu metoda bisa dijelaskeun saperti kieu: "Lamun populasi parameter aya di jero interval kapercayaan, mangka probiliti nu di estimasi bakal milu ka observasi atawa bakal deukeut kana parameter, hartina kurang atawa sarua jeung 90%". Nu make metoda Bayesian, lamun maranehna ngahasilkeun interval kapercayaan, sacara jelas bakal ngomong "Kuring percaya yen parameter di kanyataanna dina interval kapercayaan 90%".

Conto praktis kongkrit[édit | sunting sumber]

Dina kaca ieu salah sahiji conto nu leuwih ilahar dipake. Anggap X1, ..., Xn ngarupakeun sampel bebas tina populasi sebaran normal nu mibanda mean μ sarta variance σ2. Tempo

\overline{X}=(X_1+\cdots+X_n)/n,
S^2=\frac{1}{n-1}\sum_{i=1}^b\left(X_i-\overline{X}\,\right)^2.

Mangka

T=\frac{\overline{X}-\mu}{S/\sqrt{n}}

mibanda sebaran-t student numana n − 1 nyaeta tingkat kabebasan. Catetan yen ieu sebaran teu gumantung kana nilai parameter μ and σ2 nu teu ka-observasi; i.e., ngarupakeun pivotal quantity. Lamun c ngarupakeun persentil nu ka-95 tina ieu sebaran, mangka

P\left(-c<T<c\right)=0.9.

(Catetan: "95" sarta "90" bener; ieu sering dipake keur ngurangan kasalahan.)

Akibatna

P\left(\overline{X}-cS/\sqrt{n}<\mu<\overline{X}+cS/\sqrt{n}\right)=0.9

sarta urang mibanda confidence interval 90% keur μ.

Tempo oge[édit | sunting sumber]