Sebaran sampling

Ti Wikipédia, énsiklopédia bébas
Luncat ka: pituduh, sungsi


Dina statistik, sebaran sampling nyaeta sebaran probabiliti, dina kaayaan sampling dina populasi diulang, tina statistik nu diberekeun (kuantitas numerik diitung tina nilai data dina sample).

Bentuk (atawa rumus keur) sebaran sampling gumantung kana sebaran populasi, statistik nu ditempo sarta ukuran sampel nu dipake.

(Catetan yen rumus nu leuwih presisi nyebutkeun yen sebaran statistik bisa dipake keur sakabeh sampel nu mungkin tina ukuran nu diberekeun, henteu ngan sakadar "dina kaayaan sampling diulang".)

Contona, anggap populasi nu kacida gedena nuturkeun normal (ilaharna disebut kurva bel). Asumsi urang mindo nyokot sampe dina sampel nu diberekeun tina populasi sarta ngitung sample mean (arithmetic mean nilai data) keur unggal sampel. Sampel nu beda bakal mangaruhan kana bedana sampel means. Sebaran mean ieu nyaeta "sebaran sampling tina sampel mean" (keur ukuran sampel nu diberekeun). Sebaran ieu bakal jadi normal saprak populasina normal. (Dumasar kana teorema central limit, lamun populasi teu normal tapi "bentukna cukup hade", sebaran sampling tina sampel mean bakal masih keneh cukup normal sanajan ukuran sampel kacida gedena).

Simpangan baku tina sebaran sampling ngacu ka standar kasalahan (statistis) sarta di-estimasi make rumus:

\frac{\sigma}{\sqrt{N}}

numana \sigma mgarupakeun simpangan baku tina sebaran populasi sarta N nyaeta ukuran sampe (jumlah barang) dina sampel.

Hal nu penting dina rumus ieu nyaeta kudu ngalikeun opat kali ukuran sampel (4X) ngarah ukuran kasalahanna jadi (1/2). Waktu rarangkay elmu statistik numana biaya ngarupakeun faktor, ieu ngarupakeun faktor nu kudu dipikaharti ngeunaan pentingna biaya.

Alternatipna, anggap median sampel tina populasi. Ieu ngabogaan sebaran sampling nu beda sacara umum teu normal (tapi masih keneh pakait dina aturan ka-normal-an).

Tempo oge[édit | sunting sumber]

central limit theorem, standard error (statistics)