Sebaran binomial

Ti Wikipédia, énsiklopédia bébas basa Sunda
Luncat ka: pituduh, sungsi

Dina matematik, sebaran binomial ngarupakeun probability distribution diskrit nu ngajelaskeun angka keberhasilan tina sekuen n independent percobaan enya/heunteu, unggal nu hasil mibanda probabiliti p. Saperti oge hasil/gagalna percobaan disebut oge percobaan Bernoulli atawa Bernoulli trial. Sebaran binomial ngarupakeun dasar nu kawentar keur binomial test tina statistical significance.

Conto tipikalna nyaeta: 5% populasi ngarupakeun positif HIV. Anjeun nyokot 500 urang sacara acak. Kumaha cara yen anjeun meunang 30 atawa leuwih HIV-positip? Jumlah HIV-positip nu dicokot ku anjeun ngarupakeun variabel random X nu nuturkeun sebaran binomial mibanda n = 500 sarta p = .05. Hartina urang museurkeun kan probabiliti Pr[X ≥ 30].

Sacara umum, lamun variabel random X nuturkeun sebaran binomial mibanda paramater n sarta p, dituliskeun X ~ B(n, p). Probabiliti nu pasti sukses k dirumuskeun ku

 P\left[X = k\right] = {n \choose k} p^k \left(1-p\right)^{n-k}\ \mbox{for}\ k = 0, 1, 2, \cdots, n

dimana

{n \choose k}={n! \over k!(n-k)!}

ngarupakeun koéfisién binomial "n milih k" (oge dilambangkeun ku C(n, k)), ti mana ngaran sebaran. Rumus bisa dipikaharti saperti kieu: urang hayang k sukses (pk) sarta nk gagal ((1 − p)nk). Sanajan kitu, sukses k bisa kajadian dimana wae diantara n percobaan, sarta dimana C(n, k) beda jalan kasebarna sukses k dina sekuen n percobaan.

Lamun X ~ B(n, p), mangka nilai ekspektasi X nyaeta

 E\left[X\right] = np

sarta varian nyaeta

 \mbox{var}\left(X\right) = np(1-p).

Nilai nu leuwih siga atawa mode X diberekeun ku integer panggedena kurang atawa sarua jeung (n+1)p; lamun m = (n+1)p ngarupakeun interger sorangan, mangka m − 1 sarta m duanana ngarupakeun mode.

Lamun X ~ B(n, p) sarta Y ~ B(m, p) ngarupakeun variabel binomial bebas, mangka X + Y oge ngarupakeun variabel binomial; sebaranna nyaeta

 B\left(n+m, p\right).

Dua sebaran penting nu ngadeukeutan sebaran binomial nyaeta:

Binomial PDF and Normal approximation for n=6 and p=0.5.
  • Lamun np sarta n(1 − p) leuwih gede ti 5 atawa sejenna, mangka pendekatan panghadena (dumasar kana continuity correction nu mungkin dipake) ka B(n, p) dirumuskeun ku sebaran normal
 N\left(np, np\left(1-p\right)\right).
Pendekatan ieu ngarupakeun huge time-saver; sajarahna, ieu mimiti dipake sebaran normal, dimimitian ku Abraham de Moivre dina bukuna The Doctrine of Chances taun 1733. Kiwari, bisa ditempo sabab tina central limit theorem, B(n, p) ngarupakeun jumlah n bebas, identically distributed 0-1 indicator variable. Inget: ieu pendekatan hasilna teu akurat lamun teu make continuity correction.Catetan: gambar nembongkeun normal and binomial probability density function (PDF) sarta lain cumulative distribution function.
Contona, anggap anjeun nyokot sampel random n ti masarakat nu populasi loba sarta nyebutkeun ten maranehna satuju kana hiji pernyataan. Proporsi masakarat nu satuju tangtu gumantung kana sampel. Lamun grup sampel n masarakat diulang sarta bener-bener random, proprosi bakal nuturkeun sebaran normal nu mibanda mean sarua kana proporsi satuju sabenerna p dina populasi sarta mibanda simpangan baku σ = (p(1 − p)/n)1/2. Ukuran sampel n badag ngarupakeun hal nu hade sabab simpangan baku bakal jadi leutik, nu ngijinkeun keur estimasi nu hade keur paramater p nu teu dipikanyaho.
  • Lamun n badag sarta p leutik, mangka np ukuranna sedeng, mangka Poisson distribution mibanda parameter λ = np ngarupakeun pendekatan nu hade keur B(n, p).

Rumus keur Bézier curves kailhaman ku sebaran binomial.