Faktor Bayes

Ti Wikipédia, énsiklopédia bébas basa Sunda
Luncat ka: pituduh, sungsi

Dina statistik, pamakean faktor Bayes nyaeta hiji alternatif Bayesian dina tés hipotésa statistik klasik.

Ditangtukeun model pamilihan masalah nu kudu dipilih antara dua model M1 jeung M2, dumasar kana vektor data x. Faktor Bayes K ditangtukeun ku rumus

K = \frac{p(x|M_1)}{p(x|M_2)}.

Hal ieu siga hiji tes babandingan-likelihood. Sacara ilahar, model M1 jeung M2 bakal dijadikeun parameter ku parameter vektor \theta_1 jeung \theta_2; mangka K bakal ditangtukeun ku rumus

K = \frac{p(x|M_1)}{p(x|M_2)} = \frac{\int \,p(\theta_1|M_1)p(x|\theta_1 M_1)d\theta_1}{\int \,p(\theta_2|M_2)p(x|\theta_2 M_2)d\theta_2}.

Nilai K > 1 hartina data nembongkeun yen M1 leuwih deukeut tinimbang M2 sarta sabalikna. Harold Jeffreys mere skala keur ngajentrekeun K:

K Kakuatan kajadian
< 1 Negatif (ngarojong M2)
1 nepi 3 Sedeng
3 nepi ka 12 Positif
12 to 150 Kuat
> 150 Kuat kacida

Loba ahli statistik Bayes nu migunakeun faktor Bayes salaku bagean dina nangtukeun pilihan, aya oge nu ngahijikeunna dina ngira-ngira prior probability unggal model sarta ngahijikeun loss function keur nyieun pilihan nu salah.

Conto[édit | sunting sumber]

Anggap urang mibanda hiji variabel acak nu bakal nembongkeun hasil atawa gagal. Nu dipikahayang nyieun hiji model M1 nu kamungkinan hasilna nyaeta q=1/2, sarta model sejen M2 numana q bener-bener teu dipikanyaho sarta nyokot prior distribution keur q nu ngarupakeun sebaran seragam dina [0,1]. Conto nu dicokot nyaeta 200, sarta manggihkeun 115 hasil tur 85 gagal. Likelihood-na nyaeta

{200 \choose 115}q^{115}(1-q)^{85}.

Mangka

P(X=115|M_1)={200 \choose 115}\left({1 \over 2}\right)^{200}=0.00595...

tapi

P(X=115|M_2)=\int_{q=0}^1 1{200 \choose 115}q^{115}(1-q)^{85}dq = {1 \over 201} = 0.00497...

Babandingannya nyaeta 1.197..., nu mana "sedeng" lamun eta titik nujul kana M1.

Hal ieu teu sarua siga dina uji babandingan likelihood, numana bakal kapanggih estimasi maximum likelihood keur q, nyaeta 115/200=0.575, sarta tina eta nilai mangka babandinganna nyaeta 0.1045..., tur pasti nujul ka M2. Uji hipotesa frequentist bakal ngahasilkan hasil nu leuwih dramatis, anggap yen M1 bakal ditolak lamun tingkat kapercayaan 5%, saprak kamungkinan keur meunangkeun 115 hasil atau leuwih tina 200 sample lamun q=1/2 is 0.0200..., sarta dina dua-buntut bakal digambarkeun nu leuwih ekstrim tinimbang 115 nyaeta 0.0400... Perlu dicatet yen 115 leuwih ti simpangan baku jauh ti 100.

M2 nyaeta model nu leuwih kompleks tinimbang M1 sabab mibanda parameter bebas nu ngameunangkeun kana model eta data leuwih raket. Kamampun faktor Bayes dipake keur ngitung alesan kunaon sababna Bayesian inference geus dipake geus nuluykeun teori kaputusan jeung kailaharan tina Occam's razor, ngurangan Type I error.

Tempo oge[édit | sunting sumber]