Faktor Bayes

Dina statistik, pamakéan faktor Bayes nyaéta hiji alternatif Bayesian dina tés hipotésa statistik klasik.

Ditangtukeun model pamilihan masalah nu kudu dipilih antara dua modél M₁ jeung M₂, dumasar kana vektor data x. Faktor Bayes K ditangtukeun ku rumus

K={\frac {p(x|M_{1})}{p(x|M_{2})}}.

Hal ieu siga hiji tes babandingan-likelihood. Sacara ilahar, modél M₁ jeung M₂ bakal dijadikeun parameter ku parameter vektor $\theta _{1}$ jeung $\theta _{2}$ ; mangka K bakal ditangtukeun ku rumus

K={\frac {p(x|M_{1})}{p(x|M_{2})}}={\frac {\int \,p(\theta _{1}|M_{1})p(x|\theta _{1}M_{1})d\theta _{1}}{\int \,p(\theta _{2}|M_{2})p(x|\theta _{2}M_{2})d\theta _{2}}}.

Nilai K > 1 hartina data nembongkeun yén M₁ leuwih deukeut tinimbang M₂ sarta sabalikna. Harold Jeffreys méré skala keur ngajentrekeun K:

K	Kakuatan kajadian
< 1	Negatif (ngarojong M₂)
1 nepi 3	Sedeng
3 nepi ka 12	Positif
12 to 150	Kuat
> 150	Kuat kacida

Loba ahli statistik Bayes nu ngagunakeun faktor Bayes salaku bagéan dina nangtukeun pilihan, aya ogé nu ngahijikeunna dina ngira-ngira prior probability unggal modél sarta ngahijikeun loss function keur nyieun pilihan nu salah.

Conto

Anggap urang mibanda hiji variabel acak nu bakal nembongkeun hasil atawa gagal. Nu dipikahayang nyieun hiji modél M₁ nu kamungkinan hasilna nyaéta q=1/2, sarta modél séjén M₂ nu mana q bener-bener teu dipikanyaho sarta nyokot prior distribution keur q nu mangrupa sebaran seragam dina [0,1]. Conto nu dicokot nyaéta 200, sarta manggihkeun 115 hasil tur 85 gagal. Likelihood-na nyaéta

{200 \choose 115}q^{115}(1-q)^{85}.

Mangka

P(X=115|M_{1})={200 \choose 115}\left({1 \over 2}\right)^{200}=0.00595...

tapi

P(X=115|M_{2})=\int _{q=0}^{1}1{200 \choose 115}q^{115}(1-q)^{85}dq={1 \over 201}=0.00497...

Babandingannya nyaéta 1.197..., nu mana "sedeng" lamun éta titik nujul kana M₁.

Hal ieu teu sarua siga dina uji babandingan likelihood, nu mana bakal kapanggih estimasi maximum likelihood keur q, nyaéta 115/200=0.575, sarta tina éta nilai mangka babandinganna nyaéta 0.1045..., tur pasti nujul ka M₂. Uji hipotesa frequentist bakal ngahasilkan hasil nu leuwih dramatis, anggap yén M₁ bakal ditolak lamun tingkat kapercayaan 5%, saprak kamungkinan keur meunangkeun 115 hasil atau leuwih tina 200 sample lamun q=1/2 is 0.0200..., sarta dina dua-buntut bakal digambarkeun nu leuwih ekstrim tinimbang 115 nyaéta 0.0400... Perlu dicatet yén 115 leuwih ti simpangan baku jauh ti 100.

M₂ nyaéta modél nu leuwih kompleks tinimbang M₁ sabab mibanda paraméter bébas nu ngameunangkeun kana modél éta data leuwih raket. Kamampun faktor Bayes dipaké keur ngitung alesan kunaon sababna Bayesian inference geus dipaké geus nuluykeun téori kaputusan jeung kailaharan tina Occam's razor, ngurangan Type I error.

Tempo oge

Bayesian model comparison