Faktor Bayes

Ti Wikipédia, énsiklopédia bébas
Luncat ka: pituduh, sungsi

Dina statistik, pamakéan faktor Bayes nyaéta hiji alternatif Bayesian dina tés hipotésa statistik klasik.

Ditangtukeun model pamilihan masalah nu kudu dipilih antara dua model M1 jeung M2, dumasar kana vektor data x. Faktor Bayes K ditangtukeun ku rumus

Hal ieu siga hiji tes babandingan-likelihood. Sacara ilahar, model M1 jeung M2 bakal dijadikeun parameter ku parameter vektor jeung ; mangka K bakal ditangtukeun ku rumus

Nilai K > 1 hartina data nembongkeun yén M1 leuwih deukeut tinimbang M2 sarta sabalikna. Harold Jeffreys méré skala keur ngajentrekeun K:

K Kakuatan kajadian
< 1 Negatif (ngarojong M2)
1 nepi 3 Sedeng
3 nepi ka 12 Positif
12 to 150 Kuat
> 150 Kuat kacida

Loba ahli statistik Bayes nu migunakeun faktor Bayes salaku bagéan dina nangtukeun pilihan, aya ogé nu ngahijikeunna dina ngira-ngira prior probability unggal model sarta ngahijikeun loss function keur nyieun pilihan nu salah.

Conto[édit | édit sumber]

Anggap urang mibanda hiji variabel acak nu bakal nembongkeun hasil atawa gagal. Nu dipikahayang nyieun hiji model M1 nu kamungkinan hasilna nyaéta q=1/2, sarta model séjén M2 numana q bener-bener teu dipikanyaho sarta nyokot prior distribution keur q nu mangrupa sebaran seragam dina [0,1]. Conto nu dicokot nyaéta 200, sarta manggihkeun 115 hasil tur 85 gagal. Likelihood-na nyaéta

Mangka

tapi

Babandingannya nyaéta 1.197..., nu mana "sedeng" lamun éta titik nujul kana M1.

Hal ieu teu sarua siga dina uji babandingan likelihood, numana bakal kapanggih estimasi maximum likelihood keur q, nyaéta 115/200=0.575, sarta tina éta nilai mangka babandinganna nyaéta 0.1045..., tur pasti nujul ka M2. Uji hipotesa frequentist bakal ngahasilkan hasil nu leuwih dramatis, anggap yén M1 bakal ditolak lamun tingkat kapercayaan 5%, saprak kamungkinan keur meunangkeun 115 hasil atau leuwih tina 200 sample lamun q=1/2 is 0.0200..., sarta dina dua-buntut bakal digambarkeun nu leuwih ekstrim tinimbang 115 nyaéta 0.0400... Perlu dicatet yén 115 leuwih ti simpangan baku jauh ti 100.

M2 nyaéta model nu leuwih kompleks tinimbang M1 sabab mibanda parameter bébas nu ngameunangkeun kana model éta data leuwih raket. Kamampun faktor Bayes dipaké keur ngitung alesan kunaon sababna Bayesian inference geus dipaké geus nuluykeun téori kaputusan jeung kailaharan tina Occam's razor, ngurangan Type I error.

Tempo oge[édit | édit sumber]