Lompat ke isi

Faktor Bayes

Ti Wikipédia Sunda, énsiklopédi bébas
(dialihkeun ti Bayes factor)

Dina statistik, pamakéan faktor Bayes nyaéta hiji alternatif Bayesian dina tés hipotésa statistik klasik.

Ditangtukeun model pamilihan masalah nu kudu dipilih antara dua modél M1 jeung M2, dumasar kana vektor data x. Faktor Bayes K ditangtukeun ku rumus

Hal ieu siga hiji tes babandingan-likelihood. Sacara ilahar, modél M1 jeung M2 bakal dijadikeun parameter ku parameter vektor jeung ; mangka K bakal ditangtukeun ku rumus

Nilai K > 1 hartina data nembongkeun yén M1 leuwih deukeut tinimbang M2 sarta sabalikna. Harold Jeffreys méré skala keur ngajentrekeun K:

K Kakuatan kajadian
< 1 Negatif (ngarojong M2)
1 nepi 3 Sedeng
3 nepi ka 12 Positif
12 to 150 Kuat
> 150 Kuat kacida

Loba ahli statistik Bayes nu ngagunakeun faktor Bayes salaku bagéan dina nangtukeun pilihan, aya ogé nu ngahijikeunna dina ngira-ngira prior probability unggal modél sarta ngahijikeun loss function keur nyieun pilihan nu salah.

Anggap urang mibanda hiji variabel acak nu bakal nembongkeun hasil atawa gagal. Nu dipikahayang nyieun hiji modél M1 nu kamungkinan hasilna nyaéta q=1/2, sarta modél séjén M2 nu mana q bener-bener teu dipikanyaho sarta nyokot prior distribution keur q nu mangrupa sebaran seragam dina [0,1]. Conto nu dicokot nyaéta 200, sarta manggihkeun 115 hasil tur 85 gagal. Likelihood-na nyaéta

Mangka

tapi

Babandingannya nyaéta 1.197..., nu mana "sedeng" lamun éta titik nujul kana M1.

Hal ieu teu sarua siga dina uji babandingan likelihood, nu mana bakal kapanggih estimasi maximum likelihood keur q, nyaéta 115/200=0.575, sarta tina éta nilai mangka babandinganna nyaéta 0.1045..., tur pasti nujul ka M2. Uji hipotesa frequentist bakal ngahasilkan hasil nu leuwih dramatis, anggap yén M1 bakal ditolak lamun tingkat kapercayaan 5%, saprak kamungkinan keur meunangkeun 115 hasil atau leuwih tina 200 sample lamun q=1/2 is 0.0200..., sarta dina dua-buntut bakal digambarkeun nu leuwih ekstrim tinimbang 115 nyaéta 0.0400... Perlu dicatet yén 115 leuwih ti simpangan baku jauh ti 100.

M2 nyaéta modél nu leuwih kompleks tinimbang M1 sabab mibanda paraméter bébas nu ngameunangkeun kana modél éta data leuwih raket. Kamampun faktor Bayes dipaké keur ngitung alesan kunaon sababna Bayesian inference geus dipaké geus nuluykeun téori kaputusan jeung kailaharan tina Occam's razor, ngurangan Type I error.

Tempo oge

[édit | édit sumber]