Mean kuadrat kasalahan

Ti Wikipédia, énsiklopédia bébas basa Sunda
Luncat ka: pituduh, sungsi

Dina statistik, mean kuadrat kasalahan tina estimator T dina parameter nu teu ka-observasi θ nyaeta

\operatorname{MSE}(T)=\operatorname{E}((T-\theta)^2),

dina hal ieu, ngarupakeun nilai ekspektasi kuadrat "kasalahan". "Kasalahan" nyaeta jumlah numana estimator beda jeung jumlah nu keur di-estimasi. Mean kuadrat kasalahan nyukupan identitas

\operatorname{MSE}(T)=\operatorname{var}(T)+(\operatorname{bias}(T))^2

dimana

\operatorname{bias}(T)=\operatorname{E}(T)-\theta,

dina hal ieu, the bias nyaeta lobana numana nilai ekspektasi tina estimator beda keur jumlah nu teu ka-observasi nu keur di-estimasi.

Conto kongkritna. Anggap

X_1,\dots,X_n\sim\operatorname{N}(\mu,\sigma^2),

dina hal ieu, ukran sampel random n tina populasi sebaran normal. Dua estimators σ2 kadangkala dipake (atawa nu sejenna):

\frac{1}{n}\sum_{i=1}^n\left(X_i-\overline{X}\,\right)^2\ {\rm and}\ \frac{1}
{n-1}\sum_{i=1}^n\left(X_i-\overline{X}\,\right)^2

numana

\overline{X}=(X_1+\cdots+X_n)/n

ngarupakeun "sampel mean". Kahiji tina estimator ieu nyaeta estimator maximum likelihood, sarta bias, dina hal ieu, bias teu sarua jeung nol, tapi ngabogaan varian nu leuwih leutik tinimbang nu kadua, anu teu bias. Varian leutik tina akibat sejen keur bias, mangka mean kuadrat kasalahan tina bias estimator leuwih leutik tinimbang estimator unbiased.