Mean kuadrat kasalahan

Ti Wikipédia, énsiklopédia bébas
Luncat ka: pituduh, sungsi

Dina statistik, mean kuadrat kasalahan tina estimator T dina parameter nu teu ka-observasi θ nyaéta

\operatorname{MSE}(T)=\operatorname{E}((T-\theta)^2),

dina hal ieu, mangrupa nilai ekspektasi kuadrat "kasalahan". "Kasalahan" nyaéta jumlah numana estimator beda jeung jumlah nu keur di-estimasi. Mean kuadrat kasalahan nyukupan identitas

\operatorname{MSE}(T)=\operatorname{var}(T)+(\operatorname{bias}(T))^2

dimana

\operatorname{bias}(T)=\operatorname{E}(T)-\theta,

dina hal ieu, the bias nyaéta lobana numana nilai ekspektasi tina estimator beda keur jumlah nu teu ka-observasi nu keur di-estimasi.

Conto kongkritna. Anggap

X_1,\dots,X_n\sim\operatorname{N}(\mu,\sigma^2),

dina hal ieu, ukran sampel random n tina populasi sebaran normal. Dua estimators σ2 kadangkala dipaké (atawa nu sejenna):

\frac{1}{n}\sum_{i=1}^n\left(X_i-\overline{X}\,\right)^2\ {\rm and}\ \frac{1}
{n-1}\sum_{i=1}^n\left(X_i-\overline{X}\,\right)^2

numana

\overline{X}=(X_1+\cdots+X_n)/n

mangrupa "sampel mean". Kahiji tina estimator ieu nyaéta estimator maximum likelihood, sarta bias, dina hal ieu, bias teu sarua jeung nol, tapi ngabogaan varian nu leuwih leutik tinimbang nu kadua, anu teu bias. Varian leutik tina akibat sejen keur bias, mangka méan kuadrat kasalahan tina bias estimator leuwih leutik tinimbang estimator unbiased.