Efficiency (statistics)

Ti Wikipédia, énsiklopédia bébas
Luncat ka: pituduh, sungsi

Dina statistik, efisiensi nyaeta salah salah ukuran keur estimator.

Efisiensi dina unbiased statistik T diartikeun salaku

e(T)=\frac{1/I(\theta)}{{\rm var\ }T}

numana I(θ) nyaeta sampel informasi Fisher. Mangka e(T) nyaeta varian mininum nu mungkin keur estimator unbiased dibagi ku varian sabenerna. Dina Cramér-Rao inequality ngabuktikeun yen e(T) ≤ 1.


\mathrm{var} \left(\widehat{\theta}\right)
\geq
\frac
 {1}
 {\mathcal{I}(\theta)}

1\geq
\frac
 {1/\mathcal{I}(\theta)}
 {\mathrm{var} \left(\widehat{\theta}\right)}
\to
1 \geq e(T)

Estimator efisien[édit | sunting sumber]

Lamun estimator tina parameter, \theta \in \Theta, sarua jeung e(T) = 1 keur sakabeh nilai parameter, maka ieu estimator disebut efisien.

Hartina, estimator sarua jeung Cramér-Rao inequality \forall \, \theta \in \Theta.

Saterusna, estimator efisien lamun unbiased ngarupakeun minimum variance unbiased estimator oge. Hal ieu sabab estimator efisien mertahankeun kasaruan dina Cramér-Rao inequality keur sakabeh nilai parameter, numana hartina nepi ka nilai varian minimum keur sakabeh parameter (definisi MVU estimator). Kudu dicatet yen estimator MVU teu salawasna efisien sabab "minimum" teu salawasna kajadian dina Cramér-Rao inequality.

Asimtot efisiensi[édit | sunting sumber]

Keur sababaraha estimator bisa nepi ka asimtot efisiensi tur disebutna estimator efisien asimtot. Kasus ieu kapanggih dina estimator maximum likelihood atawa keur estimator nu sarua jeung asimtot Cramér-Rao inequality.

Conto[édit | sunting sumber]

Anggap ukuran sampel n dicokot tina mean μ jeung varian sebaran normal.

Sample mean \overline{x} tina runtuyan sample x[0], x[1], \ldots, x[N-1], dirumuskeun ku


\overline{x}={1 \over n}\sum_{i=1}^n x_i

mangka gedena varian 1/n. Ieu sarua jeung informasi Fisher bulak balik tina sampel (katempo jentre tina definisi) mangka migunakeun Cramér-Rao inequality, sampel mean nyaeta efisien dina efisiensi ieu sarua jeung hiji.

Ayeuna tempo sample median. Hal ieu ngarupakeun estimator nu unbiased jeung consistent keur μ. Keur n nu gede, sampel median ngadeukeutan kana sebaran normal numana mean μ jeung varian \frac{\pi}{2N} (contona, x[n] \sim \mathcal{N}\left(\mu, \frac{\pi}{2N}\right)). Mangka efisiensi na jadi 2/π, atawa kira-kira 64%. Catetan, efisiensi ieu ngarupakan efisiensi asimtot --- nyaeta limit efisiensi lamun ukuran n nuju ka tak terhingga. Keur lobana n anu terhingga bakal ngabogaan efisiensi nu leuwih gede (conto, keus ukuran sample 3 mangka efisiensina kira-kira 74%).

Loba paniliti nu milih sampel median keur estimator mean, sabab nguranganna efisiensi leuwih katembong keur sampel nu acak dina watesan henteu sensitifna data outlier.

Efisiensi relatif[édit | sunting sumber]

Lamun T jeung T' ngarupakeun estimators keur parameter θ, mangka penilti satuju yen T "leuwih efisien" batan T ′ lamun: (i) mean kuadrat kasalahan (MSE) leuwih leutik tinimbang sababaraha nilai \theta, jeung (ii) MSE teu leuwih gede ti T ′ keur sakabeh nilai θ.

Sacara formal,


E[(T-\theta)^2]\leq E[(T'-\theta)^2]

keur sakabeh \theta, nu pakait raket di unggal tempat.

Efisiensi relatif bisa oge diartikeun


e(T',T)=\frac{E[(T-\theta)^2]}{E[(T'-\theta)^2]}.

Sanajan e sacara umum fungsi θ, dina sababaraha kasus henteu pakait; mangka kitu, lamun e kurang ti hiji nembongkeun yen T leuwih hade dipake, henteu gumantung kana nilai θ sabenerna.

Rujukan[édit | sunting sumber]

ditarjamahkeun tina Wikipedia Basa Inggris, Juli 2006