Varian

Ti Wikipédia, énsiklopédia bébas
Luncat ka: pituduh, sungsi

Artikel ieu ngeunaan matematik. Tempo oge variance (land use).


Dina tiori probabiliti sarta statistik, varian tina variabel acak ngarupakeun ukuran tina statistical dispersion, nu nembongkeun sabaraha jauh tina nilai ekspektasi nu dijelaskeun di dieu. Varian nilai-real variabel acak ngarupakeun momen mean nu kadua, oge cumulant nu kadua (cumulants beda jeung central moments ngan dina tingkat 4 atawa saluhureunna).

Harti[édit | sunting sumber]

Lamun μ = E(X) ngarupakeun nilai ekspektasi tina variabel acak X, mangka varian nyaeta

\operatorname{var}(X)=\sigma^2=\operatorname{E}((X-\mu)^2),

contona, varian ngarupakeun nilai ekspektasi kuadrat simpangan X tina mean-na sorangan. Jadi varian ngarupakeun simpangan mean kuadrat. Varian variabel randomX dituliskeun salaku var(X).

Catetan loba sebaran, saperti sebaran Cauchy, teu ngabogaan varian sabab nyimpang tina integral. Dina hal sejen, lamun sebaran teu ngabogaan nilai ekspektasi, mangka teu ngabogaan varian oge. Hal nu teu bener: sebaran ngabogaan nilai ekspektasi tapi teu ngabogaan varian.

Sipat[édit | sunting sumber]

Lamun varian dihartikeun, bisa disimpulkeun yen varian teu pernah negatip sabab kuadrat bakal positip atawa nol. Lamun metoda keur ngitung varian hasilna negatip, geus tangtu aya kasalahan, ilaharna dina nangtukeun algoritma. Satuan varian nyaeta kuadrat tina satuan sebaran. Mangka, varian tina susunan ukuran jangkung dina sentimeter nyaeta sentimeter kuadrat. Kanyataan ieu kurang merenah sarta statistikawan leuwih ilahar ngagunakeun akar varian, simpangan baku sarta ngagunakeun ieu nilai salaku kasimpulan dispersi.

Ieu bisa dibuktikeun sacara gampang tina harti yen varian moal gumantung kana nilai mean \mu. Dina hal ieu, lamun variabel "disimpen" antara b jadi X+b, varian hasil variabel random beulah kenca teu kacekel. Sacara jelas, lamun variabel dikalikeun ku faktor skala a, varian ngarupakeun hasil kali nyaeta a2. Sacara resmi, lamun a jeung b ngarupakeun konstanta riil sarta X ngarupakeun variabel acak mangka varian dihartikeun ku,

\operatorname{var}(aX+b)=a^2\operatorname{var}(X)

Formula sejen keur varian saperti dina garis lurus nu dumasar kana harti di luhur nyaeta:

\operatorname{var}(X)=\operatorname{E}(X^2) - (\operatorname{E}(X))^2.

Ieu ngarupakeun rumus nu geus ilahar dipake keur ngitung varian dina kaperluan praktis.

Salah sahiji alesan varian leuwih sering dipake tinimbang ukuran dispersi sejenna nyaeta yen varian jumlah variabel acak bebas sarua jeung jumlah varian-na. (Kaayaan nu leuwih lemah tinimbang bebas, disebutna "uncorrelatedness" atawa taya hubungan). Sacara umum,

\operatorname{var}(X+Y) =\operatorname{var}(X) + \operatorname{var}(Y)
 + 2 \operatorname{cov}(X, Y).

Di dieu \operatorname{cov} nyaeta kovarian, sarua jeung nol keur variabel nu taya hubungan.

Populasi varian jeung sampel varian[édit | sunting sumber]

Dina statistik, konsep varian oge digunakeun keur ngajelaskeun susunan data. Waktu susunan data ngarupakeun populasi, mangka disebut populasi varian. Waktu susunan data ngarupakeun sample, mangka disebutna sampel varian.

Populasi varian tina populasi yi dimana i = 1, 2, ..., N dirumuskeun ku

\sigma^2 = \frac{1}{N} \sum_{i=1}^N
 \left( y_i - \mu \right) ^ 2,

dimana \mu ngarupakeun populasi mean. Dina praktek, waktu kaayaan populasi gede, geus ilahar yen teu mungkin manggihkeun nilai populasi varian nu pasti, sabab kawengku ku waktu, beaya jeung sumber sejenna.

Metoda nu geus ilahar dipake keur estimasi populasi varian nyaeta sampling. Waktu estimasi populasi varian ngagunakeun n random samples xi dimana i = 1, 2, ..., n, nuturkeun rumus di handap ieu ngarupakeun unbiased estimator:

s^2 = \frac{1}{n-1} \sum_{i=1}^n
 \left( x_i - \overline{x} \right) ^ 2,

dimana \overline{x} ngarupakeun sampel mean.

Catetan yen n-1 dina pembagi diluhur jelas beda jeung persamaan keur ngitung populasi varian. Sumber nu geus ilahar ngabingungkeun nyaeta watesan sampel varian jeung notasi s2 bisa jadi nempo kana unbiased estimator sejen tina populasi varian nu dirumuskeun di luhur, sarta kumaha cara mastikeun varian tina sampel, diitung ku n tinimbang n-1.

Sacara rasa, ngitung varian ku ngabagi make n tinimbang n-1 mere hasil populasi varian underestimate. Hal ieu sabab urang ngagunakeun sampel mean \overline{x} keur estimasu populasi mean \mu, nu teu dipikanyaho. Dina prakten, keur n nu gede, bedana salawasna kurang ti hiji.

Tempo oge algoritma keur ngitung varian.

Generalisasi[édit | sunting sumber]

Lamun X ngarupakeun nilai-vector- variabel random, nu mibanda nilai dinaRn, sarta dipinkanyaho salaku vektor kolom, mangka generalisasi sacara alami tina varian nyaeta E((X − μ)(X − μ)′), numana μ = E(X) sarta X ′ ngarupakeun transpos X, sarta jadi vektor baris. Varian ieu ngarupakeun nonnegative-definite matriks kuadrat, umumna dianggap salaku covariance matrix.

Lamun X ngarupakeun nilai-kompleks variabel random, mangka varian nyaeta E((X − μ)(X − μ)*), numana X* ngarupakeun complex conjugate X. Varian ieu ngarupakeun angka riil nonnegative.

Sajarah[édit | sunting sumber]

Watesan varian mimiti dikenalkeun ku Ronald Fisher taun 1918 dina paper-na The Correlation Between Relatives on the Supposition of Mendelian Inheritance

Tempo oge[édit | sunting sumber]

Rujukan[édit | sunting sumber]

Wikipedia Basa Inggris

Tumbu kaluar[édit | sunting sumber]