Varianco

El Vikipedio, la libera enciklopedio
Saltu al: navigado, serĉo

Pri la aliaj sencoj de la vorto vidu apartigilon varianco (apartigilo).


En probablokalkulo kaj statistiko, varianco de hazarda variablo estas mezuro de ĝia statistika disvastiĝo, kiu indikas la tipan malproksimecon de la atendita valoro.

La varianco de reel-valora hazarda variablo estas ĝia dua centra momanto, kaj ankaŭ estas ĝia dua kumulanto. La varianco de hazarda variablo estas la kvadrato de ĝia norma diferenco.

Difino[redakti | redakti fonton]

Se \mu = \operatorname{E}(X) estas la atendita valoro (meznombro) de la hazarda variablo X, tiam la varianco estas:

\operatorname{var}(X) = \operatorname{E}[ ( X - \mu ) ^ 2 ].

Do ĝi estas la atendita valoro de la kvadrato de la devio de X for de ĝia propra meznombro. Pli simple, oni povas esprimi ĝin kiel "La averaĝo de la kvadrato de la distanco de ĉiu datenpunkto for de la meznombro". Ĝi estas tial meznombra kvadratigita dekliniĝo. La varianco de hazarda variablo X estas tipe simbolita per \operatorname{var}(X), \sigma_X^2, aŭ simple \sigma^2 \ .

Notu ke la pli supra difino povas esti uzata por ambaŭ diskretaj kaj kontinuaj hazardaj variabloj, dank'al la difino de la ekspekta operatoro \operatorname{E}.

\operatorname{var}(X) =\int (x-\mu)^2 \, f(x) \, dx\,,

pri kiu \mu estas la atendita valoro, t.e.

\mu = \int x \, f(x) \, dx\,,

kaj x variante tra la tuta domajno de X.

  • Pri diskreta hazarda variablo X de probabla masa funkcio, probablo estas ligita al ĉiu elemento, x1 ↦ p1, ...xi ↦ pi, ...xn ↦ pn (N = \sum_{i=1}^n  n_i \, , \,  p_i=\frac{n_i}{N}), tial
\operatorname{var}(X) = \sum_{i=1}^n p_i\cdot(x_i - \mu)^2

kie \mu estas la atendita valoro, t.e.

\mu = \sum_{i=1}^n p_i\cdot x_i \, .

Kiam ĉiuj probabloj estas egalaj (p_i=\frac{1}{n} por ĉiu xi), \mu \ egalas al la aritmetika meznombro (averaĝo).

Multaj distribuoj, kiel la koŝia distribuo, ne havas varianco ĉar la taŭga integralo diverĝas. Aparte, se distribuo ne havas atenditan valoron, ĝi ne havas ankaŭ variancon. La malo estas ne ĉiam vera: estas distribuoj pri kiu la atendita valoro ekzistas, sed la varianco ne.

Historio[redakti | redakti fonton]

La termino varianco estis unue prezentita de Ronald Fisher en lia papero La Korelacio inter Parencoj pri Konjekto de Mendela Heredado [1] eldonita en 1918:

"La granda aro da disponeblaj statistikoj montras al ni, ke devioj de homa mezuro for de averaĝo sekvas tre proksimume la normalan distribuon de eraroj, kaj, konsekvente, ke variableco eblas esti uniforme mezurita per norma diferenco, kiu korespondas al la kvadrata radiko de la meznombra kvadratigita eraro. Kiam estas du sendependaj fontoj de variablado, kiu eblas kaŭzi, en uniforman loĝantaron, distribuojn kun normaj diferencoj \sigma_1 \ kaj \sigma_2 \ , okazas ke la distribuo, kiam ambaŭ distribuoj agas samtempe, havas norman diferencon \sqrt{\sigma_1^2 + \sigma_2^2}. Estas do dezirinde, kiam analizante fontojn de variablado, konsideri la kvadratojn de la normaj diferencoj por taksi variablecon. Ni nomos tiun kvanton Varianco..."

Varianco kaj inercimomanto[redakti | redakti fonton]

La varianco de probablodistribuo estas analoga al la inercimomanto en klasika meĥaniko, ĉar ĉi tiu korespondas al lineara masodistribuo ĉirkaŭ akso de rotacio.

Dum la inercimomanto de volumeno V estas:

I = \int_V (\vec{r}_{\perp})^2\rho(\vec r)\mathrm{d}V, kie \vec r estas la radiusvektoro de iu punkto de la korpo, \rho(\vec r) estas la masa denso ĉe la punkto, \vec r_{\perp} la orta distanco inter la punkto kaj la rotaciakso,

la varianco de kontinua hazarda variablo estas ankaŭ integralo:

\operatorname{var}(X) =\int (x-\mu)^2 \, f(x) \, dx \, , pro tiu analogio, tiaj terminoj kiel la varianco estas nomataj momanto de probablodistribuo.

Propraĵoj[redakti | redakti fonton]

Se la varianco estas difinita, ĝi estas neniam negativa, ĉar kvadratoj estas pozitivaj aŭ nulaj. La mezurunuo de varianco estas kvadrato de mezurunuo de observado. Ekzemple, se alto estas mezurita en metroj do varianco de aro de altoj estas mezurita en kvadrataj metroj. Ĉi tiu fakto estadas neoportuna, kaj motivigis anstataŭe uzi kvadratan radikon de varianco, sciatan kiel variancan devion.

Eblas pruvi de la difino ke la varianco ne dependas de meznombro \mu. Do, se la variablo estas "ŝovita" per valoro b prenante X+b, do varianco de la rezultanta hazarda variablo estas la sama. Male, se la variablo estas multiplikita per skala faktoro a, la varianco estas multiplikita per a2. Pli formale, se a kaj b estas reelaj konstantoj kaj X estas hazarda variablo kies varianco estas difinita,

\operatorname{var}(aX+b)=a^2\,\operatorname{var}(X) \ .

Alia formulo por la varianco sekvas simple el lineareco de atenditaj valoroj kaj la pli supra difino:

\operatorname{var}(X)= \operatorname{E}(X^2 - 2\,X\,\operatorname{E}(X) + [\operatorname{E}(X)]^2 )
= \operatorname{E}(X^2) - 2[\operatorname{E}(X)]^2 + [\operatorname{E}(X)]^2 = \operatorname{E}(X^2) - [\operatorname{E}(X)]^2 \ .

Ĉi tiu estas ofta maniero por kalkuli la variancon en praktiko.

Unu kaŭzo por uzi variancon prefere al la aliaj kriterioj estas tio, ke varianco de sumo aŭ diferenco de sendependaj hazardaj variabloj estas la sumo de iliaj variancoj. Por tio, pli malforta kondiĉo ol sendependeco, nomita nekorelacieco, ankaŭ sufiĉas. Ĝenerale,

\operatorname{var}(aX+bY) =a^2\, \operatorname{var}(X) + b^2\, \operatorname{var}(Y) + 2ab\, \operatorname{cov}(X, Y)\ ,

ĉi tie \operatorname{cov} estas la kunvarianco, kiu estas nulo por sendependaj hazardaj variabloj (se ĝi ekzistas).

Loĝantara varianco kaj specimena varianco[redakti | redakti fonton]

Ĝenerale, la loĝantara varianco de "finia" loĝantaro da N elementoj estas donita per:

\sigma^2 = \frac{1}{N} \sum_{i=1}^N
 \left(x_i - \overline{x} \right)^ 2 \, ,

kie \overline{x} estas la loĝantara meznombro rilatante al ia propraĵo de tiu loĝantaro. Ĉi tiu estas nure speciala kazo de la ĝenerala difino de varianco prezentita pli supre, sed limitita al finiaj loĝantaroj.

En multaj praktikaj situacioj, la vera varianco de loĝantaro estas ne sciata apriore, kaj devas esti komputita iel. Kiam traktante kun multnombraj finiaj loĝantaroj, oni povas nek observi, nek nombri ĉiujn N elementojn de la loĝantaro; do estas preskaŭ neniam eble trovi precizan valoron de la loĝantara varianco, pro tempo, kosto, kaj alia limigo. Kiam traktante kun nefiniaj loĝantaroj, ĝenerale neeblas trovi la valoron de varianco.

Komuna maniero de taksi la variancon de multnombraj finiaj aŭ malfiniaj loĝantaroj estas per specimenoj. Ni komencas kun "finia" specimena loĝantaro prenita el la entuta loĝantaro. Supozu ni ke tia specimeno estas la vico (y_1,\dots,y_n), kie n < N. Ni povas konsideri ĉi tiun specimenon laŭ du klaraj manieroj:

la unua, ni povas trakti ĝin kiel finian loĝantaron kaj priskribi ĝian variancon;

la dua, ni povas taksi la subloĝantaran variancon de ĉi tiu specimeno.

La varianco de la specimeno (y_1,\dots,y_n), vidita kiel finia loĝantaro, estas

s^2_n = \frac{1}{n} \sum_{i=1}^n
 \left(y_i - \overline{y} \right)^ 2 \ ,

kie \overline{y} estas la meznombro rilate al la specimeno. Ĉi tiu estas iam sciata kiel la dekliva specimena varianco; tamen, tiu termino estas ambigua. Iuj elektronikaj kalkuliloj povas kalkuli \sigma^2 je la premo de butono, pri kiu estas kutime markita "\sigma^2".

Kiam uzante la specimenon (y_1,\dots,y_n) por taksi la variancon de la malpli granda loĝantaro, oni estas tentata egaligi la subloĝantaran varianco al \sigma^2. Tamen, \sigma^2 estas parta proksimumo de la loĝantara varianco; ĉar oni devas konsideri la sekvantan nedeklivan specimena varianco:

s^2_{n-1} = \frac{1}{n-1} \sum_{i=1}^n
 \left(y_i - \overline{y} \right)^ 2,

kie \overline{y} estas la meznombro de la subloĝantaro.

Notu ke la termo n-1 en la denominatoro pli supre malsimilas al la ekvacio pri s^2_n, kiu havas n en la denominatoro.

Notu ke s^2_{n-1} estas ĝenerale ne identa al la vera loĝantara varianco; ĝi estas nur proksimumo, kvankam tre bona nur kiam n estas granda. Ĉar s^2_{n-1} estas teoria takso kaj estas bazita sur finia specimeno, ĝi ankaŭ estas iam ambigue nomita specimena varianco.

Unu komuna fonto de konfuzo estas ke la termino specimena varianco povas referi ĉu al la nedekliva varianco s^2_{n-1} de la loĝantara varianco, ĉu al la dekliva varianco s^2_n de la specimeno vidita kiel finia loĝantaro. Nur la kunteksto permesas klarigi la situacion. Intuicie, komputante la variancon per divido per n, anstataŭ n-1, supozigas loĝantaran variancon. Tio okazas, ĉar ni estas uzanta la specimenan meznombron \overline{y} kiel valoron de la nekonata loĝantara meznombro \mu \ , kaj la krudan histogramon de ripetitaj eroj en la specimeno, anstataŭ la nekonatajn verajn probablojn.

En praktiko, pri granda n, la distingo estas efektive kaj ofte eta.

Ĝeneraligoj[redakti | redakti fonton]

Se X estas vektoro-valorita hazarda variablo, kun valoroj en \mathbb{R}^n, kaj imagita kiel kolumna vektoro, tiam la natura ĝeneraligo de varianco estas E[(X − μ)(X − μ)T], kie μ = E[X] kaj XT estas la transpono de X, kaj do estas linia vektoro. Ĉi tiu varianco estas nenegativa-difinita kvadrata matrico, kutime referita kiel la kunvarianca matrico.

Se X estas komplekso-valorita hazarda variablo, kun valoroj en \mathbb{C}, tiam ĝia varianco estas E[(X − μ)(X − μ)*], kie X* estas la kompleksa konjugito de X. Ĉi tiu varianco estas nenegativa reela nombro.

Vidu ankaŭ[redakti | redakti fonton]

Referenco[redakti | redakti fonton]

  1. Ronald Fisher (1918) La Korelacio inter Parencoj pri Konjekto de Mendela Heredado (angle)