Saltu al enhavo

Histogramo

El Vikipedio, la libera enciklopedio

En statistiko, histogramo estas diagramo kiu montras kiel ofte aperas valoroj en aro de nombraj datumoj. Ĝi grupigas la valorojn en «ujojn» (= «klasojn» = «intervalojn»), kaj desegnas stangojn kies alto egalas la nombron da valoroj en ĉiu intervalo.

Ekzemple : alteco de gestudentoj

[redakti | redakti fonton]

Oni mezuras altecon de 25 gestudentoj (18jaraj, mezurunuo = cm)

164;164;164;165;167;168;169;176;182;183;184;190;170;156;165;171;170;170;172;169;173;165;167;155;195

Eblas priskribi tiujn rezultojn per la averaĝo (meznombro) : 171, kaj per la varianco : 91. En LibreOffice Calc, averaĝo estas havebla per =MEZUMO(nombroj) kaj varianco per =VAR(nombroj).

Tamen tiuj du nombroj ne sufiĉas por bone priskribi la tuton, pro tio utilas fari diagramon : la histogramon.

La unua etapo estas meti ĉiujn valorojn en klasojn laŭ alteco.

klaso malpli ol 160 [160- 165[ [165- 170[ [170- 175[ [175– 180[ [180- 185[ [185- 190[ [190– 195[
nombro 2 3 8 6 1 3 0 2

Poste fari diagramon, kun alteco en horizontala akso kaj nombro en vertikala akso.

En histogramoj de kontinuaj variabloj, kiel la alteco de persono, la stangoj estas kunigitaj.

Por normale distribuitaj variabloj kaj granda nombro da mezuroj, la histogramo estas sonorilforma

[redakti | redakti fonton]

Kiam mezurita eco dependas de multaj kialoj, la probableco de iu valoro varias laŭ normala distribuo, kies probablodensa funkcio havas formon de sonorilo. La modo estas la plej ofta valoro.

Histogramo el 100 valoroj (sumoj de dek hazardaj nombroj inter 0 kaj 1)
Histogramo el 100 valoroj (sumoj de dek hazardaj nombroj inter 0, kaj 1 kaj unu hazarda nombro 0 aŭ 3)

Tamen multfoje histogramo ne estas je tiu formo. Kiam iu faktoro agas pli ol aliaj, la histogramo estas dumoda, aŭ plurmoda. Ekzemple, se vi mezuras la altecon de grupo de geplenkreskuloj, vi ofte vidos du pintojn: unu ĉirkaŭ la meza alteco de virinoj kaj alian ĉirkaŭ la meza alteco de viroj. Se tiuj du modoj estas proksimaj unu al la alia, eble ili estas vide neaparteblaj, kaj oni vidas "platan pinton". Foje la formo de histogramo ne estas simetria : la modo estas proksima al unu flanko, kaj estas longa "vosto" je la alia flanko.

Pro tio, fakuloj difinas nombroj por priskribi histogramon kaj ĝian distribuon.

- indekso de malsimetrio, havebla per =NESIMETRIECO(nombroj) en LibreOffice Calc. Ĝi estas nula kiam la distribuo estas simetria.

- indekso de plateco = "kurtozo", havebla per =VOLBECO(nombroj) en LibreOffice Calc. Ĝi estas nula kiam la distribuo estas normala (normale pinta), pozitiva kiam la distribuo estas pli pinta ol normale, negativa kiam la distribuo estas malpli pinta.