Statistiko

El Vikipedio, la libera enciklopedio

Statistiko estas scienco pri la metodoj kolekti, analizi kaj interpreti empiriajn nombrajn donitaĵojn kaj kiel prezenti la rezulton. Tio fariĝas komplike, kiam la donitaĵoj kaj la interdependoj ne estas tute konataj, estas neprecizaj aŭ tro multenombraj por esti detale traktataj. Statistiko estas rimedo kompari sciencan teorion kun la reala mondo kaj serĉo de novaj interrilatoj por nova teorio.

Statistiko uzas probablon, matematikan mezurteorion kaj modeligon. Nuntempe matematiko, komputiko kaj statistiko formas novan kampon, donitaĵanalizon, kun novaj rimedoj por kalkulado, modeligo, inferenco kaj prezento.

Kvanteca scienca esplorado baziĝas sur statistikaj metodoj (kp. kvaliteca esplorado).

Oni uzas la nomon statistiko (minuskle kaj ofte plurale) ankaŭ por la datumoj mem aŭ la tabelo ellaborita laŭ la metodoj de la Statistiko.

Teorio de Statistiko

Normala distribuo.

Statistiko estas transversa apogo al ampleksa varieco de disciplinoj, de la fiziko ĝis la sociaj sciencoj, de la sciencoj de la sano ĝis la kontrolo de kvalito. Ĝi estas uzata por la decidado en areoj de negocoj aŭ institucioj registaraj.

La statistiko dividiĝas en du grandaj areoj:

Ambaŭ branĉoj apartenas al la Aplikita Statistiko. Estas ankaŭ disciplino nomata Matematika Statistiko, kiu referencas al la teoriaj bazoj de la materio. La vorto «statistikoj» ankaŭ aludas al la rezulto apliki algoritmon statistikan al aro de datumoj, kiel en statistikoj ekonomiaj, statistikoj kriminalaj, inter aliaj.

Etimologio

La germana termino Statistik, kiu estis unue enkondukita de Gottfried Achenwall (1749), referencis origine al la analizo de datumoj de la Ŝtato, tio estas, la "scienco de la ŝtato" (ankaŭ nomita aritmetika politiko laŭ ĝia rekta tradukado). Ne estis ĝis la 19a jarcento kiam la termino statistiko akiris la signifon de kolektado kaj klasifikado de datumoj. Ĉi tiu koncepto estis enkondukita de la anglo John Sinclair.

Originoj en probablo

La metodoj statistika-matematikaj emerĝis de la teorio de probablo, kiu datiĝas de la mesaĝado inter Blaise Pascal kaj Pierre de Fermat (1654). Christiaan Huygens (1657) donas la unuan sciencan traktadon de la fako. La Ars coniectandi (postmorta, 1713) de Jakob Bernoulli kaj la Doktrino de ebloj (1718) de Abraham de Moivre studis la disciplinon kiel branĉo de la matematikoj. En la moderna erao, la laboro de Kolmogórov estis kolono en la formulado de la fundamenta modelo de la Teorio de Probableco, kiu estas uzita tra la statistiko.

Pierre-Simon Laplace (1774) faras la unuan provon dedukti regulon por la ĉifro de observoj de la komencoj de la teorio de probabloj. Laplace reprezentis la leĝon de probabloj de eraroj per kurbo kaj li deduktis formulon por la mezumo de tri observoj. La metodo de kvadrataj minimumoj, kiu estis uzita por minimumigi la erarojn en mezuradoj, estis eldonita sendepende por Adrien-Marie Legendre (1805), Robert Adrain (1808), kaj Carl Friedrich Gauss (1809). Gaŭso estis uzinta la metodon en lia fama antaŭdiro de la lokigado de la nanoplanedo Cereso en 1801. Pliaj provoj estis skribitaj de Laplace (1810, 1812), Gaŭso (1823), James Ivory (1825, 1826), Hagen (1837), Friedrich Bessel (1838), W.F. Donkin (1844, 1856), John Herschel (1850) kaj Morgan Crofton (1870). Aliaj kontribuintoj estis Ellis (1844), Augustus De Morgan (1864), Glaisher (1872) kaj Giovanni Schiaparelli (1875). La formulo de Peters por , la probabla eraro de simpla observo estas bone konita.

La 19a jarcento inkludas aŭtorojn kiel Laplace, Silvestre Lacroix (1816), Littrow (1833), Richard Dedekind (1860), Helmert (1872), Hermann Laurent (1873), Liagre, Didion kaj Karl Pearson. Augustus De Morgan kaj George Boole plibonigis la prezenton de la teorio. Adolphe Quetelet (1796-1874),fariĝis alia grava fondinto de la statistiko kaj enkondukis la nocion de la «averaĝa homo» (l’homme moyen) kiel maniero kompreni la kompleksajn sociajn fenomenojn.

Aktuala stato

Dum la 20a jarcento, la kreo de precizaj instrumentoj por aferoj de publika sano (Epidemiologio, biostatistiko, ktp.) kaj sociaj kaj ekonomiaj celoj (proporcio de senlaboreco, Ekonometrio, ktp.) necesigis la konstantan uzadon de la oportunaj statistikoj.

Hodiaŭ la uzo de la statistiko etendiĝis for de ĝiaj originoj kiel servo al la Ŝtato aŭ al la registaro. Personoj kaj organizoj uzas statistikon por kompreni datumojn kaj preni decidojn en sociaj kaj naturaj sciencoj, medicino, negocoj kaj aliaj areoj. La statistiko estas komprenita ĝenerale ne kiel sub-areo de la matematikoj sed kiel malsama scienco «aliancita». Multaj universitatoj havas akademiajn fakojn de matematiko kaj statistiko aparte. La statistiko instruas en fakoj tiel diversaj kiel psikologio, eduko kaj publika sano.

Bazaj konceptoj kaj rezultoj donitaj de Teorio de probabloj

Se la probablodistribuo de variablo X estas normala, la aritmetika averaĝo estas la plej efika (minimumvarianca) pritakso de ekspekto de la variablo:

kaj la ekspektofidela estimanto por la varianco estas

La kvadratradiko pritaksas disiĝgradon de la (kvankam ne estas ekspektofidela pritakso de ).

Praktike oni plej ofte uzas la suprajn pritaksojn, kiam oni volas scii lokon ĉirkaŭ kiu X varias kaj la koncernan gradon de disiĝo.

Statistikaj metodoj

Oni povas dividi statistikajn metodojn diversmaniere:

  1. laŭ la nombro de traktataj variabloj: ĉu unu, du aŭ pli
  2. kiom oni scias pri valoroj de variablo: ĉu oni scias ilin perfekte,

t.e. la distribuo estas konata (parametra metodo), aŭ en alia ekstremo, la valoroj estas kodigitaj per klaso aŭ vicnombro (neparametra metodo)

Grafikaĵo de sonorila kurbo pri normala distribuo.
Histogramo de nombroj de okazaĵoj laŭ iliaj valoroj, la plej oftaj valoroj estas ĉircaŭ 100.


Vidu ankaŭ

Eksteraj ligiloj

Ŝablono:LigoElstara