Leĝo de Zipf

El Vikipedio, la libera enciklopedio

La distribuo de Zipfleĝo de Zipf ricevis sian nomon de George Kingsley Zipf (1902-1950). Ĝi priskribas kiom ofte la diversaj vortoj de ajna lingvo aperas en tekstoj.

En tekstoj, atendeble, gramatikaj vortoj kiaj lade aperas tre ofte. Aliaj vortoj aperas malpli ofte, aŭ eĉ nur unufoje. Zipf konstatis, ke ordigante la vortojn de plej oftaj ĝis plej maloftaj, oni vidas ke la apernombro (aŭ ofto) de vorto estas inverso de ĝia rango.

apernombro de n-ranga vorto = (apernombro de 1a-ranga vorto) / n

La apernombro de la dua vorto estas proksimume duono de la apernombro de la unua vorto. La apernombro de la tria vorto estas prokimume triono de la apernombro de la unua kaj tiel plu.

Ekzemple:

rango  ofto   vorto
1       150   la
2        90   de
3        52   kaj
...      ..   ...
771       1   vojaĝoj
772       1   volas

Sur logaritma grafikaĵo tiu serio aperas kiel rekta dekliva linio. La zipfa distribuo validas nur proksimume, nur en iom longaj tekstoj, sed ĝi aperas en ĉiuj homaj lingvoj.

Eksperimentaj rezultoj

Bujdosó Iván [1] kalkulis la Zipf-koeficienton de 21 diversaj lingvoj. Li elektis tekstojn de la konstitucipropono de la Eŭropa Unio. Tiu materialo ampleksas nur po 35 pagoj, sed la dokumentoj havas la saman enhavon. Ĉiu teksto estas traduko de la sama afero. Ĝi estas oficiala teksto kaj zorge tradukita. Do Bujdosó supozis ke “la kaŭzo de la diferencoj de la statistikaj indikoj povas esti nur la malsameco de la lingvoj”.

Pri la bildo de la rezultaj Zipf-koeficientoj por ĉiu el la 21 lingvoj, Bujdosó rimarkis ke la diversaj lingvoj ariĝis laŭ siaj grupoj: baltaj, slavaj, ĝermanaj, kaj novlatinaj. “Esperanto estas la 11a inter la 21 lingvoj”.

Li komparis siajn rezultojn kun tiuj de alia esploro[2].

Referencoj

  1. Bujdosó Iván (2008) Parencaj lingvoj, La Ondo de Esperanto, aprilo 2008 (4) p14-15
  2. Manaris k.a. (2006) Investigating esperanto's statistical proportions relative to other languages using neural networks and Zipf's Law. Proceedings of the 2006 IASTED International Conference on Artificial Intelligence and Applications (AIA 2006), feb 13-16, Innsbruck, Aŭstrio.

Eksteraj ligiloj