Common Voice

El Vikipedio, la libera enciklopedio
Salti al navigilo Salti al serĉilo
'Common Voice'
Infografiko pri kiel uzi la programaron Common Voice
Priskribo projekto por krei liberan datumbazon por komputila Parol-rekonado.
Retadreso voice.mozilla.org
Posedanto Mozilla-Fondaĵo
Information icon.svg
vdr

Common Voice estas projekto de la Mozilla-Fondaĵo por krei liberan datumbazon por komputila parolrekonado (ankaŭ nomata 'voĉrekonado'). La celo estas krei bonegan voĉan rekonilon kaj povi rekoni ajnan voĉon, ajnan akcenton. La projekton subtenas volontuloj, kiuj per mikrofono povas registri frazojn, kaj kiuj povas per aŭskultilo validigi registraĵojn de aliuloj.[1]

Kontribuado al la projekto estas tre simpla kaj postulas neniun registriĝon, kvankam eblas indiki salutnomon, retpoŝton kaj la originon (akcento). Oni povas kontribui en du manieroj, ĉefe: "Paroli" aŭ "Aŭskulti". La retejo povas esti uzata kun labortablaj kaj moveblaj aparatoj, tamen por la operaciumo IOS necesas instali la oficialan aplikaĵon de la App Store.

Kontribui "Parolante"[redakti | redakti fonton]

Irante al la oficiala retejo de la projekto, iru al la sekcio "Paroli" kaj registru la frazojn, kiuj aperas sur la ekrano.

Kontribui "Aŭskultante"[redakti | redakti fonton]

Per la sekcio "Aŭskulti" oni povas kontribui, reviziante la frazojn registritajn de aliaj uzantoj, do kontrolante, ke la registrita frazo kongruas kun la reala frazo.

Konto-kreado[redakti | redakti fonton]

Oni ankaŭ povas registri konton kaj aliri "rezervitan" areon: Panelo. En ĉi tiu sekcio oni povas vidi la rangotabelon de kunlaborantoj el la tuta mondo aŭ nur la lingvojn al kiuj oni kontribuas. Dank' al la konto eblas ankaŭ spuri la progresojn faritajn: kiuj estas la registritaj frazoj, kiom el tiuj estas aprobitaj, kaj ankaŭ la procento el la validigitaj frazoj. Oni ankaŭ povas "forigi" sian profilon iam ajn. Tiamaniere la registritaj frazoj estos forigitaj el la aro de datumoj.

La datumbazo estas disponebla laŭ la permesilo CC0.[2][3]. En Aŭgusto 2019 la datumbazon havis pli ol 20 horojn da voĉregistroj en Esperanto, faritaj de pli ol 140 personoj. Nur 10% de la voĉoj estas inaj; krome, personaj pli junaj ol 18 aŭ pli maljunaj ol 40 estas subreprezentitaj en la datumbazon.

Elŝuti la datumbazon[redakti | redakti fonton]

La datumaroj, tio estas ĉiuj "kunfanditaj" aŭdo-dosieroj, estas publike kaj senpage elŝuteblaj el la sekcio "Datumaro". Oni povas elŝuti la preferatan lingvon el tiuj disponeblaj. Estas, antaŭ ol elŝuti, iuj informoj kiel la grando de la dosiero, la horoj da validigitaj dosieroj, la totalaj horoj, la nombro de voĉoj, akcentoj, aĝoj, sekso kaj aliaj datumoj.

Vidu ankaŭ[redakti | redakti fonton]

Referencoj[redakti | redakti fonton]

  1. https://www.liberafolio.org/2020/01/20/virinaj-vocoj-mankas-en-esperanta-datumaro/
  2. https://ikso.net/nova-projekto-de-mozilla-ebligos-al-masinoj-paroli-en-esperanto/
  3. https://revuoesperanto.org/projekto_de_mozilla