Vikipedio:Roboto/Laboroj/Arkivo/2006

El Vikipedio, la libera enciklopedio

Eltrovado de senco[redakti fonton]

Ĝenerala ideo estas fari roboton, kiu plibonigas la artikolojn sence, ne nur aspekte. Ĝi trairu ĉiujn artikolojn kaj aldonu novan sencon. Kie eblas eltrovi aldonan sencon? En nia vikipedio mem kaj en la alilingvaj vikipedioj.

Pri nia vikipedia la sola varianto estas fari ligojn. Fari ligojn de ĉiuj vortoj al ĉiuj artikoloj kun koincidantaj nomoj estas troa varianto, kaj ĉiuokaze la rezulto ne estos tre interesa.

Kion eblas preni de alilingvaj vikipedioj, kio interesas sen tempbezona traduko?

  • Bildojn
  • Tabelojn
  • Ligojn ("Vidu ankaŭ jenon:")
  • Eksterajn ligojn
  • Ŝablonon "{ { Commons| } }"

Ĉi ĉion la roboto serĉu tra ĉiuj intervikiaj ligoj, kaj aldonu simple en finon se ili ankoraŭ ne estas en nia artikolo.

Bildon por uzado ne necesas alŝuti se: bildo (kun la sama nomo) jam estas en nia fako; bildo (kun la sama nomo) jam estas en komunejo; en lingvo, kie la bildo estas trovita, en bildo estas ŝablono "NowCommons" kun alia nomo, kaj bildo kun la alia nomo estas en komunejo. Se la bildon necesas alŝuti la roboto decidu kien ĝin alŝuti. Se la bildo havas unu el la ŝablonoj "{ { GFDL* } }" aŭ { { PD* } } la bildon alŝutu en komunejon, alie en nian fakon. En la fontan bildon indus aldoni ŝablonon "NowCommon" aŭ ligon, sed povas esti problemo pri havado de robota flago en tiu fako.

Tabelojn roboto aldonu ĉar tabelo estas la plej densa informo. Ankaŭ en tabelo kutime estas ne propozicioj sed apartoj vortoj, kiujn pli facile traduki, kaj nombroj kiujn tute ne necesas traduki.

Ligojn eblas aldoni, se tiuj artikoloj en alia lingvo, al kiuj estas la ligoj, havas reajn intervikiajn ligojn al nia lingvo.

Eksterajn ligojn aldoni tute simple.

Kaj en ĉiu okazo estas neceso ion traduki. Fintradukojn povas fari nur homo, sed la roboto povas helpi per preparado. La roboto serĉu alilingvan vorton en vortaro kaj simple anstataŭigu ĝin per traduko. Por propozicioj ĉio ne donas bonajn rezultojn, sed por apartaj vortoj, subtitoloj ktp. ĉio povas esti eĉ tute bona. Kaj la originala teksto ĉiam restu apude.

Vortarojn por tradukado eblas trovi en ReVo kaj en vikipedio mem, uzante XML eligon por fari vortarojn.

Verŝajne indas meti ĉiun alilingvan kaj robote tradukitan tekston en komenton, tiel ke ĝi ne videblu por legantoj, kaj poste homoj trarigardu, kontrolu, korektu kaj malkomentigu. Do, tabeloj estos post laboro de la roboto tute en komentoj. Bildoj kaj eksteraj ligoj estos komence sen subskriboj. Ligojn eblas aldoni sen iuj problemoj.

Por ke la roboton eblos uzi multfoje, ĝi ankaŭ kontrolu ĉiujn antaŭajn versiojn de la artikolo. Kaj se io jam estis en unu el la antaŭaj versioj, kaj poste estis forigita, la roboto ne aldonu ĉi tion ankoraŭfoje.

Mi mem plejverŝajne havas komprenon kiel teknike ĉi ĉion fari kaj planas eki uzadon de la roboto post kelkaj semajnoj. Sed mi atendas de ĉiuj diversajn ideojn pri ĉi tio. Maksim 11:53, 26. Dec 2005 (UTC)

Estas tre aŭdaca projekto. Verdire ĝi iom krude funkcias, sed traleginte vian enkondukon mi jam pli optimisme rilatas al la tuto. La roboto faras bonan fundamenton por postredakto homa.
Mi nur volas vin peti pri eksteraj ligoj -- oni delonge uzas ŝablonon el anstataŭ steleto antaŭ la ligo; estas bona ideo, ke la roboto mem enmetu la ŝablonon. - Slavik IVANOV 00:41, 13. Jan 2006 (UTC)
Bone, sed mi preferas ne uzi unuoblajn krampojn '[' kaj ']' por ke la adreso videblu (laŭ Helpo:Kiel redakti paĝon).
Tamen estas problemo pro tio ke se bildoj estas malŝaltitaj videblas tro longa teksto "Dosiero:Ikono_tero_malgranda.png". Ĉu eblas ŝanĝi la ŝablonon tiel ke la teksto estu malpli longa? Maksim 14:08, 13. Jan 2006 (UTC)
Mi faris. Nun montriĝas punkto "•" konata de la normalaj listoj, se ne montriĝas bildoj. Blahma 14:26, 13. Jan 2006 (UTC)

Reenkategoriigo[redakti fonton]

Mi volas ŝanĝi kategorion Usonaj prezidantoj al Kategorio:Usonaj prezidantoj. Tiu tasko ne estos tre malfacila, ĉar estas nur 43 prezidentoj, do eble mi faros ĝin permane. Tamen, mi pensas ke la ebleco robote ŝanĝi kategoriojn estus utila. Tia roboto ankaŭ povus certigi, ke personaj nomoj en kategorioj aperu laŭalfabete: Ekz - artikolo "Martina NÁVRATILOVA" estu enkategoriigita kiel [[Kategorio:Tenisludantoj|NAVRATILOVA MARTINA]]. Notu, laŭ mia opinio, la dua parto havu nur majuskajn latinajn literojn - tamen la precizaj reguloj estas diskuteblaj. (La dua parto metas ŝian nomon sub N: ofte oni forgesas ĝin, tiukaze ŝi aperus sub M) Le Hibou 08:12, 27. Dec 2005 (UTC)

Verŝajne Usonaj prezidantoj al Kategorio:Usonaj prezidentoj ? Ĉi tion mi faros, verŝajne, morgaŭ.
Sed pri [[Kategorio:Tenisludantoj|NAVRATILOVA MARTINA]] ĉio sufiĉe malpli facilas, mi ĉi tion ankoraŭ ne pretas fari perrobote. Maksim 07:25, 28. Dec 2005 (UTC)
La tasko pri Usonaj prezidantoj al Kategorio:Usonaj prezidentoj estas plenumita. Maksim 06:53, 29. Dec 2005 (UTC)
Ne tiom malfacilas la reenkategoriigo de homoj kun vicigŝlosiloj laŭ nomoj. Mia RBT jam pli-malpli sukcese traktas tion kaj enmetas tiajn ŝlosilojn en la aldonataj kategorioj Naskiĝintoj kaj Mortintoj. Post kiam mi tion finbonigos, mi povas komenci okazigi tian ĉi anstataŭigadon ankaŭ ĝenerale en ĉiuj biografiaj artikoloj. Blahma 12:08, 13. Jan 2006 (UTC)

Reaj ligoj al apartigiloj[redakti fonton]

Se estas apartigilo "ABC", kiu ligas al artikoloj "ABC (DEF)", "ABC (GHI)", "ABC (KLM)" ktp.

Do ni enmetu en ĉiun el artikoloj "ABC (DEF)", "ABC (GHI)", "ABC (KLM)" ktp. tian tekston je komenco:

"La vorto "ABC" havas plurajn signifojn. Pri la aliaj signifoj vidu apartigilon [ [ABC] ]" Maksim 07:24, 26. Jan 2006 (UTC)

Intervikiaj ligoj por kategorioj[redakti fonton]

Ilin eblas kaj nemalbonas havi, kvankam kutime oni ilin ne metas.

Se artikolo ABC havas intervikian ligon al artikolo "yz:DEF" en lingvo yz.

Do ni faru intervikian ligon de kategorio "kategorio:ABC" al "yz:kategorio:DEF" en lingvo yz, se ambaŭ kategorioj ekzistas.

Ankaŭ konsideru ke oni ofte nomas ketegoriojn el pluralo, do povas sukcesi iu el kombinaĵoj

"kategorio:ABC" al "yz:kategorio:DEF"
"kategorio:ABCj" al "yz:kategorio:DEF"
"kategorio:ABC" al "yz:kategorio:DEFj"
"kategorio:ABCj" al "yz:kategorio:DEFj"

Maksim 07:24, 26. Jan 2006 (UTC)

Mi opinias, ke tion ĉi (kune kun multaj aliaj aferoj) povas facile solvi la intervikia roboto, kiu jam ekzistas en la robotpako elŝutebla, kaj kiun do sufiĉas simple starti kaj lasi labori. Se ekzistas almenaŭ unu konekto inter la koncerna artikolo e-lingva al aliaj, ĝi kapablas trarampi la "reton" per alilingvaj vikipedioj kaj rikolti ligilojn al ĉiuj aliaj artikoloj pri tiu temo en aliaj lingvoj. Por la pli problemaj kazoj, kiam en la e-a artikolo ankoraŭ neniu intervikia ligilo troviĝas, ekzistas miakrede alia roboto, kiu ofertas unu post unu paĝojn kaj petas pri enkategoriigo - aŭ, ankaŭ, alia kiu laŭ paĝo jam enkategoriigita ofertas unu post unu la paĝojn de ĝi alligitaj kaj demandas, ĉu tiu ankaŭ apartenas en la saman kategorion. Eble indus provi iom umi pri tiuj ĉi robotoj ĉe la e-vikio, ĉu ne? Ĉu vi, Maksim, pretas fari tion, aŭ ĉu mi foje faru? Marek "Blahma" Blahuš 12:47, 26. Jan 2006 (UTC)
Al mi ŝajnas ke ĝuste tion kion mi skribis la nuna intervikia roboto fari ne kapablas. Mi mem ĉi tion provos, sed ne tuj ĉar mi ankoraŭ ne ĉiujn problemojn solvis pri jam komencitaj projektoj. Kiam mi komencos ion provi mi skribos ĉi tien, do se vi komencos nun pri ĉi tio okupiĝi vane kelkfoje farita laboro ankoraŭ ne estos.
Ankaŭ, normajn initervikiajn robotojn oni ĉi tie plenumadas, vi povas ilin vidi per ligo "montru robotojn" en paĝo de la lastaj ŝanĝoj. Ili faras redaktojn kun komentoj similaj al "(robot Adding: de)" Maksim 07:06, 27. Jan 2006 (UTC)

Intervikiaj ligoj por geografiaj kaj personaj nomoj[redakti fonton]

Kutime malmulte konataj geografiaj objektoj kaj personoj havas la saman nomon en multaj lingvoj, des pli se la lingvoj uzas latinan alfabeton. Do ni povas ligi simple al la samnoma artikolo en la alia lingvo, se ĝi ekzistas. Maksim 07:24, 26. Jan 2006 (UTC)

Ĉi tia duonaŭtomata ilo jam ekzistas:
http://tools.wikimedia.de/~flacus/IWLC/start.php
Post provo de ĝi evidentiĝas ke tute aŭtomata roboto por ĉi tio ne taŭgas ĉar tiam estos multaj misaldonoj. Maksim 05:22, 18. Apr 2006 (UTC)

Enkategoriigado[redakti fonton]

Roboto povas enkategoriigi artikolojn laŭ la unua propozicio de la artikolo. Ekzemple:

"Aaa Bbb Ccc estas fama franca pentristo (naskiĝis en 1888)."

Tiam eblas trovi substantivon post la vorto "estas" kaj la antaŭajn adjektivojn. Kaj se tiaspeca kategorio ekzistas - uzi ĝin. En la ekzemplo indas provi kategoriojn

Famaj francaj pentristoj
Fama franca pentristo
Francaj pentristoj
Pentristoj el Francio
Franca pentristo
Pentristo el Francio
Pentristoj
Pentristo

konsiderante ankaŭ kaj unue pluralojn.

Ankaŭ indas konsideri variantojn kun prepozicioj en la unua propozicio de la artikolo, ekzemple

"Aaa Bbb Ccc estas fama pentristo el Francio (naskiĝis en 1888)."


Tiel prilabori indas nur nekategoriitajn artikolojn, sed se estas nur kategorioj "naskiĝintoj en ...", "mortintoj en ...", "ĝermo" ktp ili ne sufiĉas.

Maksim 14:09, 29. Mar 2006 (UTC)

Datumoj pri usonaj urboj/kantonoj[redakti fonton]

Ĉe la Usona Oficejo de Censuso multe de datumo ekzistas, simple elŝutebla de ĉi tie. La teksto-datumbazo enhavas sufiĉe datumoj por krei bonan artikolon pri ĉiu usona urbo kaj kantono. Mi povas traduki bazan ŝablonon por roboto enmeti la jenajn: Urbo-nomo, Kantono-nomo, Ŝtato-nomo, nombro de loĝantoj, nombro de loĝejoj, Areo (entuta), Areo (lando), Areo (akvo), Latitudo, Longitudo.

Ĉu tian laboron la roboto povas fari? -- Yekrats 14:34, 31. Jan 2006 (UTC)

Jes, traduku. Ankaŭ ĉu vi povas klarigi kio estas diferenco inter (laŭ 5 dosieroj de la retpaĝo)
  • Census 2000 Tracts
  • Incorporated and Census Designated places
  • primary legal divisions or statistically equivalent entities
  • county subdivisions
  • 5 digit ZCTAs
La roboto povas envikiigi ĉiajn datumoj. Se vi preparos datumojn mi petas vin uzi formaton, kiun komprenas mia roboto:
nomo de paĝo 1
linio 1 de paĝo 1
...
linio lasta de paĝo 1
========
nomo de paĝo 2
linio 1 de paĝo 2
...
linio lasta de paĝo 2
========
...
...
...
nomo de paĝo lasta
linio 1 de paĝo lasta
...
linio lasta de paĝo lasta
========
"========" estas ne malpli ol 8 signoj "=".
Ankaŭ mi mem povas deĉifri tiuj tekstajn dosierojn de tiu retpaĝaro.
Tamen laŭ mi tiuj datumaj ne sufiĉas por krei sufiĉe grandan novan artikolon pri urbo aŭ loĝejo. Mi preferus aŭ trovi aldonajn datumojn aŭ fari artikolojn por distriktoj aŭ regionoj kun tabeloj kun la informo pri ĉiuj urboj en la distrikto aŭ regiono.
Maksim 14:48, 31. Jan 2006 (UTC)

Interlingvaj ligoj[redakti fonton]

(komenca diskuto movita ĉi tien el la Diskutejo)

Ĉu iu scias se eblas aldoni aŭtomate interlingvajn ligojn? Mi celas aldonon de la ligiloj al Esperantaj artikoloj en nacilingvajn artikolojn.
Jen ekzemplo: artikoloj pri "Reĝo Arturo" en la angla, germana, franca, ... enhavas ligilojn al esperanta artikolo, sed tiuj en la finna, hungara, pola, ... ne enhavas ilin. Ĉu necesas aldoni ĉiujn ligilojn mane?
Dankon por la informo, --Bea 14:10, 31. Jan 2006 (UTC)

La ligoj aperos aŭtomate post kelkaj semajnoj aŭ monatoj se estas almenaŭ unu ligo. Maksim 14:36, 31. Jan 2006 (UTC)
Cetere oni ankaŭ povas lanĉi sian propran roboton por okazigi la aferon, kaj ne devi atendi ĝis iu alia faros tiel. Mi jam prikonsideris tiun ĉi eblecon, sed amiko havanta roboton ĉe cs: atentigis min, ke tiu afero estas ege temporaba (por la komputilo, feliĉe ĝi povas labori sen mia asisto). Mi volas ankoraŭ unue enoridigi la ĝisnunajn miajn entreprenojn per la RBT, kaj poste mi eble povas okupiĝi pri tiu ĉi afero. Marek "Blahma" BLAHUŠ 20:38, 1. Feb 2006 (UTC)
I run an interwiki bot on eo: occasionally. (Sorry, I can read some Esperanto, but not write it.) If you have a request, please ask on my discussion page. – gpvos (diskuto) 20:08, 14. Feb 2006 (UTC)

Kiel uzi anstataŭigan roboton[redakti fonton]

La roboto prilaboras grupojn de paĝoj. Por paĝoj ene de unu grupo la anstatŭigoj estas la samaj. Por diversaj grupoj la anstatŭigoj povas esti malsamaj.

Por ĉiu paĝo, se en ĝi ekzistas iu malnova teksto, ĝi estas anstataŭigata per respektiva nova teksto, eble kelfoje en unu paĝo. Se la malnova teksto estas malplena, la nova teksto estas aldonata en fino de la paĝo.

Intervikiaj ligoj ne estas prilaborataj.

Kodo de la roboto konsistas el du dosieroj: ĉe io:User:Maksim/sozd_sta dosiero zamen.py kaj ĉe io:User:Maksim/aald dosiero bib_tekst.py


Preparu dosieron kun ĉi tia enhavo:

nomo de paĝo 1 de grupo 1
nomo de paĝo 2 de grupo 1
...
nomo de paĝo lasta de grupo 1
?=======
1
-=======
malnova teksto 1 de grupo 1
+=======
nova teksto 1 de grupo 1
?=======
1
-=======
malnova teksto 2 de grupo 1
+=======
nova teksto 2 de grupo 1
...
...
...
?=======
1
-=======
malnova teksto lasta de grupo 1
+=======
nova teksto lasta de grupo 1
============
nomo de paĝo 1 de grupo 2
nomo de paĝo 2 de grupo 2
...
nomo de paĝo lasta de grupo 2
?=======
1
-=======
malnova teksto 1 de grupo 2
+=======
nova teksto 1 de grupo 2
?=======
1
-=======
malnova teksto 2 de grupo 2
+=======
nova teksto 2 de grupo 2
...
...
...
?=======
1
-=======
malnova teksto lasta de grupo 2
+=======
nova teksto lasta de grupo 2
============
...
...
...

La dosiero devas esti konservita kiel UTF-8 kaj havi finaĵon ".txt".

Se nomo de la dosiero estas ekzemple "abcdef.txt" ruligu komandon

zamen.py abcdef

do, skribante la nomon sen la finaĵo ".txt".

Dum kaj post sia laboro la roboto kreos du dosierojn: "abcdef_ot.txt" kaj "abcdef_op.txt" (en ĉi tiu ekzemplo).

La "abcdef_ot.txt" enhavas raporton, tie ĝi skribas nomojn de la prilaboritaj paĝoj kaj kvanton de sukcesaj anstataŭigoj por ĉiu paĝo por ĉiu paro de malnova teksto kaj nova teksto.

La "abcdef_op.txt" enhavas enhavon de ĉiuj prilaboritaj paĝoj. Post "-=======" estas la fonta varianto kaj post "+=======" estas la ŝanĝita varianto de la teksto.

Simpla ekzempo: en artikolo Urbo anstataŭigi vorto "stratto" per vorto "strato":

urbo
?=======
1
-=======
stratto
+=======
strato
============

La samo sed konsiderante minusklan kaj majusklan variantoj:

urbo
?=======
1
-=======
stratto
+=======
strato
?=======
1
-=======
Stratto
+=======
Strato
============

Simpla ekzempo: en artikolo Urbo aldoni kategorion kategorio:geografio:

urbo
?=======
1
-=======
+=======
[[kategorio:geografio]]
============
Demando por kompreni la ekzemplon de enigata dosiero: ĉu en facila kazo povas esti nur la unua grupo? Ĉu vi povas doni ekzempleton, kiam bezonatas pli ol unu grupo? - Slavik IVANOV 16:02, 15. Mar 2006 (UTC)

Esperantigo de sistemaj mesaĝoj[redakti fonton]

(Jen robota propono fare de Arno, sed mi proponis helpon programi ĝin. Ne tro miru — ne temas pri robota tradukado!)

Estas multe da sistemaj mesaĝoj en la nomspaco MediaWiki kiuj estas defaŭlte anglalingvaj, kaj kiuj bezonas esperantigon. Tiu bezono neniam finiĝas, ĉar oni daŭre ŝanĝas la programaron kaj kreas novajn mesaĝojn tradukendajn. La mesaĝojn oni ŝanĝas redaktante paĝojn en la nomspaco MediaWiki (eblas por administrantoj) sed redakti ilin mane estas iom teda afero. La propono estas havi paĝon kie ĉiuj ŝanĝotaj mesaĝoj estas kune listigitaj, kaj foje robote kopii ilin al la individuaj paĝoj en la nomspaco MediaWiki. Jam ekzistas Vikipedio: ŝanĝendaj sistemaj mesaĝoj, sed ĝia formato estas iuloke malstrikta, do bezonatas aparta paĝo laŭ strikta formato kiu enhavas tute pretajn versiojn kopiotajn. Oni ne devus havi administrajn rajtojn por redakti tiun paĝon, sed la roboto bezonos administrajn rajtojn, kaj la robotisto kontrolu tuj antaŭ ekigi la roboton, ke oni ne metis spamaĵojn ktp en la liston. Mi mem proponas verki la programon venontsemajne, sed la robotisto povos esti principe iu ajn aprobita por tiu tasko, kiu disponas je Linuksa komputilo (tamen Arno sugestis ke mi faru ankaŭ tion). Provizore mi kreis la konton Vikipediisto:SistMesEspigRoboto por la roboto, kontonomo sugestita de Arno.

Mi nun ekas espereble vian diskuton de la propono ĉi tie, sed bv rimarki, ke mi mem estos for de la vikio ekde vendredo (morgaŭ) ĝis dimanĉo. Sok Na Men Sui Lui 10:59, 7. Dec 2006 (UTC)

Laŭ mi tio estas bonega propono. Kaj multan dankon al vi (Sok Na Men Sui Lui) pro via preteco krei la roboton. Eble vi povus ankoraŭ mencii, kiuj detaloj de la roboto ankraŭ estas diskutindaj. Marcos 15:34, 7. Dec 2006 (UTC)

Neniuj detaloj estas nepre diskutendaj, sed mi volis doni al homoj la eblon reagi laŭplaĉe. Ĉar la ĝisnuna respondo estis positiva (dankon), se neniu baldaŭ plendos principe pri la proponita roboto, mi kreos dum la venontaj tagoj testroboton. La testroboto redaktos nur kelkope testpaĝojn en la vikipediista nomspaco (sub-paĝoj de la v-ista paĝo de la robota konto), kaj ni povos decidi tiam ĉu la roboto ŝajnas bone funkcii. Ĉar la redaktoj estos nur kelkopaj, dum nura testado ne endos aldoni la konton al la listo de robotoj; nek necesos administraj rajtoj por la roboto dum tiuj testoj.

Unu afero eble diskutinda estas la formato de la eniga paĝo, sed almenaŭ dum testado mi verŝajne uzos la jenan (iom hazarde elektita), kaj mi atendas ke ĝi estos sufiĉe facile ŝanĝebla laŭ posta bezono.

:@%[[Paĝo redaktota]]
nova enhavo
alia linio
ktp...
:@%fino
:@%[[Alia paĝo redaktota]]
ĝia enhavo
...
:@%fino
kaj simile...

Ne indos malŝpari tempon kreante manieron por specifi ke oni deziras enmeti la precizan linion :@%fino en sisteman mesaĝon. En tiu treege malprobabla okazo, oni simple ne uzu la roboton.

Sok Na Men Sui Lui 21:55, 10. Dec 2006 (UTC) (esperante ke mi tajpis sencaĵojn, ĉar mi estas nun tro laca por kontroli)

Mia testa roboto nun ŝajne funkcias. Ĝi provizore uzas kiel enigan paĝon Vikipediisto:SistMesEspigRoboto/testo. Kiam oni ekas la roboton, ĝi interpretas en tiu paĝo ĉiun sekcion kiu estas laŭ la ĉi-supra formato, forigas ĝin de la eniga paĝo (lasante tie neŝanĝitan ĉiun alian tekston), kaj faras la redaktojn. Se la paĝo jam ekzistas, ĝi tute anstataŭigas la antaŭan tekston. La fonta kodo estas iom malbela, sed por malkaŝeco mi alŝutos ĝin al Vikipediisto:SistMesEspigRoboto/fontokodo. Mi petos de Arno robotan statuson por la robota konto, kaj indos fari pluajn zorgajn testojn antaŭ fari ion gravan per ĝi. Sok Na Men Sui Lui 00:59, 13. Dec 2006 (UTC)