Spamfiltrilo

El Vikipedio, la libera enciklopedio
Saltu al: navigado, serĉo

Spamfiltrilo, (ankaŭ nomata trudleterfiltrilo) estas parto de poŝtoservilo aŭ de retpoŝtilo, kiu provas bari spamon, tiel ke la ricevonto de la mesaĝo entute ne ricevas ĝin, aŭ tiel ke la ricevonto ne vidas ĝin. Ekzistas tri ĉefaj specoj de spamfiltriloj:

IP-filtriloj[redakti | redakti fonton]

Plej ofte uzataj ĉi-momente estas la IP-filtriloj. Iuj spamistoj konstante ŝanĝas la sendadreson, aŭ eĉ falsas ĝin, sed tamen sendas ĉiam el komputilo kun difinita IP-numero. Por haltigi tiujn spamleterojn internaciaj asocioj kiel SpamCop, SORBS kaj NJABL kreas nigrajn listojn de IP-numeroj pri kiuj oni scias, ke tra ili estas dissendata spamo. La ricevantaj poŝtoserviloj povas kompari la IP-numeron de la sendantaj poŝtoserviloj kun la enhavo de tiuj listoj, kaj malakcepti kontakton kun tiuj poŝtoserviloj, kiuj estas menciitaj en ili.

Kovertaj filtriloj[redakti | redakti fonton]

En la momento, kiam unu poŝtoservilo volas transdoni mesaĝon al alia poŝtoservilo, estas komence komunikataj nur la adreso de la sendinto, ekzemple FROM:mi@mia.retregiono.net, kaj la adreso(j) de la ricevonto(j), ekzemple RCPT:li@lia.retregiono.net (tiujn adresojn oni nomas la 'koverto' de la retletero). Eĉ ne ricevinte la kompletan enhavon de la retletero, la poŝtoservilo povas do jam bari leteron surbaze de la enhavo de la koverto. Ekzistas ĉi-loke du eblecoj:

  1. Barado pro difinita vorto en la sendadreso: povas esti barata ekzemple ĉiu poŝto, kiu venas de retregionoj en kiuj aperas difinitaj vortoj kiel sex, porn kaj simile.
  2. Barado pro la sendadreso mem: ĉar spamistoj ofte falsas retadreson, la ricevanta poŝtoservilo unue povas kontroli, ĉu la retregiono de la sendinto ja ekzistas (en la supra ekzemplo mia.retregiono.net), kaj se jes, ĉu ankaŭ la sendinto ekzistas tie (en la supra ekzemplo mi). Se ne, ĝi povas interrompi la konekton kun la sendanta poŝtoservilo. Per pli komplika sistemo, SPF oni povas kontroli ĉu la IP-adreso de la sendanto validas por la retadreso.

Enhavaj filtriloj[redakti | redakti fonton]

Se la du supraj filtriloj ne haltigas retleteron, tiam la tuta enhavo de la letero, ĉapo kaj korpo, estas transdonata de la sendanta servilo al la ricevanta servilo. En tiu momento povas okazi plia kontrolo de la enhavo. Ekzistas ĉi-loke du eblecoj:

  1. Statika enhava filtrilo: la enhavo de la retletero estas komparata kun iu listo de malpermesitaj vortoj. Se difinita vorto aperas en la retletero, ĝi ne estas plusendata al la ricevonto. Aliaj filtriloj funkcias per poentoj. Ekzemple Viagra valoras 50 poentojn kaj porno valoras 55. Se difinita letero atingas 100 poentojn, ĝi estas barita.
  2. Memlerna enhava filtrilo: pli modernaj estas la memlernaj enhavaj filtriloj. Komence ilia listo de malpermesitaj vortoj estas malplena, kaj do ĉiuj leteroj estas plusenditaj al la ricevonto. Se la ricevonto markas iun leteron kiel spamo, la filtrilo registras la enhavon de la letero. Ricevinte plurajn leterojn, la filtrilo lernas kiuj vortoj plej ofte aperas en spamleteroj, kaj kiuj vortoj ne. Tiuj memlernaj filtriloj ofte estas ankaŭ nomataj Bayes-filtriloj, laŭ la angla matematikisto kaj statistikisto Thomas Bayes. Kvankam la memlernaj filtriloj uzas statistikon, estas ne tute certe, ĉu ili uzas ĝuste tiujn formulojn, inventitaj de Bayes. Spamantoj nuntempe ofte plenigas siajn mesaĝojn per hazardaj vortoj kaj frazoj, por provi malefikigi tiajn filtrilojn.

Eksteraj ligiloj[redakti | redakti fonton]