|
VSantivirus No. 1104 Año 7, Miércoles 16 de julio de 2003
Cómo acabar con el SPAM de una vez por todas... o casi
http://www.vsantivirus.com/filtrosbayes.html
Por Skullman
skullman@villanos.net
[Publicado en VSAntivirus con autorización del autor]
El correo basura, más conocido por su acepción inglesa SPAM es un problema cada vez mayor, que nos afecta a todos los que tenemos una dirección de correo electrónico. Todos los intentos por ilegalizarlo no han conseguido absolutamente nada ya que, normalmente, los envíos se hacen desde países donde no existe ninguna legislación al respecto. O bien donde la hay, como en España, se ha comprobado que es totalmente ineficaz.
Así que, una vez más somos los propios usuarios los que tenemos que, de alguna manera ponerle freno, para que algo que antaño era tan normal como revisar tu buzón de correo, no te suponga el estar constantemente eliminando correos que te venden Viagra <http://vsantivirus.com/scam-vacaciones.htm> o que te felicitan por haber ganado un maldito viaje a Florida para toda la familia <http://vsantivirus.com/scam-vacaciones.htm>.
En nuestra lucha, hasta hace poco teníamos todas las de perder, pero parece que cada vez las armas son mejores y más eficaces. Veamos de las que disponemos:
Listas negras y listas blancas
Fue la primera idea que se barajó para acabar con el correo basura, cualquiera (empresa, institución, organismo, persona...) que disponga de un servidor que permita el envío de correo basura, será incluido en una de las múltiples listas negras. A estos servidores se les conoce como Relés de correo abiertos (Open Relays) <http://www.ordb.org/faq/#what_is> ya que permiten el envió de correo a cualquier persona, en lugar de sólo permitirlo a sus propios clientes o usuarios.
Sobre este tema, recientemente la Comisión Federal de Comercio de los EEUU <http://www.ftc.gov/> ha enviado un millar de cartas a servidores de correo que han sido identificados como relés de correo abiertos para informarles de su situación y cómo corregirla <http://www.ftc.gov/bcp/conline/edcams/spam/openrelay.htm>. Una buena iniciativa de la que debería aprender más de un gobierno.
Las listas negras se nutren directamente de las denuncias de los usuarios que han sido víctimas de un spam. Por ejemplo si yo recibo un mensaje no solicitado a mi buzón, simplemente lo envío a uno de los organismos que controlan las listas negras y ellos, después de analizar sus cabeceras, determinan el servidor que lo ha enviado y si no es seguro lo incluyen.
Si antes de bajarnos el correo, hacemos pasar nuestros mensajes por un programa que compruebe el origen de cada correo con una o varias listas negras conseguiremos eliminar más del 90% del Spam recibido. El problema es que estamos bloqueando TODOS los correos que provienen de un servidor determinado, sin importar si son o no basura.
En mi caso concreto estuve probando durante un mes Spam-Pal <http://www.spampal.org/>, una herramienta que comprobaba todos los correos que recibía con varias "listas negras". Al final opté por desinstalarlo, ya que no paraba de darme problemas con correos que en absoluto eran comerciales. Incluso en alguna ocasión me llegó a bloquear todos los correos que recibía de usuarios de Terra.
Realmente el gran problema de estas listas es que bloquean a proveedores enteros, llegando a ejercer de censores. Sin ir más lejos existe una página <http://www.dotcomeon.com/> (link en inglés) con toda una teoría conspiratoria acerca de una de las listas más utilizadas: MAPS
Las listas blancas, tienen poca utilidad para un usuario común, en ellas incluyes a todo aquel que te puede enviar correos, rechazando todos los demás. Solo son útiles cuando nuestra correspondencia es entre un grupo cerrado de gente y a la que damos su consentimiento para escribirnos.
Filtros Bayesianos
Lo que hacen estos filtros no es sino leer todos los correos que nos llegan y una vez analizado su contenido, determinar según las palabras que contengan si son "buenos" o "malos". Para que un filtro Bayes funcione, lo que tenemos que hacer es enseñarle, marcando poco a poco todo el correo basura que recibimos. Para que comience a ser efectivo debemos de haberle proporcionado unos 1000 mensajes basura y otros tantos "buenos", de este modo el filtro sabrá diferenciar su contenido.
Una vez ha aprendido, sabe, por ejemplo, que cuando encuentra un mensaje con la palabra "Viagra" hay un 99% de posibilidades de que el mensaje sea Spam. De todos modos, si nosotros fuéramos médicos o farmacéuticos, nuestro filtro habrá aprendido que en nuestros mensajes aparece también esta palabra, por lo que comprobará muchas otras más, como puedan ser "clic", "unsubscribe", etc. que jamás aparecen en nuestra correspondencia "legal".
Esta capacidad de aprendizaje es su mayor baza, y con muy poco que pongamos de nuestra parte logran cifras de acierto cercanas al 100%.
Una excelente introducción a estos filtros es el artículo que escribió Mercè Molist cuando prácticamente estos filtros eran aún pura teoría: Inteligencia artificial para luchar contra el correo basura
<http://www.vsantivirus.com/mm-ia-antispam.htm>
¿Cómo puedo utilizar los filtros bayesianos para eliminar mi correo basura?
Cada día son más los programas que hacen uso de estos filtros, en la siguiente tabla aparecen algunos de ellos, con el tipo de licencia: Libre, Shareware (Probar antes de comprar) o de pago.
Al ser un método todavía muy joven no hay muchos programas que nos permitan comprobar la eficacia de estos filtros, y actualmente los únicos clientes de correo que hace uso de ellos son Gnus en Linux <http://www.gnus.org/>, Mail en Mac OS X <http://www.apple.com/macosx/> y Mozilla 1.3 <http://mozilla.org> en todas las plataformas, incluida Windows. En este cuadro se pueden ver de una forma mucho más gráfica:
----------------------------------------------------------
Programa Gnus
Web http://www.gnus.org/
Plataformas Linux
Licencia / Precio Libre / Gratuito
Recomendado [*] [*] [*] [*] [*]
----------------------------------------------------------
Programa Mail
Web http://apple.com/
Plataformas Mac OS X
Licencia / Precio Incluido en Mac Os X
Recomendado [*] [*] [*] [*] [*]
----------------------------------------------------------
Programa Mozilla
Web http://mozilla.org/releases/
Plataformas Windows / Linux / Apple / Solaris ...
Licencia / Precio Libre / Gratuito
Recomendado [*] [*] [*] [*] [*]
----------------------------------------------------------
A continuación aparece una tabla con algunos programas que actúan de filtro, situándose entre nuestro servidor de correo y nuestro programa de e-mail favorito. Su ventaja obviamente es que no tendremos que cambiar de cliente de correo.
----------------------------------------------------------
Programa Popfile
Web http://popfile.sourceforge.net/
Plataformas Windows / Linux / Apple / Solaris
Licencia / Precio Libre / Gratuito
Comentarios Funciona con cualquier cliente de correo.
Recomendado [ ] [*] [*] [*] [*]
----------------------------------------------------------
Programa Bogofilter
Web http://bogofilter.sourceforge.net/
Plataformas Derivados de Unix
Licencia / Precio Libre / Gratuito
Comentarios Funciona con cualquier cliente de correo.
Recomendado [ ] [*] [*] [*] [*]
----------------------------------------------------------
Programa SpamSieve
Web http://www.c-command.com/spamsieve/
Plataformas Apple
Licencia / Precio Probar antes de comprar / 20$
Comentarios Funciona con Emailer, Entourage, Eudora
5.2, Mailsmith, y PowerMail, sólo en
entornos Apple
Recomendado [ ] [ ] [ ] [*] [*]
----------------------------------------------------------
Programa Spamtunnel
Web http://uiorean.cluj.astral.ro/
Plataformas Windows / Linux / Apple / Solaris
Licencia / Precio Gratuito
Comentarios Funciona con cualquier cliente de correo.
Recomendado [ ] [ ] [ ] [*] [*]
----------------------------------------------------------
Programa Smartlook
Web http://www.e-lab.bouygues.fr/DIALOG/
prototypes/smartlook/default.asp
Plataformas Windows
Licencia / Precio Comercial / Gratuito solo versión Beta
Comentarios Sólo funciona con Microsoft Outlook.
Recomendado [ ] [ ] [ ] [ ] [*]
----------------------------------------------------------
Programa Spambully
Web http://www.spambully.com/
Plataformas Windows
Licencia / Precio Probar antes de comprar / 30$
Comentarios Sólo funciona con Microsoft Outlook y
Outlook Express.
Recomendado [ ] [ ] [ ] [ ] [*]
----------------------------------------------------------
Programa Outlook Spam Filter
Web http://www.outlook-spam-filter.com/
Plataformas Windows
Licencia / Precio Probar antes de comprar / 30$
Comentarios Sólo funciona con Microsoft Outlook y
Outlook Express.
Recomendado [ ] [ ] [ ] [ ] [*]
----------------------------------------------------------
Con todos estos programas no evitamos el primer mal: bajarnos el correo basura del servidor. En esta línea existen varios programas que instalados en nuestros servidores de correo eliminarían los mensajes haciéndolos pasar por filtros bayes, aunque al no ser un sistema 100% fiable, yo siempre preferiré bajármelos a mi equipo por si alguno de los mensajes que el programa ha detectado como Spam, no lo fuera.
En mi experiencia personal, Mozilla <http://mozilla.org/> me ha eliminado más de 3.000 correos basura en los tres meses que lo llevo instalado con solo 1 falso positivo. Para mi es un índice totalmente aceptable de error y que me facilita muchísimo la tarea de revisar el correo, haciéndome casi olvidar que existe el Spam.
En definitiva, el uso de este tipo de filtros para eliminar el correo basura es una realidad, con el tiempo se harán más sofisticados y a medida que evolucione el Spam, ellos lo harán en paralelo, consiguiendo que todos nosotros seamos un poco más felices al no tener que soportar el bombardeo publicitario diario en nuestros buzones. Los filtros Bayes han llegado para quedarse y eso me produce un gran regocijo para sarna de los que se inmiscuyen en mi buzón.
Artículo publicado en "El Villano", la revista de Villagüeb, Tésnicas villanas:
http://villanos.net/revista/200301/filtrosbayes.html
Referencias:
Inteligencia artificial para luchar contra el Spam
http://www.vsantivirus.com/mm-ia-antispam.htm
(c) Video Soft - http://www.videosoft.net.uy
(c) VSAntivirus - http://www.vsantivirus.com
|