Vous avez-dû recevoir depuis peu des spams avec les conneries habituelles de viagra, offre spéciale windows, replica watch... et en dessous du texte habituel, un texte cohérent, qui n'a rien à voir, mais qui traite de tout autre chose. Souvent un extrait de littérature connu).
Qu'est-ce donc?
Pour l'expliquer il faut d'abord expliquer ce qu'est un filtre Bayesien.
Pour faire simple, c'est un outil mathématique qui permet aux filtres anti-spam d'évaluer la "spamitude" d'un mail. Ainsi par exemple si vous recevez un message avec les mots "watch", "buy", "replica", la probabilité pour que ce mail soit en fait un spam sera d'autant plus grande que ces mots seront proches les uns des autres dans le texte, et qu'ils seront sur-représentés par rapport à l'ensemble des mots du message.
Vous comprenez pourquoi si vous recevez un mail tout à fait sérieux traitant du trafic de fausses montres, votre filtre anti-spam ne devrait pas le bloquer.
Et vous comprenez aussi pourquoi en noyant ces mots clefs parmi une multitude d'autres mots sans rapport et surtout non-suspects, les filtres anti-spam auront du mal à les déceler...
C'est çà l'empoisonnement Bayesien