? /usr/local/bin/bsproc

spam/

こうしたら、今朝、ちゃんと英語のspamが二件ここに入っていた。前はSPAMを全部消していたので、元データが70件しかなくて、基礎データが不足していると思うのだが、今の所ちゃんと動いているみたいだ。後は、基礎データ作成のコマンドを定期的に実行すれば、どんどん精度が上がっていくはずである。

同様のしくみがmozillaにも標準装備されるようだ。ということは、これを回避するSPAM業者向けのアルゴリズムを発明したら、相当儲かるのではないか。そう思ってちょっと考えてみたのだが、このアルゴリズムのミソは、個人個人が自分のメールを使って基礎データを作成するので、それぞれ微妙に特性の違うフィルタを使うことになることだ。だから、ある個人のフィルタをかいくぐることは簡単だけど、多数のフィルタを全部すり抜けようとするとこれは難しい。

しかし、これもslammerやdeepblueと同じで、ある意味単純なアルゴリズムの馬力勝負型である(文法を理解したりはしない)。やはり、コンピュータというものはこう使うものらしい。