<   2011年 04月 ( 1 )   > この月の画像一覧

Popfile 成績 50万件目

(以前にもこの雑記帖に報告していた通り)
学習型のローカルメールフィルター「Popfile」を導入してから
SPAMの処理がずいぶんと楽になったのですが、
久しぶりに統計を見てみると50万メール処理を超えていたので、成績発表です。

分類精度
分類されたメール数: 506,715
分類エラーの数: 542
--------------------------------------------------------------------------------
精度: 99.89%
(最後のリセット: Mon Nov 16 12:20:39 2009 )

分類されたメール数
バケツ 分類数 誤検出 見逃し
normal 47,848 (9.44%) 141 202
spam 458,706 (90.52%) 132 340
unclassified 161 (0.03%) 286

使用しているバケツ(分類先)は単純に2つ、SPAMであるか否かで分けています。
なかなかの精度に育っていると思います。
学習1ヶ月目あたりから十分に分類が出来て現在に至るって感じです。

・・・ただし、ほんの時々、仕事関係のメールもSPAMに入っていて見落としていたりするので
最近では、メールでやり取りするお相手のメールアドレスを予めマグネット登録しています。

それでも一部のメールがSPAMに分類されるのですが、逆を言えば、これらのメールは
50万件を処理して そのうち 0.11% に相当する「SPAMメールの特徴」を持ち合わせている???
特定のキーワードでSPAMに引っ掛かることの方が多いのでしょうけど、自分でメールを送る際にも
そういったNGワードには気をつけないといけないってことですね^^;
お相手がプロバイダのSPAM除去サービスに入っておられる場合、同じようにSPAM扱いされてしまうでしょうから...
[PR]
by genmuki | 2011-04-24 18:44 | 幻夢騎