sima2*blog

ネットのよもやまをお茶の間に

スパムを手動で振り分けてみる。

   

会社で使っているメールで頭が痛いのがスパムメール。
プライベートならGmailとかでもいいんですけど、会社のメールとなると使うメールサーバーによって状況はバラバラです。サーバサイドでスパム対策している場合でも、あまりに過度にフィルタリングすると肝心の商用メールもスパム扱いしたりしてなかなか踏み込んで運用しづらい部分もあります。

会社ではBeckyを使っていてこれが振り分け条件の指定が正規表現まで使えてフレキシブルなので手動スパムフィルタを色々設定していたのですが、せっかくだからその中で簡単にできるものをちょっと紹介します。

  1. Content-Type: (iso-8859|koi8-r|windows-1250|windows-1251)
    それぞれ日本ではまず使わない文字コードの指定です。
    ちなみにそれぞれですが、
    ISO-8859:ヨーロッパ言語系
    koi8-r:ロシア語キリル文字
    Windows-1250:中央・東ヨーロッパ文字
    Windows-1251:キリル文字
    とのこと。ロシア語で取引している人は指定しちゃだめですよ?
    けど最近ロシア語というかキリル文字?のスパム増えましたね。
  2. To/Cc/Bcc: undisclosed recipients:
    宛先明示なしの同報メールでよく出てきます。普段これでメールが来るようだったら指定しない方がいいです。
    けどこれで来るときはろくなもんじゃないことが多いです。
  3. X-Mailer: The Bat
    海外のメーラーみたいです。けどこれは日本語のスパムも結構引っかかります。このメーラーで送っているのかそれとも騙っているのか・・・?
  4. Content-Type: text/plain; charset=”Shift_JIS”
    間抜けですけどあるんですね。これは全うなメーラーであればまずないのでこれは指定しちゃったほうがいいかと。
  5. Precedence: bulk
    何のヘッダかわかりませんが、こういう上のX-Mailerみたいな余計なものをつけてるスパムもあります。
  6. あとはFromに
    (セフレ|掲示板|逆ナン|人妻調査センター|逆援|出会い|美人妻)
    (ブランドスーパーコピー|【馬プロ】|完全割り切り)

    このあたりを指定しておくとまぁまずビジネスメールを削除することはないでしょう。Subjectでもいいんですけど、「美人妻」とかはドアスポのタイトルとかではありそうなのでFromのみにしといたほうが無難ですね。「掲示板」とかも普通にひっかかります。けどこれを差出人に指定している人はまぁビジネスの関係はないと思うのでw

    実際にはこの条件指定をしたフォルダを別で作っていて、たまに中をのぞいてスパムじゃないメールが入ってないかを見て全削除しています。最後のキーワード指定してるやつが圧倒的に多いんですが、いずれにせよ指定するときには「普通じゃない文字列」を見つける、考えるようにしています。

    よくスパムで「Rolex 72% OFF!」とかってタイトルがありますが、これでRolexとか指定しちゃうとほんとのロレックスからメールきたときに(こないけど)それもはじいちゃう。「% OFF」は言わずもがなです。その辺で試行錯誤しながらやってます。ちなみにメールサーバーが逆引きできなくてunknownとかついてるパターンもやってましたが、結構大手の会社とかでもよくあることなのであまり当てにはなりませんでした。

    参考までー。

     - トピック