2007.10.20
  • twitter
  • facebook
  • はてなブックマーク
  • 印刷

迷惑メールを除去する

株式会社オーグメント 代表取締役 渡辺 俊雄

最近、何人かの知人宛に「マイミクのお願い」と称して無関係のサイトに誘導する迷惑メール(スパム)が届いたようです。内容を見てみるといかにもマイミクのお願い文面なのですが、そこに記載されているアドレスが mixi のものではありません。たぶん、いつもの感じだと思って不用意にクリックすると、アダルトサイトとか詐欺サイトに飛ばされるのではと推測しています。

----- このような感じです -------
Subject: [mixi] マイミクシィへの追加リクエスト

×××さん、こんにちは。

mixiからのお知らせです。

○○さんより、マイミクシィへの追加リクエストが
ありました。

メッセージ:
先日はありがと~。(≧∇≦) マイミク、よろしくね。

以下のURLをクリックして承認・拒否を選択してください。
承認した場合、お互いが直接の友人としてマイミクシィ一覧
に追加されます。

http://mixi.jp/list_request.pl
↑ ※ここがまったく別のサイトアドレスになっています。
 (このURLは本物のミクシィです)

(以下省略)
----- ここまで -------

通常、自分宛に届いたメールを疑うのには限界があります。経験豊富な人でさえ判断に迷うことがあるということですから、メールの真偽を子供に判断させるというのは酷でしょう。したがって、対策としては出来る限り読ませる前に取り除くということを考えなくてはいけません。

迷惑メールを除去するためにはいくつかの方法があります。しかし、そのいずれもが対症療法であり、根本的なものではないということをまずは理解してください。具体的な説明などは以下のインターネット協会の「有害情報対策ポータルサイト -迷惑メール対策編-」に詳しいですが、このサイトは技術者向けの構成になっているために一般的な利用者が読むのは少し難しいかもしれません。ですので、今回は代表的な対策をいくつかご紹介し、次回で使い方についてご紹介していくことにします。

 http://www.iajapan.org/anti_spam/portal/

まず最初に知っていただきたい言葉は、「フィルタリング」です。フィルタリングとは、その名の通り何らかの基準を使いメールを“濾過”して選別する役割を担います。

フィルタリングを行うには、大きく「本文の内容から類推する方法」と「送信情報を利用する方法」といった方法が使われます。後者は技術的なものなのでここでは扱わず、利用者から見えやすい前者についてご説明していくことにします。

さて、本文の内容から類推する方法では、迷惑メールでよく出現するキーワードやフレーズをデータベース化し、それに一致するものがあるか否かという部分で判定を行う手法が使われます。内部的には「ベイジアン統計」といった手法を使い単語の統計を取っているのですが、誤判定が多く、処理に大きな負荷がかかるといった欠点があります。なぜ誤判定が多いのかは、たとえば「アダルト」と「ア*ダ*ル*ト」という例を考えてみるとわかります。人間は、どちらも「アダルト」と読むと思いますが、機械にはそんな融通は利かせられませんよね。^^; それに、「お姉さん」といった言葉をどのように評価すればいいかは文脈によって変わってきます。最近の迷惑メールの文面にやたら装飾があったり誤字脱字が多いように見えるのは、実はこのフィルタリング対策だったりします(素で間違えていることも多いと思いますが……)。

そのため、最近では「シグニチャ」と呼ばれる方式がよく使われるようになってきました。仕組み的な部分は少し難しくなるので省きますが、要は、あるユーザーが迷惑メールだと判断した場合にその情報をデータベースに登録し、他の人が受け取るメールを事前にそのデータベースに登録された情報と比較し、一致した場合は迷惑メールとして扱う、という処理を行います。

この方法は、迷惑メールの多くが同一の内容でばらまかれるといった傾向を利用したものです。最近では、Web メールで「迷惑メールとして登録する」といったボタンを見かけることが多くなったように思いますが、このボタンはここで説明した迷惑メール対策のための共有データベースにそのメールを登録させるものです。すぐに自分の役に立つわけではありませんが、同じ内容のメールを除去できたり、他の人の助けになるので積極的に使っていいのではないでしょうか(余談ですが、Gmail のこの機能は強力だと思います)。

ただ、実際には迷惑メール送信者も悪知恵を絞りますから、こうした方法を回避するためにメール本体にはたいしたことを書かず、代わりに画像ファイルにメーセッジを含めてメールに添付するという方法を使い出しました(一時期、この方法を使ったものすごい数の迷惑メールが出回りましたが、いまは下火になっています)。

迷惑メール対策は、結局はいたちごっこなのです。フィルタリングの方法が分かれば、それを回避する方法が編み出されます。これは、迷惑メールを送信することが“お金になる”ことが問題の大本なので、みんなで無視するのが一番効くと思うのですが、、、

最後に、二つほど補足をしておきます。

フィルタリングの他の方法として「ブラックリスト(black list)」と「ホワイトリスト(white list)」というものもあります。前者は、ここからは受信をしたくない(拒否)というメールアドレスやドメイン名を記述する方式。後者は、ここから来たメールは信用してかまわない(承認)というメールアドレスやドメイン名を記述する方式です。

それと、シグニチャですが、これは「そのデータを一意に特徴付ける小さなデータのこと」だと思ってください。なぜそのようにするかというと、メールの本文は長くなることが多いため、そのまま(メール本文全体を)比較しようとすると処理のための負荷が大きくなるからです。大きなデータを比較するのは大変ですが、小さな比較をするのは楽ですよね。実はこれ、ウィルスチェックとほぼ同じ方法なんですよ。

渡辺 俊雄(わたなべ としお)

株式会社オーグメント 代表取締役
1958年、東京生まれ。メーカー系システムエンジニア、大手コンピュータ出版社の書籍編集者、インターネット関連組織の広報などを経て2006年に独立。大学生と高校生の二人の子どもを持つ。

ご意見・ご要望、お待ちしています!

この記事に対する皆様のご意見、ご要望をお寄せください。今後の記事制作の参考にさせていただきます。(なお個別・個人的なご質問・ご相談等に関してはお受けいたしかねます。)

pagetop