blog/content/post/2007/11/24/2007-11-24-ベイズの定理bayes-theo...

4.6 KiB
Raw Blame History

title author date wordtwit_post_info categories
ベイズの定理(Bayes Theorem) kazu634 2007-11-24
O:8:"stdClass":13:{s:6:"manual";b:0;s:11:"tweet_times";i:1;s:5:"delay";i:0;s:7:"enabled";i:1;s:10:"separation";s:2:"60";s:7:"version";s:3:"3.7";s:14:"tweet_template";b:0;s:6:"status";i:2;s:6:"result";a:0:{}s:13:"tweet_counter";i:2;s:13:"tweet_log_ids";a:1:{i:0;i:3315;}s:9:"hash_tags";a:0:{}s:8:"accounts";a:1:{i:0;s:7:"kazu634";}}
つれづれ

朝日新聞のBEを見ていたら、ベイズの定理の解説がされていた。なんでこんなのを特集しているのかと思ったら、迷惑メールのフィルタリングに話を持って行きたかったようだ。納得。

ちなみにベイズの定理というのは、

  • P(B) : 事象Bが発生する確率
  • P(B|A) : 事象Aが起きた後での、事象Bの確率

としたときに、P(A)>0ならば

P(B|A)=P(A|B) * P(B) / P(A)

というやつです。

数学的にこれがなぜ重要かと言えば、

ベイズの定理は、ある結果データが得られた時、その結果を反映した下での事後確率を求めるのに使われている。定理はイギリスの牧師トーマス・ベイズ1702年(?) 1761年によって発見され、のちにピエールシモン・ラプラスによってその存在が広く認識されるようになった。

ベイズの定理 Wikipedia

という感じ。

これを迷惑メールのフィルタリングに当てはめて考えてみると、「あるメールが迷惑メールであり、その迷惑メールの中に存在するキーワードが別なメールにも存在すれば、その別なメールが迷惑メールである可能性が高くなる」というように適応できます。まず人間が迷惑メールであることを教えてあげて、教えれば教えるほど賢くなっていくフィルターです。

ごめんなさい。はてなのtex記法試したかっただけです。。。