2011-07-28から1日間の記事一覧

Tanimoto係数で同じ内容のニュースのタイトルを抽出する実験→失敗

はてなブックマークを見ていると、ソース元は違えど似たようなニュースがブックマークされていることが多い。これを出来るだけ簡単な方法で重複がないようにできればいいなと思っていた。もし、Tanimoto係数のような糞簡単なアルゴリズムでその重複が取り除…