Research Topics: Splog Analysis and Splog Detection

スパムブログの分析と検出

スパムプログ(スプログ)とは,アフィリエイト収入を得ることを目的として, 広告主への誘導または対象サイトのページランクを増加する目的の もとで,機械的な文書作成や他サイトの引用という手段を用いて自動的に記事を生成し, 大量のリンクを有するようなブログのことである. このようなスパムブログの特性を分析するとともに, それらを効果的に排除する技術を開発している.

スパムブログデータセットの作成と分析

日本語ブログ空間における主要ブログホスト会社10社を対象としてスパムブログを収集し, 同一のスパムブログ作成者によって自動生成されたスパムブログ(大量生成型スパムブログ)の 特性を分析する.

機械学習を用いたスパムブログ検出および能動学習によるスパムブログ収集・検出

スパムブログのHTML構造の類似性を用いた教師なしスパムブログ収集・検出

日本語ブログ空間における主要ブログホスト会社10社を対象として, スパムブログのHTMLファイルをDOM構造として抽出することにより, 同一のスパムブログ作成者によって自動生成されたスパムブログ(大量生成型スパムブログ)の HTML構造が酷似していることを示す.

________________________________________________________________________
Written by Takehito Utsuro