関連用語の自動収集
はじめに
情報の編集 (1)
情報の編集 (2)
ウェブ
関連用語収集システム
コーパス作成
候補語抽出
フィルタリング
関連度
おわりに
デモ
関連度
R
∧/∨
(d,x)
は、入力用語
d
と候補語
x
のサーチエンジンにおけるAND検索のヒット数をOR検索のヒット数で 割ったものです。 すなわち、ウェブにおいて
d
と
x
が同じページによく現れるのであれば、
x
は
d
と関連しているだろうと考える指標です。
候補語の中から、関連度
R
∧/∨
(d,x)
の値が十分に大きくなる用語を選び出すことにより、
d
の関連用語を収集します。
前のスライド
次のスライド