複合語表現の検出
複合語表現の言い換えを計算機上で実現するためには、
入力文中から複合語表現を検出する技術が必要になります。
われわれは、
複合語表現のうち機能表現に対して、
その形態情報(どのような語からできているか)や
接続情報(どのような語が前後に接続するか)を整理し、
助動詞型機能表現を検出するシステムと
助詞型機能表現を検出するシステムを作成しました
[2],
[3]。
下図に、
実装した助詞型機能表現検出システムの全体像を示します。
- 機能表現の辞書を持った形態素解析器
- 局所的な文脈情報を用いて検出を行うモジュール
二つめのモジュールが、隣接語の意味情報から検出可能な機能表現を検出します。
現在は、
大域的な文脈情報にもとづいて機能表現を検出するための方法論、
および慣用句を検出するための方法論について研究しています。