Research Topics: Statistical NLP
統計的言語処理および言語知識抽出
-
統計的なモデルに基づいて,大量の言語テキストを統計的に処理し,
語の意味・用法や文法知識を自動抽出する.
統計的モデルを用いると,言語知識を表現する際の粒度(統語/意味クラスの汎化レベル・
複数要素間の依存関係など)を柔軟に調整することが可能となり,
数学的基準に基づいて,最適なモデルを構築することができる.
動詞の下位範疇化モデル
-
"格の依存関係・格要素の最適汎化レベルを考慮した下位範疇化優先度の学習
および統語解析における優先付け"
- 宇津呂 武仁, 松本 裕治
-
「大規模資源と自然言語処理」シンポジウム論文集
,November 1996.
-
"Learning Probabilistic Subcategorization Preference
by Identifying Case Dependencies and Optimal Noun Class Generalization Level"
- Takehito Utsuro and
Yuji Matsumoto
- Proceedings of the 5th Applied Natural Language Processing Conference,
pp.364-371, April 1997.
-
"最大エントロピー法による下位範疇化の確率モデル学習および統語的曖昧性解消による評価",
- 宇津呂 武仁,宮田 高志,
松本 裕治
- 情報処理学会研究報告, 97-NL-119, pp.69-76, May 1997.
-
"General-to-Specific Model Selection for Subcategorization Preference"
- Takehito Utsuro,
Takashi Miyata, and
Yuji Matsumoto
- Proceedings of the 17th International Conference on
Computational Linguistics and
the 36th Annual Meeting of the Association for Computational Linguistics,
pp.1314-1320, August 1998.
-
"Bayesian Networkによる下位範疇化の確率モデルおよびその学習",
- 宮田 高志,宇津呂 武仁,
松本 裕治
- 情報処理学会研究報告, 97-NL-119, pp.77-84, May 1997.
-
"コーパスからの格フレーム半自動獲得のための支援環境の構築"
- 中塚 幸毅,宇津呂 武仁,
松本 裕治
- 言語処理学会第四回年次大会論文集, pp.442-445, March 1998.
日本語固有表現抽出
-
"Minimally Supervised Japanese Named Entity
Recognition: Resources and Evaluation
- Takehito Utsuro and Manabu Sassano
- Proceedings of the 2nd International Conference
on Language Resources and Evaluation,
pp.1229-1236, June 2000
-
"ブートストラップによる低人手コスト日本語固有表現抽出"
- 宇津呂武仁,颯々野学.
- 情報処理学会研究報告, 2000-NL-139, pp.9-16, September 2000.
-
"Named Entity Chunking Techniques
in Supervised Learning for Japanese Named Entity Recognition",
- Manabu Sassano and Takehito Utsuro.
- Proceedings of the 18th International Conference on
Computational Linguistics, pp.705-711, August 2000.
-
"正誤判別規則学習を用いた複数の日本語固有表現抽出システムの出力の混合"
(pdf file 250,410 bytes)
- 宇津呂武仁,颯々野学,内元 清貴.
- 自然言語処理, 第9巻, 第1号, pp.65-100, January 2002.
-
"Combining Outputs of Multiple Japanese Named Entity Chunkers
by Stacking",
- Takehito Utsuro, Manabu Sassano, Kiyotaka Uchimoto,
- Proceedings of the 2002 Conference on Empirical
Methods in Natural Language Processing,
pp.281-288, July 2002.
その他
-
"非終端記号のエントロピーを用いた文脈自由文法の一般化・特殊化"
- 宇津呂 武仁,小玉 修司, 松本 裕治
- 人工知能学会第10回全国大会論文集, 人工知能学会, pp.327-330, June, 1996.
-
"誤り駆動型の素性選択による日本語形態素解析の確率モデル学習" (ps.gz file 104,147 bytes)
- 北内 啓,
宇津呂 武仁,松本 裕治
- 情報処理学会論文誌, 第40巻, 第5号, pp.2325-2337, May 1999.
-
"コーパスからの日本語従属節係り受け選好情報の抽出およびその評価" (ps.gz file 119,091 bytes)
- 宇津呂 武仁,
西岡山 滋之,
藤尾 正和,
松本 裕治
- 自然言語処理, 第6巻, 第7号, pp.29-60, October 1999.
- "Analyzing Dependencies of Japanese Subordinate Clauses
based on Statistics of Scope Embedding Preference" ,
- Takehito Utsuro,
Shigeyuki Nishiokayama,
Masakazu Fujio, and
Yuji Matsumoto
- Proceedings of the 1st
Conference of the North American Chapter of the Association for
Computational Linguistics,
pp.110-117, May 2000
________________________________________________________________________
Written by
Takehito Utsuro