日本語には,複数の語が定型的・複合的に使われ,ひとかたまりの表現として機
能的な関係を表す表現が多数存在する.このような表現は機能表現と呼ばれ,
日本語文の構造を理解するために非常に重要である.機械翻訳をはじめとする多様
な応用において機能表現を適切に取り扱うには,多数の機能表現を網羅的かつ明
示的に検出するような統一的な解析系が必要である.しかも,機能表現と同一の
形態素列が内容的な用法で用いられている例も多く存在するため,機能表現を正
しく検出するには,単に機能表現と同一の形態素列を検出するだけでなく,その
形態素列の用法を判定しなければならない.
以上のことをふまえて,計算機による日本語機能表現の処理を実現するための
研究を行う.
- 研究助成
- 独立行政法人 情報通信研究機構 (自然言語グループ)
受託研究「Multi Word Unitの言語処理とその応用に関する研究」,
-
(代表者),平成17〜18年度.
- 科研費 基盤(A),
「円滑な情報伝達を支援する言語規格と言語変換技術」,
(分担者),平成16〜19年度.
-
科研費 特定領域,「代表性を有する大規模日本語書き言葉コーパスの構築:
21世紀の日本語研究の基盤整備」公募研究,
-
「大規模階層辞書を用いた日本語機能表現解析体系の研究」
(代表者),平成21〜22年度.
- 科研費 基盤(B),「日本語学習者の視点にたった文章の難易度判定システ
ムの構築のための実証的研究」,
(連携研究者),平成21〜23年度.
研究計画の概要
用例データベースの作成
- 2007年5月1日, 日本語複合辞用例データベース v1.0を公開しました.
- "日本語複合辞用例データベースの作成と分析"
- 土屋 雅稔, 宇津呂 武仁, 松吉 俊, 佐藤 理史, 中川 聖一
- 情報処理学会論文誌, 第47巻, 第6号, pp.1728-1741, June 2006.
-
A Corpus for Classifying Usages of Japanese Compound Functional Expressions,
- Masatoshi Tsuchiya, Takehito Utsuro,
Suguru Matsuyoshi, Satoshi Sato, and Seiichi Nakagawa,
- Proceedings of the Pacific Association for
Computational Linguistics,
pp. 345-350, August 2005.
-
"機能表現を考慮した日本語係り受け解析器学習のためのコーパス作成"
- 土屋 雅稔, 注連 隆夫, 松吉 俊, 宇津呂 武仁, 佐藤 理史, 中川聖一.
- 言語処理学会第13回年次大会論文集, 言語処理学会, pp.510-513, March 2007.
機能表現の網羅的数え上げによる階層的辞書の作成
日本語機能表現の表記の候補を網羅的に数え上げることにより,約17,000表記を
同定するとともに,それらが派生する際の規則性を整理し,
9階層の階層的辞書を構築した.
- "日本語機能表現辞書の編纂"
- 松吉俊, 佐藤理史, 宇津呂武仁.
- 自然言語処理, 第14巻, 第5号, pp.123--146, October 2007.
- 松吉俊, 佐藤理史,
「つつじ:日本語機能表現辞書」
として公開.2008年12月18日.
-
Compilation of a Dictionary of Japanese Functional Expressions with Hierarchical
Organization.
-
- Suguru Matsuyoshi, Satoshi Sato, and Takehito Utsuro
- In Y. Matsumoto and R. Sproat and K.-F. Wong and Min Zhang, editors,
Computer Processing of Oriental Languages:
Beyond the Orient: The Research Challenges Ahead,
Lecture Notes in Artificial Intelligence: Vol. 4285,
Springer, pp. 395-402, December 2006.
「つつじ:日本語機能表現辞書」を用いた大規模日本語機能表現の集約的解析・翻訳
「つつじ: 日本語機能表現一覧」における9階層の表記派生体系を利用して,
機能表現表記の機能的用法・内容的用法の識別を集約的に行う.
また,「つつじ: 日本語機能表現一覧」における199個の意味的等価クラスを利用して,
日本語機能表現を集約的に英訳する規則を作成する.
-
"階層的機能表現辞書に基づく新聞記事中の機能表現の調査・分析"
- 長坂泰治, 坂本明子, 宇津呂武仁, 森下洋平, 松吉俊, 土屋雅稔.
- NLP若手の会第4回シンポジウム, September 2009.
-
"大規模日本語機能表現辞書の階層性を利用した機能表現検出",
- 長坂 泰治, 宇津呂 武仁, 土屋 雅稔,
- 言語処理学会第14回年次大会論文集, pp.837-840, March 2008.
-
"日本語機能表現の集約的英訳における意味的等価クラスの利用"
- 坂本明子, 長坂泰治, 宇津呂武仁, 松吉俊.
- 特定領域研究「日本語コーパス」平成21 年度全体会議予稿集, pp. 111-118, September 2009.
-
"日本語機能表現の集約的英訳",
- 坂本 明子, 宇津呂 武仁, 松吉 俊,
- 言語処理学会第15回年次大会論文集, pp.654-657, March 2009.
-
Identifying and Utilizing the Class of Monosemous Japanese Functional Expressions in Machine Translation,
- Akiko Sakamoto, Taiji Nagasaka, Takehito Utsuro and Suguru Matsuyoshi,
- Proceedings of the 23rd Pacific Asia Conference on Language,
Information and Computation, pp. 803-810, December 2009.
-
Utilizing Semantic Equivalence Classes of Japanese Functional Expressions in Machine Translation,
- Akiko Sakamoto, Takehito Utsuro and Suguru Matsuyoshi,
- Proceedings of the 3rd International Universal Communication Symposium, pp. 46-53, December 2009.
統計的手法による機能表現の解析
- "機械学習を用いた日本語機能表現のチャンキング"
- 土屋 雅稔,注連 隆夫,高木 俊宏,内元 清貴,松吉 俊,
宇津呂 武仁,佐藤 理史,中川 聖一.
- 自然言語処理, 第14巻, 第1号, pp.111-138, January 2007.
-
Chunking Japanese Compound Functional Expressions by Machine Learning,
- Masatoshi Tsuchiya, Takao Shime, Toshihiro Takagi, Takehito Utsuro,
Kiyotaka Uchimoto, Suguru Matsuyoshi, Satoshi Sato, and Seiichi Nakagawa",
- Proceedings of the 2nd International Workshop on Web as Corpus (EACL-2006 Workshop),
pp. 11-18, April 2006.
-
"日本語機能表現の自動検出と統計的係り受け解析への応用"
- 注連隆夫, 土屋雅稔, 松吉俊, 宇津呂武仁, 佐藤理史.
- 自然言語処理, 第14巻, 第5号, pp.167--197, October 2007.
-
Learning Dependency Relations of Japanese Compound Functional Expressions,
- Takehito Utsuro, Takao Shime, Masatoshi Tsuchiya,
Suguru Matsuyoshi and Satoshi Sato",
- Proceedings of the Workshop on A Broader Perspective on Multiword Expressions (ACL-2007 Workshop),
pp. 65-72, June 2007.
-
Chunking and Dependency Analysis of
Japanese Compound Functional Expressions by Machine Learning.
-
- Takehito Utsuro, Takao Shime, Masatoshi Tsuchiya,
Suguru Matsuyoshi, and Satoshi Sato,
- Text, Speech and Dialogue:
10th International Conference, TSD 2007, Plzen, Czech Republic,
Lecture Notes in Artificial Intelligence: Vol. 4629,
Springer, pp. -, September 2007.
その他の研究
-
"形態素情報を用いた日本語機能表現の検出"
- 土屋 雅稔, 宇津呂 武仁, 佐藤 理史, 中川 聖一.
- 言語処理学会第11回年次大会論文集, 言語処理学会, pp.584-587, March 2005.
-
"機能・意味・形態にもとづく助詞型機能表現の分類"
- 松吉 俊, 佐藤 理史, 宇津呂 武仁.
- 言語処理学会第11回年次大会論文集, 言語処理学会, pp.384-387, March 2005.
-
"接続情報にもとづく助詞型機能表現の自動検出"
- 松吉 俊, 佐藤 理史, 宇津呂 武仁.
- 言語処理学会第11回年次大会論文集, 言語処理学会, pp.1044-1047, March 2005.
-
"助動詞型機能表現の形態・接続情報と自動検出"
- 中塚 裕之, 佐藤 理史, 宇津呂 武仁.
- 言語処理学会第11回年次大会論文集, 言語処理学会, pp.596-599, March 2005.