- 研究助成
- 筑波大学 ロケット・スタート支援
「外国語文書中の評価・意見情報の抽出・翻訳サービスの実現」,
(代表者),平成18年度.
- 情報・システム研究機構 国立情報学研究所
共同研究(公募型)
- 「世界ニュースのための多言語ニュース記事およびウェブブログ記事収集および分析支援システムの構築」
(分担者),
平成19年度.
- 「Wikipedia概念体系を利用した多言語巨大ブログ空間
の索引付け,及び,多言語ブログにおける言語対照情報分析」
(代表者),
平成20年度.
- 「多言語・多ジャンルの情報源から発信される情報の間
の差異発見支援に基づく戦略的情報アクセス機構」
(代表者),
平成21年度.
- 「トピック空間・ブログ空間の集約的索引付け方式に基づく多言語ブログ間の差異発見と分析」
(代表者),
平成22年度.
- 「トピックモデルおよび時系列モデルを用いたブログへのファセット自動付与およびファセット検索方式」
(代表者),
平成23年度.
- 「トピックモデルおよび時系列モデルを用いたファセット自動付与および多様性・俯瞰性を考慮した閲覧方式」
(代表者),
平成24年度.
- 「トピックモデルおよび時系列モデルを用いたファセット自動付与
および閲覧インタフェースを利用した検索・俯瞰・分析方式の研究」
(代表者),
平成25年度.
- 「ウェブ検索者の情報要求観点を索引とするウェブ情報空間の集約・俯瞰およびアノテーションの研究」
(代表者),
平成26年度.
- 科研費 基盤(B),「トピックの特性を言語間で比較・対照分析する多言語ウェブテキストマイニングの研究」,
(代表者),平成20〜22年度.
- 科研費 基盤(B),「トピックの特性の多観点把握に基づく多言語ウェブテキストの言語間対照分析システム」,
(代表者),平成23〜25年度.
- 科研費 基盤(B),「ウェブ検索における情報要求観点の言語間比較・対照分析システムの研究」,
(代表者),平成26〜28年度.
次の世代の検索エンジンにおいて、利用者が本当に欲しい情報を的確に提示するための一歩として,
検索エンジン・サジェストが提示する「みんなが調べたこと」に着目し,
他の情報源からは収集困難な情報を集約・俯瞰する方式を開発する.
利用者が本当に欲しい情報を的確に提示するための一歩として,
ツイッター・ブログ・ニュースにおける膨大な検索結果の中から,
関連する情報を集約して効率良く俯瞰する各種の機能について研究する.
2011/03/11 - 2011/12頃のニュース・ブログ記事集合に対して
「東日本大震災」についての関心の推移を追跡した.
消費者トラブル等の社会的問題を題材にして,安心・安全な社会を支えるための
情報アクセス技術を開発する.
Wikipedia中の専門知識を利用して,専門家・マニアのブログを発見する
多言語にわたって最新のトピックを網羅する知識体系として,
Wikipediaのカテゴリ体系を利用し,
Wikipediaに記述されている専門知識を手がかりにして,
特定のトピックについての専門化・マニアのブログを発見する.
Wikipediaは世界中で利用されるWeb百科事典として著名であり,
また,日々増え続けているために新語などにも対応できる.
- "Wikipedia概念体系とブログ空間の間のトピック対応の推定",
- 川場 真理子, 中崎 寛之, 横本 大輔, 宇津呂 武仁, 福原 知宏
- 日本データベース学会論文誌, 第8巻, 第1号, pp.17-22, June 2009.
-
Towards Conceptual Indexing of the Blogosphere through Wikipedia Topic Hierarchy,
- Mariko Kawaba, Daisuke Yokomoto, Hiroyuki Nakasaki, Takehito Utsuro, and Tomohiro Fukuhara,
- Proceedings of the 23rd Pacific Asia Conference on Language,
Information and Computation, pp. 702-709, December 2009.
-
Linking Wikipedia Entries to Blog Feeds by Machine Learning,
- Mariko Kawaba, Hiroyuki Nakasaki, Daisuke Yokomoto, Takehito Utsuro, and Tomohiro Fukuhara,
- Proceedings of the 3rd International Universal Communication Symposium, pp. 355-362, December 2009.
-
"多言語Wikipediaエントリを用いた特定トピックブログサイト検索と日英対照ブログ分析"
- 川場 真理子, 中崎 寛之, 宇津呂 武仁, 福原 知宏,
- 第22回人工知能学会全国大会論文集, June 2008.
特定のトピックを対象として,多様な立場で書かれたブロガー・ブログ記事を収集・類型化する
上述の研究の発展として,「犯罪」分野を事例にとり,被害者・分析者のブログを収集・類型化する枠組みを
提案する.
-
"特定トピックの日英ブログ収集・分析・類型化: 事例研究"
- 中崎寛之, 阿部佑亮, 宇津呂武仁, 河田容英, 福原知宏, 神門典子, 吉岡真治, 中川裕志, 清田陽司.
- 情報処理学会研究報告, 2009-NL-194, November 2009.
-
Cross-Lingual Analysis of Concerns and Reports on Crimes in Blogs,
- Hiroyuki Nakasaki, Yusuke Abe, Takehito Utsuro, Yasuhide Kawada, Tomohiro Fukuhara, Noriko Kando, Masaharu Yoshioka, Hiroshi Nakagawa and Yoji Kiyota,
- Proceedings of the Workshop on Mining User-Generated Content for Security, December 2009.
Wikipediaを多言語知識体系として,多言語ブログ中の文化間差異の発見を支援する
ブログは世界中の人によって書かれ,多くの意見や情報が日々更新されている.
ブログから同一トピックにおける日本と海外の比較を行うためには,
英語と日本語両方の言語のブログを読む必要がある.
しかし,両言語でトピックについて特徴的記事が書かれたブログを取得するのは困難であり,
またどのような観点でブログを読むべきかを明確にしておく必要がある.そこで,
ユーザがトピックを入力すると,日本語と英語両方のブログから関連するキーワードや文を取得し,
ユーザに提示することによって,米英等の英語文化と日本語文化における文化間差異の
発見を支援する機構を開発する.
-
"同一トピックの日英ブログにおける文化間差異の発見支援",
- 中崎 寛之, 川場 真理子, 山崎 小有里, 宇津呂 武仁, 福原 知宏,
- データ工学と情報マネジメントに関するフォーラム---DEIM フォーラム--- 論文集, pp.-, March 2009.
-
トピックの特性を言語間で比較・対照分析する多言語ウェブテキストマイニングの研究,
-
Visualizing Cross-Lingual/Cross-Cultural Differences in Concerns in Multilingual Blogs,
- Hiroyuki Nakasaki, Mariko Kawaba, Sayuri Yamazaki, Takehito Utsuro and Tomohiro Fukuhara",
- Proceedings of the International Conference on Weblogs and Social Media,
pp. 270-273, May 2009.
-
Cross-Lingual Blog Analysis by Cross-Lingual Comparison of
Characteristic Terms and Blog Posts,
- Hiroyuki Nakasaki, Mariko Kawaba, Takehito Utsuro, Tomohiro Fukuhara,
Hiroshi Nakagawa and Noriko Kando,
- Proceedings of the 2nd International Symposium on Universal Communication,
pp. -, December 2008.
多言語ブログを情報源とする関心マイニング
今日,インターネット上では様々な国や地域においてウェブ
ログ(ブログ)を用いた情報発信が盛んである.そこで多言語のブログ
記事と新聞記事から社会の関心動向を解析するシステムの研究
開発を行い,日本国内の社会問題に関する関心動向を把握する技術に
ついて研究する.例えば,今日の社会問題は新型インフルエンザ
や地球温暖化に代表されるように国や地域を越えて世界共通の
問題として存在する.こうしたグローバルな問題の解決には,
言語の壁を越えた関心動向の把握と分析が必要となる.
-
KANSHIN: A Cross-lingual Concern Analysis System using Multilingual Blog Articles,
- Tomohiro Fukuhara, Akifumi Kimura, Yoshiaki Arai,
Takayuki Yoshinaka, Hidetaka Masuda, Takehito Utsuro and Hiroshi Nakagawa,
- Proceedings of the 1st International Workshop on Next-Generation Search (INGS2008),
April 2008.
-
"複数言語間の語彙出現傾向比較による言語横断型ウェブログ関心解析システムの開発"
- 福原 知宏, 宇津呂 武仁,中川 裕志.
- 言語処理学会第13回年次大会「大規模Web研究基盤上での自然言語処理・情報検索研究」
ワークショップ論文集, 言語処理学会, pp.40-43, March 2007.
-
Cross-Lingual Concern Analysis from Multilingual Weblog Articles,
- Tomohiro Fukuhara and Takehito Utsuro and Hiroshi Nakagawa",
- Proceedings of the 6th International Workshop on Social Intelligence Design,
pp. 55-64, July 2007.
________________________________________________________________________