Research Topics: Mining from Multilingual Text on the Web

ウェブ上の多言語テキストからのマイニング



検索エンジンにおける情報集約・俯瞰機能・・・「みんなが調べたこと」を調べよう

次の世代の検索エンジンにおいて、利用者が本当に欲しい情報を的確に提示するための一歩として, 検索エンジン・サジェストが提示する「みんなが調べたこと」に着目し,

他の情報源からは収集困難な情報を集約・俯瞰する方式を開発する.

ツイッター・ブログ・ニュースの話題を集約・俯瞰する検索エンジン

利用者が本当に欲しい情報を的確に提示するための一歩として, ツイッター・ブログ・ニュースにおける膨大な検索結果の中から,

関連する情報を集約して効率良く俯瞰する各種の機能について研究する.

東日本大震災に関するニュース・ブログの分析支援

2011/03/11 - 2011/12頃のニュース・ブログ記事集合に対して 「東日本大震災」についての関心の推移を追跡した.

安心・安全な社会を支える情報アクセス

消費者トラブル等の社会的問題を題材にして,安心・安全な社会を支えるための 情報アクセス技術を開発する.



Wikipedia中の専門知識を利用して,専門家・マニアのブログを発見する

多言語にわたって最新のトピックを網羅する知識体系として, Wikipediaのカテゴリ体系を利用し, Wikipediaに記述されている専門知識を手がかりにして,

特定のトピックについての専門化・マニアのブログを発見する.

Wikipediaは世界中で利用されるWeb百科事典として著名であり, また,日々増え続けているために新語などにも対応できる.

特定のトピックを対象として,多様な立場で書かれたブロガー・ブログ記事を収集・類型化する

上述の研究の発展として,「犯罪」分野を事例にとり,被害者・分析者のブログを収集・類型化する枠組みを 提案する.

Wikipediaを多言語知識体系として,多言語ブログ中の文化間差異の発見を支援する

ブログは世界中の人によって書かれ,多くの意見や情報が日々更新されている. ブログから同一トピックにおける日本と海外の比較を行うためには, 英語と日本語両方の言語のブログを読む必要がある. しかし,両言語でトピックについて特徴的記事が書かれたブログを取得するのは困難であり, またどのような観点でブログを読むべきかを明確にしておく必要がある.そこで, ユーザがトピックを入力すると,日本語と英語両方のブログから関連するキーワードや文を取得し, ユーザに提示することによって,米英等の英語文化と日本語文化における文化間差異の 発見を支援する機構を開発する.

多言語ブログを情報源とする関心マイニング

今日,インターネット上では様々な国や地域においてウェブ ログ(ブログ)を用いた情報発信が盛んである.そこで多言語のブログ 記事と新聞記事から社会の関心動向を解析するシステムの研究 開発を行い,日本国内の社会問題に関する関心動向を把握する技術に ついて研究する.例えば,今日の社会問題は新型インフルエンザ や地球温暖化に代表されるように国や地域を越えて世界共通の 問題として存在する.こうしたグローバルな問題の解決には, 言語の壁を越えた関心動向の把握と分析が必要となる.

________________________________________________________________________
Written by Takehito Utsuro