トピックス

このページでは,自然言語処理に関する様々なトピックを説明するコンテンツを,これから準備していきます.乞うご期待!ちなみに,Wikipediaでは,以下のようなトピックについて,解説が掲載されています(タイトルクリックでWikipediaのページに飛びます).

自然(+音声)言語処理とその周辺

言語を取り巻く技術には色々あります.身近なところでは・・・
  • かな漢字変換 かな列を与えると漢字に変換してくれます.
  • 検索エンジン インターネット上に存在するウェブページや画像などの情報を検索するシステムの総称
  • 情報検索 大量のデータの中から目的にあった情報を取り出すための技術
  • 機械翻訳翻訳ソフト ある言語の文章を入力すると,それを別の言語の文書に翻訳してくれます.
  • 音声認識 人間がしゃべった音声を与えると,それをテキストに書き起こしてくれます.
  • 質問応答システム 「名探偵明智小五郎の妻の名前は何ですか?」のような質問文を与えると,その答えを知識源から探して答えます.
  • 情報抽出 文書からある特定のタイプの情報だけを取り出します.
  • 自動要約生成 文章を与えると,その要約文を自動的に作り出します.
  • 自然言語理解 コンピュータに人間の言葉を理解させることを目指します.
実は,このような応用的技術を支える基礎的な技術があります.
  • 形態素解析 日本語文を与えると,それを分かち書きして,品詞を与えます.
  • 構文解析 英語の場合は,文中のどの語が主語,動詞,目的語,補語にあたるのかを調べます.日本語の場合は,どの文節がどの文節を修飾するのかを調べます.
  • 語義選択 ある文中において,複数の語義をもつ単語が現れたとき,どの語義で使われているのかを決めます.(専用ページ
  • 照応解析 「彼」とか「それ」などの代名詞や指示詞が何を指しているのかを推定します.(専用ページ
さらに,上で述べたあらゆる課題に適用することができる,基礎的な技術に「学習」があります.以下,説明のページを用意しています.
  • 機械学習の原理
    • 分類問題に対する機械学習の適用: プロバイダ解約者データを例に,決定木学習を説明します.(詳細ページへ)
  • 機械学習の応用
    • 確率モデルによる言語解析の優先付け: 係り受け解析器を学習によって自動的に作る方法を説明します.(詳細ページへ)

宇津呂研蔵書

  • 研究室で所蔵する蔵書の一覧(登録作業継続中)を紹介します.
  • 自然言語処理,音声認識,情報検索・検索エンジン,プログラミング,機械学習,確率モデル,情報理論,データ構造とアルゴリズム,言語学,日本語教育学,等,周辺分野まで含めた多岐にわたる分野の蔵書を所蔵しています.

基礎的事項を習得するための教科書一覧のページはこちら 宇津呂研全蔵書(登録作業継続中)はこちら

ツール

  • LinuxまたはWindows上で動く自然言語処理のツールや,Web上で実際にすぐに試せるツールを紹介しています.実際に触ってみてくださいね.
ツール一覧はこちら

筑波大学以前の所属機関において共同で研究してきたメンバー(主に学生さん)の研究について紹介します

リンク集