研究紹介 > -2. ニューラルネットワーク・ディープラーニングによる人工知能・自然言語処理 > ・・・機械翻訳
ニューラルネットワークに基づく機械翻訳
ニューラルネットワークに基づく機械翻訳方式には,
長所: 正確かつ流暢な訳文を生成できる反面、
短所: 大規模語彙の翻訳に弱い,という問題があります.
この問題を克服するために,
・ニューラルネットワークに基づく機械翻訳
・統計的機械翻訳
の二方式を併用する以下のアプローチを実現しました.
1. 訓練時: 大語彙部分の専門用語をトークンに置き換えて,語彙数を抑えた後で訓練を行います.
2-1. 翻訳時: 大語彙の専門用語を除いた地の文の部分はニューラルネット翻訳によって翻訳し,
2-2. 翻訳時: 大語彙の専門用語部分は統計的機械翻訳によって翻訳します.
また,ニューラルネットワークに基づく機械翻訳方式には,
もう一つの短所: 訳抜けが頻発する,という問題があります.
この問題を克服するために,
・翻訳結果を原文に逆翻訳し,訳抜け箇所を検出する
方式を併用するアプローチにより翻訳性能を改善しました.
関連論文
-
"言語横断検索・リランキングに基づく目的言語翻訳メモリ利用型NMT"
- 田村拓也,王小天,宇津呂武仁,永田昌明. 電子情報通信学会論文誌, Vol. J107-D, No.4, pp. -, April 2024.
-
Enhanced Retrieve-Edit-Rerank Framework with kNN-MT.
- Xiaotian Wang, Takuya Tamura, Takehito Utsuro, and Masaaki Nagata, Proceedings of the 37th Pacific Asia Conference on Language, Information and Computation, pp.-, December 2023.
-
Leveraging Highly Accurate Word Alignment
for Low Resource Translation by Pretrained Multilingual Model,
- Jingyi Zhu, Minato Kondo, Takuya Tamura, Takehito Utsuro, and Masaaki Nagata. Proceedings of the Machine Translation Summit XIX Vol. 1: Research Track, pp. 336-347, September 2023.
-
Target Language Monolingual Translation Memory based NMT
by Cross-lingual Retrieval of
Similar Translations and Reranking,
- Takuya Tamura, Xiaotian Wang, Takehito Utsuro, and Masaaki Nagata. Proceedings of the Machine Translation Summit XIX Vol. 1: Research Track, pp. 313-323, September 2023.
-
"大規模言語モデルを用いたfine-tuningおよびfew-shot learningによる
機械翻訳精度の比較・評価",
- 近藤 海夏斗, 宇津呂 武仁, 永田 昌明. NLP若手の会(YANS)第18回シンポジウム(2023), August 2023.
-
"言語横断検索とリランキングを用いる翻訳メモリ利用型NMT",
- 田村拓也, 王小天, 宇津呂武仁, 永田昌明. 言語処理学会第29回年次大会論文集, pp.1833-1838, March 2023.
-
"Preordering based Low Resource Translation Using Pretrained Multilingual Model",
- Jingyi Zhu, Takuya Tamura, Fuzhu Zhu, Xiaotian Wang, Taiki Sakai, Takehito Utsuro, and Masaaki Nagata. 言語処理学会第29回年次大会論文集, pp.1818-1823, March 2023.
-
"Prompting Candidate Words for Refined Word-Level Quality Estimation",
- Yizhen Wei, Takehito Utsuro, and Masaaki Nagata. 言語処理学会第28回年次大会論文集, pp.365-369, March 2022.
-
"Word-level Quality Estimation for Machine Translation based on Source-MT Word Alignment",
- Yizhen Wei, Takehito Utsuro, and Masaaki Nagata. 言語処理学会第27回年次大会論文集, pp.1664-1667, March 2021.
-
"多言語BERTを単語埋め込みに用いるMany-to-Many翻訳による低資源言語翻訳",
- 磯部僚也, Yizhen Wei, 田村拓也, 宇津呂武仁, 永田昌明. 言語処理学会第27回年次大会論文集, pp.430-433, March 2021.
-
"多言語対訳サイトの特徴分析に基づくWeb上の対訳データのフィルタリング",
- 三好健悟, Yizhen Wei, 田村拓也, 宇津呂武仁, 永田昌明. 言語処理学会第27回年次大会論文集, pp.232-235, March 2021.
-
"Transformerによるニューラル機械翻訳におけるマルチホップ注意機構の提案"
- 飯田頌平, 崔鴻翌, 洪博軒, Yizhen Wei, 宇津呂武仁,永田昌明, 電子情報通信学会論文誌, Vol. J104--D, No.1, pp. 94-104, January 2021.
-
University of Tsukuba’s Machine Translation System
for IWSLT20 Open Domain Translation Task,
- Hongyi Cui, Yizhen Wei, Shohei Iida, Masaaki Nagata, and Takehito Utsuro. Proceedings of the 17th International Conference on Spoken Language Translation, pp. 145-148, July 2020.
-
"特許文を対象としたMany-to-One Multi-Sourceニューラル機械翻訳",
- 洪博軒, 飯田頌平, 崔鴻翌, 磯部僚也, 宇津呂武仁, 永田昌明 言語処理学会第26回年次大会論文集, pp.457-460, March 2020.
-
"Multilingual BERTの二言語領域適応に基づく対訳文同定",
- 飯田頌平, 三好健悟, 崔鴻翌, 洪博軒, 宇津呂武仁, 永田昌明 言語処理学会第26回年次大会論文集, pp.453-456, March 2020.
-
Mixed Multihead Self-attention for Neural Machine Translation,
- Hongyi Cui, Shohei Iida, Po-Hsuan Hung, Takehito Utsuro, and Masaaki Nagata. Proceedings of the 3rd Workshop on Neural Generation and Translation, pp. 206-214, November 2019.
-
Selecting Informative Context Sentence by Forced Back-Translation,
- Ryuichiro Kimura, Shohei Iida, Hongyi Cui, Po-Hsuan Hung, Takehito Utsuro and Masaaki Nagata. Proceedings of the Machine Translation Summit XVII Volume 1: Research Track, pp. 162-171, August 2019.
-
Attention over Heads: A Multi-Hop Attention for Neural Machine Translation,
- Shohei Iida, Ryuichiro Kimura, Hongyi Cui, Po-Hsuan Hung, Takehito Utsuro and Masaaki Nagata. Proceedings of the 57th Annual Meeting of the Association for Computational Linguistics: Student Research Workshop, pp. 217-222, July 2019.
-
"フレーズ・トークン込みNMTモデル及びSMTによる大語彙フレーズ翻訳によるハイブリッド翻訳方式"
- 龍梓,木村龍一郎,飯田頌平,宇津呂武仁,三橋朋晴,山本幹雄, 電子情報通信学会論文誌, Vol. J102--D, No.3, pp. 104-117, March 2019. 学生論文特集秀逸論文, アジア太平洋機械翻訳協会(AAMT) 第7回(2020年) 長尾賞 学生奨励賞
-
"マルチホップ注意機構を用いたニューラル機械翻訳",
- 飯田 頌平,木村 龍一郎,崔 鴻翌,洪 博軒,宇津呂 武仁,永田 昌明, 言語処理学会第25回年次大会論文集, pp.113-116, March 2019.
-
"文脈考慮型ニューラル機械翻訳における最適文脈文選択法",
- 木村 龍一郎,飯田 頌平,崔 鴻翌,洪 博軒,宇津呂 武仁,永田 昌明, 言語処理学会第25回年次大会論文集, pp.109-112, March 2019.
-
"ニューラル機械翻訳における大規模語彙および訳抜けへの対応の併用",
- 木村 龍一郎,龍 梓,飯田 頌平,宇津呂 武仁,三橋 朋晴,山本 幹雄, 言語処理学会第24回年次大会論文集, pp.877-880, March 2018.
-
Effect on Reducing Untranslated Content by Neural Machine Translation with a Large Vocabulary of Technical Terms,
- Ryuichiro Kimura, Zi Long, Takehito Utsuro, Tomoharu Mitsuhashi and Mikio Yamamoto, Proceedings of the 7th Workshop on Patent and Scientific Literature Translation, pp. 13-24, September 2017.
-
"Neural Machine Translation Model with a Large Vocabulary Selected by Branching Entropy"
- Zi Long, Takehito Utsuro, Tomoharu Mitsuhashi, and Mikio Yamamoto, arXiv:1704.04520 [cs.CL]
- Proceedings of the 16th Machine Translation Summit, pp.227-240, September, 2017.
- Zi Long, Takehito Utsuro, Tomoharu Mitsuhashi, and Mikio Yamamoto, arXiv:1704.04520 [cs.CL]