研究者総覧
論文
- タイトル
- クロス言語情報検索を用いたニュース記事からのノイジィパラレルコーパスの構築
- タイトル(英)
- Creating a Noisy Parallel Corpus from Newswire Articles Using Cross-Language Information Retrieval
- 参照URL
- https://researchmap.jp/hideki_hirakawa/published_papers/32300476
- 著者
- Nigel Collier,平川秀樹,熊野明
- 著者(英)
- Nigel Collier,Hideki Hirakawa,Akira Kumano
- 担当区分
- 責任著者
- 概要
- 多言語検索・翻訳などの精度向上のため対応する多言語文書の文の対応関係の抽出(アラインメント)は有用であり、特に大量に存在する対応関係にノイズが多い文書への対応が課題である。本論文では、表現や内容の対応関係が良くない日・英ニュース記事を対象として、ベクタースペースモデルをベースに用いた5つのアラインメント手法を適用し再現率70%、適合率70%が可能であることを示した。
- 概要(英)
- 出版者・発行元
- 出版者・発行元(英)
- 誌名
- 情報処理学会論文誌
- 誌名(英)
- 巻
- 40
- 号
- 1
- 開始ページ
- 351
- 終了ページ
- 361
- 出版年月
- 1999年1月
- 査読の有無
- 査読有り
- 招待の有無
- 掲載種別
- 研究論文(学術雑誌)
- ISSN
- DOI URL
- 共同研究・競争的資金等の研究課題
研究者
平川 秀樹
(ヒラカワ ヒデキ)