研究者総覧
MISC
- タイトル
- 言語天文台を設立するための言語判定フレームワークの開発
- タイトル(英)
- Language Identification Framework for Language Observatory
- 参照URL
- https://researchmap.jp/mikami_yoshiki/misc/13582137
- 著者
- 中鉢 欣秀,Janos Gondri Nagy,Wunna Ko Ko,三上 喜貴
- 著者(英)
- Chubachi Yoshihide,Janos Gondri Nagy,Wunna Ko Ko,Mikami Yoshiki
- 担当区分
- 概要
- Webページを収集してその使用言語を自動的に判定できる, 言語トレーナーと言語アイデンティファイアーからなる言語判定フレームワークを開発した.このソフトウェアは, 世界各国の言語専門家とのコラボレーションによる教師文書の収集作業を支援する.また, N-Gramを利用した言語判定コンポーネントを備え, かつ, プラグイン機能により他のアルゴリズムにも交換可能である.このフレームワークを用い, 世界中のWebページにおける言語利用の多様性を調査する「言語天文台」の設立を目指しているので報告する.
- 概要(英)
- The language identification framework which consists of the language trainer tool and identifier tool has been developed for automatic identification of collected Web pages. It supports world-wide collaboration of the linguistic experts to aggregate the teacher texts of multi-language samples. We designed that software as a framework which can be plugged-in various kind of identification algorithm as a software component. Currently, an N-Gram based identification component is provided as default. Using this framework, we aim to establish the Language Observatory in order to measure linguist...
- 出版者・発行元
- 一般社団法人情報処理学会
- 出版者・発行元(英)
- Information Processing Society of Japan (IPSJ)
- 誌名
- 情報処理学会研究報告. 自然言語処理研究会報告
- 誌名(英)
- IPSJ SIG Notes
- 巻
- 2006
- 号
- 1
- 開始ページ
- 49
- 終了ページ
- 54
- 出版年月
- 2006年1月12日
- 査読の有無
- 招待の有無
- 掲載種別
- ISSN
- 0919-6072
- DOI URL
- 共同研究・競争的資金等の研究課題
研究者
三上 喜貴
(ミカミ ヨシキ)