研究者総覧

研究業績に対する検索条件
※ スペース区切りで絞り込み検索が可能です。
研究業績タイプによる絞り込み条件です。絞り込みは行っていません。
MISC
タイトル
言語天文台を設立するための言語判定フレームワークの開発
タイトル(英)
Language Identification Framework for Language Observatory
参照URL
https://researchmap.jp/mikami_yoshiki/misc/13582137
著者
中鉢 欣秀,Janos Gondri Nagy,Wunna Ko Ko,三上 喜貴
著者(英)
Chubachi Yoshihide,Janos Gondri Nagy,Wunna Ko Ko,Mikami Yoshiki
担当区分
概要
Webページを収集してその使用言語を自動的に判定できる, 言語トレーナーと言語アイデンティファイアーからなる言語判定フレームワークを開発した.このソフトウェアは, 世界各国の言語専門家とのコラボレーションによる教師文書の収集作業を支援する.また, N-Gramを利用した言語判定コンポーネントを備え, かつ, プラグイン機能により他のアルゴリズムにも交換可能である.このフレームワークを用い, 世界中のWebページにおける言語利用の多様性を調査する「言語天文台」の設立を目指しているので報告する.
概要(英)
The language identification framework which consists of the language trainer tool and identifier tool has been developed for automatic identification of collected Web pages. It supports world-wide collaboration of the linguistic experts to aggregate the teacher texts of multi-language samples. We designed that software as a framework which can be plugged-in various kind of identification algorithm as a software component. Currently, an N-Gram based identification component is provided as default. Using this framework, we aim to establish the Language Observatory in order to measure linguist...
出版者・発行元
一般社団法人情報処理学会
出版者・発行元(英)
Information Processing Society of Japan (IPSJ)
誌名
情報処理学会研究報告. 自然言語処理研究会報告
誌名(英)
IPSJ SIG Notes
2006
1
開始ページ
49
終了ページ
54
出版年月
2006年1月12日
査読の有無
招待の有無
掲載種別
ISSN
0919-6072
DOI URL
共同研究・競争的資金等の研究課題
研究者
三上 喜貴 (ミカミ ヨシキ)