タイトル |
-
ja
現代日本語書き言葉均衡コーパスのUniversal Dependencies
|
その他のタイトル |
-
en
Universal Dependencies Annotation for 'Balanced Corpus of Contemporary Written Japanese'
|
作成者 |
|
主題 |
-
Other
現代日本語書き言葉均衡コーパス(BCCWJ)
-
Other
Balanced Corpus of Contemporary Written Japanese (BCCWJ)
|
内容注記 |
-
Other
会議名: 言語資源活用ワークショップ2017, 開催地: 国立国語研究所, 会期: 2017年9月5日-6日, 主催: 国立国語研究所 コーパス開発センター
-
Other
自然言語処理の分野では多言語かつ言語横断的な言語研究が盛んに取り組まれている。その言語横断的な言語研究の取り組みとしてUniversal Dependencies(UD)がある。UDでは品詞や係り受け構造の標準・スキーマを定め,多言語のコーパスを提供している。本論文では,日本語コーパスである現代日本語書き言葉均衡コーパス(BCCWJ)をUDのスキーマへと変換したコーパスについて紹介をする。BCCWJでは日本語における文節単位の係り受け情報がすでに付与されている。この係り受け構造を基にしてUDへと変換するプログラムの開発を行った。しかし,文節単位はUDの単語単位には沿っていない。そのため,BCCWJで提供されている短単位と長単位というふたつの言語単位を単語の単位をして認定したコーパスを構築する。短単位と長単位についてUDのスキーマに当てはめた場合,どのような係り受け構造ができるのかを示す。
-
Other
source:http://pj.ninjal.ac.jp/corpus_center/lrw2017.html
-
Other
identifier:国立国語研究所
-
Other
identifier:国立国語研究所
|
出版者 |
国立国語研究所
|
日付 |
Created2018-03-19
,
Issued2017
|
言語 |
|
資源タイプ |
conference paper |
出版タイプ |
VoR |
資源識別子 |
URI
http://id.nii.ac.jp/1328/00001514/
,
DOI
https://doi.org/10.15084/00001514
|
ID |
|
収録誌情報 |
-
言語資源活用ワークショップ発表論文集 = Proceedings of Language Resources Workshop
-
巻2
開始ページ133
終了ページ143
|
ファイル |
|
コンテンツ更新日時 |
2023-06-26 |