一覧に戻る

タイトル
  • ja 現代日本語書き言葉均衡コーパスのUniversal Dependencies
その他のタイトル
  • en Universal Dependencies Annotation for 'Balanced Corpus of Contemporary Written Japanese'
作成者
    • ja 大村, 舞
    • ja 浅原, 正幸
    • en Mai, OMURA
    • en Masayuki, ASAHARA
主題
  • other 現代日本語書き言葉均衡コーパス(BCCWJ)
  • other Balanced Corpus of Contemporary Written Japanese (BCCWJ)
内容注記
  • Other 会議名: 言語資源活用ワークショップ2017, 開催地: 国立国語研究所, 会期: 2017年9月5日-6日, 主催: 国立国語研究所 コーパス開発センター
  • Other 自然言語処理の分野では多言語かつ言語横断的な言語研究が盛んに取り組まれている。その言語横断的な言語研究の取り組みとしてUniversal Dependencies(UD)がある。UDでは品詞や係り受け構造の標準・スキーマを定め,多言語のコーパスを提供している。本論文では,日本語コーパスである現代日本語書き言葉均衡コーパス(BCCWJ)をUDのスキーマへと変換したコーパスについて紹介をする。BCCWJでは日本語における文節単位の係り受け情報がすでに付与されている。この係り受け構造を基にしてUDへと変換するプログラムの開発を行った。しかし,文節単位はUDの単語単位には沿っていない。そのため,BCCWJで提供されている短単位と長単位というふたつの言語単位を単語の単位をして認定したコーパスを構築する。短単位と長単位についてUDのスキーマに当てはめた場合,どのような係り受け構造ができるのかを示す。
  • Other source:http://pj.ninjal.ac.jp/corpus_center/lrw2017.html
  • Other identifier:国立国語研究所
  • Other identifier:国立国語研究所
出版者 国立国語研究所
日付
    Created2018-03-19 , Issued2017
言語
  • jpn
資源識別のタイプ conference paper
出版タイプ VoR
資源識別子 URI http://id.nii.ac.jp/1328/00001514/ , DOI https://doi.org/10.15084/00001514
ID
  • JaLC 10.15084/00001514
収録誌情報
  • 言語資源活用ワークショップ発表論文集 = Proceedings of Language Resources Workshop 2, 133-143
ファイル
コンテンツ更新日時 2020-11-04