Back

Title
  • ja 現代日本語書き言葉均衡コーパスのUniversal Dependencies
Alternative
  • en Universal Dependencies Annotation for 'Balanced Corpus of Contemporary Written Japanese'
Creator
    • ja 大村, 舞
    • ja 浅原, 正幸
    • en Mai, OMURA
    • en Masayuki, ASAHARA
Subject
  • Other 現代日本語書き言葉均衡コーパス(BCCWJ)
  • Other Balanced Corpus of Contemporary Written Japanese (BCCWJ)
Description
  • Other 会議名: 言語資源活用ワークショップ2017, 開催地: 国立国語研究所, 会期: 2017年9月5日-6日, 主催: 国立国語研究所 コーパス開発センター
  • Other 自然言語処理の分野では多言語かつ言語横断的な言語研究が盛んに取り組まれている。その言語横断的な言語研究の取り組みとしてUniversal Dependencies(UD)がある。UDでは品詞や係り受け構造の標準・スキーマを定め,多言語のコーパスを提供している。本論文では,日本語コーパスである現代日本語書き言葉均衡コーパス(BCCWJ)をUDのスキーマへと変換したコーパスについて紹介をする。BCCWJでは日本語における文節単位の係り受け情報がすでに付与されている。この係り受け構造を基にしてUDへと変換するプログラムの開発を行った。しかし,文節単位はUDの単語単位には沿っていない。そのため,BCCWJで提供されている短単位と長単位というふたつの言語単位を単語の単位をして認定したコーパスを構築する。短単位と長単位についてUDのスキーマに当てはめた場合,どのような係り受け構造ができるのかを示す。
  • Other source:http://pj.ninjal.ac.jp/corpus_center/lrw2017.html
  • Other identifier:国立国語研究所
  • Other identifier:国立国語研究所
Publisher 国立国語研究所
Date
    Created2018-03-19 , Issued2017
Language
  • jpn
Resource Type conference paper
Version Type VoR
Identifier URI http://id.nii.ac.jp/1328/00001514/ , DOI https://doi.org/10.15084/00001514
ID
  • JaLC 10.15084/00001514
Journal
  • 言語資源活用ワークショップ発表論文集 = Proceedings of Language Resources Workshop
  • Volume Number2 Page Start133 Page End143
File
Oaidate 2023-06-26