一覧に戻る

タイトル
  • ja 現代日本語書き言葉均衡コーパスのUniversal Dependencies
その他のタイトル
  • en Universal Dependencies Annotation for 'Balanced Corpus of Contemporary Written Japanese'
作成者

ja 大村, 舞

ja 浅原, 正幸

en Mai, OMURA

en Masayuki, ASAHARA

主題
  • Other 現代日本語書き言葉均衡コーパス(BCCWJ)
  • Other Balanced Corpus of Contemporary Written Japanese (BCCWJ)
内容注記
Other
  • 会議名: 言語資源活用ワークショップ2017, 開催地: 国立国語研究所, 会期: 2017年9月5日-6日, 主催: 国立国語研究所 コーパス開発センター
Other
  • 自然言語処理の分野では多言語かつ言語横断的な言語研究が盛んに取り組まれている。その言語横断的な言語研究の取り組みとしてUniversal Dependencies(UD)がある。UDでは品詞や係り受け構造の標準・スキーマを定め,多言語のコーパスを提供している。本論文では,日本語コーパスである現代日本語書き言葉均衡コーパス(BCCWJ)をUDのスキーマへと変換したコーパスについて紹介をする。BCCWJでは日本語における文節単位の係り受け情報がすでに付与されている。この係り受け構造を基にしてUDへと変換するプログラムの開発を行った。しかし,文節単位はUDの単語単位には沿っていない。そのため,BCCWJで提供されている短単位と長単位というふたつの言語単位を単語の単位をして認定したコーパスを構築する。短単位と長単位についてUDのスキーマに当てはめた場合,どのような係り受け構造ができるのかを示す。
Other
  • source:http://pj.ninjal.ac.jp/corpus_center/lrw2017.html
Other
  • identifier:国立国語研究所
Other
  • identifier:国立国語研究所
出版者国立国語研究所
日付 Created 2018-03-19 , Issued 2017
言語jpn
資源タイプconference paper
出版タイプVoR
資源識別子 URI http://id.nii.ac.jp/1328/00001514/ , DOI https://doi.org/10.15084/00001514
ID

JaLC10.15084/00001514

収録誌情報
    • 言語資源活用ワークショップ発表論文集 = Proceedings of Language Resources Workshop
    2, 133-143
ファイル
コンテンツ更新日時2019-12-13T05:51:07Z