hellog〜英語史ブログ

#3282. The Parsed Corpus of Middle English Poetry (PCMEP)[corpus][me][hc][ppcme][laeme][link]

2018-04-22

 中英語の韻文を集めた統語タグ付きコーパスをみつけた.The Parsed Corpus of Middle English Poetry より編纂者 Richard Zimmermann 氏の許可を得て利用できる.
 現段階で,同コーパスは41のテキスト,160,432語からなっている(テキスト・リストはこちら).カバーする時代範囲は c. 1150--1420年,すなわち Helsinki Corpus の区分でいえば M1, M2, M3 に相当する時代である.統語タグは Penn Parsed Corpora of Historical English と同じ方法で付されており,Corpus Search 2 などのツールを用いて解析できる.
 Related Corpora のページの情報も有用.そこにある中英語に関する各種コーパスやデータベースへのリンクを,以下にも張りつけておきたい.

 ・ The Penn-Parsed Corpus of Middle English
 ・ The Corpus of Middle English Prose and Verse
 ・ The Innsbruck Corpus of Middle English Prose
 ・ A Parsed Linguistic Atlas of Early Middle English (P-LAEME)
 ・ Database of Middle English Romance

 アンテナ張りを怠っているうちに,いろいろなプロジェクトや成果物が現われていたのだなという感慨.

Referrer (Inside): [2021-01-15-1]

[ | 固定リンク | 印刷用ページ ]

Powered by WinChalow1.0rc4 based on chalow