ノルウェーの Stavanger 大学で,Merja Stenroos 氏が中心となって The Middle English Scribal Texts Programme (MEST) が進行中である.Glasgow 大学と Helsinki 大学の協力のもとに,中英語のテキストのコーパス化が進んでいる.このプログラムは具体的には2つのプロジェクトからなり,1つは1998年に Glasgow 大学が立ち上げた Middle English Grammar Project の延長線上にある The Middle English Grammar Corpus (MEG-C) の編纂で,もう1つは2012年に開始された Language and Geography in Middle English Local Documents (MELD) である.
今回は,前者のプロジェクト MEG-C について紹介したい.このコーパスは,後期中英語の方言地図 LALME のソースとなったテキストを電子化するという目的で編纂されている.姉妹版である初期中英語の方言地図 LAEME が最初からコーパス付きでオンライン公開されたのと対照的に,LALME では,編纂された時代が時代だけに,方言地図が紙媒体で公表されたにすぎなかった.2013年に LALME が改訂・電子化され eLALME としてアクセスできるようになったが,方言地図作成のもととなった資料自体は電子化されていなかった.現在,そのコーパスファイル群がMEG-C files から自由にダウンロードできるようになっている.
MEG-C は,実際には LALME の参照した1350--1500年のソーステキストのみならず,より早い時期のテキストをも含むコーパスとして成長している.長いテキストについては3000語のサンプルを取って収容しているが,現行の2011.1版では,目標とするテキストの半分ほどがカバーされているという.写本やファクシミリから転写しているというから,LAEME のコーパスに勝るとも劣らぬ大変な労力である.ありがたく利用させていただきたい.
早速,MEG-C にちょっとした検索をかけてみた.「#1394. between の異形態の分布の通時的変化」 ([2013-02-19-1]) で見た between の歴史的異形の分布のなかで,とりわけ語尾において x をもつ betwix(t) タイプが,後期中英語でどれくらい使用されていたかに関心があった.そこで検索してみると,104例が -x で終わるタイプ,14例が -xe で終わるタイプ,2例が -xt で終わるタイプという結果が出た.この頻度の傾向は,Helsinki Corpus による M3--M4期からの証拠とほぼ符合する.互いのコーパスの信頼度を測ることができたといえるだろう.
中英語の方言研究も,ますますツールが充実してきた感がある.
・ Stenroos, Merja, Martti Mäkinen, Simon Horobin, and Jeremy Smith. The Middle English Grammar Corpus, version 2011. 1. U of Stavanger, 2011. Online at http://www.uis.no/research/culture/the_middle_english_grammar_project/. Accessed : 4 October 2013.
Powered by WinChalow1.0rc4 based on chalow