標題の問いに手っ取り早く答えるには,次の表で事足りる(Görlach (68) による表の一部より).
South | Midland | North | ||
Present Indicative | 3sg. | -(e)þ | -(e)þ | -(e)s |
pl. | -(e)þ | -(e)n | -(e)s |
LAEME: 3sp 's' and 'th' | LAEME: pp 's', 'th', 'n', 'e', and zero |
LAEME: NPTR pp 'e' and zero |
eLALME: 3sp 's' | eLALME: 3sp 'th' |
eLALME: pp 's' | eLALME: pp 'th' |
eLALME: pp 'n' | eLALME: pp 'e' or zero |
「#1389. between の語源」 ([2013-02-14-1]),「#1393. between の歴史的異形態の豊富さ」([2013-02-18-1]),「#1394. between の異形態の分布の通時的変化」 ([2013-02-19-1]) に続いて,今回は LAEME を用いて通時的変化および方言別分布を調査した結果を報告する.
Helsinki Corpus による通時的調査 ([2013-02-19-1]) の場合と同様に,多数の異形態をまとめるに当たって,語尾以外における母音の違いは無視し,第2音節以降の子音(と,もしあれば語尾の母音も)の種類と組み合わせに注目した.lexel に "between" を指定して取り出した例をもとに,241個のトークンを半世紀ごと,方言別に整理した(区分は[2012-10-10-1]の記事「#1262. The LAEME Corpus の代表性 (1)」で採用したものと同じ).原データはこちらを参照.以下,最初に年代別,次に方言別の集計結果を掲げる.
PERIOD | nn | n | ne | x | xe | xn | xte | hn | he | tn | tx | txn | txe | ths | s | e | yn | zn | Sum |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
C12b | 18 | 1 | 2 | 7 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 28 |
C13a | 23 | 4 | 19 | 6 | 4 | 4 | 0 | 9 | 14 | 0 | 1 | 0 | 1 | 0 | 0 | 0 | 0 | 0 | 85 |
C13b | 20 | 3 | 23 | 2 | 1 | 3 | 4 | 1 | 0 | 0 | 0 | 1 | 0 | 2 | 1 | 1 | 1 | 1 | 64 |
C14a | 5 | 13 | 28 | 9 | 2 | 2 | 0 | 0 | 0 | 3 | 1 | 0 | 0 | 0 | 0 | 1 | 0 | 0 | 64 |
Sum | 66 | 21 | 72 | 24 | 7 | 9 | 4 | 10 | 14 | 3 | 2 | 1 | 1 | 2 | 1 | 2 | 1 | 1 | 241 |
DIALECT | nn | n | ne | x | xe | xn | xte | hn | he | tn | tx | txn | txe | ths | s | e | yn | zn | Sum |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
N | 0 | 0 | 1 | 9 | 2 | 2 | 0 | 0 | 0 | 0 | 1 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 15 |
NEM | 14 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 14 |
NWM | 7 | 0 | 6 | 0 | 0 | 0 | 0 | 8 | 14 | 0 | 0 | 0 | 0 | 2 | 0 | 0 | 0 | 0 | 37 |
SEM | 14 | 20 | 9 | 5 | 0 | 0 | 0 | 0 | 0 | 3 | 0 | 1 | 0 | 0 | 0 | 0 | 0 | 0 | 52 |
SWM | 31 | 1 | 26 | 7 | 5 | 7 | 0 | 2 | 0 | 0 | 1 | 0 | 1 | 0 | 1 | 0 | 1 | 1 | 84 |
SW | 0 | 0 | 16 | 3 | 0 | 0 | 4 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 1 | 0 | 0 | 24 |
SE | 0 | 0 | 14 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 1 | 0 | 0 | 15 |
Sum | 66 | 21 | 72 | 24 | 7 | 9 | 4 | 10 | 14 | 3 | 2 | 1 | 1 | 2 | 1 | 2 | 1 | 1 | 241 |
昨日の記事[2012-12-16-1]で,Helsinki Corpus を用いて「#1329. 英語史における eth, thorn, <th> の盛衰」を概観した.グラフによると,<þ> が <ð> を押しのけて著しく成長するのは,M1 (1150--1250) から M2 (1250--1350) にかけての時期であり,この時期について詳細に調査するには LAEME がうってつけである.方言による差異なども確認できるだろうと考え,早速,大雑把に調査してみた.大雑把というのは,例えば,1つの語形のなかに <þ> が2回以上現われたとしても1回と数えるなど,自動処理上の都合があるためである.
以下は,時代別(半世紀単位)および方言別の分布を示すグラフである(数値データは,HTMLソースを参照).なお,方言付与については,[2012-03-19-1]の記事「#1057. LAEME Index of Sources の検索ツール Ver. 2」で触れたように,仮のものである.COUNTY と DIALECT の仮の対応表はこちらを参照.
LAEME による時代別の調査結果は,昨日の Helsinki Corpus による調査結果と符合する.C13a と C13b の間に <ð> の減小と <þ> の増加が著しく観察される.以降,数十年間は <ð> 独走の時代といってよいだろう.一方,方言別にみると概ね <þ> が支配的だが,NWM を除く中部においては <ð> もある程度は健闘していることがわかる.方言別の分布は,より詳細な調査が必要かもしれない.
「#184. two の /w/ が発音されないのはなぜか」 ([2009-10-28-1]) で,two の発音に含まれる半母音 /w/ が,いつどのように脱落したかについて簡単に触れた.15?16世紀に脱落したとされるが,綴字で確認する限りでは,方言によってはもっと早く中英語期に脱落していたことを示す証拠がある.
まず,後期中英語について.LALME の Dot Map 548--57 に two の異綴りの方言分布が示されている.主要な異綴りについて概説すれば,twa タイプ (Dot Map 548) は北部方言に限定されているのに対して,最も普通の two タイプ (Dot Map 550) は北部を含むイングランド全域にまんべんなく例証される.問題の <w> の綴字を含まない to(o) タイプ (Dot Map 557) は,広く南部に見られ,とりわけ East Anglia や South-West Midland に濃く分布している.このように,後期中英語では,すでに w の落ちた形態がイングランド南半で珍しくなかったことがわかる.
では,初期中英語ではどうだったろうか.LAEME で調べてみた.TO あるいは TO- の綴字をもつ "two" を取り出し,方言別,時代別に整理すると以下のようになった.
C12b | C13a | C13b | C14a | |
---|---|---|---|---|
N | 1 | |||
NEM | 1 | |||
NWM | ||||
SEM | 28 | 6 | ||
SWM | 1 | 1 | ||
SW | 4 | 20 | ||
SE |
[2012-11-24-1]の記事「#1307. most と mest」で取り上げた中英語の最上級 most の異形態について,初期中英語における母音別の分布を LAEME を用いて調査した.地図上に位置づけられるテキストから取り出した most の異形態は全部で249例あり,これを語幹母音に従って分別したものを HelMapperUK に流し込んだ.読み込ませたデータファイルはこちら.マークの大きさは頻度に比例する.
<mast> など <a> を示すものは主として北部に分布し,<mest>, <meast>,
[2012-10-10-1], [2012-10-11-1]の記事で,The LAEME Corpus の代表性について取りあげた.私の評価としては,カバーしている方言と時代という観点からみて代表性は著しく損なわれているものの,現在利用できる初期中英語コーパスとしては体系的に編まれた最大規模のコーパスであり,十分な注意を払ったうえで言語研究に活用すべきツールである.The LAEME Corpus の改善すべき点はもちろんあるし,他のコーパスによる補完も目指されるべきだとは考えるが,言語を歴史的に研究する際に必然的につきまとう限界も考慮した上で評価しないとアンフェアである.
歴史言語学は,言語の過去の状態を観察し,復元するという課題を自らに課している.過去を扱う作業には,現在を扱う作業には見られないある限界がつきまとう.Milroy (45) の指摘する歴史言語学研究の2つの限界 (limitations of historical inquiry) を示そう.
[P]ast states of language are attested in writing, rather than in speech . . . [W]ritten language tends to be message-oriented and is deprived of the social and situational contexts in which speech events occur.
[H]istorical data have been accidentally preserved and are therefore not equally representative of all aspects of the language of past states . . . . Some styles and varieties may therefore be over-represented in the data, while others are under-represented . . . . For some periods of time there may be a great deal of surviving information: for other periods there may be very little or none at all.
乗り越えがたい限界ではあるが,克服の努力あるいは克服にできるだけ近づく努力は,いろいろな方法でなされている.そのなかでも,Smith はその著書の随所で (1) 書き言葉と話し言葉の関係の理解を深めること,(2) 言語の内面史と外面史の対応に注目すること,(3) 現在の知見の過去への応用の可能性を探ること,の重要性を指摘している.
とりわけ (3) については,近年,社会言語学による言語変化の理解が急速に進み,その原理の過去への応用が盛んになされるようになってきた.Labov の論文の標題 "On the Use of the Present to Explain the Past" が,この方法論を直截に物語っている.
これと関連する方法論である uniformitarian_principle (斉一論の原則)を前面に押し出した歴史英語の論文集が,Denison et al. 編集のもとに,今年出版されたことも付け加えておこう.
・ Milroy, James. Linguistic Variation and Change: On the Historical Sociolinguistics of English. Oxford: Blackwell, 1992.
・ Smith, Jeremy J. An Historical Study of English: Function, Form and Change. London: Routledge, 1996.
・ Labov, William. "On the Use of the Present to Explain the Past." Readings in Historical Phonology: Chapters in the Theory of Sound Change. Ed. Philip Baldi and Ronald N. Werth. Philadelphia: U of Pennsylvania P, 1978. 275--312.
・ Denison, David, Ricardo Bermúdez-Otero, Chris McCully, and Emma Moore, eds. Analysing Older English. Cambridge: CUP, 2012.
昨日の記事[2012-10-10-1]に引き続き,The LAEME Corpus の代表性の話題.今回は,語数,より正確には同コーパスで文法情報が付与されている語 (tagged words) の数により,方言・時代ごとの代表性を考える.まず,表を掲げよう.
Table 2: Dialectal and Diachronic Distribution of Linguistic Evidence by Number of Tagged Words
C12b | C13a | C13b | C14a | Total | |
---|---|---|---|---|---|
N | 0 (0.000%) | 362 (0.062) | 0 (0.000) | 52,883 (9.083) | 53,245 (9.146) |
NEM | 11,342 (1.948) | 0 (0.000) | 3,980 (0.684) | 2,344 (0.403) | 17,666 (3.034) |
NWM | 0 (0.000) | 58,332 (10.019) | 16,173 (2.778) | 0 (0.000) | 74,505 (12.797) |
SEM | 40,082 (6.885) | 26,722 (4.590) | 21,921 (3.765) | 31,408 (5.395) | 120,133 (20.634) |
SWM | 1,030 (0.177) | 90,400 (15.527) | 106,981 (18.375) | 108 (0.019) | 198,519 (34.098) |
SW | 1,168 (0.201) | 2,610 (0.448) | 46,032 (7.907) | 30,517 (5.242) | 80,327 (13.797) |
SE | 0 (0.000) | 4,043 (0.694) | 3,199 (0.549) | 30,561 (5.249) | 37,803 (6.493) |
Total | 53,622 (9.210) | 182,469 (31.341) | 198,286 (34.058) | 147,821 (25.390) | 582,198 (100.000) |
私の関心の中心は初期中英語期の形態論である.この時代に関心をもつ者にとっては,LAEME (編者によれば,発音は /ˈleɪmiː/ )とそこから派生した The LAEME Corpus (Text Database) の登場は,同時代に関する研究環境を著しく改善し得るツールとして,最大限に歓迎される.LAEME については,本ブログでも laeme の記事で採りあげてきたし,とりわけツールとしての可能性を探り,拡張すべく「#846. HelMapperUK --- hellog 仕様の英国地図作成 CGI」 ([2011-08-21-1]) ,「#856. LAEME text database のデータ点とテキスト規模」 ([2011-08-31-1]) ,「#942. LAEME Index of Sources の検索ツール」 ([2011-11-25-1]) ,「#1057. LAEME Index of Sources の検索ツール Ver. 2」 ([2012-03-19-1]) を公表してきた.
大工にとって道具の手入れが大事なように,研究者にとってツールの研究は大事である.具体的に The LAEME Corpus を使っているうちに,全体として俯瞰するとどのようなコーパスなのか,知りたくなってきた.[2010-11-16-1]の記事「#568. コーパスの定義と英語コーパス入門」で示した通り,コーパスの主たる特徴の1つに representativeness (代表性)がある.これは,コーパス評価のための指標の1つでもある.歴史コーパスにおける代表性の確保の難しさについては,「#531. OED の引用データをコーパスとして使えるか」 ([2010-10-10-1]) や「#1243. 語の頻度を考慮する通時的研究のために」 ([2012-09-21-1]) でも触れてきたが,この点では The LAEME Corpus も苦戦を強いられている.カバーしている方言分布については「#856. LAEME text database のデータ点とテキスト規模」 ([2011-08-31-1]) で採りあげたが,今回は方言区分に加えて時代区分も含めながら The LAEME Corpus のツール分析を試みたい.
まずは,収録されているテキストの数を考える.当該コーパスは "scribal text" という単位でテキストが収録されているが,これを方言と時代にしたがって分別すると,散らばり具合がわかる.なお,方言区分と時代区分はそれ自体が方法論上の大問題なのだが,以下では,恣意的な区分(とはいってもある程度の根拠はあるが)として,方言は7つへ,時代は4つへと分けている.すなわち,方言は N (Northern), NEM (North-East Midland), NWM (North-West Midland), SEM (South-East Midland), SWM (South-West Midland), SW (Southwestern), SE (Southeastern) へ,時代は C12b (12世紀後半),C13a, C13b, C14a へ.中英語の方言区分については「#130. 中英語の方言区分」 ([2009-09-04-1]) も参照.
Table 1: Dialectal and Diachronic Distribution of Linguistic Evidence by Number of Texts
C12b | C13a | C13b | C14a | Total | |
---|---|---|---|---|---|
N | 0 (0.00%) | 1 (0.86) | 0 (0.00) | 7 (6.03) | 8 (6.90) |
NEM | 1 (0.86) | 0 (0.00) | 5 (4.31) | 2 (1.72) | 8 (6.90) |
NWM | 0 (0.00) | 9 (7.76) | 5 (4.31) | 0 (0.00) | 14 (12.07) |
SEM | 4 (3.45) | 7 (6.03) | 14 (12.07) | 7 (6.03) | 32 (27.59) |
SWM | 2 (1.72) | 13 (11.21) | 17 (14.66) | 1 (0.86) | 33 (28.45) |
SW | 3 (2.59) | 5 (4.31) | 7 (6.03) | 2 (1.72) | 17 (14.66) |
SE | 0 (0.00) | 2 (1.72) | 1 (0.86) | 1 (0.86) | 4 (3.45) |
Total | 10 (8.62) | 37 (31.90) | 49 (42.24) | 20 (17.24) | 116 (100.00) |
[2011-11-25-1]の記事「#942. LAEME Index of Sources の検索ツール」で SQL による検索用 CGI を公開した.最近,研究で LAEME を本格的に使う機会があり,検索用のデータベースに少しく情報を追加した.そこで,上位互換となる Ver. 2 を作ったので,公開する.
追加した情報は,PERIOD, COUNTY, DIALECT の3フィールド.PERIOD は,もともとの IOS で与えられていたテキストの DATE をもとに,半世紀区切りで大雑把に区分しなおしたもの.C13b2--C14a1 など区分のまたがる場合には,早いほうをとって C13b と読み替えた."ca. 1300" なども同様に,早いほうへ倒して C13b とした.DATE において C13, C14 など半世紀で区切れない年代が与えられている場合には,C13, C14 のようにそのまま残した.
COUNTY は,LOC に与えられていた情報をもとに,3文字の略字表記で示した.DIALECT は,所属する州 (county) をもとに大雑把に N (Northern), NWM (North-West Midland), NEM (North-East Midland), SEM (South-East Midland), SWM (South-West Midland), SW (Southwestern), SE (Southeastern) の7方言に区分したものである.方言線は州境と一致しているわけではないし,方言線そのものの選定も,「#130. 中英語の方言区分」 ([2009-09-04-1]) や「#1030. England の現代英語方言区分 (2)」 ([2012-02-21-1]) で見たように,難しい.したがって,今回の DIALECT の付与も,[2009-09-04-1]の中英語方言地図に大雑把に照らしての仮のものである.参考までに,COUNTY と DIALECT の対応表はこちら.
# 各 PERIOD に振り分けられたテキストの数
select distinct PERIOD, count(*) from ios group by PERIOD;
# 各 COUNTY に振り分けられたテキストの数
select distinct COUNTY, count(*) from ios group by COUNTY;
# 各 DIALECT に振り分けられたテキストの数
select distinct DIALECT, count(*) from ios group by DIALECT;
# DIALECT/PERIOD ごとに,所属するテキストの多い順にリストアップ
select distinct DIALECT, PERIOD, count(*) from ios group by DIALECT, PERIOD order by count(*) desc;
# Worcestershire のテキストを取り出し,PERIOD 順に諸情報を羅列
select TEXT_ID, FILE, MS, COUNTY, PERIOD, TAGGED_WORDS from ios where COUNTY = 'WOR' order by PERIOD;
LAEME で Auxiliary Data Sets -> Index of Sources とメニューをたどると,LAEME が対象としているテキストソースのリスト (The LAEME Index of Sources) を,様々な角度から検索して取り出すことができる.LAEME のテキストデータベースを年代別,方言別,Grid Reference 別などの基準で分析したい場合に,適切なテキストの一覧を得られるので,LAEME 使いこなしのためには非常に重要な機能である.
しかし,もう少し検索式に小回りを利かせられたり,一覧の出力がコンパクトに表形式で得られれば使い勝手がよいだろうと思っていた.そこで,Index of Sources を独自にデータベース化し,SQL を用いて検索可能にしてみた.LAEME の使用者で,かつSQLを扱える人以外には何も役に立たないのだが,せっかく作ったので公開.
# Ancrene Wisse/Riwle のテキスト情報の取り出し
select TEXT_ID, MS, FILE, GRID, LOC, DATE, TEXT from ios where FILE like "%ar%t.tag" and TEXT like "%Ancrene%";
# Poema Morale のテキスト情報の取り出し
select TEXT_ID, MS, FILE, GRID, LOC, DATE, TEXT from ios where FILE like "%pm%t.tag" and TEXT like "%Poema%";
# Grid Reference の与えられているテキストの取り出し
select TEXT_ID, MS, FILE, GRID from ios where GRID != "000 000";
# DATE に "C13a" を含むテキストの取り出し
select TEXT_ID, DATE from ios where DATE like "%C13a%";
# 年代ごとに集計
select DATE, count(DATE) from ios group by DATE order by DATE;
# タグ付けされている語数をテキストごとに確認
select TEXT_ID, TAGGED_WORDS, PLACE_NAMES, PERSONAL_NAMES from ios;
# 全テキスト情報へのリンク集
select TEXT_ID, MS, FILE, URL from ios;
LAEME text database で扱われている scribal texts の数は,LAEME Index of Sources (PDF) によると,ざっと168個だが,そのなかで地図上の位置が特定されているものは121個(約72%)である.位置情報は Ordinance Survey National Grid Reference として得られるし,各テキストについてタグ付けされている語数も得られるので,組み合わせれば,データ点ごとにどの程度の規模のテキストがコーパスとして利用できるか,地図上に表現することができることになる.この作業を,[2011-08-21-1]の記事「HelMapperUK --- hellog 仕様の英国地図作成 CGI」で公開した地図作成ツールを用いて行なった.以下が結果である.
異なるデータ点は96を数え,データ点と関連づけられるテキスト(群)を構成する語数の平均値は6307語ほどである(タグ付けされた語数はこれより若干下回る).凡例として地図の右上に示した赤塗りの円の面積がこの平均語数に相当し,この面積を基準として,各データ点が,語数に相当する面積をもつ白抜きの赤丸として描かれている(参考までに,HelMapperUK に読み込ませたデータはこちら).
地図を眺めて直感的にわかることは,データ点にせよ収録語数にせよ,South-West Midland と South-East Midland に随分と集中しているということである.これは,LAEME の編者の1人である Laing が自らの論文 "Never the twain shall meet" で注意を喚起している通りである.LAEME のテキストの位置特定は,LALME が編み出した "fit technique" という理論的手法に負っているが,この手法の成否の鍵は "anchor texts" と呼ばれる確実な出発点が多く手に入るかどうかという点にある.だが,残念なことに,後期中英語と異なり初期中英語では "anchor texts" が格段に少ない."anchor texts" は,後の理論的な位置特定に際して磁石のように機能するため,出発点が東や西に離れて分布していると,これから "fit" させようと思っているテキストも相対的に東西のどちらか側に引きつけられてしまうという結果になることが多い.Midland の中央にデータ点がまばらなのは,このような事情にも帰せられる.
地図作成ツール HelMapperUK は,半ば LAEME の活用のために作ったようなものだが,LAEME 自体を分析するのにも利用できそうだ.
なお,LAEME Index of Sources は先に貼り付けたリンク より PDF で入手できるが,その他にもLAEME のトップページ から Auxiliary Data Sets -> Index of Sources とたどると,様々なパラメータによりソーステキストの情報検索ができる.
・ Laing, Margaret. "Never the twain shall meet: Early Middle English --- The East-West Divide." Placing Middle English in Context. Ed. I. Taavitsainen et al. Berlin: Mouton de Gruyter, 2000. 97--124.
・ McIntosh, Angus, M. L. Samuels, and M. Benskin. A Linguistic Atlas of Late Mediaeval English. 4 vols. Aberdeen: Aberdeen UP, 1986.
中英語の方言を研究していると,LALME の Dot Map 風のイングランド地図を描けると便利だと思う機会がある.LALME の地図を用いるのであればコピーしたりスキャンしたりすればよいし,オンラインの LAEME であれば "Mapping" 機能から "Feature Maps" で特に注目すべき言語項目に関する地図はデジタル画像で得られる.後者では,"Create a Feature Map" なるユーザーによる地図作成機能もおいおい追加されるとのことで,中英語方言学のヴィジュアル化は今後も進展して行くと思われる.
しかし,それでも様々な困難や不便はある.例えば,LAEME でも,自分の関心のある言語項目が LAEME 自体で扱われていなければ地図作成機能は役に立たないし(例えば,私の中英語名詞複数の研究では名詞の歴史的な文法性が重要だが,LAEME text database では性がタグ付けされていないのでフルには活用できなかった),LALME についてはそもそも地図がデジタル化されていず応用しにくい(地図のデジタル化,少なくともテキスト情報や座標情報のデジタル化が一刻も早く望まれる).
それでも,手をこまねいて待っているわけには行かない.既存のツールと自分の関心は大概ずれているものであり,自ら研究環境を作る必要に迫られるのが常だからだ.中英語の方言地図に関する限り,LALME や LAEME からテキストの方言付与情報さえ得られれば,自ら集めた言語項目に関するデータを地図上にプロットすることは十分に可能である.(需要は少ないと思われるが)その作業を少しでも簡便化するために,HelMapperUK なる CGI を作成してみた.英国のベースマップ上にデータポイントをプロットするという単機能に特化しており,凡例をつけるなどの付加機能はないが,ヴィジュアル化して概観をつかむという用途には十分と思われる.
昨日の記事[2011-03-17-1]で記事で取り上げた The Northern Personal Pronoun Rule (NPPR) は北部イングランドで中英語期に行なわれた統語規則とされる.初期中英語で実際に文証されるかどうかを,LAEME で確認してみたい.
Laing and Lass (26--27) によれば,LAEME のコーパスでは NPPR が 動詞にタグ付けされているということなので,簡単に拾い出すことができる.Tasks ページから以下のようにメニューをたどり,検索表現として "(-)vps2%apn(%)" (代名詞の直後に現われる動詞の現在形複数)と "(-)vps2%bpn(%)" (代名詞の直前に現われる動詞の現在形複数)でそれぞれ検索してみた.検索表現をより細かく工夫することはできるが,これで当面の用は足せる.
[LISTS] -> [Make an Item List] -> [Inflections] and [Search by TAG] -> ( [(-)vps2%apn(%)] or [(-)vps2%bpn(%)] ) and Frequency Counts
出力された情報を読み解くにも少々の知識と経験がいるが,各行は「検索対象となったテキスト番号」「そのテキストの言語が位置づけられている州の略名」「問題の語尾の種類と頻度」からなっている.NPPR では,複数人称代名詞の前後で動詞の現在形が( -e や -en もありうるが)ゼロ語尾を取るというのが最も顕著な特徴なので,語尾として "0" が含まれている行を探し出せばよい.その行を以下に抜き出す.
[for "(-)vps2%apn(%)"]
188 | DUR | +E [2] 0 [2] |
285 | NFK | +E [7] +En [4] +ETH [3] +N [2] 0 [2] +EN [1] |
295 | YWR | +>I>Ey [17] 0 [9] |
296 | YCT | +E [16] 0 [14] +E [2] |
297 | YER | 0 [36] +E [10] +IEy [2] |
298 | YNR | +E [43] 0 [31] |
300 | NFK | 0 [31] |
119 | [-] | 0 [2] |
173 | WOR | +Ay [1] +E [1] +Ey [1] 0 [1] |
247 | HRF | +E [2] +ET [1] +T [1] 0 [1] |
295 | YWR | 0 [4] |
296 | YCT | 0 [5] +E [3] |
297 | YER | 0 [8] +E [4] |
298 | YNR | 0 [22] +E [10] 0+ [2] |
2000 | WOR | +E [6] 0 [3] +Ed [1] +IE [1] |
2001 | WOR | 0 [3] |
- Yef þai lef her rihtwislie
- For in hali bok find we
- For if we schrif us clen of sinne
- Ye wen ful wel nou euerilkan
- Þan sau þai in vs goddes sede
- Of his offering today spec we
Tasks ページから CONCORDANCING 機能により用例のコンコーダンス・ラインを出力することもできるが,検索の敷居はさらに高い.TAGGED TEXTS からテキストファイルを取り出して自分で検索したほうが容易かもしれない.
・ Laing, Margaret and Roger Lass. "Tagging." Chapter 4 of "A Linguistic Atlas of Early Middle English: Introduction." Available online at http://www.lel.ed.ac.uk/ihd/laeme1/pdf/Introchap4.pdf .
初期中英語の方言地図 LAEME の機能が向上してきた.その先輩でもあり生みの親でもある後期中英語の方言地図 LALME は,綴字と発音の関係を考察する上で重要な知見をもたらしてきた.中英語における綴字の地理的分布が,発音の地理的分布と同様に方言学的な価値をもっていることを明らかにした.それまでは,綴字は発音に従属する二次的な体系であり,綴字の地理的分布が本質的に重要な価値をもっているとはみなされていなかったが,LALME は綴字を独立して観察されるべき体系として位置づけたのである.綴字を発音から解放したとでも言おうか.
中英語方言学は,1986年の LALME の登場によって意表を突かれながら,新たな段階に入ることになった.ここに一種の解放感ならぬ開放感があったことは確かである.文書でしか残されていない中英語の言語的実態,ことに発音の実態を蘇らせたいと思えば,綴字の問題に行き着いてしまう.綴字がどのくらい忠実に発音を表わしているのかは,まさに隔靴掻痒たる問題である.例えば,悪名高いものに現代英語の shall に対応する後期中英語 East Anglia 地方の綴字 xul, xal がある(この語の他の奇妙な綴字は MED を参照).この <x> の文字で表わされる音価は [ks] なのか [ʃ] なのか,あるいは別の音なのか.このような難問が立ちはだかるなかで,綴字と発音を一度切り離して考えてみよう,綴字の側だけでも独立して考察してみよう,という研究上の選択肢が与えられることとなった.
しかし,発音の呪縛からの解放感は永久に続くわけではない.LALME の出版後,(時代としてはより古いが)その続編として LAEME のプロジェクトが始まったが,プロジェクトの後半から本格的に参加した歴史形態音韻論の理論家 Lass は,綴字と発音の関係を再考して次のように述べている.
The statement in LALME (vol. 1, 6) that the maps constitute 'a dialect atlas of written Middle English', and that texts are 'treated as examples of a system of written language in its own right' is often misinterpreted. The emphasis on the independent value of written evidence was particularly apposite two decades ago, given the post-Bloomfieldian view that was current then (and to a large extent still is) that writing is of no independent linguistic interest, but merely 'parasitic on' speech. But this must not be misunderstood and taken to imply that phonological interpretation is per se unnecessary. The LALME editors take no such line. They were fully aware of the potential phonological implications of their data. LALME is rich in phonological commentary, while the series of Dot Maps (vol. 1) crucially depends on acknowledging the relationship between sound and symbol. (Lass and Laing 11--12)
これは,20年ほどの解放感の後で xul の音価は何かという悪夢のような問題に立ち返らなければならないという宣言だろうか.上の論文でなされている Lass and Laing の文字論,書記素論の考察は,初期中英語の綴字問題にとどまらず,現代英語の綴字と発音の関係にも光を与えるものであり,読み応えがある.
・ Lass, Roger and Margaret Laing. "Interpreting Middle English." Chapter 2 of "A Linguistic Atlas of Early Middle English: Introduction." Available online at http://www.lel.ed.ac.uk/ihd/laeme1/pdf/Introchap2.pdf .
・ McIntosh, Angus, M. L. Samuels, and M. Benskin. A Linguistic Atlas of Late Mediaeval English. 4 vols. Aberdeen: Aberdeen UP, 1986.
昨日の記事[2009-07-28-1]に引き続き,third の音位転換がいつ起こったか.今回は,後期中英語を守備範囲とする LALME を見てみる.北部方言に限っての異綴りリストなので,全体像はわからないものの,示唆的な分布である.
terd, thed, therd, therdde, therde, third, thirdde, thirde, thrd, thre, thred, thredd, thredde, threde, thrid, thridd, thridde, thride, thryd, thrydd, thrydde, thryde, thryde, thyrde, thyrd, trid, tyrd, þerd, þerde, þird, þirdde, þirde, þred, þred, þredde, þrede, þrid, þrid-, þridde, þride, þryd, þrydd, þrydde, þryde, þyrd, yerdde, yird, yirdde, yirde, yred, yredde, yrede, yrid, yridde, yride, yryd, yryde
初期中英語では音位転換はほとんど起こっていなかったが,後期中英語では音位転換を経た <母音 + r> が,3分の1強の綴りに確認される.特に頻度の高い綴りは,third, thrid, thridde, thryd, thyrd あたりだが,そのうちの二つが音位転換をすでに経ている綴りである.
参考までに,オンライン版の Middle English Dictionary から thrid をのぞいて,異綴りを確認してみることを勧める.
上記から,音位転換形は突然に広まったわけではなく,ゆっくりと確実に分布を広がってきたことが分かる.10世紀半ばの古英語の時代に ðirdda という音位転換形が用いられている例もあり,その頃から緩慢に分布を広げてきたのだろう.最終的に third に定着するのは近代英語期になってからだと想定されるが,確実なことは LAEME や LALME に引き続き,初期近代英語のコーパスで異綴りの調査を行う必要がある.
・Laing, Margaret and Roger Lass, eds. A Linguistic Atlas of Early Middle English, 1150--1325. http://www.lel.ed.ac.uk/ihd/laeme1/laeme1.html . Online. Edinburgh: U of Edinburgh, 2007.
・McIntosh, Angus, Michael Louis Samuels, Michael Benskin, eds. A Linguistic Atlas of Late Mediaeval English. Aberdeen: Aberdeen UP, 1986.
[2009-06-27-1]で取りあげたが,音位転換 ( metathesis ) の代表例の一つに third がある.古英語の綴り þridda から,また現代英語の対応する基数詞 three の綴りから分かるとおり,本来は <ir> ではなく <ri> という順序だった.ところが,後に音の位置が転換し,現代標準語の綴りに落ち着いた.
では,いつこの音位転換が起こったのか.[2009-06-21-1]で紹介した LAEME と LALME という中英語の綴りを準網羅的に集積した資料を用いれば大体のことはわかる.今回は,初期中英語 ( Early Middle English ) を守備範囲とする LAEME で調べてみた.
LAEME はオンラインで利用できるので,実際に以下の手順を試してもらいたい.TAG DICTIONARY -> Numbers とたどって右側のブラウザに現れる長いリストが,数詞の異綴り集である.記号の読み方は多少慣れる必要があるが,"3/qo" が「3の序数詞」つまり third に対応するタグなので,これをキーワードに検索をかければ,13行ほどがヒットする.異綴りを整理すると,以下の通り.
dridde, Dridðe, thred, thrid, thridde, thride, thrid/de, trhed, tridde, tridde, þerdde, þr/idde, þred, þredde, þri/de, þrid, þrid/de, þrid/den, þridda, þriddan, Þridde, þridde, þridden, þride, þridðe, þrid/de, þrirde, þri[d]/de, ðridde, Ðridde, ðride, yridde, yridden
以上から,音位転換が起こっているのは þerdde くらいで,まだまだ初期中英語期の段階では <ri> が圧倒的だということがわかる.
蛇足だが,我が家における最近の音位転換のヒット作は「竜のお仕事」(←「タツノオトシゴ」)である.だが,これだけ配置替えされてしまっては,単純に音位転換と呼べるのかどうかは不明である.
・Laing, Margaret and Roger Lass, eds. A Linguistic Atlas of Early Middle English, 1150--1325. http://www.lel.ed.ac.uk/ihd/laeme1/laeme1.html . Online. Edinburgh: U of Edinburgh, 2007.
・McIntosh, Angus, Michael Louis Samuels, Michael Benskin, eds. A Linguistic Atlas of Late Mediaeval English. Aberdeen: Aberdeen UP, 1986.
今日は,英語史に直接かかわる話ではないが,言語の起源や言語変化を考える際にヒントを与えてくれる手話言語学 ( sign linguistics ) という分野を紹介したい.紹介するといっても,私もつい先日その存在を知ったばかりなので,非常におこがましいが,許していただきたい.経緯を述べれば,今月号の『月刊言語』が手話言語学の特集を組んでおり,それを読んで inspiration をかき立てられただけの話である.
手話言語学の中身については何もわからないが,それが言語の起源や機能を考える際に,多くの示唆を与えてくれそうだという匂いは感じることができた.どのような点で示唆的なのか.神田和幸氏による以下のポイントが分かりやすい (10).
・音声言語を獲得できない聾者が手話を発生させるのはなぜか
・動物にもサインが分かりやすいのはなぜか
・音声言語が通じない人間同士が身振りで伝えようとするのはなぜか
・音声言語を発しながら無意識にジェスチャーするのはなぜか
つまり,音声言語の発生に先行して身振り言語が発生していたことは容易に想像され,その身振り言語が体系的に整理されたものが手話言語と考えれば,手話言語研究が言語起源説に貢献しうるということは自明のように思われる.
浅学非才をさらけ出すが,手話言語は音声言語に匹敵する非常に複雑で精緻な内部体系をもっているということも初めて知った.手話言語に語彙があり文法があることは漠然と知っていても,形態論があり,なんと音韻論(に相当するもの)もあるというから驚きだ.アンドレ・マルティネのいう言語の二重分節 ( double articulation ) が手話言語にも歴然と存在するという.
2008年5月3日に発効した,国際連合の「障害のある人の権利に関する条約」の第二条「定義」の項で,手話などの非音声言語も音声言語と同様に「言語」と位置づける旨が明記されているという(条約の英文はこちら).手話言語は,名実ともに,歴とした言語なのだそうだ.
本ブログの趣旨に近い話題をあげれば,音声言語の方言や言語変化に相当するものが手話言語にもあるという.考えてみれば,手話言語に方言や通時的変化があっても確かに不思議ではない.日本手話言語地図の作成が計画されているというのもうなずける.
手話言語学は,「言語=音声言語」という従来の前提からは生まれ得ない,言語の本質に迫る新たな視点を提供してくれる,発想の種になるかもしれない.中英語の綴り字の変異を地図上にプロットした LALME や LAEME ([2009-06-21-1]) が英語史研究に新時代をもたらしてきたことを考えると,視覚言語にもっと注目が集まってもよい.「言語=音声言語」という犯すべからざる言語学の大前提を少し揺るがしてみるのも面白いのではないか.その意味で,手話言語学は,音声言語ではなく文字言語にどっぷり浸かっている文献学研究にとっても心強い仲間になるかもしれない.
・McIntosh, Angus, Michael Louis Samuels, Michael Benskin, eds. A Linguistic Atlas of Late Mediaeval English. Aberdeen: Aberdeen UP, 1986.
・Laing, Margaret and Roger Lass, eds. A Linguistic Atlas of Early Middle English, 1150--1325. http://www.lel.ed.ac.uk/ihd/laeme1/laeme1.html . Online. Edinburgh: U of Edinburgh, 2007.
昨日[2009-06-20-1]の記事で through の綴りが後期中英語期だけでも515通りあったことを紹介した.そこで書き忘れたのだが,どこからこのような情報が得られるかということである.まさか,丹念に中英語のテキストをしらみつぶしに読んで,一つ一つ through とおぼしき形態をせっせと収集したというわけではない.また,電子コーパスとして全テキストが検索可能になっていたとしても,lemmatise(見出し語化)されていなければ,そもそも検索欄にどの綴り字を入力すればいいのかが不明である.
方法の一つとして Oxford English Dictionary ( OED ) の利用がある.この究極の英英辞書は,古英語から現代英語までの各単語の異綴りを数多く掲載している.確かに汎用的に使える方法だが,OED でthrough を引いてみると,せいぜい数十の異綴りしか得られない.
もう一つの方法は,A Linguistic Atlas of Late Mediaeval English ( LALME ) の利用である.これは,選ばれた基本語の異綴りがブリテン島の地図の上にプロットされている「方言地図」である.時代は後期中英語に限られているものの,異綴り研究にとっては究極のツールである.今回の through の異綴りも LALME ですでにまとめられているリストを打ち込んだだけである.LALME の初期中英語期の姉妹編として LAEME なるものもあり,こちらはオンラインで利用可能なので,ぜひ試されたい(URLは末尾).
さて,515通りの列挙を眺めていると目がチカチカしてくるが,その中で私の独断と偏見で選ぶベスト10(ワースト10ともいえる)を,突っ込みを入れながら挙げてみよう.
1. yhurght (←ほぼ yoghurt)
2. trghug (←ほぼ発音不可能)
3. thrwght (←母音字なし,その一)
4. thwrw (←母音字なし,その二)
5. thrvoo (←vって・・・)
6. throw (←違う単語になってる)
7. threw (←その過去形まである)
8. yora (←どうしてこうなるの?)
9. ȝour (←なぜ?)
10. through (←ちゃんとあるじゃない!)
・McIntosh, Angus, Michael Louis Samuels, Michael Benskin, eds. A Linguistic Atlas of Late Mediaeval English. Aberdeen: Aberdeen UP, 1986.
・Laing, Margaret and Roger Lass, eds. A Linguistic Atlas of Early Middle English, 1150--1325. http://www.lel.ed.ac.uk/ihd/laeme1/laeme1.html . Online. Edinburgh: U of Edinburgh, 2007.
Powered by WinChalow1.0rc4 based on chalow