hellog〜英語史ブログ     ChangeLog 最新     カテゴリ最新     前ページ 1 2 / page 2 (2)

laeme - hellog〜英語史ブログ

最終更新時間: 2024-11-22 17:50

2015-03-09 Mon

#2142. 中英語における3単現および複現の語尾の方言分布 [map][laeme][lalme][me_dialect][me][3sp][3pp][verb][conjugation][nptr]

 標題の問いに手っ取り早く答えるには,次の表で事足りる(Görlach (68) による表の一部より).

 SouthMidlandNorth
Present Indicative3sg.-(e)þ-(e)þ-(e)s
pl.-(e)þ-(e)n-(e)s


 これを地図上に示すと「#790. 中英語方言における動詞屈折語尾の分布」 ([2011-06-26-1]) の通りとなるが,より詳しい分布を得たいときには LAEME (初期中英語)と eLALME (後期中英語)を参照するのが便利である (cf. 「#1622. eLALME」 ([2013-10-05-1])) .以下では,両アトラスより得られた地図の画像を貼り付けよう(クリックするとより大きく綺麗な画像が得られる).まずは,1150--1325年をカバーする LAEME より,3単現(左)と複現(右)の語尾の分布をそれぞれ示す.

LAEME: 3sp 's' and 'th' LAEME: 3pp 's', 'th', 'n', 'e', and zero
LAEME: 3sp 's' and 'th' LAEME: pp 's', 'th', 'n', 'e', and zero


 両地図で北部に集まる赤丸が -s を,南部に集まる青四角が -th を表す.右の複現の語尾では東中部その他に黒三角が散在しているが,これは -n 語尾を表す.次に,複数代名詞と接する動詞の現在形が -e またはゼロの語尾をとる "Northern Present Tense Rule" (NPTR; cf. 「#689. Northern Personal Pronoun Rule と英文法におけるケルト語の影響」 ([2011-03-17-1]),nptr) の分布図を見よう.

LAEME: NPTR pp 'e' and zero
LAEME: NPTR pp 'e' and zero


 では次に後期中英語の分布に移る.eLALME では,語尾の種類ごとに別々の地図を作成した.まずは3単現から.

eLAEME: 3sp 's' eLAEME: 3sp 'th'
eLALME: 3sp 's' eLALME: 3sp 'th'


 前時代の分布をよく受け継いでおり,左図の通り -s が北部に,右図の通り -th が中部以南に分布しているのがわかる.複現については,-s, -th, -n, -e (or zero) の4種類について各々の地図を見てみよう.

eLAEME: pp 's' eLAEME: 3pp 'th'
eLALME: pp 's' eLALME: pp 'th'
eLAEME: pp 'n' eLAEME: 3pp 'th'
eLALME: pp 'n' eLALME: pp 'e' or zero


 こちらも前時代の分布をよく受け継いでおり,北部で -s (左上図),中部以南で -th (右上図)が優勢だが,中部で -n (左下図)が前時代よりも著しく拡張していることが見て取れる.全体的に,初期中英語と後期中英語の分布間で量的な差は見られるが,質的には大きな変化はないといってよいだろう.  *

 ・ Görlach, Manfred. The Linguistic History of English. Basingstoke: Macmillan, 1997.

[ 固定リンク | 印刷用ページ ]

2013-02-24 Sun

#1399. 初期中英語における between の異形態の分布 [laeme][corpus][preposition][me_dialect][methodology]

 「#1389. between の語源」 ([2013-02-14-1]),「#1393. between の歴史的異形態の豊富さ」([2013-02-18-1]),「#1394. between の異形態の分布の通時的変化」 ([2013-02-19-1]) に続いて,今回は LAEME を用いて通時的変化および方言別分布を調査した結果を報告する.
 Helsinki Corpus による通時的調査 ([2013-02-19-1]) の場合と同様に,多数の異形態をまとめるに当たって,語尾以外における母音の違いは無視し,第2音節以降の子音(と,もしあれば語尾の母音も)の種類と組み合わせに注目した.lexel に "between" を指定して取り出した例をもとに,241個のトークンを半世紀ごと,方言別に整理した(区分は[2012-10-10-1]の記事「#1262. The LAEME Corpus の代表性 (1)」で採用したものと同じ).原データはこちらを参照.以下,最初に年代別,次に方言別の集計結果を掲げる.

PERIODnnnnexxexnxtehnhetntxtxntxethsseynznSum
C12b181270000000000000028
C13a23419644091401010000085
C13b2032321341000102111164
C14a5132892200031000010064
Sum662172247941014321121211241

DIALECTnnnnexxexnxtehnhetntxtxntxethsseynznSum
N00192200001000000015
NEM140000000000000000014
NWM706000081400002000037
SEM1420950000030100000052
SWM3112675702001010101184
SW001630040000000010024
SE001400000000000010015
Sum662172247941014321121211241


 現代英語の between に連なる,n を含む最も普通のタイプが左3列に示されているが,bitweonen などの "nn" タイプは時代とともに "n" タイプや "ne" タイプに置換されてゆく様子がうかがえる.Mustanoja (369) は,"nn" タイプについて "The -en forms occur mainly in the more southern parts of the country" と記述しているが,実際には NEM や NWM にも現われている.つまり,"nn" タイプの分布は,方言の問題である以上に時代の問題である可能性がある.語尾の n の脱落がより北部で,かつ,より遅い時代に見られることは,予想できることだろう.
 n 系列には遠く及ばないが,bituixbitƿixen などの x 系列の使用がこの時期に稀でないことは,Helsinki Corpus の調査結果と符合している.x 系列は N, SEM, SWM, SW に分布しており,間に挟まれた NEM, NWM には文証されない.この分布は妙だが,全体として例が十分に多くないために,North Midlands の現存テキストに現われる機会がなかったということかもしれない.近代英語期にかけて成長する t を付加した xte タイプは,初期中英語では C13b SW に bitwixte などの形態でわずかに現われるにとどまっている.
 bituhenbituhe などの h 系列は,Helsinki Corpus によれば,古英語後期より一気に衰退したとのことだったが,LAEME によれば,初期中英語では C13a NWM に集中する形で生き残っていたようだ.しかし,その時までに衰退傾向は決定づけられていたと言えるだろう.
 今回の調査で感覚を得たが,(初期)中英語期に開始した,あるいは進行していると疑われる変化について調べるには,Helsinki Corpus で通時的変化を大づかみにした上で,LAEME を用いて,より細かい時代区分と方言の別を考慮して掘り下げてゆくのがよさそうだ.

Referrer (Inside): [2014-12-19-1] [2013-07-29-1]

[ 固定リンク | 印刷用ページ ]

2012-12-17 Mon

#1330. 初期中英語における eth, thorn, <th> の盛衰 [thorn][th][spelling][laeme][alphabet][graphemics]

 昨日の記事[2012-12-16-1]で,Helsinki Corpus を用いて「#1329. 英語史における eth, thorn, <th> の盛衰」を概観した.グラフによると,<þ> が <ð> を押しのけて著しく成長するのは,M1 (1150--1250) から M2 (1250--1350) にかけての時期であり,この時期について詳細に調査するには LAEME がうってつけである.方言による差異なども確認できるだろうと考え,早速,大雑把に調査してみた.大雑把というのは,例えば,1つの語形のなかに <þ> が2回以上現われたとしても1回と数えるなど,自動処理上の都合があるためである.
 以下は,時代別(半世紀単位)および方言別の分布を示すグラフである(数値データは,HTMLソースを参照).なお,方言付与については,[2012-03-19-1]の記事「#1057. LAEME Index of Sources の検索ツール Ver. 2」で触れたように,仮のものである.COUNTY と DIALECT の仮の対応表はこちらを参照.

The Ebb and Flow of 'eth', 'thorn', and <th> by EME Subperiod
The Ebb and Flow of 'eth', 'thorn', and <th> by EME Dialect


 LAEME による時代別の調査結果は,昨日の Helsinki Corpus による調査結果と符合する.C13a と C13b の間に <ð> の減小と <þ> の増加が著しく観察される.以降,数十年間は <ð> 独走の時代といってよいだろう.一方,方言別にみると概ね <þ> が支配的だが,NWM を除く中部においては <ð> もある程度は健闘していることがわかる.方言別の分布は,より詳細な調査が必要かもしれない.

[ 固定リンク | 印刷用ページ ]

2012-12-11 Tue

#1324. two の /w/ はいつ落ちたか [numeral][spelling][pronunciation][laeme][lalme]

 「#184. two の /w/ が発音されないのはなぜか」 ([2009-10-28-1]) で,two の発音に含まれる半母音 /w/ が,いつどのように脱落したかについて簡単に触れた.15?16世紀に脱落したとされるが,綴字で確認する限りでは,方言によってはもっと早く中英語期に脱落していたことを示す証拠がある.
 まず,後期中英語について.LALME の Dot Map 548--57 に two の異綴りの方言分布が示されている.主要な異綴りについて概説すれば,twa タイプ (Dot Map 548) は北部方言に限定されているのに対して,最も普通の two タイプ (Dot Map 550) は北部を含むイングランド全域にまんべんなく例証される.問題の <w> の綴字を含まない to(o) タイプ (Dot Map 557) は,広く南部に見られ,とりわけ East Anglia や South-West Midland に濃く分布している.このように,後期中英語では,すでに w の落ちた形態がイングランド南半で珍しくなかったことがわかる.
 では,初期中英語ではどうだったろうか.LAEME で調べてみた.TO あるいは TO- の綴字をもつ "two" を取り出し,方言別,時代別に整理すると以下のようになった.

 C12bC13aC13bC14a
N   1
NEM   1
NWM    
SEM  286
SWM 11 
SW  420
SE    


 ちょうど LALME の Dot Map 557 で to(o) が比較的濃い分布を示していた地域に,TO(-) が集まっている.初期中英語から後期中英語への分布の連続性がよく表われている例といえるだろう.<w> をもたない綴字は,時代としてはおよそ13世紀後半以降に,南部諸方言を中心に始まったと考えてよさそうだ.対応する音声における /w/ の脱落も同様に考えるのが妥当だろう.
 中英語におけるこの語の数々の異綴りについては,MEDを参照.

 ・ McIntosh, Angus, M. L. Samuels, and M. Benskin. A Linguistic Atlas of Late Mediaeval English. 4 vols. Aberdeen: Aberdeen UP, 1986.

Referrer (Inside): [2022-03-20-1] [2019-04-05-1]

[ 固定リンク | 印刷用ページ ]

2012-12-07 Fri

#1320. LAEME で見る most の異形態の分布 [vowel][superlative][map][laeme][me_dialect][comparison]

 [2012-11-24-1]の記事「#1307. mostmest」で取り上げた中英語の最上級 most の異形態について,初期中英語における母音別の分布を LAEME を用いて調査した.地図上に位置づけられるテキストから取り出した most の異形態は全部で249例あり,これを語幹母音に従って分別したものを HelMapperUK に流し込んだ.読み込ませたデータファイルはこちら.マークの大きさは頻度に比例する.

Variants of

 <mast> など <a> を示すものは主として北部に分布し,<mest>, <meast>, など前舌母音を示すものは中西部および南東部に分布する.後に優勢となる <most> など後舌母音を示すものは,この時代にはいまだ East Anglia に見られるのみである.

Referrer (Inside): [2015-09-29-1] [2014-04-13-1]

[ 固定リンク | 印刷用ページ ]

2012-10-12 Fri

#1264. 歴史言語学の限界と,その克服への道 [methodology][uniformitarian_principle][writing][history][sociolinguistics][laeme][corpus][representativeness][evidence]

 [2012-10-10-1], [2012-10-11-1]の記事で,The LAEME Corpus の代表性について取りあげた.私の評価としては,カバーしている方言と時代という観点からみて代表性は著しく損なわれているものの,現在利用できる初期中英語コーパスとしては体系的に編まれた最大規模のコーパスであり,十分な注意を払ったうえで言語研究に活用すべきツールである.The LAEME Corpus の改善すべき点はもちろんあるし,他のコーパスによる補完も目指されるべきだとは考えるが,言語を歴史的に研究する際に必然的につきまとう限界も考慮した上で評価しないとアンフェアである.
 歴史言語学は,言語の過去の状態を観察し,復元するという課題を自らに課している.過去を扱う作業には,現在を扱う作業には見られないある限界がつきまとう.Milroy (45) の指摘する歴史言語学研究の2つの限界 (limitations of historical inquiry) を示そう.

[P]ast states of language are attested in writing, rather than in speech . . . [W]ritten language tends to be message-oriented and is deprived of the social and situational contexts in which speech events occur.

[H]istorical data have been accidentally preserved and are therefore not equally representative of all aspects of the language of past states . . . . Some styles and varieties may therefore be over-represented in the data, while others are under-represented . . . . For some periods of time there may be a great deal of surviving information: for other periods there may be very little or none at all.


 乗り越えがたい限界ではあるが,克服の努力あるいは克服にできるだけ近づく努力は,いろいろな方法でなされている.そのなかでも,Smith はその著書の随所で (1) 書き言葉と話し言葉の関係の理解を深めること,(2) 言語の内面史と外面史の対応に注目すること,(3) 現在の知見の過去への応用の可能性を探ること,の重要性を指摘している.
 とりわけ (3) については,近年,社会言語学による言語変化の理解が急速に進み,その原理の過去への応用が盛んになされるようになってきた.Labov の論文の標題 "On the Use of the Present to Explain the Past" が,この方法論を直截に物語っている.
 これと関連する方法論である uniformitarian_principle (斉一論の原則)を前面に押し出した歴史英語の論文集が,Denison et al. 編集のもとに,今年出版されたことも付け加えておこう.

 ・ Milroy, James. Linguistic Variation and Change: On the Historical Sociolinguistics of English. Oxford: Blackwell, 1992.
 ・ Smith, Jeremy J. An Historical Study of English: Function, Form and Change. London: Routledge, 1996.
 ・ Labov, William. "On the Use of the Present to Explain the Past." Readings in Historical Phonology: Chapters in the Theory of Sound Change. Ed. Philip Baldi and Ronald N. Werth. Philadelphia: U of Pennsylvania P, 1978. 275--312.
 ・ Denison, David, Ricardo Bermúdez-Otero, Chris McCully, and Emma Moore, eds. Analysing Older English. Cambridge: CUP, 2012.

[ 固定リンク | 印刷用ページ ]

2012-10-11 Thu

#1263. The LAEME Corpus の代表性 (2) [laeme][corpus][representativeness]

 昨日の記事[2012-10-10-1]に引き続き,The LAEME Corpus の代表性の話題.今回は,語数,より正確には同コーパスで文法情報が付与されている語 (tagged words) の数により,方言・時代ごとの代表性を考える.まず,表を掲げよう.

Table 2: Dialectal and Diachronic Distribution of Linguistic Evidence by Number of Tagged Words

 C12bC13aC13bC14aTotal
N0 (0.000%)362 (0.062)0 (0.000)52,883 (9.083)53,245 (9.146)
NEM11,342 (1.948)0 (0.000)3,980 (0.684)2,344 (0.403)17,666 (3.034)
NWM0 (0.000)58,332 (10.019)16,173 (2.778)0 (0.000)74,505 (12.797)
SEM40,082 (6.885)26,722 (4.590)21,921 (3.765)31,408 (5.395)120,133 (20.634)
SWM1,030 (0.177)90,400 (15.527)106,981 (18.375)108 (0.019)198,519 (34.098)
SW1,168 (0.201)2,610 (0.448)46,032 (7.907)30,517 (5.242)80,327 (13.797)
SE0 (0.000)4,043 (0.694)3,199 (0.549)30,561 (5.249)37,803 (6.493)
Total53,622 (9.210)182,469 (31.341)198,286 (34.058)147,821 (25.390)582,198 (100.000)


 直感的に理解できるように,この分布をモザイクプロットで表現したのが下図である(印刷用にはこちらのPDFをどうぞ).

Dialect/Period Distribution of Tagged Words

 分布の偏りは一目瞭然である.しかし,方言・時代の各スロットを構成するテキストの種類などをより細かく調べると,さらに重要な問題が見えてくる.いくつかのスロットでは,総語数の大部分がほんの一握りのテキストによって占められているのである.例えば,N C14a というスロットは,全体のなかで4番目に収録語数の多いスロットだが,その語数の95.61%は Cursor Mundi という1作品(正確には,それを表わす3種類の異なる書写言語を反映した 3 scribal texts [##296, 297, 298])で占められている.同様に,NEM C13b では #182 のみで80.93%の語数がカバーされている.NWM C13b では #272 のみで93.11%だ.SEM C12b では異なる2人の写字生の手による Trinity Homilies (##1200, 1300) が総語数の84.06%を占め,SEM C13a でも異なる2人の写字生の手による Vices and Virtues (##64, 65) が総語数の93.83%を占める.SW C13b の #1600 は,それだけで69.71%を占める,等々.
 これらの例が示唆することは,問題の方言・時代スロットは必ずしもその方言・時代の言語変種を代表しているわけではなく,むしろ特定のテキストに現われる言語変種を代表しているということかもしれなということだ.The LAEME Corpus の使用の際には,なお一層の注意が必要である.

[ 固定リンク | 印刷用ページ ]

2012-10-10 Wed

#1262. The LAEME Corpus の代表性 (1) [laeme][corpus][representativeness]

 私の関心の中心は初期中英語期の形態論である.この時代に関心をもつ者にとっては,LAEME (編者によれば,発音は /ˈleɪmiː/ )とそこから派生した The LAEME Corpus (Text Database) の登場は,同時代に関する研究環境を著しく改善し得るツールとして,最大限に歓迎される.LAEME については,本ブログでも laeme の記事で採りあげてきたし,とりわけツールとしての可能性を探り,拡張すべく「#846. HelMapperUK --- hellog 仕様の英国地図作成 CGI」 ([2011-08-21-1]) ,「#856. LAEME text database のデータ点とテキスト規模」 ([2011-08-31-1]) ,「#942. LAEME Index of Sources の検索ツール」 ([2011-11-25-1]) ,「#1057. LAEME Index of Sources の検索ツール Ver. 2」 ([2012-03-19-1]) を公表してきた.
 大工にとって道具の手入れが大事なように,研究者にとってツールの研究は大事である.具体的に The LAEME Corpus を使っているうちに,全体として俯瞰するとどのようなコーパスなのか,知りたくなってきた.[2010-11-16-1]の記事「#568. コーパスの定義と英語コーパス入門」で示した通り,コーパスの主たる特徴の1つに representativeness (代表性)がある.これは,コーパス評価のための指標の1つでもある.歴史コーパスにおける代表性の確保の難しさについては,「#531. OED の引用データをコーパスとして使えるか」 ([2010-10-10-1]) や「#1243. 語の頻度を考慮する通時的研究のために」 ([2012-09-21-1]) でも触れてきたが,この点では The LAEME Corpus も苦戦を強いられている.カバーしている方言分布については「#856. LAEME text database のデータ点とテキスト規模」 ([2011-08-31-1]) で採りあげたが,今回は方言区分に加えて時代区分も含めながら The LAEME Corpus のツール分析を試みたい.
 まずは,収録されているテキストの数を考える.当該コーパスは "scribal text" という単位でテキストが収録されているが,これを方言と時代にしたがって分別すると,散らばり具合がわかる.なお,方言区分と時代区分はそれ自体が方法論上の大問題なのだが,以下では,恣意的な区分(とはいってもある程度の根拠はあるが)として,方言は7つへ,時代は4つへと分けている.すなわち,方言は N (Northern), NEM (North-East Midland), NWM (North-West Midland), SEM (South-East Midland), SWM (South-West Midland), SW (Southwestern), SE (Southeastern) へ,時代は C12b (12世紀後半),C13a, C13b, C14a へ.中英語の方言区分については「#130. 中英語の方言区分」 ([2009-09-04-1]) も参照.

Table 1: Dialectal and Diachronic Distribution of Linguistic Evidence by Number of Texts

 C12bC13aC13bC14aTotal
N0 (0.00%)1 (0.86)0 (0.00)7 (6.03)8 (6.90)
NEM1 (0.86)0 (0.00)5 (4.31)2 (1.72)8 (6.90)
NWM0 (0.00)9 (7.76)5 (4.31)0 (0.00)14 (12.07)
SEM4 (3.45)7 (6.03)14 (12.07)7 (6.03)32 (27.59)
SWM2 (1.72)13 (11.21)17 (14.66)1 (0.86)33 (28.45)
SW3 (2.59)5 (4.31)7 (6.03)2 (1.72)17 (14.66)
SE0 (0.00)2 (1.72)1 (0.86)1 (0.86)4 (3.45)
Total10 (8.62)37 (31.90)49 (42.24)20 (17.24)116 (100.00)


 上の表を作成するにあたり対象としたのは,The LAEME Corpus に収録されている167個の scribal texts のうち,半世紀という単位で時代の区分がなされている116個のみである.
 表を一瞥すればわかるように,テキスト分布の偏りは大きい.方言でいえば SEM と SWM は層が異常に厚く,全体の3分の2ほどをカバーしているが,一方で N, NEM, SE は層が薄い.時代でみると,C13a と C13b だけで7割を越え,C12b と C14a は層が薄い.方言・時代の組み合わせでは,6スロットまでが "0" を示す.歴史コーパス編纂における representative の確保は絶望的とすら思えてくる.少なくとも,The LAEME Corpus を用いて得られる方言や時代についてのデータやそこから得られる結論は,よくよく注意して解釈しなければならないということがいえるだろう.
 この表は scribal text の数をもとに作成されているが,各 scribal text の長さはまちまちである.そこで,テキスト数ではなく,語数による分布の具合も調べてみる必要がある.語数に基づく代表性の議論は,明日の記事で.

[ 固定リンク | 印刷用ページ ]

2012-03-19 Mon

#1057. LAEME Index of Sources の検索ツール Ver. 2 [laeme][web_service][cgi][dialect]

 [2011-11-25-1]の記事「#942. LAEME Index of Sources の検索ツール」で SQL による検索用 CGI を公開した.最近,研究で LAEME を本格的に使う機会があり,検索用のデータベースに少しく情報を追加した.そこで,上位互換となる Ver. 2 を作ったので,公開する.
 追加した情報は,PERIOD, COUNTY, DIALECT の3フィールド.PERIOD は,もともとの IOS で与えられていたテキストの DATE をもとに,半世紀区切りで大雑把に区分しなおしたもの.C13b2--C14a1 など区分のまたがる場合には,早いほうをとって C13b と読み替えた."ca. 1300" なども同様に,早いほうへ倒して C13b とした.DATE において C13, C14 など半世紀で区切れない年代が与えられている場合には,C13, C14 のようにそのまま残した.
 COUNTY は,LOC に与えられていた情報をもとに,3文字の略字表記で示した.DIALECT は,所属する州 (county) をもとに大雑把に N (Northern), NWM (North-West Midland), NEM (North-East Midland), SEM (South-East Midland), SWM (South-West Midland), SW (Southwestern), SE (Southeastern) の7方言に区分したものである.方言線は州境と一致しているわけではないし,方言線そのものの選定も,「#130. 中英語の方言区分」 ([2009-09-04-1]) や「#1030. England の現代英語方言区分 (2)」 ([2012-02-21-1]) で見たように,難しい.したがって,今回の DIALECT の付与も,[2009-09-04-1]の中英語方言地図に大雑把に照らしての仮のものである.参考までに,COUNTY と DIALECT の対応表はこちら

    


 使用法は[2011-11-25-1]の旧版と同じで,テーブル名は "ios" (for "Index of Sources") で固定.フィールドは,全部で23フィールド (ID, MS, TEXT_ID, FILE, DATE, PERIOD, TEXT, GRID, LOC, COUNTY, DIALECT, COMMENT, SAMPLING, TAGGED_WORDS, PLACE_NAMES, PERSONAL_NAMES, WORDS, SCRIPT, OTHER, STATUS, BIBLIO, CROSS_REF, URL) .select 文のみ有効.以下,典型的な検索式を挙げておく.

# 各 PERIOD に振り分けられたテキストの数
select distinct PERIOD, count(*) from ios group by PERIOD;

# 各 COUNTY に振り分けられたテキストの数
select distinct COUNTY, count(*) from ios group by COUNTY;

# 各 DIALECT に振り分けられたテキストの数
select distinct DIALECT, count(*) from ios group by DIALECT;

# DIALECT/PERIOD ごとに,所属するテキストの多い順にリストアップ
select distinct DIALECT, PERIOD, count(*) from ios group by DIALECT, PERIOD order by count(*) desc;

# Worcestershire のテキストを取り出し,PERIOD 順に諸情報を羅列
select TEXT_ID, FILE, MS, COUNTY, PERIOD, TAGGED_WORDS from ios where COUNTY = 'WOR' order by PERIOD;

  *  

Referrer (Inside): [2012-12-17-1] [2012-10-10-1]

[ 固定リンク | 印刷用ページ ]

2011-11-25 Fri

#942. LAEME Index of Sources の検索ツール [laeme][web_service][cgi]

 LAEME で Auxiliary Data Sets -> Index of Sources とメニューをたどると,LAEME が対象としているテキストソースのリスト (The LAEME Index of Sources) を,様々な角度から検索して取り出すことができる.LAEME のテキストデータベースを年代別,方言別,Grid Reference 別などの基準で分析したい場合に,適切なテキストの一覧を得られるので,LAEME 使いこなしのためには非常に重要な機能である.
 しかし,もう少し検索式に小回りを利かせられたり,一覧の出力がコンパクトに表形式で得られれば使い勝手がよいだろうと思っていた.そこで,Index of Sources を独自にデータベース化し,SQL を用いて検索可能にしてみた.LAEME の使用者で,かつSQLを扱える人以外には何も役に立たないのだが,せっかく作ったので公開.

    


 以下,使用法の説明.テーブル名は "ios" (for "Index of Sources") で固定.フィールドは,LAEME 本家の検索で対象となっている18のフィールドに加えて,整理番号としての "ID" と,テキスト情報の掲載されたオンラインページへの "URL" を加えた計20フィールド (ID, MS, TEXT_ID, FILE, DATE, TEXT, GRID, LOC, COMMENT, SAMPLING, TAGGED_WORDS, PLACE_NAMES, PERSONAL_NAMES, WORDS, SCRIPT, OTHER, STATUS, BIBLIO, CROSS_REF, URL) .select 文のみ有効.以下に,典型的な検索式を例として載せておく.

# Ancrene Wisse/Riwle のテキスト情報の取り出し
select TEXT_ID, MS, FILE, GRID, LOC, DATE, TEXT from ios where FILE like "%ar%t.tag" and TEXT like "%Ancrene%";

# Poema Morale のテキスト情報の取り出し
select TEXT_ID, MS, FILE, GRID, LOC, DATE, TEXT from ios where FILE like "%pm%t.tag" and TEXT like "%Poema%";

# Grid Reference の与えられているテキストの取り出し
select TEXT_ID, MS, FILE, GRID from ios where GRID != "000 000";

# DATE に "C13a" を含むテキストの取り出し
select TEXT_ID, DATE from ios where DATE like "%C13a%";

# 年代ごとに集計
select DATE, count(DATE) from ios group by DATE order by DATE;

# タグ付けされている語数をテキストごとに確認
select TEXT_ID, TAGGED_WORDS, PLACE_NAMES, PERSONAL_NAMES from ios;

# 全テキスト情報へのリンク集
select TEXT_ID, MS, FILE, URL from ios;

Referrer (Inside): [2012-10-10-1] [2012-03-19-1]

[ 固定リンク | 印刷用ページ ]

2011-08-31 Wed

#856. LAEME text database のデータ点とテキスト規模 [map][laeme][lalme]

 LAEME text database で扱われている scribal texts の数は,LAEME Index of Sources (PDF) によると,ざっと168個だが,そのなかで地図上の位置が特定されているものは121個(約72%)である.位置情報は Ordinance Survey National Grid Reference として得られるし,各テキストについてタグ付けされている語数も得られるので,組み合わせれば,データ点ごとにどの程度の規模のテキストがコーパスとして利用できるか,地図上に表現することができることになる.この作業を,[2011-08-21-1]の記事「HelMapperUK --- hellog 仕様の英国地図作成 CGI」で公開した地図作成ツールを用いて行なった.以下が結果である.

LAEME data points and text sizes

 異なるデータ点は96を数え,データ点と関連づけられるテキスト(群)を構成する語数の平均値は6307語ほどである(タグ付けされた語数はこれより若干下回る).凡例として地図の右上に示した赤塗りの円の面積がこの平均語数に相当し,この面積を基準として,各データ点が,語数に相当する面積をもつ白抜きの赤丸として描かれている(参考までに,HelMapperUK に読み込ませたデータはこちら).
 地図を眺めて直感的にわかることは,データ点にせよ収録語数にせよ,South-West Midland と South-East Midland に随分と集中しているということである.これは,LAEME の編者の1人である Laing が自らの論文 "Never the twain shall meet" で注意を喚起している通りである.LAEME のテキストの位置特定は,LALME が編み出した "fit technique" という理論的手法に負っているが,この手法の成否の鍵は "anchor texts" と呼ばれる確実な出発点が多く手に入るかどうかという点にある.だが,残念なことに,後期中英語と異なり初期中英語では "anchor texts" が格段に少ない."anchor texts" は,後の理論的な位置特定に際して磁石のように機能するため,出発点が東や西に離れて分布していると,これから "fit" させようと思っているテキストも相対的に東西のどちらか側に引きつけられてしまうという結果になることが多い.Midland の中央にデータ点がまばらなのは,このような事情にも帰せられる.
 地図作成ツール HelMapperUK は,半ば LAEME の活用のために作ったようなものだが,LAEME 自体を分析するのにも利用できそうだ.
 なお,LAEME Index of Sources は先に貼り付けたリンク より PDF で入手できるが,その他にもLAEME のトップページ から Auxiliary Data Sets -> Index of Sources とたどると,様々なパラメータによりソーステキストの情報検索ができる.

 ・ Laing, Margaret. "Never the twain shall meet: Early Middle English --- The East-West Divide." Placing Middle English in Context. Ed. I. Taavitsainen et al. Berlin: Mouton de Gruyter, 2000. 97--124.
 ・ McIntosh, Angus, M. L. Samuels, and M. Benskin. A Linguistic Atlas of Late Mediaeval English. 4 vols. Aberdeen: Aberdeen UP, 1986.

Referrer (Inside): [2012-10-10-1] [2011-08-21-1]

[ 固定リンク | 印刷用ページ ]

2011-08-21 Sun

#846. HelMapperUK --- hellog 仕様の英国地図作成 CGI [cgi][web_service][map][lalme][laeme][bre]

 中英語の方言を研究していると,LALME の Dot Map 風のイングランド地図を描けると便利だと思う機会がある.LALME の地図を用いるのであればコピーしたりスキャンしたりすればよいし,オンラインの LAEME であれば "Mapping" 機能から "Feature Maps" で特に注目すべき言語項目に関する地図はデジタル画像で得られる.後者では,"Create a Feature Map" なるユーザーによる地図作成機能もおいおい追加されるとのことで,中英語方言学のヴィジュアル化は今後も進展して行くと思われる.
 しかし,それでも様々な困難や不便はある.例えば,LAEME でも,自分の関心のある言語項目が LAEME 自体で扱われていなければ地図作成機能は役に立たないし(例えば,私の中英語名詞複数の研究では名詞の歴史的な文法性が重要だが,LAEME text database では性がタグ付けされていないのでフルには活用できなかった),LALME についてはそもそも地図がデジタル化されていず応用しにくい(地図のデジタル化,少なくともテキスト情報や座標情報のデジタル化が一刻も早く望まれる).
 それでも,手をこまねいて待っているわけには行かない.既存のツールと自分の関心は大概ずれているものであり,自ら研究環境を作る必要に迫られるのが常だからだ.中英語の方言地図に関する限り,LALMELAEME からテキストの方言付与情報さえ得られれば,自ら集めた言語項目に関するデータを地図上にプロットすることは十分に可能である.(需要は少ないと思われるが)その作業を少しでも簡便化するために,HelMapperUK なる CGI を作成してみた.英国のベースマップ上にデータポイントをプロットするという単機能に特化しており,凡例をつけるなどの付加機能はないが,ヴィジュアル化して概観をつかむという用途には十分と思われる.



 以下で使い方の説明をするが,その前に,まずこちらのデータファイルの内容を上のテキストボックスに上書きコピペして出力結果の確認をどうぞ.これは,拙著の複数形研究で分析した初期中英語テキストの分布で,赤丸が手作業で分析したもの,青四角が LAEME text database を援用して分析したもの,それぞれの形で小さいものはテキストの全体ではなく部分を分析したものを表わす.(実際,Hotta (55) の地図はおよそこのようにして描かれた.)

 では,使い方の説明(基本的に作者個人仕様のものを公開しているだけなのでインターフェースは洗練されていません,あしからず).テキストボックスにあらかじめ入力されているとおり,入力データは設定部 (Configuration) で始まる.以下が設定可能な変数.

 ・ 「map」変数には "England" か "UK" が入る.これで,出力される地図の範囲を決定.
 ・ 「scale」変数は,X方向とY方向への拡大率を指定.拡大なし (scale=1 1) だと,出力画像は 386 * 313 Pixels (England) ,529 * 557 Pixels (UK) の大きさ.
 ・ 「pattern + 数字」変数は,プロットに用いる記号を定義する.イコールの後にはスペース区切りで (1) 形 ("box", "circle", "cross", "diamond", "invertedtriangle", "plus", or "triangle") ,(2) その形を塗りつぶすか否か (ex. "fill" or "stroke") ,(3) 色 (ex. "aqua", "black", "blue", "cyan", "green", "lime", "magenta", "red"; 他の大抵の色名にも対応しているはずだが出力される画像に反映されない色もある) ,(4) 大きさ(線の長さや円の直径に相当する Pixels)の4項目の値を与える.パターンは好きなだけユーザー定義可能.

 その後にデータ部 (Data points) が続く.1行に1データポイントで,各行はタブ区切りで (1) X座標,(2) Y座標,(3) 上で定義されたパターン名のいずれか ("pattern1" など)の3項目の値を与える(実際にはパターン名は省略可能.その場合,自動的に "pattern1" が用いられる.).座標系については,LALMELAEME で採用されている Ordinance Survey National Grid Reference の3桁ずつの座標系 (ex. "372 244") ,あるいは一般の経度・緯度 (ex. -2.408752393 52.09322081) のいずれも可能(自動で判定される).
 空行,あるいは "#" で始まるコメント行はデータとして無視される.

 出力結果は GIF 形式の画像として表われる.別途,EPS 形式のベクター画像としてもダウンロードできるようにした(こちらのファイルをいじれるのであれば,各種の設定を含めた細かいチューニングが可能).
 英国ベースマップの作成には,CIA World DataBank IIDCW Map Interface for Europe のデータを参照した.

(後記 2011/08/31(Wed):[2011-08-31-1]の記事「LAEME text database のデータ点とテキスト規模」で,HelMapperUK で作製した地図の実例を示した.)

 ・ McIntosh, Angus, M. L. Samuels, and M. Benskin. A Linguistic Atlas of Late Mediaeval English. 4 vols. Aberdeen: Aberdeen UP, 1986.
 ・ Laing, Margaret and Roger Lass, eds. A Linguistic Atlas of Early Middle English, 1150--1325. http://www.lel.ed.ac.uk/ihd/laeme1/laeme1.html . Online. Edinburgh: U of Edinburgh, 2007.
 ・ Hotta, Ryuichi. The Development of the Nominal Plural Forms in Early Middle English. Hituzi Linguistics in English 10. Tokyo: Hituzi Syobo, 2009.

[ 固定リンク | 印刷用ページ ]

2011-03-18 Fri

#690. Northern Personal Pronoun Rule を LAEME で検証 [laeme][me_dialect][personal_pronoun][verb][nptr]

 昨日の記事[2011-03-17-1]で記事で取り上げた The Northern Personal Pronoun Rule (NPPR) は北部イングランドで中英語期に行なわれた統語規則とされる.初期中英語で実際に文証されるかどうかを,LAEME で確認してみたい.
 Laing and Lass (26--27) によれば,LAEME のコーパスでは NPPR が 動詞にタグ付けされているということなので,簡単に拾い出すことができる.Tasks ページから以下のようにメニューをたどり,検索表現として "(-)vps2%apn(%)" (代名詞の直後に現われる動詞の現在形複数)と "(-)vps2%bpn(%)" (代名詞の直前に現われる動詞の現在形複数)でそれぞれ検索してみた.検索表現をより細かく工夫することはできるが,これで当面の用は足せる.

[LISTS] -> [Make an Item List] -> [Inflections] and [Search by TAG] -> ( [(-)vps2%apn(%)] or [(-)vps2%bpn(%)] ) and Frequency Counts


 出力された情報を読み解くにも少々の知識と経験がいるが,各行は「検索対象となったテキスト番号」「そのテキストの言語が位置づけられている州の略名」「問題の語尾の種類と頻度」からなっている.NPPR では,複数人称代名詞の前後で動詞の現在形が( -e や -en もありうるが)ゼロ語尾を取るというのが最も顕著な特徴なので,語尾として "0" が含まれている行を探し出せばよい.その行を以下に抜き出す.

[for "(-)vps2%apn(%)"]
188DUR+E [2] 0 [2]
285NFK+E [7] +En [4] +ETH [3] +N [2] 0 [2] +EN [1]
295YWR+>I>Ey [17] 0 [9]
296YCT+E [16] 0 [14] +E [2]
297YER0 [36] +E [10] +IEy [2]
298YNR+E [43] 0 [31]
300NFK0 [31]

[for "(-)vps2%bpn(%)"]
119[-]0 [2]
173WOR+Ay [1] +E [1] +Ey [1] 0 [1]
247HRF+E [2] +ET [1] +T [1] 0 [1]
295YWR0 [4]
296YCT0 [5] +E [3]
297YER0 [8] +E [4]
298YNR0 [22] +E [10] 0+ [2]
2000WOR+E [6] 0 [3] +Ed [1] +IE [1]
2001WOR0 [3]


 州名を一覧すると,Durham, Yorkshire, Hereford, Worcester, Norfolk など北部から中部にかけて分布していることが分かる.特にテキスト番号295--298は Cursor Mundi という長大な詩を指し,14世紀前半の北部方言を代表するテキストとして知られている.
 テキスト298 (Edinburgh, Royal College of Physicians, MS of Cursor Mundi, hand B, fols. 16r-36v: Extracts from the Northern Homily Collection) から例を抜き出すと,例えば次のような NPPR を示す行が得られる.問題の動詞は赤字で記した.

- Yef þai lef her rihtwislie
- For in hali bok find we
- For if we schrif us clen of sinne
- Ye wen ful wel nou euerilkan
- Þan sau þai in vs goddes sede
- Of his offering today spec we


 Tasks ページから CONCORDANCING 機能により用例のコンコーダンス・ラインを出力することもできるが,検索の敷居はさらに高い.TAGGED TEXTS からテキストファイルを取り出して自分で検索したほうが容易かもしれない.

 ・ Laing, Margaret and Roger Lass. "Tagging." Chapter 4 of "A Linguistic Atlas of Early Middle English: Introduction." Available online at http://www.lel.ed.ac.uk/ihd/laeme1/pdf/Introchap4.pdf .

[ 固定リンク | 印刷用ページ ]

2011-02-19 Sat

#663. 中英語方言学における綴字と発音の関係 [lalme][laeme][me_dialect][spelling_pronunciation_gap][grammatology][graphemics][x]

 初期中英語の方言地図 LAEME の機能が向上してきた.その先輩でもあり生みの親でもある後期中英語の方言地図 LALME は,綴字と発音の関係を考察する上で重要な知見をもたらしてきた.中英語における綴字の地理的分布が,発音の地理的分布と同様に方言学的な価値をもっていることを明らかにした.それまでは,綴字は発音に従属する二次的な体系であり,綴字の地理的分布が本質的に重要な価値をもっているとはみなされていなかったが,LALME は綴字を独立して観察されるべき体系として位置づけたのである.綴字を発音から解放したとでも言おうか.
 中英語方言学は,1986年の LALME の登場によって意表を突かれながら,新たな段階に入ることになった.ここに一種の解放感ならぬ開放感があったことは確かである.文書でしか残されていない中英語の言語的実態,ことに発音の実態を蘇らせたいと思えば,綴字の問題に行き着いてしまう.綴字がどのくらい忠実に発音を表わしているのかは,まさに隔靴掻痒たる問題である.例えば,悪名高いものに現代英語の shall に対応する後期中英語 East Anglia 地方の綴字 xul, xal がある(この語の他の奇妙な綴字は MED を参照).この <x> の文字で表わされる音価は [ks] なのか [ʃ] なのか,あるいは別の音なのか.このような難問が立ちはだかるなかで,綴字と発音を一度切り離して考えてみよう,綴字の側だけでも独立して考察してみよう,という研究上の選択肢が与えられることとなった.
 しかし,発音の呪縛からの解放感は永久に続くわけではない.LALME の出版後,(時代としてはより古いが)その続編として LAEME のプロジェクトが始まったが,プロジェクトの後半から本格的に参加した歴史形態音韻論の理論家 Lass は,綴字と発音の関係を再考して次のように述べている.

The statement in LALME (vol. 1, 6) that the maps constitute 'a dialect atlas of written Middle English', and that texts are 'treated as examples of a system of written language in its own right' is often misinterpreted. The emphasis on the independent value of written evidence was particularly apposite two decades ago, given the post-Bloomfieldian view that was current then (and to a large extent still is) that writing is of no independent linguistic interest, but merely 'parasitic on' speech. But this must not be misunderstood and taken to imply that phonological interpretation is per se unnecessary. The LALME editors take no such line. They were fully aware of the potential phonological implications of their data. LALME is rich in phonological commentary, while the series of Dot Maps (vol. 1) crucially depends on acknowledging the relationship between sound and symbol. (Lass and Laing 11--12)


 これは,20年ほどの解放感の後で xul の音価は何かという悪夢のような問題に立ち返らなければならないという宣言だろうか.上の論文でなされている Lass and Laing の文字論,書記素論の考察は,初期中英語の綴字問題にとどまらず,現代英語の綴字と発音の関係にも光を与えるものであり,読み応えがある.

 ・ Lass, Roger and Margaret Laing. "Interpreting Middle English." Chapter 2 of "A Linguistic Atlas of Early Middle English: Introduction." Available online at http://www.lel.ed.ac.uk/ihd/laeme1/pdf/Introchap2.pdf .
 ・ McIntosh, Angus, M. L. Samuels, and M. Benskin. A Linguistic Atlas of Late Mediaeval English. 4 vols. Aberdeen: Aberdeen UP, 1986.

Referrer (Inside): [2015-07-25-1] [2011-02-20-1]

[ 固定リンク | 印刷用ページ ]

2009-07-29 Wed

#93. third の音位転換はいつ起こったか (2) [metathesis][spelling][lalme][laeme]

 昨日の記事[2009-07-28-1]に引き続き,third の音位転換がいつ起こったか.今回は,後期中英語を守備範囲とする LALME を見てみる.北部方言に限っての異綴りリストなので,全体像はわからないものの,示唆的な分布である.

terd, thed, therd, therdde, therde, third, thirdde, thirde, thrd, thre, thred, thredd, thredde, threde, thrid, thridd, thridde, thride, thryd, thrydd, thrydde, thryde, thryde, thyrde, thyrd, trid, tyrd, þerd, þerde, þird, þirdde, þirde, þred, þred, þredde, þrede, þrid, þrid-, þridde, þride, þryd, þrydd, þrydde, þryde, þyrd, yerdde, yird, yirdde, yirde, yred, yredde, yrede, yrid, yridde, yride, yryd, yryde


初期中英語では音位転換はほとんど起こっていなかったが,後期中英語では音位転換を経た <母音 + r> が,3分の1強の綴りに確認される.特に頻度の高い綴りは,third, thrid, thridde, thryd, thyrd あたりだが,そのうちの二つが音位転換をすでに経ている綴りである.
 参考までに,オンライン版の Middle English Dictionary から thrid をのぞいて,異綴りを確認してみることを勧める.
 上記から,音位転換形は突然に広まったわけではなく,ゆっくりと確実に分布を広がってきたことが分かる.10世紀半ばの古英語の時代に ðirdda という音位転換形が用いられている例もあり,その頃から緩慢に分布を広げてきたのだろう.最終的に third に定着するのは近代英語期になってからだと想定されるが,確実なことは LAEMELALME に引き続き,初期近代英語のコーパスで異綴りの調査を行う必要がある.

 ・Laing, Margaret and Roger Lass, eds. A Linguistic Atlas of Early Middle English, 1150--1325. http://www.lel.ed.ac.uk/ihd/laeme1/laeme1.html . Online. Edinburgh: U of Edinburgh, 2007.
 ・McIntosh, Angus, Michael Louis Samuels, Michael Benskin, eds. A Linguistic Atlas of Late Mediaeval English. Aberdeen: Aberdeen UP, 1986.

[ 固定リンク | 印刷用ページ ]

2009-07-28 Tue

#92. third の音位転換はいつ起こったか [metathesis][spelling][lalme][laeme]

 [2009-06-27-1]で取りあげたが,音位転換 ( metathesis ) の代表例の一つに third がある.古英語の綴り þridda から,また現代英語の対応する基数詞 three の綴りから分かるとおり,本来は <ir> ではなく <ri> という順序だった.ところが,後に音の位置が転換し,現代標準語の綴りに落ち着いた.
 では,いつこの音位転換が起こったのか.[2009-06-21-1]で紹介した LAEMELALME という中英語の綴りを準網羅的に集積した資料を用いれば大体のことはわかる.今回は,初期中英語 ( Early Middle English ) を守備範囲とする LAEME で調べてみた.
 LAEMEオンラインで利用できるので,実際に以下の手順を試してもらいたい.TAG DICTIONARY -> Numbers とたどって右側のブラウザに現れる長いリストが,数詞の異綴り集である.記号の読み方は多少慣れる必要があるが,"3/qo" が「3の序数詞」つまり third に対応するタグなので,これをキーワードに検索をかければ,13行ほどがヒットする.異綴りを整理すると,以下の通り.

dridde, Dridðe, thred, thrid, thridde, thride, thrid/de, trhed, tridde, tridde, þerdde, þr/idde, þred, þredde, þri/de, þrid, þrid/de, þrid/den, þridda, þriddan, Þridde, þridde, þridden, þride, þridðe, þrid/de, þrirde, þri[d]/de, ðridde, Ðridde, ðride, yridde, yridden


以上から,音位転換が起こっているのは þerdde くらいで,まだまだ初期中英語期の段階では <ri> が圧倒的だということがわかる.
 蛇足だが,我が家における最近の音位転換のヒット作は「竜のお仕事」(←「タツノオトシゴ」)である.だが,これだけ配置替えされてしまっては,単純に音位転換と呼べるのかどうかは不明である.

 ・Laing, Margaret and Roger Lass, eds. A Linguistic Atlas of Early Middle English, 1150--1325. http://www.lel.ed.ac.uk/ihd/laeme1/laeme1.html . Online. Edinburgh: U of Edinburgh, 2007.
 ・McIntosh, Angus, Michael Louis Samuels, Michael Benskin, eds. A Linguistic Atlas of Late Mediaeval English. Aberdeen: Aberdeen UP, 1986.

[ 固定リンク | 印刷用ページ ]

2009-07-16 Thu

#79. 手話言語学からの inspiration [sign_linguistics][double_articulation][origin_of_language][lalme][laeme]

 今日は,英語史に直接かかわる話ではないが,言語の起源や言語変化を考える際にヒントを与えてくれる手話言語学 ( sign linguistics ) という分野を紹介したい.紹介するといっても,私もつい先日その存在を知ったばかりなので,非常におこがましいが,許していただきたい.経緯を述べれば,今月号の『月刊言語』が手話言語学の特集を組んでおり,それを読んで inspiration をかき立てられただけの話である.
 手話言語学の中身については何もわからないが,それが言語の起源や機能を考える際に,多くの示唆を与えてくれそうだという匂いは感じることができた.どのような点で示唆的なのか.神田和幸氏による以下のポイントが分かりやすい (10).

 ・音声言語を獲得できない聾者が手話を発生させるのはなぜか
 ・動物にもサインが分かりやすいのはなぜか
 ・音声言語が通じない人間同士が身振りで伝えようとするのはなぜか
 ・音声言語を発しながら無意識にジェスチャーするのはなぜか

 つまり,音声言語の発生に先行して身振り言語が発生していたことは容易に想像され,その身振り言語が体系的に整理されたものが手話言語と考えれば,手話言語研究が言語起源説に貢献しうるということは自明のように思われる.
 浅学非才をさらけ出すが,手話言語は音声言語に匹敵する非常に複雑で精緻な内部体系をもっているということも初めて知った.手話言語に語彙があり文法があることは漠然と知っていても,形態論があり,なんと音韻論(に相当するもの)もあるというから驚きだ.アンドレ・マルティネのいう言語の二重分節 ( double articulation ) が手話言語にも歴然と存在するという.
 2008年5月3日に発効した,国際連合の「障害のある人の権利に関する条約」の第二条「定義」の項で,手話などの非音声言語も音声言語と同様に「言語」と位置づける旨が明記されているという(条約の英文はこちら).手話言語は,名実ともに,歴とした言語なのだそうだ.
 本ブログの趣旨に近い話題をあげれば,音声言語の方言や言語変化に相当するものが手話言語にもあるという.考えてみれば,手話言語に方言や通時的変化があっても確かに不思議ではない.日本手話言語地図の作成が計画されているというのもうなずける.
 手話言語学は,「言語=音声言語」という従来の前提からは生まれ得ない,言語の本質に迫る新たな視点を提供してくれる,発想の種になるかもしれない.中英語の綴り字の変異を地図上にプロットした LALMELAEME ([2009-06-21-1]) が英語史研究に新時代をもたらしてきたことを考えると,視覚言語にもっと注目が集まってもよい.「言語=音声言語」という犯すべからざる言語学の大前提を少し揺るがしてみるのも面白いのではないか.その意味で,手話言語学は,音声言語ではなく文字言語にどっぷり浸かっている文献学研究にとっても心強い仲間になるかもしれない.

 ・McIntosh, Angus, Michael Louis Samuels, Michael Benskin, eds. A Linguistic Atlas of Late Mediaeval English. Aberdeen: Aberdeen UP, 1986.
 ・Laing, Margaret and Roger Lass, eds. A Linguistic Atlas of Early Middle English, 1150--1325. http://www.lel.ed.ac.uk/ihd/laeme1/laeme1.html . Online. Edinburgh: U of Edinburgh, 2007.

[ 固定リンク | 印刷用ページ ]

2009-06-21 Sun

#54. through 異綴りベスト10(ワースト10?) [spelling][lalme][laeme][oed][me_dialect][through]

 昨日[2009-06-20-1]の記事で through の綴りが後期中英語期だけでも515通りあったことを紹介した.そこで書き忘れたのだが,どこからこのような情報が得られるかということである.まさか,丹念に中英語のテキストをしらみつぶしに読んで,一つ一つ through とおぼしき形態をせっせと収集したというわけではない.また,電子コーパスとして全テキストが検索可能になっていたとしても,lemmatise(見出し語化)されていなければ,そもそも検索欄にどの綴り字を入力すればいいのかが不明である.
 方法の一つとして Oxford English Dictionary ( OED ) の利用がある.この究極の英英辞書は,古英語から現代英語までの各単語の異綴りを数多く掲載している.確かに汎用的に使える方法だが,OEDthrough を引いてみると,せいぜい数十の異綴りしか得られない.
 もう一つの方法は,A Linguistic Atlas of Late Mediaeval English ( LALME ) の利用である.これは,選ばれた基本語の異綴りがブリテン島の地図の上にプロットされている「方言地図」である.時代は後期中英語に限られているものの,異綴り研究にとっては究極のツールである.今回の through の異綴りも LALME ですでにまとめられているリストを打ち込んだだけである.LALME の初期中英語期の姉妹編として LAEME なるものもあり,こちらはオンラインで利用可能なので,ぜひ試されたい(URLは末尾).
 さて,515通りの列挙を眺めていると目がチカチカしてくるが,その中で私の独断と偏見で選ぶベスト10(ワースト10ともいえる)を,突っ込みを入れながら挙げてみよう.

 1. yhurght (←ほぼ yoghurt
 2. trghug (←ほぼ発音不可能)
 3. thrwght (←母音字なし,その一)
 4. thwrw (←母音字なし,その二)
 5. thrvoo (←vって・・・)
 6. throw (←違う単語になってる)
 7. threw (←その過去形まである)
 8. yora (←どうしてこうなるの?)
 9. ȝour (←なぜ?)
 10. through (←ちゃんとあるじゃない!)

 ・McIntosh, Angus, Michael Louis Samuels, Michael Benskin, eds. A Linguistic Atlas of Late Mediaeval English. Aberdeen: Aberdeen UP, 1986.
 ・Laing, Margaret and Roger Lass, eds. A Linguistic Atlas of Early Middle English, 1150--1325. http://www.lel.ed.ac.uk/ihd/laeme1/laeme1.html . Online. Edinburgh: U of Edinburgh, 2007.

[ 固定リンク | 印刷用ページ ]

Powered by WinChalow1.0rc4 based on chalow