hellog〜英語史ブログ     ChangeLog 最新     カテゴリ最新     1 2 次ページ / page 1 (2)

hc - hellog〜英語史ブログ

最終更新時間: 2019-03-19 05:58

2018-04-22 Sun

#3282. The Parsed Corpus of Middle English Poetry (PCMEP) [corpus][me][hc][ppcme][laeme][link]

 中英語の韻文を集めた統語タグ付きコーパスをみつけた.The Parsed Corpus of Middle English Poetry より編纂者 Richard Zimmermann 氏の許可を得て利用できる.
 現段階で,同コーパスは41のテキスト,160432語からなっている(テキスト・リストはこちら).カバーする時代範囲は c. 1150--1420年,すなわち Helsinki Corpus の区分でいえば M1, M2, M3 に相当する時代である.統語タグは Penn Parsed Corpora of Historical English と同じ方法で付されており,Corpus Search 2 などのツールを用いて解析できる.
 Related Corpora のページの情報も有用で,そこにある中英語に関する各種コーパスやデータベースへのリンクを,以下にも張りつけておきたい.

 ・ The Penn-Parsed Corpus of Middle English
 ・ The Corpus of Middle English Prose and Verse
 ・ The Innsbruck Corpus of Middle English Prose
 ・ A Parsed Linguistic Atlas of Early Middle English (P-LAEME)
 ・ Database of Middle English Romance

 アンテナ張りを怠っているうちに,いろいろなプロジェクトや成果物が現われていたのだなという感慨.

[ | 固定リンク | 印刷用ページ ]

2018-01-10 Wed

#3180. 徐々に高頻度語の仲間入りを果たしてきたフランス・ラテン借用語 [french][latin][loanword][borrowing][frequency][statistics][lexicology][hc][bnc]

 英語史では,中英語から初期近代英語にかけて,フランス語とラテン語から大量の語彙借用がなされた.それらのうち現在常用されるものについては,おそらく借用時点からスタートして時間とともに使用頻度が増してきたものと想像される.というのは,借用された当初から高頻度で用いられたとは考えにくく,徐々に英語に同化し,日常化してきたととらえるのが自然だからだ.
 この仮説を実証するのにいくつかの方法がありそうだが,Durkin があるやり方で調査を行なっている.中英語,初期近代英語,現代英語のそれぞれにおいてコーパスに基づく最高頻度語リストを作り,そのなかにフランス・ラテン借用語がどのくらいの割合で含まれているかを調べ,その割合の通時的推移を比較するという手法だ.古い時代のコーパスでは綴字の変異という問題が関わるため,厳密に調査しようとすれば単純にはいかないが,Durkin はとりあえずの便法として,中英語と初期近代英語については Helsinki Corpus の 1150--1500年と1500--1710年のセクションを用いて,現代英語については BNC を用いて異綴字ベースで調査した.それぞれ頻度ランキングにして900--1000位ほどまでの単語(綴字)リストを作り,そのなかでフランス・ラテン語借用語が占める割合をはじき出した.
 結果は,中英語セクションでは7%ほどだったものが,初期近代英語セクションでは19%まで上昇し,さらに現代英語セクションでは38%までに至っている.粗い調査であることは認めつつも,フランス・ラテン借用語で現在頻用されているものの多くについては,歴史のなかで徐々に頻度を上げてきた結果として,現在の日常的な性格を示すことがよくわかった.
 さらにおもしろいことに,初期近代英語のセクション(1500--1710年)に関する数値について,高頻度語リストに含まれるフランス・ラテン借用語のすべてが1500年より前に借用されたものであり,しかもその2/3ほどは確実にフランス借用語であるという事実が確認される (Durkin 338--39) .
 また,中英語と初期近代英語の高頻度語リストに含まれるフランス・ラテン借用語の多くが,現代英語の高頻度語リストにも再現されている事実にも触れておこう.古い2期には現われるが現代期からは漏れている語群を眺めると,なんとも時代の変化を感じさせてくれる.例えば,honour, justice, manner, noble, parliament, pray, prince, realm, religion, supper, treason, usury, virtue である (Durkin 340) .
 時代によって最頻語リストやキーワードが異なることは当然といえば当然だが,歴史英語コーパスを用いて様々な時代を比較してみるとおもしろそうだ.例えば,初期近代英語コーパスに基づくキーワード・リストについて「#2332. EEBO のキーワードを抽出」 ([2015-09-15-1]) を参照.また,頻度と歴史の問題については「#1243. 語の頻度を考慮する通時的研究のために」 ([2012-09-21-1]) も参照されたい.

 ・ Durkin, Philip. Borrowed Words: A History of Loanwords in English. Oxford: OUP, 2014.

[ | 固定リンク | 印刷用ページ ]

2016-05-24 Tue

#2584. 歴史英語コーパスの代表性 [representativeness][corpus][methodology][hc][register]

 コーパスの代表性 (representativeness) や均衡 (balance) の問題については,「#1280. コーパスの代表性」 ([2012-10-28-1]) その他の記事で扱ってきた.古い時代の英語のコーパスを扱う場合には,現代英語コーパスに関する諸問題がそのまま当てはまるのは当然のことながら,それに上乗せしてさらに困難な問題が多く立ちはだかる.
 まず,歴史英語コーパスという話題以前の問題として,コーパスの元をなす母集合のテキスト集合体そのものが,歴史の偶然により現存しているものに限られるという制約がある.碑文,写本,印刷本,音声資料などに記されて現在まで生き残り,保存されてきたものが,すべてである.また,これらの資料は存在することはわかっていても,現実的にアクセスできるかどうかは別問題である.現実的には,印刷あるいは電子形態で出版されているかどうかにかかっているだろう.それらの資料がテキストの母集合となり,運よく編纂者の選定にかかったその一部が,コーパス(主として電子形態)へと編纂されることになる.こうして成立した歴史英語コーパスは,数々の制約をかいくぐって,ようやく世に出るのであり,この時点で理想的な代表性が達成されている見込みは,残念ながら薄い.
 また,歴史英語とひとくくりに言っても,実際には現代英語と同様に様々な lects や registers が区分され,その区分に応じてコーパスが編纂されるケースが多い.確かに,ある意味で汎用コーパスと呼んでもよい Helsinki Corpus のような通時コーパスや,統語情報に特化しているが異なる時代をまたぐ Penn Parsed Corpora of Historical English もあるし,使い方によっては通時コーパスとしても利用できる OED の引用文検索などがある.しかし,通常は,編纂の目的や手間に応じて,より小さな範囲のテキストに絞って編纂されるコーパスが多い.古英語コーパスや中英語コーパスなど時代によって区切ること (chronolects) もあれば ,イギリス英語やアメリカ英語などの方言別 (dialects) の場合もあるし,Chaucer や Shakespeare など特定の作家別 (idiolects) の場合もあろう.社会方言 (sociolects) 別というケースもあり得るし,使用域 (registers) に応じてコーパスを編纂するということもあり得る.使用域といっても,談話の場(ジャンルや主題),媒体(話し言葉か書き言葉か),スタイル(形式性)などに応じて,下位区分することもできる.一方,分類をあまり細かくしてしまうと,上述のように現存するテキストの量が有限であり,たいてい非常に少なかったり分布が偏っているわけだから,代表性や均衡を保つことがなおのこと困難となる.
 時代別 (chronolects) の軸を中心にすえて近年の比較的大規模な歴史英語コーパスの編纂状況を概観してみると,各時代の英語の辞書・文法・方言地図のような参考資料の編纂と関連づけて編纂されたものがいくつかあることがわかる.これらは,各時代の基軸コーパスとして位置づけられるといってよいかもしれない.例えば,Dictionary of Old English Corpus (DOEC), A Linguistic Atlas of Early Middle English (LAEME), Middle English Grammar project (MEG) 等である.近代についてはコーパスというよりはテキスト・データベースというべき EEBO (Early English Books Online) も利用可能となってきているし,アメリカ英語については Corpus of Historical American English (COHA) 等の試みもある.
 上に挙げた代表的で著名なもののほか,様々な切り口からの歴史英語コーパス編纂の企画が続々と現われている.その逐一については,「#506. CoRD --- 英語歴史コーパスの情報センター」 ([2010-09-15-1]) で紹介した,Helsinki 大学の VARIENG ( Research Unit for Variation, Contacts and Change in English ) プロジェクトより CoRD ( Corpus Resource Database ) を参照されたい.
 ハード的にいえば,上述のように,歴史英語コーパスの代表性を巡る問題を根本的に解決するのは困難ではあるが,一方で個別コーパスの編纂は活況を呈しており,諸制約のなかで進歩感はある.今ひとつはソフト的な側面,使用者側のコーパスに対する態度に関する課題もあるように思われる.電子コーパスの時代が到来する以前にも,歴史英語の研究者は,時間を要する手作業ながらも紙媒体による「コーパス」の編纂,使用,分析を常に行なってきたのである.彼らも,私たちが意識しているほどではなかったものの,ある程度はコーパスの代表性や均衡といった問題を考えてきたのであり,解決に至らないとしても,有益な研究を継続し,知見を蓄積してきた.電子コーパス時代となって代表性や均衡の問題が目立って取り上げられるようになったが,確かにその問題自体は大切で,考え続ける必要はあるものの,明らかにしたい言語現象そのものに焦点を当て,コーパスを便利に使いこなしながらその研究を続けてゆくことがより肝要なのではないか.

Referrer (Inside): [2016-12-05-1]

[ | 固定リンク | 印刷用ページ ]

2015-07-17 Fri

#2272. 歴史的な and の従属接続詞的(独立分詞構文的)用法 [conjunction][participle][syntax][contact][celtic][hc][substratum_theory]

 一言で言い表しにくい歴史的な統語構造がある.伝統英文法の用語でいえば,「独立分詞構文の直前に and が挿入される構造」と説明すればよいだろうか.中英語から近代英語にかけて用いられ,現在でもアイルランド英語やスコットランド英語に見られる独特な統語構造だ.Kremola and Filppula が Helsinki Corpus を用いてこの構造の歴史について論じているのだが,比較的理解しやすい例文を以下に再掲することにしよう.

 ・ And thei herynge these thingis, wenten awei oon aftir anothir, and thei bigunnen fro the eldre men; and Jhesus dwelte aloone, and the womman stondynge in the myddil. (Wyclif, John 8, 9, circa 1380)
 ・ For we have dwelt ay with hir still And was neuer fro hir day nor nyght. Hir kepars haue we bene And sho ay in oure sight. (York Plays, 120, circa 1459)
 ・ & ȝif it is founde þat he be of good name & able þat þe companye may be worscheped by him, he schal be resceyued, & elles nouȝht; & he to make an oþ with his gode wil to fulfille þe poyntes in þe paper, þer whiles god ȝiueþ hym grace of estat & of power (Book of London English, 54, 1389)
 ・ . . . and presently fixing mine eyes vpon a Gentleman-like object, I looked on him, as if I would suruay something through him, and make him my perspectiue: and hee much musing at my gazing, and I much gazing at his musing, at las he crost the way . . . (All the Workes of John Taylor the Water Poet, 1630)
 ・ . . . and I say, of seventy or eighty Carps, [I] only found five or six in the said pond, and those very sick and lean, and . . . (The Compleat Angler, 1653--1676)
 ・ Which would be hard on us, and me a widow. (Mar. Edgeworth, Absentee, xi, 1812) (←感嘆的用法)


 これらの and の導く節には定動詞が欠けており,代わりに不定詞,現在分詞,過去分詞,形容詞,名詞,前置詞句などが現われるのが特徴である.統語的には主節の前にも後にも出現することができ,機能的には独立分詞構文と同様に同時性や付帯状況を表わす.この構文の頻度は中英語では稀で,近代英語で少し増えたとはいえ,常に周辺的な統語構造であったには違いない.Kremola and Filppula (311, 315) は,統語的に独立分詞構文と酷似しているが,それとは直接には関係しない発達であり,したがってラテン語の絶対奪格構文ともなおさら関係しないと考えている.
 それでは,この構造の起源はどこにあるのか.Kremola and Filppula (315) は,不定詞が用いられているケースについては,ラテン語の対格付き不定詞構文の関与もあるかもしれないと譲歩しているものの,それ以外のケースについてはケルト諸語の対応する構造からの影響を示唆している.

The infinitival type, which at least in its non-exclamatory use is closer to coordination than the other types, may well derive from the Latin accusative with the infinitive . . . But the non-infinitival constructions (and the exclamatory infinitival patterns), although they too are often considered to have their origins in the Latin absolute constructions, could also stem from another source, viz. Celtic languages. Whereas the Latin models typically lack the overt subordinator, subordinating and-structures closely equivalent to the ones met in Middle English and Early Modern English are a well-attested feature of the neighbouring Celtic languages from their earliest stages on.


 私自身はケルト系言語を理解しないので,Kremola and Filppula (315--16) に挙げられている古アイルランド語,中ウェールズ語,現代アイルランド語からの類似した文例を適切に評価できない.しかし,彼らは,先にも述べたように,現代でもこの構造がアイルランド英語やスコットランド英語に普通に見られることを指摘している.
 なお,Filppula は,英語の統語論にケルト諸語の基層的影響 (substratum_theory) を認めようとする論客である.「#1584. 言語内的な要因と言語外的な要因はどちらが重要か? (3)」 ([2013-08-28-1]) の議論も参照されたい.

 ・ Kremola, Juhani and Markku Filppula. "Subordinating Uses of and in the History of English." History of Englishes: New Methods and Interpretations in Historical Linguistics. Ed. Matti Rissanen, Ossi Ihalainen, Terttu Nevalainen, and Irma Taavitsainen. Berlin: Mouton de Gruyter, 1992. 762--71.

[ | 固定リンク | 印刷用ページ ]

2015-07-14 Tue

#2269. 受動態の動作主に用いられた byof の競合 [preposition][passive][grammaticalisation][hc]

 標記の問題について直接,間接に「#1333. 中英語で受動態の動作主に用いられた前置詞」 ([2012-12-20-1]),「#1350. 受動態の動作主に用いられる of」 ([2013-01-06-1]),「#1351. 受動態の動作主に用いられた throughat」 ([2013-01-07-1]) で取り上げてきた.後期中英語から初期近代英語にかけての時期の byof の競合について,Peitsara の論文を読んだので,その結論部 (398) を引用しておきたい.

   I hope to have shown, firstly, that the by-agent prevailed in English in the 15th century, i.e. two centuries earlier than suggested so far. . . . The necessary consequence of the first conclusion is that agentive by can hardly have been rare before 1400.
   Secondly, it appears that there has not been a development from a general agentive of into a general agentive by in Middle English, but the two variants have existed side by side (possibly together with some others excluded from this study) fro some time. They were, however, not in free variation in the 15th and 16th centuries but had become specialized, partly according to the type of text and partly according to the semantic fields of the participles in the passive clause. This specialization was more complicated than, and partly different from, that described by some scholars, and it apparently involved foreign influence.
   Thirdly, the Middle English period was particularly favourable for the gradual grammaticalization of by in agentive function because of the heavier functional load of the preposition of and the lack of special grammaticalization for by.


 この論文は1992年のものであり,2015年の現在からすると最新というわけではないのだが,当時のハイテクツールといってよい Helsinki Corpus を利用した事例研究として,注目すべきものではある.先行研究を批判的に評価し,新しいツールに依拠しながら,by が15世紀までに受動態の動作主を表わす前置詞として一般化しつつあった(そして含意としては後に文法化した)こと,一方で of は同じ頃,同様の用法を有しながらも複数の要因によって使い分けられるマイナーな代替物として機能していたことを明らかにした.
 引用の第2段落の最後の文にあるように,Peitsara は英語での前置詞の選択がラテン語やフランス語の語法に影響を受けた可能性にも言い及んでいる.ラテン語 deof に,フランス語 parby に相当し,それぞれの関与が考えられそうだが,実際には Peitsara はこの方向での突っ込んだ調査はしていないし,特別な意見を述べているわけではない.今後の研究が期待されるところだ.同様に,前置詞の選択が,動詞(過去分詞)の意味にも依存しているらしいと述べているが,これについても今後の調査が待たれる.

 ・ Peitsara, Kirsti. "On the Development of the by-Agent in English." History of Englishes: New Methods and Interpretations in Historical Linguistics. Ed. Matti Rissanen, Ossi Ihalainen, Terttu Nevalainen, and Irma Taavitsainen. Berlin: Mouton de Gruyter, 1992. 379--99.

[ | 固定リンク | 印刷用ページ ]

2014-11-05 Wed

#2018. <nacio(u)n> → <nation> の綴字変化 [spelling][latin][etymological_respelling][corpus][hc][eebo]

 近現代英語で <nation> と綴られる語は,中英語では主として <nacio(u)n> と綴られていた.<nacio(u)> → <nation> の変化は,具体的にはなぜ,いつ,どのように生じたのだろうか.ここでは母音字 <ou> → <o> の変化と,子音字 <c> → <t> の変化を分けて考える必要がある.
 まず母音字の変化について考えよう.中尾 (331) によると,俗ラテン語において /o/ + 鼻音で終わる閉音節は,対応する Norman French の形態では鼻母音化した短母音 /ʊ/ あるいは長母音 /uː/ を示した.この音をもつ語が中英語へ借用されると,round, troumpe, count, nombre, countrefeten, countour, cuntree, counseil, commissioun, condicioun, nacioun, resoun, sesoun, religioun などと綴られた.-<sioun> や -<tioun> の発音は,対応する現代の -<sion> や -<tion> の発音 /ʃ(ə)n/ とは異なり,いまだ同化も弱化もしておらず,完全な音価 /siuːn/ を保っていたと考えられる.後期中英語から初期近代英語にかけてこの音節に強勢が落ちなくなってくると,同化や弱化が始まり,現在の /ʃ(ə)n/ に近づいていったろう.この過程で長母音を示唆する綴字 -<ioun> はふさわしくないと感じられ,1文字を落として -<ion> とするのが一般化したと想像される.
 しかし,<ou> → <o> の変化が単に発音と綴字を一致させるべく生じたものであるという説明が妥当かどうかは検証の余地がある.そこには多少なりとも語源的綴字 (etymological_respelling) の作用があったのではないか.というのは,ME nacioun が後に nation へ変化したとき,変化したのは問題の母音字だけではなく,先行する子音字の <c> から <t> への変化もろともだったからである.Upward and Davidson (97) によると,

The letter C with the value /s/ before E and I in OFr had two main sources. One was Lat C: Lat certanus > certain. The other was Lat T, which before unstressed E, I acquired the same value, /ts/, as C had in LLat. Medieval Lat commonly alternated T and C in such cases: nacionem or nationem, whence the widespread use of forms such as nacion in OFr and ME. The C adopted in LLat, OFr and ME for classical Lat T has sometimes survived into ModE: Lat spatium > space; platea > place. Elsewhere, a later preference for classical Lat etymology has led to the restoration of T in place of C, as in the -TION endings: ModE nation.


つまり,<nacio(u)n> → <nation> における母音字の変化も子音字の変化も,古典ラテン語の綴字に一致させるべく生じたものではないか.
 この綴字変化がいつ,どのように生じたかについて,歴史コーパスを用いて調査してみた.まずは Helsinki Corpus に当たって,次の結果を得た(以下の検索では,いずれも複数語尾のついた綴字なども一緒に拾ってある).件数は少ないものの,16世紀が変化の時期だったことがうかがわれる.


<nacion> (<nacioon>)<nation>
M2 (1250--1350) 0 (1)0
M3 (1350--1420)7 (1)0
M4 (1420--1500)2 (0)0
E1 (1500--1569)2 (0)2
E2 (1570--1639)0 (0)13
E3 (1640--1710)0 (0)14


 前回と同様,初期近代英語期 (1418--1680) の約45万語からなる書簡コーパスのサンプル CEECS (The Corpus of Early English Correspondence でも検索してみたが,大雑把な年代区分で仕分けした限り,明確な結果の解釈は難しい.


<nacion><nation>
CEECS1 (1418--1638)212
CEECS2 (1580--1680)127


 有用な結果を得ることができたのは,EEBO (Early English Books Online) からのテキストを蓄積して個人的に作っている巨大なデータベースの検索によってである.半世紀ごとに区分した各サブコーパスの規模はそれぞれ異なるので,通時的な数値の単純比較はできないが,それぞれの時代における異綴字の相対的な分布は一目瞭然だろう.


<nacion><nacioun><nation><natioun>
1451--1500 (123,537 words)4000
1501--1550 (1,825,565 words)900820
1551--1600 (6,648,588 words)64094713
1601--1650 (21,296,378 words)1806,4510
1651--1700 (38,545,254 words)11022,3501
1701--1750 (33,741 words)00120


 母音字については,初期近代英語期の入り口までにすでに <-ioun> 形はほぼ廃れていたようである.そして,子音字については,16世紀中に一気に <t> が <c> を置き換えていった様子がわかる.少なくともこの子音字の変化のタイミングについては,一般に語源的綴字の最盛期といわれる16世紀に一致していることは指摘しておいてよいだろう.一方,母音字の変化については,語源的綴字による説明を排除するわけではないが,生じた時期が相対的に早かったことから,先述のとおり発音と綴字を一致させようという動機づけに基づいていた可能性が高いのではないか.

 ・ 中尾 俊夫 『音韻史』 英語学大系第11巻,大修館書店,1985年.

Referrer (Inside): [2015-11-26-1] [2014-12-06-1]

[ | 固定リンク | 印刷用ページ ]

2014-03-15 Sat

#1783. whole の <w> [spelling][phonetics][etymology][emode][h][hc][hypercorrection][etymological_respelling][ormulum][w]

 whole は,古英語 (ġe)hāl (healthy, sound. hale) に遡り,これ自身はゲルマン祖語 *(ȝa)xailaz,さらに印欧祖語 * kailo- (whole, uninjured, of good omen) に遡る.heal, holy とも同根であり,hale, hail とは3重語をなす.したがって,<whole> の <w> は非語源的だが,中英語末期にこの文字が頭に挿入された.
 MED hōl(e (adj.(2)) では,異綴字として wholle が挙げられており,以下の用例で15世紀中に <wh>- 形がすでに見られたことがわかる.

a1450 St.Editha (Fst B.3) 3368: When he was take vp of þe vrthe, he was as wholle And as freysshe as he was ony tyme þat day byfore.


 15世紀の主として南部のテキストに現れる最初期の <wh>- 形は,whole 語頭子音 /h/ の脱落した発音 (h-dropping) を示唆する diacritical な役割を果たしていたようだ.しかし,これとは別の原理で,16世紀には /h/ の脱落を示すのではない,単に綴字の見栄えのみに関わる <w> の挿入が行われるようになった.この非表音的,非語源的な <w> の挿入は,現代英語の whore (< OE hōre) にも確認される過程である(whore における <w> 挿入は16世紀からで,MED hōr(e (n.(2)) では <wh>- 形は確認されない).16世紀には,ほかにも whom (home), wholy (holy), whoord (hoard), whote (hot)) whood (hood) などが現れ,<o> の前位置での非語源的な <wh>- が,当時ささやかな潮流を形成していたことがわかる.wholewhore のみが現代標準英語まで生きながらえた理由については,Horobin (62) は,それぞれ同音異義語 holehoar との区別を書記上明確にするすることができるからではないかと述べている.
 Helsinki Corpus でざっと whole の異綴字を検索してみたところ(「穴」の hole などは手作業で除去済み),中英語までは <wh>- は1例も検出されなかったが,初期近代英語になると以下のように一気に浸透したことが分かった.

 <whole><hole>
E1 (1500--1569)7132
E2 (1570--1639)682
E3 (1640--1710)840


 では,whole のように,非語源的な <w> が初期近代英語に語頭挿入されたのはなぜか.ここには語頭の [hw] から [h] が脱落して [w] となった音韻変化が関わっている.古英語において <hw>- の綴字で表わされた発音は [hw] あるいは [ʍ] だったが,この発音は初期中英語から文字の位置の逆転した <wh>- として表記されるようになる(<wh>- の規則的な使用は,1200年頃の Ormulum より).しかし,同時期には,すでに発音として [h] の音声特徴が失われ,[w] へと変化しつつあった徴候が確認される.例えば,<h> の綴字を欠いた疑問詞に wat, wænne, wilc などが文証される.[hw] と [h] のこの不安定さゆえに,対応する綴字 <wh>- と <h>- も不安定だったのだろう,この発音と綴字の不安定さが,初期近代英語期の正書法への関心と,必ずしも根拠のない衒いに後押しされて,<whole> や <whore> のような非語源的な綴字を生み出したものと考えられる.
 なお,whole には,語頭に /w/ をもつ /woːl/, /wʊl/ などの綴字発音が各種方言に聞かれる.EDD Online の WHOLE, adj., sb. v. を参照.

 ・ Horobin, Simon. Does Spelling Matter? Oxford: OUP, 2013.

[ | 固定リンク | 印刷用ページ ]

2014-03-05 Wed

#1773. ich, everich, -lich から語尾の ch が消えた時期 [me][corpus][hc][phonetics][personal_pronoun][consonant]

 「#1198. icI」 ([2012-08-07-1]) の記事で,古英語から中英語にかけて用いられた1人称単数代名詞の主格 ich が,語末の子音を消失させて近代英語の I へと発展した経緯について論じた.そこでは,純粋な音韻変化というよりは,機能語に見られる強形と弱形の競合が関わっているのではないかと提案した.
 しかし,音韻的な要因が皆無というわけではなさそうだ.Schlüter によれば,後続する語頭の音に種類によって,従来の長形 ich か刷新的な短形 i かのいずれかが選ばれやすいという事実が,確かにある.
 Schlüter は,Helsinki Corpus を用いて中英語期内で時代ごとに,そして後続音の種類別に,ich, everich, -lich それぞれの変異形の分布を調査した.以下に,Schlüter (224, 227, 226) に掲載されている,各々の分布表を示そう.

I1150--1250 (ME I)1250--1350 (ME II)1350--1420 (ME III)1420--1500 (ME IV)
tokens%tokens%tokens%tokens%
before Vich169100121954300
I006513597253100
before <h>ich171100105973200
I003315698316100
before Cich51394363420000
I3364945811061002043100
EVERY1150--1250 (ME I)1250--1350 (ME II)1350--1420 (ME III)1420--1500 (ME IV)
tokens%tokens%tokens%tokens%
before Veverich- 686764939
everiche- 1140000
every- 004361461
before <h>everich- 00120- 
everiche- 1100120- 
every- 00360- 
before Ceverich- 6292200
everiche- 10482200
every- 52410596138100
-LY1150--1250 (ME I)1250--1350 (ME II)1350--1420 (ME III)1420--1500 (ME IV)
tokens%tokens%tokens%tokens%
before V-lich231281212410
-liche162875177238215
-ly117112518842195
before <h>-lich13187211200
-liche5982247381400
-ly0026498476100
before C-lich7013181518220
-liche468859377395232
-ly1121087889394797


 3つの表で,とりわけ子音の前位置 (before C) で ch の脱落した短形のパーセンテージを通時的に追ってもらいたい.短形の拡大の速度に多少の違いはあるが,ME II と ME III の境である1350年の前後で,明らかな拡大が観察される.14世紀半ばに,ichI, everichevery, -lich → -ly の変化が著しく生じたことが読み取れる.
 もう少し細かくいえば,問題の3項目を比べる限り,ich, everich, -lich の順で,語尾の ch が,とりわけ子音の前位置において脱落していったことがわかる.この変化に関して重要なのは,音節境界における音韻的な要因は確かに作用しているものの,そこに語彙的な要因がかぶさるように作用しているらしいことである.Schlüter (228) の調査のまとめ部分を引用しよう.

. . . the affricate [ʧ] in final position has turned out to constitute another weak segment whose disappearance is codetermined by syllable structure constraints militating against the adjacency of two Cs or Vs across word boundaries. . . . [T]he three studies have shown that the demise of final [ʧ] proceeds at different speeds depending on the item concerned: it is given up fastest in the personal pronoun, not much later in the quantifier, and most hesitantly in the suffix. In other words, the phonetic erosion is overshadowed by lexical distinctions. Relics of the obsolescent long variants are typically found in high-frequency collocations like ich am or everichone, where the affricate is protected from erosion by the ideal phonotactic constellation it ensures.


 関連して,「#40. 接尾辞 -ly は副詞語尾か?」 ([2009-06-07-1]) 及び「#832. everyeach」 ([2011-08-07-1]) も参照.

 ・ Schlüter, Julia. "Weak Segments and Syllable Structure in ME." Phonological Weakness in English: From Old to Present-Day English. Ed. Donka Minkova. Basingstoke: Palgrave Macmillan, 2009. 199--236.

Referrer (Inside): [2016-11-22-1] [2014-04-11-1]

[ | 固定リンク | 印刷用ページ ]

2014-02-12 Wed

#1752. interpretorinterpreter (2) [spelling][suffix][corpus][emode][hc][ppcme2][ppceme][archer][lc]

 標記の件については「#1740. interpretorinterpreter」 ([2014-01-31-1]) と「#1748. -er or -or」 ([2014-02-08-1]) で触れてきたが,問題の出発点である,16世紀に interpretorinterpreter へ置換されたという言及について,事実かどうかを確認しておく必要がある.この言及は『英語語源辞典』でなされており,おそらく OED の "In 16th cent. conformed to agent-nouns in -er, like speak-er" に依拠しているものと思われるが,手近にある16世紀前後の時代のいくつかのコーパスを検索し,詳細を調べてみた.
 まずは,MED で中英語の綴字事情をのぞいてみよう.初例の Wycliffite Bible, Early Version (a1382) を含め,33例までが -our あるいは -or を含み,-er を示すものは Reginald Pecock による Book of Faith (c1456) より2例のみである.初出以来,中英語期中の一般的な綴字は,-o(u)r だったといっていいだろう.
 同じ中英語の状況を,PPCME2 でみてみると,Period M4 (1420--1500) から Interpretours が1例のみ挙った.
 次に,初期近代英語期 (1418--1680) の約45万語からなる書簡コーパスのサンプル CEECS (The Corpus of Early English Correspondence でも検索してみたが,2期に区分されたコーパスの第2期分 (1580--1680) から interpreterinterpretor がそれぞれ1例ずつあがったにすぎない.
 続いて,MEMEM (Michigan Early Modern English Materials) を試す.このオンラインコーパスは,こちらのページに説明のあるとおり,初期近代英語辞書の編纂のために集められた,主として法助動詞のための例文データベースだが,簡便なコーパスとして利用できる.いくつかの綴字で検索したところ,interpretour が2例,いずれも1535?の Thomas Elyot による The Education or Bringing up of Children より得られた.一方,現代的な interpreter(s) の綴字は,9の異なるテキスト(3つは16世紀,6つは17世紀)から計16例確認された.確かに,16世紀からじわじわと -er 形が伸びてきているようだ.
 LC (The Lampeter Corpus of Early Modern English Tracts) は,1640--1740年の大衆向け出版物から成る約119万語のコーパスだが,得られた7例はいずれも -er の綴字だった.
 同様の結果が,約330万語の近現代英語コーパス ARCHER 3.2 (A Representative Corpus of Historical English Registers) (1600--1999) でも認められた.1672年の例を最初として,13例がいずれも -er である.
 最後に,中英語から近代英語にかけて通時的にみてみよう.HC (Helsinki Corpus) によると,E1 (1500--70) の Henry Machyn's Diary より,"he becam an interpretour betwen the constable and certein English pioners;" が1例のみ見られた.HC を拡大させた PPCEME によると,上記の例を含む計17例の時代別分布は以下の通り.

 -o(u)r-er(s)
E1 (1500--1569)21
E2 (1570--1639)35
E3 (1640--1710)06


 以上を総合すると,確かに16世紀に,おそらくは同世紀の後半に,現代的な -er が優勢になってきたものと思われる.なお,OED では,1840年の例を最後に -or は姿を消している.

[ | 固定リンク | 印刷用ページ ]

2013-11-21 Thu

#1669. longestlengest を置き換えたのはいつか? [hc][corpus][adjective][comparison][i-mutation][analogy]

 「#1649. longerleng(er) を置き換えたのはいつか?」 ([2013-11-01-1]) で,歴史的な i-mutation 形の比較級 leng(er) が,いつ類推形 longer に置換されたのかをコーパスによって調査した.今回は,同じ過程を経たと想定される最上級について同様の調査を施した結果を報告する.歴史的な i-mutation 形の最上級 lengest は,英語史のどの段階で類推形 longest に置換されたのだろうか.
 Helsinki Corpus で,語幹母音のヴァリエーションを念頭に置きつつ,両形を検索した.結果を通時的に整理すると以下のようになる.


LONGESTLENGEST
O100
O202
O3013
O403
M101
M200
M301
M401
E130
E240
E320


 比較級よりも例がずっと少ないが,傾向ははっきりしている.比較級の場合と同様に,E1 (1500--1570) が転換期となっている.もちろん,この少数の例のみで結論を急ぐことはできない.例えば,lōng (adj. (1)) の用例を参照すれば,後期中英語の15世紀の Higden's Polychronicon 訳において,"In Armeny..Ytaly and other regiones..the longeste day other ny3hte is but oonly of xv houres equinoccialle." として longest が確かに文証される.それでも,比較級のケースと通時的な分布が似ているということは,今回の結果を評価する上で,重要な点となるだろう.
 前回と同様,初期近代英語期 (1418--1680) の約45万語からなる書簡コーパスのサンプル CEECS (The Corpus of Early English Correspondence でも検索してみたが,2期に区分されたコーパスの第1期分 (1418--1638) から longest が1例ヒットしたのみだったので,ここから意味ある見解を引き出すことはできかった.

[ | 固定リンク | 印刷用ページ ]

2013-11-01 Fri

#1649. longerleng(er) を置き換えたのはいつか? [hc][corpus][adjective][comparison][i-mutation][analogy]

 現代英語の形容詞・副詞 long の比較級の形態は規則的な longer だが,古英語から中英語にかけては lenger (副詞としては leng も)のように語幹に前母音をもつ諸形態が用いられていた.ゲルマン祖語の比較級を表わす形態素 *-iþo が契機となって直前の語幹母音に i-mutation が生じ,本来の語幹の後母音が前母音へと変化した.その効果は,古英語 leng(ra) や中英語の leng(er) に現れている.
 ところが,原級は古英語でも中英語でも lang, long などと常に後母音を示していたので,やがて類推作用 (analogy) により比較級も原級に -er を付けるだけの規則的な形態を取るようになった.かつての i-mutation という音韻変化の効果が,類推という形態変化の効果により打ち消されたといえる.
 さて,類推により longer につらなる形態が現れたのがいつ頃のことかが気になったので,調べてみた.OED では longer として見出しは立っていないので,long の項で例文を探してみると,a1533 に longer が現れている.MED でも同じ事情だったので lōng (adj. (1)) の例文を探すと,a1400 (a1325) に langer が初出する.しかし,例文検索から得られる初出年の情報だけでは心許ない.
 一方,leng(er) の最終使用年代を調べるという逆方向の調べ方もしてみた.OED によると,副詞 leng の最終は Chaucer で c1386,形容詞・副詞の lenger は,副詞の用法としての Spenser の1590年が最終例だった.以上を総合すると,14--15世紀頃に longer が現れ,16世紀には歴史的な leng(er) を置き換えたという筋書きになりそうだ.
 だが,先に述べたように longer の見出しが立っていない以上,OED の例文に頼るのみで新旧形態の交代過程を結論づけるわけにはいかない.このような目的には,補助的に歴史コーパスが有用である.Helsinki Corpus により,ざっと新旧それぞれの異形態を拾い上げてみた.古英語では第2音節の r は原級の屈折形であることを考慮し,また取りこぼしや雑音混入の可能性にも気をつけたが,完璧ではないかもしれないことを断りつつ,以下に数字を示す.


LONGERLENG(ER)
O101
O2014
O3045
O407
M1014
M2021
M31126
M4325
E1116
E2190
E3460


 M3 (1350--1420) に longer が現れ,E1 (1500--1570) を最後に lenger が姿を消したことがわかる.1500年頃を境に新旧形態の立場が比較的急速に入れ替わったように見えるが,Helsinki Corpus も小規模なコーパスといわざるを得ないので,あくまで近似的な結論ととらえておく必要がある.だが,全体としてこの結果は OED からの証拠が示唆するところとおよそ同じであり,歴史辞書と歴史コーパスが互いに補完し合って結論を強めているといってよいだろう.
 さらに,手元にあった初期近代英語期 (1418--1680) の約45万語からなる書簡コーパスのサンプル CEECS (The Corpus of Early English Correspondence でも同様の検索を施した.約24万6千語を含む第1期分 (1418--1638) と約20万4千語を含む第2期分 (1580--1680) を区別して調べたところ,以下の通りとなり,やはりおよそ16世紀後半には古い lenger が廃れたといえそうだ.


LONGERLENG(ER)
CEECS1316
CEECS2370

Referrer (Inside): [2013-11-21-1]

[ | 固定リンク | 印刷用ページ ]

2013-03-12 Tue

#1415. shewshow (1) [spelling][phonetics][corpus][hc][diphthong]

 動詞 show には古い異綴り shew がある.法律文書,聖書,詩などには見られるものの,現在では一般的にはあまりお目にかからない.しかし,shew は18世紀まで優勢な綴字であり,19世紀前半まで現役として活躍していたし,20世紀前半ですら目にすることがあった.OED "show, v." の語源欄の記述を参照しよう.

The spelling shew, prevalent in the 18th cent. and not uncommon in the first half of the 19th cent., is now obsolete exc. in legal documents. It represents the obsolete pronunciation (indicated by rhymes like view, true down to c1700) normally descending from the Old English scéaw- with falling diphthong. The present pronunciation, to which the present spelling corresponds, represents an Old English (? dialectal) sceāw- with a rising diphthong.


 この異綴りの由来は,古英語 scéawian (to look) の形態に由来する.語幹の2重母音が長母音へと滑化 (smoothing) する際に,もともと下降調2重母音であれば最初の母音が伸びて ē となり,上昇調2重母音であれば最後の母音が伸び,結果として ō となった.shew に連なる前者の系列では,規則的な音発達により,/ʃjuː/ が出力されるはずだが,show に連なる後者の系列の発音 /ʃoʊ/ に置換されることになった.近代後半までに綴字としては shew が優勢でありながら,発音としては show が一般化していたとことになる.なお,sew /soʊ/ も,これと平行的な発達の結果である.
 OED や語源辞書では,近代までは shew 系列が優勢だったということだが,劣勢だった show 系列の萌芽は中英語から確認される (cf. MED "sheuen (v.(1))") .Helsinki Corpus により,中英語から近代英語までの shew vs show の通時的な分布を概観してみよう.(データファイルは "shew" and "show" in Helsinki Corpus を参照.)


shew 系列show 系列
M1120
M2362
M31850
M42077
E119813
E211315
E3714


 確かに初期近代英語期までの通時的な傾向は明白である.だが,後期近代英語期以降の show の逆転劇については未調査なので,明日の記事で探ってみる.

[ | 固定リンク | 印刷用ページ ]

2013-02-19 Tue

#1394. between の異形態の分布の通時的変化 [hc][corpus][preposition]

 「#1389. between の語源」 ([2013-02-14-1]) 及び昨日の記事「#1393. between の歴史的異形態の豊富さ」([2013-02-18-1]) に引き続いての話題.between の歴史的な異形態の分布を,Helsinki Corpus でざっと調査してみた.調査の結果,全コーパスより between の形態として 97 types, 793 tokens が確認された.以下はその97種類の異形態,異綴りである.

be-twen, be-twene, be-twix, be-twyen, be-twyn, be-twyx, be-twyxe, betuen, betuene, betuh, betuih, betuixt, betun, betux, betuyx, betwe, between, betweene, betwen, betwenan, betwene, betweoh, betweohn, betweon, betweonan, betweonen, betweonon, betweonum, betweox, betweoxan, betwex, betwi, betwih, betwihn, betwinan, betwinum, betwioh, betwion, betwix, betwixe, betwixt, betwixte, betwixts, betwne, betwoex, betwonen, betwuh, betwux, betwuxn, betwyh, betwyn, betwynan, betwyne, betwyx, betwyxe, betwyxen, betwyxte, bi-tuine, bi-twen, bi-twene, bi-twenen, bi-tweohnen, bi-tweone, bi-tweonen, bi-twexst, bi-twext, bi-twihan, bi-twixst, bituen, bituene, bituhe, bituhen, bituhhe, bituhhen, bituien, bituih, bituin, bituix, bitunon, bitweies, bitwen, bitwene, bitwenen, bitwenenn, bitweon, bitweone, bitweonen, bitweonon, bitweonum, bitwex, bitwexe, bitwien, bitwih, bitwix, bitwixe, bitwixen, bitwyxe


 全793例の形態を一定の基準でまとめて集計するのは容易ではないが,今回は語尾以外における母音の違いは無視することにし,第2音節以降の子音(と,もしあれば語尾の母音も)の種類と組み合わせによって集計した.例えば,"nm", "nn", "x", "xt" というタイプは,それぞれ betweonum, betweonan, betwyx, betwixt などの形態を代表する.以下の表は,Helsinki Corpus における時代区分を参照し,例の挙がらなかった O1 (古英語第1期)の時期を除く10期における通時的変化を要約したものである.


nmnnnnexxexnxtxtexstxtshhnhnnheseiSum
O214100130100003140000064
O35221605600000048000000147
O41153022000000300000044
M10284813010000041900068
M2015321110000000010042
M300431241801040000001083
M40041125621600000000156
E1001266200253000000000108
E2002344000316000000000104
E30054800014001000000077
Sum206712520015625572154182819111793


 現代の between に連なる n をもつ形態は,古英語から近代英語に至るまで一貫して主流派であることがわかる.betwix などの x 系列も,古英語から中英語まで n 系列に匹敵するほど頻用されているが,近代英語で xt 系列が出現するに及び,古くからの x 系列は影を潜めてゆく.h 系列は,古英語では盛んだったが,古英語末期から一気に衰退してゆく.
 中英語に関しては,方言による分布の差も調査する必要があるだろう.

[ | 固定リンク | 印刷用ページ ]

2012-12-16 Sun

#1329. 英語史における eth, thorn, <th> の盛衰 [thorn][spelling][hc][alphabet][graphemics]

 古英語や中英語では,現代英語の <th> /θ, ð/ に相当する文字として,<þ> "thorn" と <ð> "eth" or "edh" が頻繁に用いられた.中英語期以降は <th> が両者を置き換えてゆくことになったが,ルーン文字に由来する前者は([2012-01-28-1]の記事「#1006. ルーン文字の変種」を参照),中英語期中,とりわけ北部方言でしぶとく生き残った.17世紀の印刷本に現われることすらあったという (Schmitt and Marsden 159) .
 では,<þ>, <ð>, <th> に関する上の記述は,Helsinki Corpus によって裏付けられるだろうか.写本の時代区分(COCOA の <C で表される part of corpus)をキーにしておおまかに頻度を数え,各時代の内部比率でグラフ化した.数値データは,HTMLソースを参照.また,時代区分についてはマニュアルを参照.

The Ebb and Flow of 'eth', 'thorn', and <th> by HC


 近代英語での <þ> の使用は Helsinki Corpus では確認できなかったものの,上に概観した3種類の文字素の盛衰はおよそ裏付けられたといってよいだろう.古英語から M2 (1250--1350) にかけて,<ð> がひたすら減少する一方で,<þ> は分布を広げていた.しかし,絶頂もつかの間,次の時代以降,<þ> は <th> に急速に置き換えられてゆく.
 中英語ではとりわけ北部で <þ> が持続したというが,こちらも確認したいところだ.Helsinki Corpus を用いた他の頻度調査の例としては,「#381. oftoften の分布の通時的変化」 ([2010-05-13-1]) も参照.

 ・ Schmitt, Norbert, and Richard Marsden. Why Is English Like That? Ann Arbor, Mich.: U of Michigan P, 2006.

[ | 固定リンク | 印刷用ページ ]

2012-12-10 Mon

#1323. Helsinki Corpus の COCOA 検索 [cgi][web_service][hc][corpus]

 Helsinki Corpus (The Diachronic Part of the Helsinki Corpus of English Texts) は1991年に公開されて以来,英語歴史コーパスの元祖として重用されてきた.HC の役割は現在でも薄れておらず,本ブログでも「#381. oftoften の分布の通時的変化」 ([2010-05-13-1]) を始め,hc の各記事で言及してきた.
 HC を本格的に使いこなすには,こちらのマニュアルを熟読する必要がある.とりわけ時代別サブコーパスの語数は押さえておく必要があるし,COCOA Format による参照コードの理解も重要だ.COCOA Format は,HC のソーステキスト内にそのテキストに関する種々の情報を付与するための形式である.各テキストについて,その年代,方言,著者の性別,韻文か散文かなどの情報が,この形式により付与されている.使用者は,この情報を利用することにより,特定の条件を満たすテキストを選び出すことができるというわけだ.
 HC の COCOA 情報を利用した条件の絞り込みを簡便にするために,まず表形式にまとめ,それをデータベース化 (SQLite) した.

    


 以下,使用法の説明.SQL対応で,テーブル名は "hccocoa" として固定.select 文のみ有効.フィールドは26項目:"ID", "A", "B", "C", "D", "E", "F", "G", "H", "I", "J", "K", "M", "N", "O", "P", "Q", "R", "S", "T", "U", "V", "W", "X", "Y", "Z".各パラメータの意味は,以下の通り.また,各パラメータの取りうる値の詳細については,マニュアルを参照(あるいは,"select distinct C from hccocoa order by C" などと検索しても調べられる).

A = "author"
B = "name of text file"
C = "part of corpus"
D = "dialect"
E = "participant relationship"
F = "foreign original"
G = "relationship to foreign original"
H = "social rank of author"
I = "setting"
J = "interaction"
K = "contemporaneity"
M = "date of manuscript"
N = "name of text"
O = "date of original"
P = "page"
Q = "text identifier"
R = "record"
S = "sample"
T = "text type"
U = "audience description"
V = "verse" or "prose"
W = "relationship to spoken language"
X = "sex of author"
Y = "age of author"
Z = "prototypical text category"


 典型的な検索式を例として挙げておく.

# 表全体を再現
select * from hccocoa

# 時代区分別のテキスト数
select C, count(*) from hccocoa group by C

# テキストタイプ別のテキスト数
select T, count(*) from hccocoa group by T

# ME に時代区分されているテキストの各種情報を一覧
select B, C, D, V from hccocoa where C like 'M%' order by C

[ | 固定リンク | 印刷用ページ ]

2012-11-24 Sat

#1307. mostmest [analogy][superlative][vowel][me_dialect][corpus][hc][ppcme2][comparison]

 中英語には,最上級 mostmest という前舌母音字を伴って現われることが少なくない.近代英語以降,後者は廃れていったが,両形の起源と分岐はどこにあるのだろうか.
 most は Proto-Germanic *maistaz に遡ることができ,ゲルマン諸語では Du. meest, G meist, ON mestr, Goth. maists などで文証される.音韻規則に従えば,古英語形は māst となるはずであり,実際にこの形態は Northumbrian 方言で確認されるものの,南部方言では確認されない.南部では,前舌母音を伴う West-Saxon mǣst や Kentish mēst が用いられた.OED によれば,前舌母音形は,lǣst "least" との類推とされる.この前舌母音の系統が,主として mest(e) という形態で中英語の南部方言へも継承され,そこでは15世紀まで使われた.
 一方,北部方言に起源をもつ形態は,中英語では後舌母音の系統を発達させ,主として most(e) という形態が多用された.じきに中部,南部でも一般化したが,北部方言形の南下というこの時期の一般的な趨勢に加え,比較級 mo, more の母音との類推も一役買ったのではないかと想像される.
 結果的に,近代英語以降にはゲルマン祖語からの規則的な発達形 most が標準的となってゆき,古英語から中英語にかけて用いられた mest は標準からは失われていった.「一番先の」を意味する中英語 formest (cf. 比較級 former) が,15世紀に foremost として再分析された背景には,上述の most による mest の置換が関与しているかもしれない.もっとも,古英語より,最上級語尾の -est 自体が -ost とよく混同されたのであり,最上級に関わる形態論において,両母音の交替は常にあり得たことなのかもしれない.
 なお,PPCME2 でざっと後舌母音系統 (ex. most) と前舌母音系統 (ex. mest) の分布を調べてみると,前者が354例,後者が168例ヒットした.Helsinki Corpus でも簡単に調査したが,中英語でも現代標準英語と同様に most 系統が主流だったことは間違いないようだ.

Referrer (Inside): [2015-09-29-1] [2012-12-07-1]

[ | 固定リンク | 印刷用ページ ]

2012-10-24 Wed

#1276. hereby, hereof, thereto, therewith, etc. [compounding][synthesis_to_analysis][adverb][register][corpus][bnc][hc]

 標題のような herethere を第1要素とし,前置詞を第2要素とする複合副詞は多数ある.これらは,herethis と,thereitthat と読み替えて,それを前置詞の後ろに回した句と意味的に等しく,標題の語はそれぞれ by this, of this, to that, with that ほどを意味する.現代では非常に形式張った響きがあるが,古英語から初期近代英語にかけてはよく使用され,その種類や頻度はむしろ増えていたほどである.だが,17世紀以降は急激に減ってゆき,現代のような限られた使用域 (register) へと追い込まれた.衰退の理由としては,英語の構造として典型的でないという点,つまり総合から分析への英語の自然な流れに反するという点が指摘されている (Rissanen 127) .文法化した語として,現代まで固定された状態で受け継がれた語は,therefore のみといってよいだろう.
 現代英語で確認される使用域の偏りは,すでに中英語にも萌芽が見られる.here-, there- 複合語は,後期中英語ではいまだ普通に使われているが,ジャンルでみると法律文書での使用が際だっている.以下は,Rissanen (127) の Helsinki Corpus による調査結果である(数字は頻度,カッコ内の数字は1万語当たりの頻度を表わす).


StatutesOther texts
ME4 (1420--1500)68 (60)621 (31)
EModE1 (1500--70)77 (65)503 (28)
EModE2 (1570--1640)84 (71)461 (26)
EModE3 (1640--1710)126 (96)191 (12)


 初期近代英語のあいだ,一般には問題の複合語の頻度は落ちているが,法律文書においては token 頻度が(そして,Rissanen, p. 128 によれば type 頻度も)増加していることに注意されたい.後の時代でも,法律文書における使用は続き,現代に至る.
 現代の分布については,独自に BNCweb で調べてみた.therefore を除く,hereabout, hereabouts, hereafter, hereby, herein, hereinafter, hereof, hereto, heretofore, hereupon, herewith, thereabout, thereabouts, thereafter, thereby, therefrom, therein, thereinafter, thereof, thereon, thereto, theretofore, thereunder, thereupon, therewith の25語について,Written Corpus に絞った上で,CQP syntax にて 「"(hereabout|hereabouts|hereafter|hereby|herein|hereinafter|hereof|hereto|heretofore|hereupon|herewith|thereabout|thereabouts|thereafter|thereby|therefrom|therein|thereinafter|thereof|thereon|thereto|theretofore|thereunder|thereupon|therewith)" %c」と検索した.出現頻度は 68.93 wpm で,散らばり具合は3140テキスト中の1522テキストである.
 次に,法律関係の文書を最も多く含んでいると想定されるジャンルとして「W:ac:polit_law_edu」に絞り,同じ検索式で結果を見ると,231.33 wpm で,186テキスト中の153テキストに出現する.なお,「W:admin」に絞ると,コーパスサイズはずっと小さくなるが,頻度は439.85 wpm となり,最頻出ジャンルであることがわかる.いずれにせよ,この種のジャンルで here-, there- 複合語が今なお頻繁に用いられていることは確かめられた.

 ・ Rissanen, Matti. "Standardisation and the Language of Early Statutes." The Development of Standard English, 1300--1800. Ed. Laura Wright. Cambridge: CUP, 2000. 117--30.

[ | 固定リンク | 印刷用ページ ]

2010-11-26 Fri

#578. go him [me][syntax][reflexive_pronoun][personal_pronoun][hc][dative]

 中英語ではごく普通に見られるが,現代の視点から見ると妙な構造がある.go に主語に対応する目的格代名詞が付随する構造で,現代風にいえば he goes him のような表現である.統語的には主語を指示する再帰代名詞と考えられるが,himself のような複合形が用いられることは中英語にはない(中尾, p. 187).機能的には一種の ethical dative と考えられるかもしれないが,そうだとしてもその機能はかなり希薄なように思える.
 例えば,Chaucer の "The Physician's Tale" (l. 207) からの例(引用は The Riverside Chaucer より).

He gooth hym hoom, and sette him in his halle,


 この構造についてざっと調べた限りでは,まだ詳しいことは分からないのだが,OED では "go" の語義45として以下の記述があった.

45. With pleonastic refl. pron. in various foregoing senses. Now only arch. [Cf. F. s'en aller.]


例文としては,中英語期から4例と,随分と間があいて1892年のものが1例あるのみだった.
 一方 Middle English Dictionary のエントリーを見てみると,2a.(b) に関連する記述があったが,特に解説はない.以前から思っていたことだが,中英語では実に頻繁に起こる構造でありながら,ちょっと調べたくらいではあまり詳しい説明が載っていないのである.ただし,中尾 (187) によれば,中英語では gon のほか,arisen, feren, flen, rennen, riden, sitten, stonden などの往来発着の自動詞がこの構造をとることが知られている.
 中英語で盛んだったこの構造は,近代英語期ではどうなったのだろうか.Helsinki Corpus で go him を中心とした例を検索してみたが,中英語からは10例以上が挙がったものの,近代英語期からは1例も挙がらなかった.この統語構造は近代英語期に廃れてきたようにみえるが,どういった経緯だったのだろうか.

 ・ 中尾 俊夫 『英語史 II』 英語学大系第9巻,大修館書店,1972年.

[ | 固定リンク | 印刷用ページ ]

2010-06-04 Fri

#403. 流れに逆らっている比較級形成の歴史 [comparison][hc][synthesis_to_analysis]

 現代英語の文法では,形容詞の比較級は,-er を接尾辞として付加する屈折 ( inflection ) か,more を前置する迂言 ( periphrasis ) かによって形成される.いずれを適用するかについては,例外はあるもののおよその傾向はある.一音節語は原則として屈折形をとり,それ以外の多音節語は原則として迂言形をとる.しかし,二音節語のうち語尾に -y, -ly, -er, -le などをもつものについては屈折形をとることが多いという.実際には両方法ともに可能な語も少なくない.
 Kytö (123) によると,現代英語のこの傾向は16世紀の初めまでにおよそ確立したという.古英語期には散発的な迂言形の例を除いて,すべての形容詞において屈折形が原則だった.13世紀になるとラテン語の影響(おそらくはフランス語の影響よりも強い),そして強調の目的で自発的にも迂言形が生じてきて,中英語期を通じて拡大した.これは,総合 ( synthesis ) から 分析 ( analysis ) へ向かう英語の一般的な言語変化の流れに乗ったゆえとも考えられる.
 しかし,後期中英語から初期近代英語の比較級(と最上級)の分布を Helsinki Corpus で調査した Kytö の研究によると,synthesis から analysis へという全体的な流れに反して,屈折形もかなり粘り強く残ってきたし,語群によってはむしろ復活・拡大してきたという.まとめとして,このように述べている.

The results indicate that while the comparison of adjectives first followed the tendency of English to favour analytic forms as against synthetic, it was the synthetic forms that finally took over during the period when the Present-day usage became established. (140)


 流れに逆らっているように見える比較級形成の歴史はおもしろい.

 ・ Kytö, Merja. " 'The best and most excellentest way': The Rivalling Forms of Adjective Comparison in Late Middle and Early Modern English." Words: Proceedings of an International Symposium, Lund, 25--26 August 1995, Organized under the Auspices of the Royal Academy of Letters, History and Antiquities and Sponsored by the Foundation Natur och Kultur, Publishers. Ed. Jan Svartvik. Stockholm: Kungl. Vitterhets Historie och Antikvitets Akademien, 1996. 123--44.

[ | 固定リンク | 印刷用ページ ]

2010-05-13 Thu

#381. oftoften の分布の通時的変化 [corpus][hc]

 過去二日の記事[2010-05-11-1], [2010-05-12-1]で,often という語の歴史をみた.OED によると oft に代わって often が一般化するのは16世紀以降ということだが,頻度の高い語なので Helsinki Corpus ( The Diachronic Part of the Helsinki Corpus of English Texts ) で確かめられそうだと思い,時代区分( COCOA の <C で表される part of corpus )のみをキーにしておおまかに頻度を数えてみた.時代区分の略号などはこちらのマニュアルから.

WORDPERIODoftoften
REGEX/\bofte?\b//\boft[ei]n\b/
OEO100
O2720
OX/240
O3450
O2/3320
OX/31060
O490
O2/480
O3/4370
OX/420
MEM1670
MX/1200
M2604
MX/291
M3634
M2/3150
M4157
M2/430
M3/4171
MX/4200
EModEE11428
E21433
E3978


 なるほど,確かに近代英語期に入る16世紀に一気に often が広まっている.その後 oft が静かにおもむろに消えてゆく様も確認できた.この交代劇の妙にスピーディなのが気になるところである.

Referrer (Inside): [2012-12-16-1] [2012-12-10-1]

[ | 固定リンク | 印刷用ページ ]

Powered by WinChalow1.0rc4 based on chalow