hellog〜英語史ブログ     ChangeLog 最新    

eebo - hellog〜英語史ブログ

最終更新時間: 2019-10-13 11:14

2018-10-16 Tue

#3459. 16--17世紀の君主の称号は GraceHighnessMajesty か? [eebo][corpus][title][address_term][honorific][monarch]

 標題は「#3095. Your Grace, Your Highness, Your Majesty」 ([2017-10-17-1]) で取り上げた話題である.初期近代英語期のトピックなので,EEBO (Early English Books Online) で調査するのにふさわしいと思い,Early English Books Online corpus のインターフェースを用いて検索してみた.
 検索欄には "your|his|her majesty|majestie|highness|grace" を入力し,検索結果として出力されたデータについて,所有代名詞の種類や異綴字は一緒くたに扱いつつ,GRACE 系,Highness 系,Majesty 系の3つに整理した.本来であれば実際の指示対象が君主か否かをコンコーダンスラインで逐一確認する必要があるのだが,今回はあくまで傾向を知るための粗い調査なので,あしからず.

 1470s1480s1490s1500s1510s1520s1530s1540s1550s1560s1570s1580s1590s1600s1610s1620s1630s1640s1650s1660s1670s1680s1690sTotal
GRACE651331459269130319622544773116921241174168216641483179020883222229632004092321632092
HIGHNESS00000000006000731038192212521328272713608671
MAJESTY000000000001821881425921856791977536102546312735901251701
Total6513314592691303196225447731175214211951770181321063646100451289796509991195541358892464


 傾向は明確である.16世紀中は GRACE がほぼ唯一の称号だが,17世紀に入ると MAJESTY が加速度的に増え,1630年代には GRACE を追い抜く.MAJESTY は James I の治世 (1603--25) の後半に確立したとされてきたが,今回の結果もほぼそれに合致している.一方,HIGHNESS は17世紀半ばに突如として増えてはくるが,他の2つより優勢になったことはない.

[ | 固定リンク | 印刷用ページ ]

2018-09-18 Tue

#3431. 各種の EEBO 検索インターフェース [eebo][corpus][emode][site][web_service][link][n-gram][kwic]

 初期近代英語期の膨大なテキストを収録した EEBO (Early English Books Online) について,「#3117. EEBO corpus がリリース」 ([2017-11-08-1]) で BYU 提供の EEBO 検索インターフェース Early English Books Online corpus を紹介した.
 それとは別に,Early Modern Print: Text Mining Early Printed English というサイトのプロジェクトで,n-gram や KWIC などの検索インターフェースが提供されていることを知ったので紹介しておきたい.全体的なイントロは,こちらのページをどうぞ.個々の具体的なツールは,次のリンクからアクセスできる.

 ・ EEBO N-Gram Browser (説明はこちら
 ・ EEBO-TCP Key Words in Context (説明はこちら
 ・ EEBO-TCP and ESTC Text Counts
 ・ EEBO-TCP Words Per Year

 また,University of Michigan の提供する Early English Books Online の各種サーチや Lancaster University による EEBO on CQPweb (V3) も同様に有用.
 各種インターフェースのいずれを用いるか迷うところだ.

[ | 固定リンク | 印刷用ページ ]

2017-11-08 Wed

#3117. EEBO corpus がリリース [eebo][corpus][web_service][site]

 本ブログでも何度か利用していたテキスト・データベース EEBO (Early English Books Online) が,BYU の Mark Davies 氏によりコーパス化され,この10月にオンラインで公開された.Early English Books Online corpus よりアクセスできる.
 簡単にこのコーパスを紹介すると,まず規模としては "755 million words in more than 25,000 texts from the 1470s to the 1690s" を含む,巨大コーパスであることがわかる.時代としては初期近代英語をまるまるカバーしている.BYU系の他のコーパスと同様に,見出し語化がなされており,品詞タグや意味タグも賦与されている.コンコーダンス・ラインを出したり,共起表現を分析することはもとより,10年ごとに検索語句の頻度を自動的にグラフ化するなど,様々な機能が備わっている.
 10年のまとまりごとのテキスト数や総語数の情報は,上のページのインフォメーションから容易に得られるが,第4列に1テキスト辺りの平均語数を加えた表を示そう.

Decade#words#texts#words/#texts
1470s712,130 18 39,562.8
1480s3,706,937 43 86,207.8
1490s1,992,503 49 40,663.3
1500s1,288,091 45 28,624.2
1510s946,117 35 27,031.9
1520s3,042,934 73 41,684.0
1530s7,099,997 181 39,226.5
1540s8,709,681 239 36,442.2
1550s7,219,423 283 25,510.3
1560s16,084,901 361 44,556.5
1570s26,927,229 442 60,921.3
1580s31,955,245 558 57,267.5
1590s24,105,385 723 33,340.8
1600s40,031,223 898 44,578.2
1610s42,901,535 894 47,988.3
1620s38,550,967 994 38,783.7
1630s42,826,013 1,036 41,337.9
1640s47,129,000 3,805 12,386.1
1650s99,452,875 2,416 41,164.3
1660s63,491,742 2,481 25,591.2
1670s74,600,805 2,421 30,814.0
1680s92,583,947 3,977 23,279.8
1690s79,719,722 2,999 26,582.1
TOTAL755,078,402 24,971 30,238.2


 全期間にしめる各10年間の値を百分率でグラフ化してみた.赤は単語数,水色はテキスト数に基づいた数値である.いずれも16世紀から17世紀にかけてサブコーパスが大きくなっているのが分かるが,単語数は1650年代と1680年代,テキスト数は1640年代と1680年代が際立っていることを気に留めておきたい.

% of Words and Texts for Each Decade in EEBO Corpus

Referrer (Inside): [2018-09-18-1]

[ | 固定リンク | 印刷用ページ ]

2015-11-15 Sun

#2393. <Crist> → <Christ> [loan_translation][etymology][spelling][etymological_respelling][eebo][capitalisation][hebrew]

 この重要な名前の起源は,ヘブライ語で「聖油で清める」を意味する māshīaχ (> PDE Messiah) にある.これをギリシア語で翻訳借用したもの,いわば「なぞり」が,ギリシア語の Khrīstós (cf. khríein (v.)) であるここからラテン語 Chrīstus を経由して,英語やその他の言語へ入った.古高地ドイツ語では <crist>, <krist> のほかに <christ> もあったが,古英語では <crist> の綴字で現われ,中英語でも <ch-> の綴字はほとんど現われない.ただし,ギリシア文字を模して,<xpist>, <xps> などの表記はありえた.
 OED によると,"This word and its derivatives and cognates (including CHRISM n. and its derivatives) were very rarely (and perhaps only accidentally) spelt with ch- in Middle English, but this has been the regular fashion since 1500; in French it began in the preceding century." とある.
 また,『英語語源辞典』によると,<ch> の綴字は1500年以降に標準化したとあり,語頭の大文字使用が普通になるのは17世紀初めからであるという.なお,古英語における母音 /iː/ の発音は,アイルランド系宣教師の影響によるものという興味深い記述もあった.
 15--16世紀に <ch-> が現われたということ,またフランス語ではそれより少し早く同じ綴字が行われていたということは,英語史の潮流から考えるに,ルネサンス期とその前夜に特徴的な語源的綴字 (etymological_respelling) のもう1つの例と考えるのが妥当だろう.また,OED の言及しているように中英語で "accidentally" にではあれ,<ch-> が稀に生起したというのもおもしろい.というのは,ルネサンス期と結びつけられやすい語源的綴字の多くの例が,実は中英語期の段階でも散発的に生起しているという事実があるからだ.この点においても,<Christ> は典型的な語源的綴字の例と呼ぶことができそうだ.
 EEBO (Early English Books Online) の自作テキストデータベースから簡易検索してみたところ,15世紀後半では <c-> のみがヒットし,<ch-> の例は見当たらなかった.ところが,16世紀前半になると,100万語当たりで従来の <c-> が60回の頻度で用いられているのに対して,新興の <ch-> は234回も生起している.16世紀後半になると,旧綴字はほぼ廃用となった.全体として,16世紀中に,新綴字が爆発的な勢いで伸張したといえる.

Referrer (Inside): [2018-03-22-1]

[ | 固定リンク | 印刷用ページ ]

2015-09-21 Mon

#2338. 16世紀,hem, 'em 不在の謎 (2) [personal_pronoun][emode][corpus][eebo][punctuation]

 昨日の記事 ([2015-09-20-1]) に引き続いての話題.16世紀に hem, 'em が不在,あるいは非常に低頻度という件について,EEBO (Early English Books Online) のテキストデータベースを利用して,簡易検索してみた.検索結果は,動詞 hem を含め,相当の雑音が混じっており,丁寧に除去する手間は取っていないものの,16世紀からの例は確かに極端に少ないことがわかった.
 16世紀前半からの明確な例は,Andrew Boorde, The pryncyples of astronamye (1547) に現われる "doth geue influence to hem the which be borne vnder this signe" の1例のみである.16世紀前半の300万語ほどのサブコーパスのなかで,極めて珍しい'em に至っては,16世紀後半のサブコーパスも含めても例がない.
 16世紀後半のサブコーパスでも,hem の例は少々現われるとはいえ,さして状況は変わらない.F. T., The debate betweene Pride and Lowlines (1577) なるテキストにおいて "for they doon hem blame", "For which hem thinketh they should been aboue" などと生起したり,Joseph Hall, Certaine worthye manuscript poems of great antiquitie reserued long in the studie of a Northfolke gentleman (1597) という当時においても古めかしい詩のなかで何度か現われたりする程度である
 一方,17世紀サブコーパスの検索結果一覧をざっと眺めると,hem の頻度が著しく増えたという印象はないが,'em が見られ始め,ある程度拡張している様子である.後者の 'em の出現は,アポストロフィという句読記号自体の拡大が17世紀にかけて進行したことと関係するだろう (see 「#582. apostrophe」 ([2010-11-30-1])) .
 hem, 'em の歴史的継続性という議論については,問題の16世紀にもかろうじて用例が文証されるということから,継続性を認めてよいだろうとは考える.口語ではもっと頻繁に用いられていただろうという推測も,おそらく正しいだろう.しかし,なぜ文章の上にほとんど反映されなかったのかという疑問は残るし,17世紀以降に復活してきた際に,すでに共時的には them の省略形と解釈されていた可能性についてどう考えるかという問題も残る.この話題は,いまだ謎といってよい.

[ | 固定リンク | 印刷用ページ ]

2015-09-15 Tue

#2332. EEBO のキーワードを抽出 [eebo][lob][corpus][keyword][text_tool][emode]

 コーパスからキーワードを拾うという分析を,「#317. 拙著で自分マイニング(キーワード編)」 ([2010-03-10-1]),「#518. Singapore English のキーワードを抽出」 ([2010-09-27-1]),「#880. いかにもイギリス英語,いかにもアメリカ英語の単語」 ([2011-09-24-1]) で紹介してきた.今回は初期近代英語を中心的に扱うテキスト・データベース EEBO (Early English Books Online) より,キーワードを拾ってみたい.
 EEBO から個人的に収集した初期近代英語のテキスト集(全11億語以上)に対し,WordSmith の KeyWords 抽出機能を用いた.参照コーパスとしては,現代イギリス英語を代表するものとして LOB コーパスを指定した.本来は参照コーパスのほうがずっと大規模ではなければならないのだが,EEBO が大きすぎるということで,今回は目をつぶっておきたい.狙いは,現代英語と比べて使用頻度の著しく高い初期近代英語の語を拾い出すということである.当時の社会を特徴づける語彙が集まるはずである.
 キーワード性を示す指標の高い順に,500語までのリストがたちどころに得られた.いずれも小文字で示す.

[ Top 100 ]

amp, note, god, and, that, hath, them, christ, shall, haue, thou, they, thy, so, all, our, not, their, upon, doth, vnto, of, unto, his, king, yet, or, hee, eacute, vs, ye, him, lord, thee, which, bee, doe, saith, men, onely, but, vpon, be, nor, de, c, gods, by, faith, holy, great, church, your, o, as, selfe, wee, owne, ad, con, est, things, then, such, therefore, himselfe, may, y, to, sin, grace, cause, tis, us, mr, ther, kings, thereof, let, spirit, man, al, vp, yea, any, this, ac, s, pro, ing, com, thus, e, against, forth, re, shew, whom, l, wherein

[ -- 200 ]

loue, ly, selves, scripture, self, law, st, those, thing, cor, sinne, being, glory, euery, death, good, sonne, true, neuer, whereof, iohn, againe, psal, pope, religion, ed, hym, soule, hast, lib, ex, heaven, agrave, whiche, pray, neither, downe, acirc, tion, quod, my, sed, fore, soul, nature, euen, dayes, is, p, apostles, euer, till, feare, chap, ver, rom, vnder, ma, qui, vse, according, giue, power, ouer, mans, egrave, lesse, se, doctrine, ne, ment, meanes, themselues, shal, d, sins, viz, prince, did, vertue, wicked, honour, earth, ut, blessed, princes, ter, apostle, th, persons, que, thinke, same, others, lords, ought, pag, truth, none, kingdome

[ -- 300 ]

tho, si, cap, goe, if, beene, flesh, et, christs, make, fathers, concerning, reason, body, mercy, selues, enemies, bishops, farre, v, bishop, ar, hearts, wil, likewise, other, rome, name, obedience, en, wise, cum, speake, finde, nay, iesus, we, conscience, manner, non, heart, sinnes, it, yt, hauing, saints, generall, mat, contrary, worke, wit, sayd, whereby, covenant, wherefore, gen, passe, poore, lorde, publick, word, mens, suffer, na, heare, mee, ei, heb, divers, christians, therein, theyr, minde, shalt, bloud, shewed, certaine, vers, un, son, amongst, ibid, ca, jesus, betwixt, quae, scriptures, say, divine, thine, rest, countrey, besides, di, heauen, cannot, qu, therfore, godly, sent

[ -- 400 ]

m, moses, these, christian, called, n, vn, false, should, paul, also, discourse, meane, without, booke, whence, shee, emperour, souls, place, thereby, yeares, tyme, lawes, peace, what, dis, behold, foure, citie, giuen, israel, anno, liberty, thence, gospel, cast, ograve, aboue, souldiers, tooke, sa, priests, gaue, fol, maketh, places, pardon, te, warre, saviour, wayes, saint, thinges, will, themselves, kinde, suche, bene, love, salvation, yeare, towne, spirituall, esse, fa, duke, majesty, brethren, laws, alwayes, workes, ab, lest, for, wrath, wordes, soules, done, sunt, angels, vel, ry, liue, ted, ty, looke, repentance, dr, beare, prayer, keepe, faire, ii, parts, helpe, iudge, no, churches, r

[ -- 500 ]

dy, vsed, prophet, outward, ble, ap, spake, sect, armes, notwithstanding, come, h, naturall, maner, crosse, popes, sayth, pa, papists, whatsoever, gospell, iudgement, writ, noble, hoc, par, sacrifice, dye, worship, ons, af, eternal, leaue, ob, euill, am, sacrament, diuers, both, ghost, quam, lye, yee, comming, secondly, how, iustice, sword, daies, father, vi, before, prayers, bodie, whome, councell, nec, though, faithfull, lawe, humane, aut, wel, mi, hir, iii, worthy, isa, easie, ugrave, nowe, lawfull, ere, seene, priest, glorious, serue, commanded, earle, forme, thither, eternall, prophets, turne, iewes, mo, im, halfe, matth, manifest, wilt, are, words, iust, betweene, affections, ocirc, li, ned, creatures

 対象としたのは EEBO から収集した平テキストであり,そこには多くの注記やタグも含まれている.それを除去するなどの特別なテキスト処理は施していないので,雑音も相当混じっていることに注意したい.実際,1位の amp はタグの一部であり,2位の note も注記を表わす記号と考えてよいので,いずれも無視すべきだが,ここではキーワード抽出結果をそのまま提示することにした.
 現代でも高頻度語ではあるが,初期近代では綴字が異なる hath, haue, doth, hee, vs, bee などが上位に来ることは理解できるだろう.また,現代では古風となっている2人称単数代名詞 thou, thy, thee の顕著なことも理解できる.
 おもしろいのは,現在でも現役ではあるが,それほど顕著ではなくなっている語である.例えば,リストの上位にキリスト教的な語が多いことに気づく.200位以内に限ってざっと拾うだけでも、god, christ, gods, faith, holy, church, grace, spirit, loue, scripture, sinne, glory, death, pope, religion, soule, heaven, pray, soul, apostles, vertue, wicked, honour, blessed, apostle などが挙がる.チューダー朝,スチュアート朝ともに,キリスト教に翻弄され続けた時代だったことも関係するだろう.逆にいえば,現代がいかに世俗化したか,ということでもある.
 綴字としては,無音の <e> の自由な付加・脱落,<u> と <v> 及び <i> と <j> の混在,shall の顕著な使用,ye の残存などが挙げられるだろう (see 「#373. <u> と <v> の分化 (1)」 ([2010-05-05-1]),「#374. <u> と <v> の分化 (2)」 ([2010-05-06-1]); 「#1650. 文字素としての j の独立」 ([2013-11-02-1])) .また,現在では堅苦しい機能語も多い (ex. upon, vnto, nor, therefore, thereof, whereof) .

Referrer (Inside): [2018-09-06-1] [2018-01-10-1]

[ | 固定リンク | 印刷用ページ ]

2015-01-19 Mon

#2093. <gauge> vs <gage> [spelling][pronunciation][spelling_pronunciation_gap][eebo][clmet][emode][lmode][coha][ame_bre][spelling_pronunciation]

 「#2088. gauge の綴字と発音」 ([2015-01-14-1]) を受けて,<gauge> vs <gage> の異綴字の分布について歴史的に調べてみる.まずは,初期近代英語の揺れの状況を,EEBO (Early English Books Online) に基づいたテキスト・データベースにより見てみよう

Period (subcorpus size)<gage> etc.<gauge> etc.
1451--1500 (244,602 words)0 wpm (0 times)0 wpm (0 times)
1501--1550 (328,7691 words)3.35 (11)0.00 (0)
1551--1600 (13,166,673 words)6.84 (90)0.076 (1)
1601--1650 (48,784,537 words)3.01 (147)0.35 (17)
1651--1700 (83,777,910 words)0.060 (5)0.19 (5)
1701--1750 (90,945 words)0.00 (0)0.00 (0)


 17世紀に <gauge> 系が少々生起するくらいで,初期近代英語の基本綴字は <gage> とみてよいだろう.次に,18世紀以後の後期近代英語に関しては,CLMET3.0 を利用して検索した.

Period (subcorpus size)<gage> etc.<gauge> etc.
1710--1780 (10,480,431 words)51
1780--1850 (11,285,587)1920
1850--1920 (12,620,207)249


 おそらく1800年くらいを境に,それまで非主流派だった <gauge> が <gage> に肉薄し始め,19世紀中には追い抜いていったという流れが想定される.現代英語では BNCweb で調べる限り <gauge> が圧倒しているから,20世紀中もこの流れが推し進められたものと考えられそうだ.
 一方,<gage> の使用も多いといわれるアメリカ英語について COHA で調べてみると,実際のところ現代的には <gauge> のほうが圧倒的に優勢であるし,歴史的にも <gauge> が20世紀を通じて堅調に割合を伸ばしてきたことがわかる.あくまで,現代アメリカ英語では <gage> 「も」使われることがあるというのが実態のようだ.この事実は,「#1739. AmE-BrE Diachronic Frequency Comparer」 ([2014-01-30-1]) により "(?-i)\bgau?g(e|es|ed|ings?)\b" として検索をかけて得られる以下の表からも示唆される.いずれの変種でも <gauge> 系は見られるものの,<gage> 系についてはイギリス英語ではゼロ,アメリカ英語では部分的に使用されるという違いがある.

IDWORD19611991--92ca 2006
Brown (AmE)LOB (BrE)Frown (AmE)FLOB (BrE)AmE06 (AmE)BE06 (BrE)
1gage401010
2gages200010
3gaging1010000
4gauge16151061621
5gauged252110
6gauges011012
7gauging011000


 「#2088. gauge の綴字と発音」 ([2015-01-14-1]) で触れたアメリカ英語での <gage> 綴字の歴史的連続性の問題については,まだ明らかにするところまで行っていないが,<gage> が少々使用されている背景は気になるところだ.アメリカ英語に多いとされる綴字発音 (spelling_pronunciation) の効果なのだろうか.

[ | 固定リンク | 印刷用ページ ]

2014-12-03 Wed

#2046. <pronunciation> vs <pronounciation> [pronunciation][spelling][emode][lmode][eebo][clmet]

 「#2043. 英語綴字の表「形態素」性」 ([2014-11-30-1]) の記事の後半で,動詞 <pronounce> に対して名詞 <pronunciation> と綴られる理由に触れた.近現代英語の綴字はより表語的(より正確には表「形態素」的)な体系へと発展してきたが,前時代的な表音性も多分に残っており,この例のように <ou> = /aʊ/, <u> = /ʌ/ の関係が守られているケースがある.
 しかし,派生関係にある動詞と名詞の語幹部分に異なる母音,異なる母音字があるというのは厄介なことには違いない.そこで,この不一致を是正しようという欲求,あるいは一種の類推作用が生じることは自然の成り行きである.名詞を <pronouciation> と綴ったり,/prəˌnaʊnsiˈeɪʃən/ と発音する試みが行われてきた.この試みはしばしば規範主義者から誤用とレッテルを貼られてきたが,逆にいえば,それほどよく用いられることがあるということだ.Horobin (247) にも,"commonly misspelled pronounciation" として言及がある.OED は次のように述べている.

The forms pronouncyacyon, pronounciacion, pronountiation, pronounciation show the influence of PRONOUNCE v. This influence is also seen in the pronunciation Brit. /prəˌnaʊnsɪˈeɪʃn/, U.S. /prəˌnaʊnsiˈeɪʃ(ə)n/, which has frequently been criticized in usage guides.


 名詞における /aʊ/ の発音は,Web3 では "substandard" とレーベルが貼られており,Longman Pronunciation Dictionary では注意が喚起されている.
 名詞形の問題の母音を表わす綴字については,この語がフランス語から借用された後期中英語より <u> が普通だったが,OED によれば <ou> をもつ異綴りが15世紀以来行われてきたという.そこで,EEBO (Early English Books Online) に基づいたテキスト・データベースで調べてみると,16--17世紀には確かにパラパラと <ou> の例が挙がる.多少の異形も含めて検索した結果は以下の通り.

Period (subcorpus size)<pronunciation> etc.<pronounciation> etc.
1451--1500 (244,602 words)0 wpm (0 times)0 wpm (0 times)
1501--1550 (328,7691 words)9.73 (32)0.30 (1)
1551--1600 (13,166,673 words)1.14 (15)0.30 (4)
1601--1650 (48,784,537 words)1.35 (66)0.12 (6)
1651--1700 (83,777,910 words)1.38 (116)0.19 (16)
1701--1750 (90,945 words)0 (0)0 (0)


 続く18世紀以後については,CLMET3.0 で調べてみた.後期近代英語では <pronouciation> 系列は非標準綴字としておよそ地下に潜ったようである.

Period (subcorpus size)<pronunciation> etc.<pronounciation> etc.
1710--1780 (10,480,431 words)312
1780--1850 (11,285,587)430
1850--1920 (12,620,207)640


 ・ Horobin, Simon. Does Spelling Matter? Oxford: OUP, 2013.

Referrer (Inside): [2017-10-07-1]

[ | 固定リンク | 印刷用ページ ]

2014-12-02 Tue

#2045. なぜ mayn't が使われないのか? (2) [auxiliary_verb][negative][clitic][corpus][emode][lmode][eebo][clmet][sobokunagimon]

 昨日の記事「#2044. なぜ mayn't が使われないのか? (1)」 ([2014-12-01-1]) に引き続き,標記の問題.今回は歴史的な事実を提示する.OED によると,短縮形 mayn't は16世紀から例がみられるというが,引用例として最も早いものは17世紀の Milton からのものだ.

1631 Milton On Univ. Carrier ii. 18 If I mayn't carry, sure I'll ne'er be fetched.


 OED に基づくと,注目すべき時代は初期近代英語以後ということになる.そこで EEBO (Early English Books Online) ベースで個人的に作っている巨大テキスト・データベースにて然るべき検索を行ったところ,次のような結果が出た(mainat などの異形も含めて検索した).各時期のサブコーパスの規模が異なるので,100万語当たりの頻度 (wpm) で比較されたい.

Period (subcorpus size)mayn'tmay not
1451--1500 (244,602 words)0 wpm (0 times)474.24 wpm (116 times)
1501--1550 (328,7691 words)0 (0)133.22 (438)
1551--1600 (13,166,673 words)0 (0)107.01 (1,409)
1601--1650 (48,784,537 words)0.020 (1)131.85 (6,432)
1651--1700 (83,777,910 words)1.03 (86)131.54 (11,020)
1701--1750 (90,945 words)0 (0)109.96 (10)


 短縮形 mayn't は非短縮形 may not に比べて,常に圧倒的少数派であったことは疑うべくもない.短縮形の16世紀からの例は見つからなかったが,17世紀に少しずつ現われ出す様子はつかむことができた.18世紀からの例がないのは,サブコーパスの規模が小さいからかもしれない.「#1948. Addison の clipping 批判」 ([2014-08-27-1]) で見たように,Addison が18世紀初頭に mayn't を含む短縮形を非難していたほどだから,口語ではよく行われていたのだろう.
 続いて後期近代英語のコーパス CLMET3.0 で同様に調べてみた.18--19世紀中にも,mayn't は相対的に少ないながらも確かに使用されており,19世紀後半には頻度もやや高まっているようだ.mayn'tmay not の間で揺れを示すテキストも少なくない.

Period (subcorpus size)mayn'tmay not
1710--1780 (10,480,431 words)33859
1780--1850 (11,285,587)21703
1850--1920 (12,620,207)68601


 19世紀後半に mayn't の使用が増えている様子は,近現代アメリカ英語コーパス COHA でも確認できる.



 20世紀に入ってからの状況は未調査だが,「#677. 現代英語における法助動詞の衰退」 ([2011-03-05-1]) から示唆されるように,may 自体が徐々に衰退の運命をたどることになったわけだから,mayn't の運命も推して知るべしだろう.昨日の記事で触れたように特に現代アメリカ英語では shan'tshall とともに衰退したてきたことと考え合わせると,否定短縮形の衰退は助動詞本体(肯定形)の衰退と関連づけて理解する必要があるように思われる.may 自体が古く堅苦しい助動詞となれば,インフォーマルな響きをもつ否定接辞を付加した mayn't のぎこちなさは,それだけ著しく感じられるだろう.この辺りに,mayn't の不使用の1つの理由があるのではないか.もう1つ思いつきだが,mayn't の不使用は,非標準的で社会的に低い価値を与えられている ain't と押韻することと関連するかもしれない.いずれも仮説段階の提案にすぎないが,参考までに.

[ | 固定リンク | 印刷用ページ ]

2014-11-05 Wed

#2018. <nacio(u)n> → <nation> の綴字変化 [spelling][latin][etymological_respelling][corpus][hc][eebo]

 近現代英語で <nation> と綴られる語は,中英語では主として <nacio(u)n> と綴られていた.<nacio(u)> → <nation> の変化は,具体的にはなぜ,いつ,どのように生じたのだろうか.ここでは母音字 <ou> → <o> の変化と,子音字 <c> → <t> の変化を分けて考える必要がある.
 まず母音字の変化について考えよう.中尾 (331) によると,俗ラテン語において /o/ + 鼻音で終わる閉音節は,対応する Norman French の形態では鼻母音化した短母音 /ʊ/ あるいは長母音 /uː/ を示した.この音をもつ語が中英語へ借用されると,round, troumpe, count, nombre, countrefeten, countour, cuntree, counseil, commissioun, condicioun, nacioun, resoun, sesoun, religioun などと綴られた.-<sioun> や -<tioun> の発音は,対応する現代の -<sion> や -<tion> の発音 /ʃ(ə)n/ とは異なり,いまだ同化も弱化もしておらず,完全な音価 /siuːn/ を保っていたと考えられる.後期中英語から初期近代英語にかけてこの音節に強勢が落ちなくなってくると,同化や弱化が始まり,現在の /ʃ(ə)n/ に近づいていったろう.この過程で長母音を示唆する綴字 -<ioun> はふさわしくないと感じられ,1文字を落として -<ion> とするのが一般化したと想像される.
 しかし,<ou> → <o> の変化が単に発音と綴字を一致させるべく生じたものであるという説明が妥当かどうかは検証の余地がある.そこには多少なりとも語源的綴字 (etymological_respelling) の作用があったのではないか.というのは,ME nacioun が後に nation へ変化したとき,変化したのは問題の母音字だけではなく,先行する子音字の <c> から <t> への変化もろともだったからである.Upward and Davidson (97) によると,

The letter C with the value /s/ before E and I in OFr had two main sources. One was Lat C: Lat certanus > certain. The other was Lat T, which before unstressed E, I acquired the same value, /ts/, as C had in LLat. Medieval Lat commonly alternated T and C in such cases: nacionem or nationem, whence the widespread use of forms such as nacion in OFr and ME. The C adopted in LLat, OFr and ME for classical Lat T has sometimes survived into ModE: Lat spatium > space; platea > place. Elsewhere, a later preference for classical Lat etymology has led to the restoration of T in place of C, as in the -TION endings: ModE nation.


つまり,<nacio(u)n> → <nation> における母音字の変化も子音字の変化も,古典ラテン語の綴字に一致させるべく生じたものではないか.
 この綴字変化がいつ,どのように生じたかについて,歴史コーパスを用いて調査してみた.まずは Helsinki Corpus に当たって,次の結果を得た(以下の検索では,いずれも複数語尾のついた綴字なども一緒に拾ってある).件数は少ないものの,16世紀が変化の時期だったことがうかがわれる.


<nacion> (<nacioon>)<nation>
M2 (1250--1350) 0 (1)0
M3 (1350--1420)7 (1)0
M4 (1420--1500)2 (0)0
E1 (1500--1569)2 (0)2
E2 (1570--1639)0 (0)13
E3 (1640--1710)0 (0)14


 前回と同様,初期近代英語期 (1418--1680) の約45万語からなる書簡コーパスのサンプル CEECS (The Corpus of Early English Correspondence でも検索してみたが,大雑把な年代区分で仕分けした限り,明確な結果の解釈は難しい.


<nacion><nation>
CEECS1 (1418--1638)212
CEECS2 (1580--1680)127


 有用な結果を得ることができたのは,EEBO (Early English Books Online) からのテキストを蓄積して個人的に作っている巨大なデータベースの検索によってである.半世紀ごとに区分した各サブコーパスの規模はそれぞれ異なるので,通時的な数値の単純比較はできないが,それぞれの時代における異綴字の相対的な分布は一目瞭然だろう.


<nacion><nacioun><nation><natioun>
1451--1500 (123,537 words)4000
1501--1550 (1,825,565 words)900820
1551--1600 (6,648,588 words)64094713
1601--1650 (21,296,378 words)1806,4510
1651--1700 (38,545,254 words)11022,3501
1701--1750 (33,741 words)00120


 母音字については,初期近代英語期の入り口までにすでに <-ioun> 形はほぼ廃れていたようである.そして,子音字については,16世紀中に一気に <t> が <c> を置き換えていった様子がわかる.少なくともこの子音字の変化のタイミングについては,一般に語源的綴字の最盛期といわれる16世紀に一致していることは指摘しておいてよいだろう.一方,母音字の変化については,語源的綴字による説明を排除するわけではないが,生じた時期が相対的に早かったことから,先述のとおり発音と綴字を一致させようという動機づけに基づいていた可能性が高いのではないか.

 ・ 中尾 俊夫 『音韻史』 英語学大系第11巻,大修館書店,1985年.

Referrer (Inside): [2015-11-26-1] [2014-12-06-1]

[ | 固定リンク | 印刷用ページ ]

2014-10-01 Wed

#1983. -ick or -ic (3) [suffix][corpus][spelling][emode][eebo][johnson]

 昨日の記事「#1982. -ick or -ic (2)」 ([2014-09-30-1]) に引き続き,初期近代英語での -ic(k) 語の異綴りの分布(推移)を調査する.使用するコーパスは市販のものではなく,個人的に EEBO (Early English Books Online) からダウンロードして蓄積した巨大テキスト集である.まだコーパス風に整備しておらず,代表性も均衡も保たれていない単なるテキストの集合という体なので,調査結果は仮のものとして解釈しておきたい.時代区分は16世紀と17世紀に大雑把に分け,それぞれコーパスサイズは923,115語,9,637,954語である(コーパスサイズに10倍以上の開きがある不均衡な実態に注意).以下では,100万語当たりの頻度 (wpm) で示してある.

Spelling pairPeriod 1 (1501--1600) (in wpm)Period 2 (1601--1700) (in wpm)
angelick / angelic0.00 / 0.001.45 / 0.21
antick / antic0.00 / 0.002.49 / 0.10
apoplectick / apoplectic0.00 / 0.000.21 / 0.00
aquatick / aquatic0.00 / 0.000.10 / 0.00
arabick / arabic0.00 / 0.000.52 / 0.10
archbishoprick / archbishopric0.00 / 0.000.10 / 0.00
arctick / arctic0.00 / 0.000.42 / 0.00
arithmetick / arithmetic0.00 / 0.003.22 / 0.31
aromatick / aromatic0.00 / 0.000.83 / 0.10
asiatick / asiatic0.00 / 0.000.31 / 0.00
attick / attic0.00 / 0.000.31 / 0.21
authentick / authentic0.00 / 0.003.94 / 0.42
balsamick / balsamic0.00 / 0.000.73 / 0.10
baltick / baltic0.00 / 0.000.93 / 0.00
bishoprick / bishopric1.08 / 0.004.25 / 0.00
bombastick / bombastic0.00 / 0.000.10 / 0.00
catholick / catholic5.42 / 0.0038.39 / 1.97
caustick / caustic0.00 / 0.000.21 / 0.00
characteristick / characteristic0.00 / 0.000.21 / 0.10
cholick / cholic0.00 / 0.000.93 / 0.00
comick / comic1.08 / 0.001.45 / 0.10
critick / critic0.00 / 0.001.76 / 1.87
despotick / despotic0.00 / 0.000.62 / 0.21
domestick / domestic0.00 / 0.008.09 / 0.21
dominick / dominic1.08 / 0.000.62 / 0.42
dramatick / dramatic0.00 / 0.000.83 / 0.10
emetick / emetic0.00 / 0.000.31 / 0.00
epick / epic0.00 / 0.000.21 / 0.10
ethick / ethic0.00 / 0.000.00 / 0.10
exotick / exotic0.00 / 0.000.73 / 0.10
fabrick / fabric0.00 / 0.008.72 / 0.31
fantastick / fantastic1.08 / 0.003.42 / 0.10
frantick / frantic1.08 / 0.003.94 / 0.00
frolick / frolic1.08 / 0.003.32 / 0.00
gallick / gallic0.00 / 0.003.32 / 0.52
garlick / garlic0.00 / 0.002.28 / 0.00
heretick / heretic2.17 / 0.006.02 / 0.00
heroick / heroic0.00 / 0.0016.91 / 1.35
hieroglyphick / hieroglyphic0.00 / 0.000.31 / 0.00
lethargick / lethargic0.00 / 0.000.52 / 0.10
logick / logic0.00 / 0.007.06 / 1.04
lunatick / lunatic0.00 / 0.001.66 / 0.00
lyrick / lyric0.00 / 0.000.42 / 0.10
magick / magic2.17 / 0.003.32 / 0.10
majestick / majestic0.00 / 0.004.88 / 0.42
mechanick / mechanic0.00 / 0.004.15 / 0.00
metallick / metallic0.00 / 0.000.21 / 0.00
metaphysick / metaphysic0.00 / 0.000.10 / 0.21
mimick / mimic0.00 / 0.000.42 / 0.00
musick / music7.58 / 627.2240.98 / 251.40
mystick / mystic0.00 / 0.001.45 / 0.10
panegyrick / panegyric0.00 / 0.004.46 / 0.10
panick / panic0.00 / 0.001.35 / 0.10
paralytick / paralytic0.00 / 0.000.10 / 0.00
pedantick / pedantic0.00 / 0.000.93 / 0.00
philosophick / philosophic0.00 / 0.000.00 / 0.21
physick / physic1.08 / 0.0027.39 / 1.56
plastick / plastic0.00 / 0.000.21 / 0.00
platonick / platonic0.00 / 0.000.93 / 0.00
politick / politic0.00 / 0.0015.98 / 1.14
prognostick / prognostic0.00 / 0.000.52 / 0.00
publick / public5.42 / 3.25237.39 / 5.71
relick / relic0.00 / 0.000.52 / 0.00
republick / republic0.00 / 0.003.01 / 0.31
rhetorick / rhetoric0.00 / 0.005.71 / 0.21
rheumatick / rheumatic0.00 / 0.000.21 / 0.00
romantick / romantic0.00 / 0.000.83 / 0.00
rustick / rustic0.00 / 0.001.66 / 0.00
sceptick / sceptic0.00 / 0.000.10 / 0.10
scholastick / scholastic0.00 / 0.000.31 / 0.42
stoick / stoic0.00 / 0.000.93 / 0.00
sympathetick / sympathetic0.00 / 0.000.21 / 0.00
topick / topic0.00 / 0.001.45 / 0.00
traffick / traffic3.25 / 0.008.61 / 0.42
tragick / tragic3.25 / 0.002.91 / 0.00
tropick / tropic0.00 / 0.001.04 / 0.00


 全体として眺めると,初期近代英語では -ick のほうが -ic よりも優勢である.-ic が例外的に優勢なのは,16世紀からの music と,17世紀の critic, scholastic くらいである.昨日の結果と合わせて推測すると,1700年以降,おそらく18世紀前半の間に,-ick から -ic への形勢の逆転が比較的急速に進行していたのではないか.個々の語において逆転のスピードは多少異なるようだが,一般的な傾向はつかむことができた.18世紀半ばに -ick を選んだ Johnson は,やはり保守的だったようだ.

[ | 固定リンク | 印刷用ページ ]

Powered by WinChalow1.0rc4 based on chalow