hellog〜英語史ブログ     ChangeLog 最新    

coha - hellog〜英語史ブログ

最終更新時間: 2018-12-18 04:58

2015-01-19 Mon

#2093. <gauge> vs <gage> [spelling][pronunciation][spelling_pronunciation_gap][eebo][clmet][emode][lmode][coha][ame_bre][spelling_pronunciation]

 「#2088. gauge の綴字と発音」 ([2015-01-14-1]) を受けて,<gauge> vs <gage> の異綴字の分布について歴史的に調べてみる.まずは,初期近代英語の揺れの状況を,EEBO (Early English Books Online) に基づいたテキスト・データベースにより見てみよう

Period (subcorpus size)<gage> etc.<gauge> etc.
1451--1500 (244,602 words)0 wpm (0 times)0 wpm (0 times)
1501--1550 (328,7691 words)3.35 (11)0.00 (0)
1551--1600 (13,166,673 words)6.84 (90)0.076 (1)
1601--1650 (48,784,537 words)3.01 (147)0.35 (17)
1651--1700 (83,777,910 words)0.060 (5)0.19 (5)
1701--1750 (90,945 words)0.00 (0)0.00 (0)


 17世紀に <gauge> 系が少々生起するくらいで,初期近代英語の基本綴字は <gage> とみてよいだろう.次に,18世紀以後の後期近代英語に関しては,CLMET3.0 を利用して検索した.

Period (subcorpus size)<gage> etc.<gauge> etc.
1710--1780 (10,480,431 words)51
1780--1850 (11,285,587)1920
1850--1920 (12,620,207)249


 おそらく1800年くらいを境に,それまで非主流派だった <gauge> が <gage> に肉薄し始め,19世紀中には追い抜いていったという流れが想定される.現代英語では BNCweb で調べる限り <gauge> が圧倒しているから,20世紀中もこの流れが推し進められたものと考えられそうだ.
 一方,<gage> の使用も多いといわれるアメリカ英語について COHA で調べてみると,実際のところ現代的には <gauge> のほうが圧倒的に優勢であるし,歴史的にも <gauge> が20世紀を通じて堅調に割合を伸ばしてきたことがわかる.あくまで,現代アメリカ英語では <gage> 「も」使われることがあるというのが実態のようだ.この事実は,「#1739. AmE-BrE Diachronic Frequency Comparer」 ([2014-01-30-1]) により "(?-i)\bgau?g(e|es|ed|ings?)\b" として検索をかけて得られる以下の表からも示唆される.いずれの変種でも <gauge> 系は見られるものの,<gage> 系についてはイギリス英語ではゼロ,アメリカ英語では部分的に使用されるという違いがある.

IDWORD19611991--92ca 2006
Brown (AmE)LOB (BrE)Frown (AmE)FLOB (BrE)AmE06 (AmE)BE06 (BrE)
1gage401010
2gages200010
3gaging1010000
4gauge16151061621
5gauged252110
6gauges011012
7gauging011000


 「#2088. gauge の綴字と発音」 ([2015-01-14-1]) で触れたアメリカ英語での <gage> 綴字の歴史的連続性の問題については,まだ明らかにするところまで行っていないが,<gage> が少々使用されている背景は気になるところだ.アメリカ英語に多いとされる綴字発音 (spelling_pronunciation) の効果なのだろうか.

[ | 固定リンク | 印刷用ページ ]

2011-06-09 Thu

#773. PPCMBE と COHA の比較 [corpus][coha][ppcmbe][lmode][adjective][comparison][inflection][representativeness]

 本ブログでも何度か取り上げている2つの歴史英語コーパス PPCMBE ( Penn Parsed Corpus of Modern British English; see [2010-03-03-1]. ) と COHA ( Corpus of Historical American English; see [2010-09-19-1]. ) について,塚本氏が『英語コーパス研究』の最新号に研究ノートを発表している.両者とも2010年に公開された近代英語後期のコーパスだが,それぞれ英米変種であること,また編纂目的が異なることから細かな比較の対象には適さない.しかし,代表性をはじめとするコーパスの一般的な特徴を比べることは意味があるだろう.
 PPCMBE は1700--1914年のイギリス英語テキスト約949,000語で構成されており,Parsed Corpora of Historical English の1部をなす.同様に構文解析されたより古い時代の対応するコーパスとの接続を意識した作りである.有料でデータを入手する必要がある.一方,COHA は1810--2009年のアメリカ英語テキスト4億語を収録した巨大コーパスである.こちらは,構文解析はされていない.COHA は無料でオンラインアクセスできるため使いやすいが,インターフェースが固定されているので柔軟なデータ検索ができないという難点がある.
 コーパスの規模とも関係するが,PPCMBE は代表性 (representativeness) の点で難がある.PPCMBE のコーパステキストを18ジャンルへ細かく分類し,テキスト年代を10年刻みでとると,サイズがゼロとなるマス目が多く現われる.これは,区分を細かくしすぎると有意義な分析結果が出ないということであり,使用に際して注意を要する.
 一方,COHA のコーパステキストは Fiction, Popular Magazines, Newspapers, Non-Fiction Books の4ジャンルへ大雑把に区分されている.細かいジャンル分けの研究には利用できないが,10年刻みでも各マス目に適切なサイズのテキストが配されており,代表性はよく確保されている.ただし,Fiction の構成比率がどの時代も約50%を占めており,Fiction の言語の特徴(特に語彙)がコーパス全体の言語の特徴に影響を与えていると考えられ,分析の際にはこの点に注意を要する.
 塚本氏は,両コーパスの以上の特徴を,後期近代英語における形容詞の比較級・最上級の問題によって示している.CONCE (Corpus of Nineteenth-Century English) を用いた Kytö and Romaine の先行研究によれば,19世紀の間,比較級の迂言形に対する屈折形の割合は,30年刻みで世紀初頭の57.1%から世紀末の67.8%へと増加しているという.同様の調査を COHA と PPCMBE で10年刻みに施したところ,前者では1810年の64.7%から1910年の74.3%へ着実に増加していることが確かめられたが,後者では1810年の79.4%から1910年の78.0%まで増減の揺れが激しかったという(塚本,p. 56).しかし,CONCEと同様の30年刻みで分析し直すと,PPCMBE でも有意な変化をほぼ観察できるほどの結果がでるという.
 コーパスはそれぞれ独自の特徴をもっている.よく把握して利用する必要があることを確認した.関連して,[2010-06-04-1]の記事「流れに逆らっている比較級形成の歴史」を参照.

 ・ 塚本 聡 「2つの指摘コーパス---その代表性と類似性」『英語コーパス研究』第18号,英語コーパス学会,2011年,49--59頁.
 ・ Kytö, M. and S. Romaine. "Adjective Comparison in Nineteenth-Century English." Nineteenth-Century English: Stability and Change. Ed. M. Kytö, M. Rydén, and E. Smitterberg. Cambridge: CUP, 2006. 194--214.

Referrer (Inside): [2017-08-15-1] [2015-09-29-1]

[ | 固定リンク | 印刷用ページ ]

2011-04-01 Fri

#704. brethren and sister(e)n [plural][analogy][ame][i-mutation][relationship_noun][corpus][coca][coha]

 昨日の記事[2011-03-31-1]で,古英語の親族名詞の屈折表を見た.brethren の起源についても言及したが,これと関連して親族名詞お得意の類推 ( analogy ) の例をもう一つ挙げよう.brethren との類推で sister(e)n という複数形がある.MED の記述にあるように,中英語では -(e)n 形はごく普通であり,-s 形が一般化するのは brother の場合と同じく近代期以降である.この辺りの話題は私の専門領域なので,詳細なデータをもっている.初期中英語でもイングランドの北部や東部では -s が優勢だが,南部や西部ではこの時期の sister の複数形は原則として -n あるいは母音の語尾が圧倒していることは間違いない ( Hotta, p. 256 ) .
 さて,sister(e)n は現代英語に生き残っているが,brethren と異なり,通常辞書には記載されていない.BNC ( The British National Corpus ) でもヒットしなかった.しかし,COCA ( Corpus of Contemporary American English ), COHA ( Corpus of Historical American English ) ではそれぞれ4例,15例(19世紀後半以降の例)がヒットし,もっぱらアメリカ英語で聞かれることが分かる.COCA からの例を1つ挙げる.政治討論会番組 "CNN Crossfire" からの用例である(赤字は引用者).

Well, you know, I hate to correct you, but you made the same mistake many of your liberal brethren and sisteren, have said in analyzing this dissent by Judge Stevens.


 COCA, COHA 両コーパスからの計19例のうち16例までが brethren and sister(e)n として現われ,主にフィクションで用いられ,dearmy が先行する呼びかけの使い方が多い.brethren と同様に宗教的,組合的な文脈で現われているようだが,限定された語義としてのほか,文体的な効果もあるのかもしれない.関連して,OEDsister の語義5を引用しておこう."In the vocative, as a mode of address, chiefly in transferred senses. Also colloq. as a mode of address to an unrelated woman, esp. one whose name is not known."
 もっぱらアメリカ英語で用いられることについては,Mencken (502) が触れている.

Sisteren or sistern, now confined to the Christians, white and black, of the Get-Right-with-God country, was common in Middle English and is just as respectable, etymologically speaking, as brethren.


 sister(e)n という複数形に関する歴史的な問題は,近現代アメリカ英語での使用を,中英語期以来の継続としてとらえるべきか,あるいはアメリカ英語で改めてもたらされた刷新としてとらえるべきか,である.OED によると,sister(e)n は一般的な文章語としては16世紀半ばに廃れたとある.初期近代英語期の例やイギリス英語を含めた諸方言の例を調査しないと分からないが,(1) brethren との類推は時代を問わずありそうであること,(2) brethren と脚韻を踏むので呼びかけなど口語で特に好まれそうであること,この2点からアメリカ英語での再形成と考えるのが妥当ではないだろうか.中英語で非語源的な sister(e)n が作り出されたくらいだから,近代英語で改めて作られたとしても不思議はない.
 sister(e)n は通常の辞書には載っていないくらいのレアな複数形だが,brethren, children, oxen (but see [2010-08-22-1]) と同じ,現代に残る少数派 -en 複数の仲間に入れてあげたい気がする.

 ・ Hotta, Ryuichi. The Development of the Nominal Plural Forms in Early Middle English. Hituzi Linguistics in English 10. Tokyo: Hituzi Syobo, 2009.
 ・ Mencken, H. L. The American Language. Abridged ed. New York: Knopf, 1963.

Referrer (Inside): [2011-04-05-1]

[ | 固定リンク | 印刷用ページ ]

2010-09-19 Sun

#510. アメリカ英語における whilst の消失 [corpus][coha][ame_bre][ame]

 Brigham Young University の Mark Davies により Corpus of Historical American English (COHA) が,最近,公開された.1810--2009年の範囲を覆うアメリカ英語コーパスで,総語数にして4億語を超える大型コーパスだ.公開されてからチョコチョコいじっているが,ワンクリックで10年区切りの頻度が出てグラフまで出してくれるので,この2世紀間のアメリカ英語の通時変化を鳥瞰するのにこれほど便利なツールはない.
 特におもしろいのは,現在のイギリス英語とアメリカ英語とで形態や語法が異なっている1対の表現をそれぞれこのコーパスで検索してみることである.かつてはアメリカ英語でももっぱらイギリス的な表現が使われていたのが,時代が下るとともにイギリス色が抜けてゆく(あるいはアメリカ色が強まってゆく)様子がよく分かることだ.このこと自体は容易に予想されることだが,それがあまりに視覚的に明快に示されるので驚いてしまうのだ.例えば,私のゼミ学生で卒業論文のために英米差を調査している学生がいる.特に BrE in the street と AmE on the street の前置詞の差異に注目しているが,COHA でそれぞれをフレーズ検索すると後者が時代とともに増えてきていることが一目瞭然だという.
 [2010-09-17-1], [2010-09-18-1]とで接続詞の whilewhilst を話題にしたので,今回は COHA を用いて関連する調査をおこなってみたい.現代アメリカ英語では whilst はほとんど使われないが,イギリス英語では文語として現役である.では,かつてのアメリカ英語ではどうだったろうか.かつてはイギリス英語と同様にそれなりに使われていたが,ある時代から徐々に使われなくなり廃語となったという筋書きが予想される.それを COHA で確かめてみた.検索欄に "whilst.[cs]" (従属接続詞としての whilst )と入れて検索すると,たちどころに以下のような年代別頻度数が棒グラフとともに出力される.文字通りワンクリックなので「調査」と呼ぶのも大げさだ.結果としては,whilst は1810年代から2000年代までほぼ漸減を続けている.最も古い1810年代ですら whilstwhile に比べれば minor variant にすぎないが,当時は100万語当たり81.27回現れていた.それが1930年代には5.04にまで落ちており,2000年代ではわずか1.59回である.

whilst by COHA

 [2010-09-18-1]で出見たように Dracula (1897年) で while が14回しか現れないのに対して whilst が95回というのは,時代や文体によるところが大きいとしても,激しくイギリス的であることは間違いないようだ.

Referrer (Inside): [2013-07-29-1] [2011-06-09-1]

[ | 固定リンク | 印刷用ページ ]

Powered by WinChalow1.0rc4 based on chalow