hellog〜英語史ブログ

#902. 借用されやすい言語項目[borrowing][loan_word]

2011-10-16

 昨日の記事「#901. 借用の分類」 ([2011-10-15-1]) で述べたとおり,借用を論じるに当たって,Haugen の強調する importation と substitution の区別は肝要である.この区別は,借用されやすい言語項目について考える際にも,重要な視点を提供してくれる.
 直感的にも理解できると思われるが,他言語から最も借用されやすい言語項目といえば,語彙であり,特に名詞である.一方,文法項目の借用は不可能ではないとしても,最も例が少ないだろうということは,やはり直感されるところだ.言語項目の借用されやすさを尺度として表わすと,"scale of adoptability" なるものが得られる.William Dwight Whitney の1881年の scale によると,名詞が最も借用されやすく,次に他の品詞,接尾辞,屈折接辞,音と続き,文法項目が最も借用されにくいという (Haugen 224) (関連して,現代英語の新語ソースの76.7%が名詞である件については[2011-09-23-1]の記事を,英語語彙の品詞別割合については[2011-02-22-1], [2011-02-23-1]の記事を参照).文法項目の借用されにくさについては,Whitney は,言語項目が形式的あるいは構造的であればあるだけ,その分,外国語の侵入から自由であるという趣旨のことを述べている.
 もちろん,文法項目でも借用されている例はあり,上述の scale は規則ではなく傾向である.しかし,この scale は多くの言語からの多くの借用例によって支持されている.この問題について,Haugen (224) は importation vs. substitution の視点から,次のように述べている.

All linguistic features can be borrowed, but they are distributed along a SCALE OF ADOPTABILITY which somehow is correlated to the structural organization. This is most easily understood in the light of the distinction made earlier between importation and substitution. Importation is a process affecting the individual item needed at a given moment; its effects are partly neutralized by the opposing force of entrenched habits, which substitute themselves for whatever can be replaced in the imported item. Structural features are correspondences which are frequently repeated. Furthermore, they are established in early childhood, whereas the items of vocabulary are gradually added to in later years. This is a matter of the fundamental patterning of language: the more habitual and subconscious a feature of language is, the harder it will be to change.


 これを私的に解釈すると次のようになるだろうか.借用は,ある言語項目を必要に応じて(ただし,[2009-06-13-1]の記事「#46. 借用はなぜ起こるか」で挙げた理由ような広い意味での「必要」である)他言語から招き入れる過程であり,その方法にはソース言語の形態を導入する革新的な importation と,自言語の形態で済ませる保守的な substitution がある.言語体系にそれほど強く織り込まれていず,頻度もまちまちである一般名詞のような借用においてすら保守的な substitution に頼る可能性が常にあるのだから,言語体系に深く構造的に組み込まれており,高頻度で生起する文法的な項目は,借用を必要とする機会が稀であるばかりか,稀に借用される場合にも革新的な importation に頼る確率は低いだろう.このように考えると,借用における substitution は一見すると importation よりも目立たないが,(両者を足して借用100%とする場合)後者と異なりその比率が0%になることはなさそうだ,ということになろうか.従来の一般的な考え方に従って importation を借用の核とみなすのではなく,substitution を借用の核とみなすことにするならば,実際のところ,言語には見た目以上に借用が多いものなのかもしれない.

 ・ Haugen, Einar. "The Analysis of Linguistic Borrowing." Language 26 (1950): 210--31.

[ | 固定リンク | 印刷用ページ ]

#879. Algeo の新語ソース調査から示唆される通時的傾向[pde][word_formation][loan_word][statistics][lexicology][neologism]

2011-09-23

 連日の話題となっているが,Algeo と Bauer を比べているうちに俄然おもしろくなってきた新語ソース調査について (##873,874,875,876,877,878,879) .Algeo の詳細な区分 は,1963--72年の新語サンプル5000語に基づいたあくまで共時的な調査結果だが,いくつかの点で通時的な傾向を示唆しているように思える.Algeo 自身が言及あるいは議論している点について,以下に要約する.

 (1) 新語の約3分の2 (63.9%) が,既存要素の合成,つまり複合 (compounding) と接辞添加 (affixation) により生じている.複合と接辞添加は特に古英語において新語形成の主要な手段だったと言及されることが多いが,現在英語においてもお得意の語形成であるという事実は変わっていない.
 (2) 合成のなかでは,接辞添加 (34.1%) のほうが複合 (29.8%) よりも多い.前者のなかでは,接頭辞のほうが接尾辞より種類が多いものの,接尾辞は統語機能をそなえているために出現頻度が高く,より重要である.この意味で,英語は "a suffixing language" (272) である.
 (3) 短縮 (shortening) は,客観的な証拠はないものの,"I suspect that the number of shortenings in English has increased greatly during the last two or three centuries" (271) .その理由としては,識字率向上の結果として生じた書き言葉の優勢を指摘している."Of the various kinds of shortening, the largest subgroup is that in which the shortening is based on the written form (acronyms, alphabetisms, and the like); this preeminence of the written language is clearly one of the consequences of increasing literacy" (272) .
 (4) 英語において借用 (borrowing) は14世紀をピークとして衰退してきており,現在ではむしろ他言語へ単語を貸し出すソース言語としての役割が大きくなってきている.

 もう1つ,詳細な区分では数値として表われていないが興味深い事実として,以下の点を指摘している.

. . . of the whole sample of new words, 76.7 percent are nouns, 15.2 percent adjectives, 7.8 percent verbs, and .3 percent other parts of speech. It seems that there are far more new things than new events to talk about. Whatever the case may be syntactically, in its lexicon, English is a nominalizing language. (272)


 新語に名詞が多いという事実は驚くに当たらないかもしれない(英語語彙の品詞別割合については[2011-02-22-1], [2011-02-23-1]の記事を参照).英語が本当に "a nominalizing language" かどうかを検証するには,語彙全体における名詞の割合について通言語的に調査する必要があるだろう.それでも,Algeo のこの指摘は,Potter のいう現代英語の "noun disease" (100--05) という問題と関係しているかもしれないと考えると,興味をそそられる( "noun disease" については,[2011-09-04-1]の記事「#860. 現代英語の変化と変異の一覧」の1項目として挙げた).
 最後に,影が薄くなってきている新語ソースとしての借用について,借用元言語として日本語がフランス語に次いで第2位であるという事実が注意をひく.日本語からの借用については,以下の記事を参照.

 ・ #45. 英語語彙にまつわる数値: [2009-06-12-1]
 ・ #142. 英語に借用された日本語の分布: [2009-09-16-1]
 ・ #126. 7言語による英語への影響の比較: [2009-08-31-1]

 ・ Algeo, John. "Where Do the New Words Come From?" American Speech 55 (1980): 264--77.
 ・ Potter, Simon. Changing English. London: Deutsch, 1969.

[ | 固定リンク | 印刷用ページ ]

#666. COCA 最頻5000語で品詞別の割合は?[lexicology][corpus][statistics][n-gram][coca]

2011-02-22

 COCA ( Corpus of Contemporary American English ) に基づいた各種語彙リストが Corpus-based word frequency lists, collocates, and n-grams から入手できる.そのなかで最も基本的なリストが,こちらの最頻5000語リストである.列挙されているのは見出し語 ( lemma ) 単位で,順位はコーパスに現われる頻度と分散の関数で計算されている.UCREL CLAWS7 Tagset の品詞コード表に基づいた粗い品詞情報も付与されており,品詞別の頻度などを手軽に分析することができる.
 今回は,500語ごとに区切って頻度の高い順にL1からL10までの階級を設け,それぞれの階級における品詞別割合を出した.品詞は開いた語類 ( open class ) を中心とし,noun, verb, adj., adv., others の5区分とした.(数値データはこのページのHTMLソースを参照.)

Lemma-Based POS Ratios by COCA

 第1階級を除き,どの階級でも名詞が過半数を占めているのは予想できたことだが,第2階級以降に名詞の割合が思ったほど伸びていないことが分かった.動詞と形容詞が後半の階級でもおよそ一定の割合を占め続けているのも予想外だった.全体として,最頻5000語リストに限れば,名詞が飛び抜けつつも,開いた語類の内部比率はおよそ一定に保たれているといえよう.階級幅を様々に動かして試してみたが,およそ安定期に入るのは500語以降と見てよさそうだ.
 [2011-02-16-1]の記事で中英語期のフランス借用語の品詞別割合をみたが,全体としての形容詞比率は0.1768だった.今回の現代英語の最頻5000語では,全体としての形容詞比率は0.1678.比べて意味のある数値かどうかは分からないが,英語(言語?)における品詞別比率の「安定感」のようなものはあるのだろうか.
 COCA に基づくもの以外にオンラインで入手できる最頻英単語リストについては[2010-03-01-1]の記事を参照.頻度表を利用した別のパイロット・スタディとしては,単語の音節数を扱った[2010-04-17-1]の記事を参照.

[ | 固定リンク | 印刷用ページ ]

#667. COCA 最頻50万語で品詞別の割合は?[lexicology][corpus][french][loan_word][adjective][statistics][coca]

2011-02-23

 昨日の記事[2011-02-22-1]に引き続き,COCA ( Corpus of Contemporary American English ) に基づく単語の頻度リストを利用したパイロット・スタディ.今回は,こちらで最近になって追加された最頻50万語のリストを用いて,昨日と同様の品詞別割合を調べた.昨日のリストは見出し語 ( lemma ) に基づいた最頻5000語,今日のリストは語形 ( word form ) に基づいた最頻50万語(正確には497187語)で,性格が異なることに注意したい.
 昨日とほぼ同じ作業だが,今回は2万語ずつで階級を区切り,L1からL25までの階級のそれぞれにおいて noun, verb, adj., adv., others の5区分で品詞別割合を出した.(数値データはこのページのHTMLソースを参照.)

Form-Based POS Ratios by COCA

 L6(12万語レベル)辺りから品詞別比率は安定期に入るといってよいだろう.L17(34万語レベル)辺りから変動期が始まるのが気になるが,階級幅を大きくしてみると(ならしてみると)直前のレベルから大きく逸脱していない.
 [2011-02-16-1]の記事以来,形容詞の比率が気になっているが,今回のデータ全体から計算すると,0.1738という値がはじきだされた.昨日の lemma 調査では0.1678だったから,値は非常に近似している.ただし,名詞と動詞の lemma 対 word form の比率は,名詞が 0.5086 : 0.6985,動詞が 0.2000 : 0.1065 と大きく異なるので,形容詞の 0.1678 : 0.1738 という近似は偶然かもしれない.lemma 対 word form の品詞別割合には異なる傾向があるのかもしれないが,それでも大規模に調べると安定期と呼びうる区間が出現することは確かなようだ.
 [2011-02-16-1]の記事で触れたように,中英語期のフランス借用語における形容詞比率は0.1768だった.今回の値0.1738と酷似しているが,主題の性質がまるで違うので,直接の関係を論じることは無理である.もとより昨日と今日の調査は,[2011-02-16-1]の調査とは無関係に始めたものである.しかし,偶然と思えるこの結果は,示唆的ではある.借用語彙といえば名詞が圧倒的なはずだと予想していたものの,フランス語や古ノルド語からはおよそ一定の割合の形容詞(それぞれ lemma 調査で0.1768と0.1817)が借用されていた.そして,その比率は時代が異なるとはいえ現代英語の比率と近似している.英語語彙全体における比率と借用語彙における比率が近似しているということは,もし偶然でないとしたら,何を意味するのだろうか.フランス借用語彙や古ノルド借用語彙が,英語に適応するような自然な比率で英語語彙へ溶け込んだということだろうか.これは,今回のパイロット・スタディの結果を受けての印象に基づく speculation にすぎない.今後も品詞別割合という観点に注目していきたい.

[ | 固定リンク | 印刷用ページ ]