hellog〜英語史ブログ

#429. 現代英語の最頻語彙10000語の起源と割合[loan_word][lexicology][statistics][pde]

2010-06-30

 現代英語の語彙の起源と割合については,[2010-05-16-1]でまとめたとおり,本ブログでも何度か扱ってきた.

 ・ [2010-03-02-1]: 現代英語の基本語彙100語の起源と割合
 ・ [2009-11-15-1]: 現代英語の基本語彙600語の起源と割合
 ・ [2009-11-14-1]: 現代英語の借用語の起源と割合 (2)

 この種の英語語彙の語源調査については本格的なものは存在しないようだが,もう一つ関連する先行研究をみつけたので紹介したい.
 Williams (67--68) は,数千通の商用書簡から最頻1万語を取り出し,頻度の高い順に1000語単位で10のグループを設けた.各グループについて語源別に比率をまとめた表を Williams より再掲する(宇賀治,pp. 84--85 にも掲載あり).ついでに,見やすいように棒グラフも作った.

DecileEnglishFrenchLatinDanishOther
183%11%2%2%2%
234461127
3294614110
4274517110
527471718
6274219210
7234517213
8264118213
9254117215
10254218114
Etymological Breakdown of the Most Frequent 10000 Words by Williams


 2000語,3000語レベルから早くも各言語の比率が落ち着いてくるのは,[2010-04-11-1]でみた音節数の分布とある程度は相関していそうでおもしろい.
 "Other" グループは雑多あるいは語源不詳の語も含まれるが,そのなかで各1000語の語群のいずれかで1%を超えるものは Dutch 借用語のみだという.また,調査対象としたコーパスをひっくるめて token 頻度で調べると以下の通り.こうしてみると英語は英語なのだとわかる.

English78.1%
French15.2
Latin3.1
Danish2.4
Other (Greek, Dutch, Italian, Spanish, German, etc.)1.3


 ・ Williams, Joseph M. Origins of the English Language: A Social and Linguistic History. New York: The Free Press, 1975.
 ・ 宇賀治 正朋著 『英語史』 開拓社,2000年.

[ | 固定リンク | 印刷用ページ ]

Powered by WinChalow1.0rc4 based on chalow