hellog〜英語史ブログ

#756. 世界からの借用語[loan_word][lexicology][pde_characteristic][world_languages]

2011-05-23

 現代英語の最大の特徴の1つである cosmopolitan vocabulary については pde_characteristic を始めとする記事で,また時にそれを "asset" とみなす見方については批判的に[2009-09-27-1], [2010-05-22-1]の記事などで扱ってきた.関連して,現代英語語彙が借用語に満たされていることについては,[2010-05-16-1]にリンクを張った諸記事や loan_word の各記事で話題にしてきた.
 英語の語彙がいかに世界的かをざっと知るには,[2009-11-14-1]の記事「現代英語の借用語の起源と割合 (2)」のグラフをみるのが手っ取り早いが,単語とその借用元言語を具体的にリスト化しておけば,なお手っ取り早い.そこで,主として Crystal ( The English Language, p. 40 and Encyclopedia, pp. 126--27 ) に基づき,他の例も多少付け加えながら,借用元言語で世界一周ツアーしてみたい.

LanguageWords
Afrikaansapartheid, gnu, impala, indri, kraal, mamba, trek, tse-tse
Aleutianparka
American Indianchipmunk, moccasin, pow wow, skunk, squaw, totem, wigwam
Anglo-SaxonGod, Sunday, beer, crafty, gospel, house, rain, rainbow, sea, sheep, understand, wisdom
Arabicalgebra, assassin, azimuth, emir, ghoul, harem, hashish, intifada, mohair, sheikh, sherbet, sultan, zero
Araucaniancoypu, poncho
Australianboomerang, budgerigar, dingo, kangaroo, koala, wallaroo, wombat
Brazilianabouti, ai, birimbao, bossa nova, favela, jaguar, manioc, piranha
Canadian Indianpecan, toboggan
Chinesechopsuey, chow mein, cumquat, kaolin, ketchup, kung fu, litchi, sampan, tea, tycoon, typhoon, yen (=desire)
Czechhowitzer, pistol, robot
Dutchbluff, cruise, easel, frolic, knapsack, landscape, poppycock, roster, slim
Eskimoanorak, igloo, kayak
Finnishsauna
Frenchanatomy, aunt, brochure, castle, cellar, challenge, chocolate, crocodile, cushion, debt, dinner, entrance, fruit, garage, grotesque, increase, jewel, justice, languish, medicine, montage, moustache, passport, police, precious, prince, sacrifice, sculpture, sergeant, table, trespass, unique, venison, victory, vogue, voyeur
Gaelicbanshee, brogue, galore, leprechaun
Germanangst, dachshund, gimmick, hamburger, hamster, kindergarten, lager, nix, paraffin, plunder, poodle, sauerkraut, snorkel, strafe, waltz, yodel, zinc
Greekanonymous, catastrophe, climax, coma, crisis, dogma, euphoria, lexicon, moussaka, neurosis, ouzo, pylon, schizophrenia, stigma, therm, thermometer, tonic, topic
Haitianbarbecue, cannibal, canoe, peccary, potato, yucca
Hawaiianaloha, hula, lei, nene, ukulele
Hebrewbar mitzvah, kibbutz, kosher, menorah, shalom, shibboleth, targum, yom kippur, ziggurat
Hindibungalow, chutney, dekko, dungaree, guru, gymkhana, jungle, pundit, pyjamas, sari, shampoo, thug
Hungariancimbalom, goulash, hussar, paprika
Icelandicgeyser, mumps, saga
Irishblarney, brat, garda, taoiseach, whiskey
Italianarcade, balcony, ballot, bandit, ciao, concerto, falsetto, fiasco, giraffe, lava, mafia, opera, scampi, sonnet, soprano, studio, timpani, traffic, violin
Japanesebonsai, geisha, haiku, hara-kiri, judo, kamikaze, karate, kimono, shogun, tycoon, zaitech
Javanesebatik, gamelan, lahar
Koreanhangul, kimchi, makkoli, ondol, won
Latinalibi, altar circus, aquarium, circus, compact, diocese, discuss, equator, focus, frustrate, genius, include, index, interim, legal, monk, nervous, onus, orbit, quiet, ulcer, ultimatum, vertigo
Malagasyraffia
Malayamok, caddy, gong, kapok, orang-outang, sago, sarong
Maorihaka, hongi, kakapo, kiwi, pakeha, whare
Nahuatlaxolotl, coyote, mescal, tomato, tortilla
Norwegiancosy, fjord, krill, lemming, ski, slalom
Old Norseboth, egg, knife, low, sky, take, they, want
Persianbazaar, caravan, divan, shah, shawl, sofa
Peruviancondor, inca, llama, maté, puma, quinine
Polishhorde, mazurka, zloty
Polynesiankava, poe, taboo, tapa, taro, tattoo
Portuguesebuffalo, flamingo, marmalade, pagoda, veranda
Quechuanllama
Russianagitprop, borsch, czar, glasnost, intelligentsia, perestroika, rouble, samovar, sputnik, steppe, troika
Sanskritswastika, yoga
Scottishcaber, cairn, clan, lock, slogan
Serbo-Croatcravat, silvovitz
Spanishalbatross, banana, bonanza, cafeteria, cannibal, canyon, cigar, cobra, cork, dodo, guitar, hacienda, hammock, junta, marijuana, marmalade, molasses, mosquito, potato, rodeo, sherry, sombrero, stampede, supremo
Swahilibongo, bwana, harmattan, marimba, safari, voodoo
Swedishombudsman, tungsten, verve
Tagalogboondock, buntal, ylang-ylang
Tamilbandicoot, catamaran, curry, mulligatawny, pariah
TibetanKoumiss, argali, lama, polo, shaman, sherpa, yak, yeti
Tongantaboo
Turkishaga, bosh, caftan, caviare, coffee, fez, jackal, kiosk, shish kebab, yoghurt
Vietnameseao dai, nuoc mam
Welshcoracle, corgi, crag, eisteddfod, hwyl, penguin
Yiddishchutzpah, gelt, kosher, nosh, oy vay, schemozzle, schmaltz, schmuk


 ・ Crystal, David. The English Language. 2nd ed. London: Penguin, 2002.
 ・ Crystal, David. The Cambridge Encyclopedia of the English Language. 2nd ed. Cambridge: CUP, 2003.

[ | 固定リンク | 印刷用ページ ]

#309. 現代英語の基本語彙100語の起源と割合[loan_word][lexicology][statistics][pde]

2010-03-02

 昨日の記事[2010-03-01-1]で,現代英語の最頻英単語リストをいくつか紹介した.そのなかで,やや古いが広く参照されている GSL ( General Service List ) に基づき,最頻100語の語源別の内訳を調べてみた.

Etymological Sources of 100 Most Frequent Words in PDE

 英語の本来語 ( native words ) の一人勝ちであることは一目瞭然である.借用語 ( loan words ) はわずかである.最頻語彙の血は紛れもなく Anglo-Saxon である.
 古ノルド語由来の語は they, she, take, get, give の5語のみ.ただし,she の語源にはイングランド北部方言説など諸説がある.また,getgive については,語頭子音 /g/ こそ古ノルド語形に由来すると言ってよいが,対応する語は古英語にもあり,考え方によってはどちらの言語にも帰せられる.ここでは,いずれも古ノルド語由来として数えた.
 フランス語由来の語は,state, use, people の3語のみ.
 過去の記事でも類似する統計をいくつか載せているので,そちらも要参照.

 ・ [2009-11-15-1]: 現代英語の基本語彙600語の起源と割合
 ・ [2009-11-14-1]: 現代英語の借用語の起源と割合 (2)
 ・ [2009-08-15-1]: 現代英語の借用語の起源と割合

[ | 固定リンク | 印刷用ページ ]

#202. 現代英語の基本語彙600語の起源と割合[loan_word][lexicology][statistics][pde][romancisation]

2009-11-15

 昨日の記事[2009-11-14-1]に引き続き,現代英語の語彙に関する統計値の話題.昨日は,借用語に限定し,そのソース言語の相対的割合を示すグラフを掲げた.今日は,本来語も借用語も含めた現代英語の語彙全体から基本語600語を取り出し,その語源をソース言語ごとに数え上げるという切り口による統計を紹介する.以下の数値と議論の出典は,昨日と同じく Hughes による.
 数値をみる前に,基本語彙 ( core vocabulary ) を客観的に定義するのは難しいという問題に触れておきたい.話し言葉で考えるのか,書き言葉で考えるのか.個々の話し手,書き手によって基本語彙とは異なるものではないのか.世界英語のどの変種 ( variety ) を対象に考えるのか,イギリス英語か,アメリカ英語か,それ以外か.この問題に対して,Hughes は,LDOCE3 の頻度ラベルが S1 かつ W1 であるもの,すなわち話し言葉でも書き言葉でも最頻1000語に入っている語だけを選び出すことにした.この総数が600語であり,これを "the kernel of the core" (392) として調査対象にした.以下は,ソース言語別の割合をグラフ化したものである.

Etymological Sources of PDE Core Vocabulary


 従来の類似調査や伝統的な英語史観からは,Anglo-Saxon 由来の本来語の割合はもっと高いはずではないか(6割〜7割)と予想されるところだが,意外にも5割を切っている.話し言葉の記述に力を入れている LDOCE3 に基づく結果であるだけに,なおさらこの結果は意外である.
 もう一つ興味深いのは,Anglo-Saxon と Norse を合わせた Germanic 連合軍と,Norman French と Latin と Greek を合わせた Latinate-Classic 連合軍とが,およそ半々に釣り合っていることだ.語彙に関しては,中英語以降,英語はゲルマン系からロマンス系へと舵を切っているということが英語史ではよくいわれる.現代において,語彙のロマンス化の傾向は維持されているのみならず,むしろ強まってきているということを,このデータは示唆するのではないか.

 ・ Hughes, G. A History of English Words. Oxford: Blackwell, 2000. 391--94.
 ・ Longman Dictionary of Contemporary English. 3rd ed. Harlow: Longman, 1995.

[ | 固定リンク | 印刷用ページ ]

#429. 現代英語の最頻語彙10000語の起源と割合[loan_word][lexicology][statistics][pde]

2010-06-30

 現代英語の語彙の起源と割合については,[2010-05-16-1]でまとめたとおり,本ブログでも何度か扱ってきた.

 ・ [2010-03-02-1]: 現代英語の基本語彙100語の起源と割合
 ・ [2009-11-15-1]: 現代英語の基本語彙600語の起源と割合
 ・ [2009-11-14-1]: 現代英語の借用語の起源と割合 (2)

 この種の英語語彙の語源調査については本格的なものは存在しないようだが,もう一つ関連する先行研究をみつけたので紹介したい.
 Williams (67--68) は,数千通の商用書簡から最頻1万語を取り出し,頻度の高い順に1000語単位で10のグループを設けた.各グループについて語源別に比率をまとめた表を Williams より再掲する(宇賀治,pp. 84--85 にも掲載あり).ついでに,見やすいように棒グラフも作った.

DecileEnglishFrenchLatinDanishOther
183%11%2%2%2%
234461127
3294614110
4274517110
527471718
6274219210
7234517213
8264118213
9254117215
10254218114
Etymological Breakdown of the Most Frequent 10000 Words by Williams


 2000語,3000語レベルから早くも各言語の比率が落ち着いてくるのは,[2010-04-11-1]でみた音節数の分布とある程度は相関していそうでおもしろい.
 "Other" グループは雑多あるいは語源不詳の語も含まれるが,そのなかで各1000語の語群のいずれかで1%を超えるものは Dutch 借用語のみだという.また,調査対象としたコーパスをひっくるめて token 頻度で調べると以下の通り.こうしてみると英語は英語なのだとわかる.

English78.1%
French15.2
Latin3.1
Danish2.4
Other (Greek, Dutch, Italian, Spanish, German, etc.)1.3


 ・ Williams, Joseph M. Origins of the English Language: A Social and Linguistic History. New York: The Free Press, 1975.
 ・ 宇賀治 正朋著 『英語史』 開拓社,2000年.

[ | 固定リンク | 印刷用ページ ]

#845. 現代英語の語彙の起源と割合[lexicology][loan_word][statistics][bnc][corpus]

2011-08-20

 現代英語の語彙における本来語と借用語の比率については,本ブログでも何度か取り上げてきた.いくつかリンクを張っておこう.

 ・ [2010-12-31-1]: #613. Academic Word List に含まれる本来語の割合
 ・ [2010-06-30-1]: #429. 現代英語の最頻語彙10000語の起源と割合
 ・ [2010-05-16-1]: #384. 語彙数とゲルマン語彙比率で古英語と現代英語の語彙を比較する
 ・ [2010-03-02-1]: #309. 現代英語の基本語彙100語の起源と割合
 ・ [2009-11-15-1]: #202. 現代英語の基本語彙600語の起源と割合
 ・ [2009-11-14-1]: #201. 現代英語の借用語の起源と割合 (2)
 ・ [2009-08-15-1]: #110. 現代英語の借用語の起源と割合

 語種の数量的な調査には,数え挙げる際のソースを何にするか,type-count か token-count か,どのくらいの語彙規模を扱うか,語源にまつわる不正確さをどのように処理するか,などの考慮すべき事項が様々あり,研究者によって結果がまちまちとなることがある.しかし,複数の調査を比べれば,およその平均値や全体像が見えてくるのも確かである.
 先日参加してきた ICOME7 (The Seventh International Conference on Middle English) で,8月4日,OED3 の主幹語源学者 Philip Durkin 氏が "Some neglected aspects of Middle English lexical borrowing from (Anglo-)French" と題する講演で関連する話題について触れていたので,要点をメモしておく.
 Durkin 氏は BNC から最頻1000語のリストを取り出し,語源分析した.その結果,英語本来語が489語,フランス・ラテン語が489語,ノルド語が32語,それ以外の言語が10語という数値が得られた.大規模コーパスの頻度リスト (see [2010-03-01-1]) を利用した語源調査はいつか自分でやろうと思っていたが,Durkin 氏のおかげでその労力を省くことができた(ありがとうございます!).
 これにより,上記のリンクで示した諸調査と合わせて,type-count に基づく最頻100語,600語,1000語,2000語,3000語,4000語,5000語,6000語,7000語,8000語,9000語,10000語という12段階の語彙規模での語種別比率が得られたことになる.母体となる現代英語語彙の情報ソース,数え方,語種区分はそれぞれ異なっているのかもしれないが,一応の目安として以下で全体像を示したい.語種区分は English, French and/or Latin, Scandinavian, Other として4種類に統一した.

LevelEnglishFrench/LatinScandinavianOther
100 (GSL)92%3%5%0%
600 (LDOCE3)474544
1000 (BNC)46.948.93.21.0
1000 (Williams)831322
2000 (Williams)345727
3000 (Williams)2960110
4000 (Williams)2762110
5000 (Williams)276418
6000 (Williams)2761210
7000 (Williams)2362213
8000 (Williams)2659213
9000 (Williams)2558215
10000 (Williams)2560114
Etymological Breakdown of the Most Frequent Words


 上から3つ目と4つ目の棒グラフは,同じ最頻1000語レベルでの比較だが,3つ目は上述の Durkin の BNC 調査によるもの,4つ目は[2010-06-30-1]の記事で示した Williams のものである.著しい差異が生じたが,これも調査方法が異なるがゆえだろうか.注意して解釈する必要があるが,この点を除けば全体としてなだらかに推移し,最終的には本来語25%,ラテン・フランス語60%,それ以外が15%という数値におよそ落ち着くようだ.

[ | 固定リンク | 印刷用ページ ]

#1202. 現代英語の語彙の起源と割合 (2)[lexicology][loan_word][statistics][old_norse]

2012-08-11

 [2011-08-20-1]の記事「#845. 現代英語の語彙の起源と割合」で,現代英語の最頻語を借用元言語別に分別した統計値を紹介した.このような語彙統計は,何を資料に使ったか,どのような方法で調査したかなどによって結果が変動しがちであるため,複数の調査結果を照らし合わせて評価するのがよい.Schmitt and Marsden (82) は,Bird による調査結果の統計値を与えている.これをグラフ化してみた.(数値データは,HTMLソースを参照.)

Sources of the most frequent 7,476 words of English

 続けて Schmitt and Marsden (83) は,英語本来語のみで構成された印象深い1節を紹介している.

But with all its manifold new words from other tongues, English could never have become anything but English. And as such it has sent out to the world, among many other things, some of the best books the world has ever known. It is not unlikely, in the light of writings by Englishmen in earlier times, that this would have been so even if we had never taken any words from outside the word hoard that has come down to us from those times. It is true that what we have borrowed has brought greater wealth to our word stock, but the true Englishness of our mother tongue has in no way been lessened by such loans, as those who speak and write it lovingly will always keep in mind.


 [2010-04-20-1]の記事「#358. アイスランド語と英語の関係」のなかで,"Though they are both weak fellows, she gives them gifts." という北欧単語のみで構成された英文(ただし語源について北欧系かどうか疑わしい語も含まれている)を提示したが,これはさすがに不自然で,強引な文だ.しかし,英語本来語で構成された上の文章は十分に自然だ.
 フランス借用語のみで構成された文章は可能だろうか.可能だとしても,どのくらい自然だろうか.

 ・ Schmitt, Norbert, and Richard Marsden. Why Is English Like That? Ann Arbor, Mich.: U of Michigan P, 2006.

[ | 固定リンク | 印刷用ページ ]

#110. 現代英語の借用語の起源と割合[loan_word][lexicology][statistics][pde]

2009-08-15

 現代英語の語彙が,世界の諸言語からの借用の上に成り立っていることは,英語史を学んだ者にはよく知られている.英語は歴史上,実に350以上の言語から語を借用してきており,その数は本来語の数よりも多い.
 語彙に関する統計は[2009-06-12-1]でも触れたように,決定版といえるようなものが見つけにくいが,借用語の起源と割合については,OED の第2版で調査した Hughes が参考になる.Hughes を参照して橋本功先生が作成した円グラフと同じものを,本ブログのためにリメイクしてみた.現代英語における借用語彙の全体を100%としたときの,各借用元言語の貢献の割合を示したものである.

Origins of PDE Loanwords


 フランス語とラテン語からの借用語については,言語的に類似している(親子関係にある)ため,どちらから入ったか区別のつかない例も多く,フランス・ラテン借用語としてまとめて扱われることが多い.足し算すると,英語の借用語のうち,実に52%がフランス・ラテン借用ということになる.英語の語彙に与えた両言語の影響の大きさは,この数値から容易に理解されよう.

 ・橋本 功 『英語史入門』 慶應義塾大学出版会,2005年. 90頁.
 ・Hughes, G. A History of English Words. Oxford: Blackwell, 2000.

[ | 固定リンク | 印刷用ページ ]

#201. 現代英語の借用語の起源と割合 (2)[loan_word][lexicology][statistics][pde]

2009-11-14

 標題について[2009-08-15-1]で円グラフを示したが,そのときにグラフ作成に用いた数値は孫引きのデータだった.今回は OED (2nd ed.) で語彙調査をした Hughes の原典から直接データを取り込み,より精確なグラフを作成してみた.カウントの対象とされたソース言語は75言語,借用語総数は169327語である.
 一つ目は円グラフで,現代英語の借用語全体を100としたときのソース言語の相対比率を示したものである.[2009-08-15-1]で示したグラフをより精確にしたものと理解されたい.
 二つ目は棒グラフで,比率ではなく借用語数で,ソース言語別にプロットしたものである.
 少数のソース言語が借用語の大多数を供給している実態がよくわかる.もとの数値データはこのページのHTMLソースを参照.

Etymological Sources of Borrowings into English by OED2 in Pie Chart

Etymological Sources of Borrowings into English by OED2 in Bar Chart


 ・Hughes, G. A History of English Words. Oxford: Blackwell, 2000. 370.

[ | 固定リンク | 印刷用ページ ]

#384. 語彙数とゲルマン語彙比率で古英語と現代英語の語彙を比較する[oe][pde][loan_word][lexicology][statistics]

2010-05-16

 これまでも現代英語の語彙数と起源別割合については,グラフとともにいろいろなソースから具体的な数値を挙げてきた.

 ・ [2010-03-02-1]: 現代英語の基本語彙100語の起源と割合
 ・ [2009-11-15-1]: 現代英語の基本語彙600語の起源と割合
 ・ [2009-11-14-1]: 現代英語の借用語の起源と割合 (2)

 それとは別に,語彙や起源別割合の通時的な増減やその他を扱った話題としては,以下のような記事を書いてきた.

 ・ [2009-08-22-1]: フランス借用語の年代別分布
 ・ [2009-08-19-1]: 初期近代英語の借用語の起源と割合
 ・ [2009-06-12-1]: 英語語彙にまつわる数値

 語彙の数値というのは,参照する辞書などのソースを何にするのか,単語の頻度を考慮に入れるのか,などによって調査結果が大きく変わる可能性があり,なかなか難しい.起源言語別で数えるにしても,語源そのものが不詳だったり,フランス語なのかラテン語なのかなどで判断のつかないケースがあったりと,やはり難しい.ただ,予想される通り OEDSOED の情報に基づいた数値が多いようではある.
 今回は,使用されている語彙リストのソース自体は不明なのだが,広く参照される可能性のある Encyclopedia of Linguistics に掲載されている数値を調べてみた.それぞれ "Old English" と "English" の項から関連箇所を引用する.

The recorded vocabulary of OE is estimated at approximately 30,000 words. Only about 3% of these were of non-Germanic origin. (779)


As a result of borrowing, the Gmc word stock is now a low 30% and the Romance one is 50%. (292)


 後者では現代英語の総語彙を対象語彙としているようではあるが,その語数は記されていない.もし OED2 に準拠しているのであれば,定義・例説の与えられている語の数として 615,100 辺りを念頭においているのかもしれない ( see Dictionary facts ) .あるいは,定義されている語源の数である 219,800 辺りを念頭においているのだろうか.不明の点が多いが,現代英語の語彙数として仮に 615,100 という数を採用するとして,古英語と現代英語の語彙とそのなかのゲルマン語彙比率について比べる表を掲げよう.ゲルマン語彙とは,Anglo-Saxon 起源の本来語と(特に現代英語において)Old Norse 起源の借用語を合わせたものが中心になると考えてよいだろう.

 Old EnglishPresent-Day English
vocabulary30,000615,100?
native words (%)9730


 語彙数がざっと20倍,ゲルマン語彙比率が1/3以下になったのだから,語彙体系の激変が起こったといってよい.大語彙推移 ( The Great Vocabulary Shift ) とでも呼びたくなる大変化だ.

 ・ Minkova, Donka. "Old English." Encyclopedia of Linguistics. Ed. Philip Strazny. New York: Fitzroy Dearborn, 2005. 777--80.
 ・ Leitner, Gerhard. "English." Encyclopedia of Linguistics. Ed. Philip Strazny. New York: Fitzroy Dearborn, 2005. 288--94.

[ | 固定リンク | 印刷用ページ ]