バケ (66) は,中英語期のフランス語彙の大量借用について概説しながら,次のような印象的な指摘をしている.
フランス語によってひどく影響を受けた語彙場と並んで,フランス語によって,ほとんど,あるいは全然特質化されてこなかった場を究明しうることは感激であるといえよう.
中英語期にフランス語の語彙的影響がいかに大きかったかという議論は無数にあるが,その中にあって英語が影響を受けなかった語彙領域は何かと問う視点は新鮮である.中英語のフランス語に限らず,英語史を通じて諸言語より甚大な語彙的影響を受けながらも,英語語彙は本来語要素を25%程度は保ってきた([2011-08-20-1]の記事「現代英語の語彙の起源と割合」を参照).ラテン語であればキリスト教用語,フランス語であれば法律用語や貴族用語,イタリア語であれば音楽用語など,借用語が特定の語彙領域に顕著である事実については,英語史のどの概説書でも述べられている.しかし,逆に本来語が生きながらえた語彙領域は何かという観点からの記述は,基本語や機能語に言及する以外では稀である.
だが,基本語や機能語であっても借用語に置換される例はいくらでもある.father, mother, brother, sister, son, daughter, child は基本語かつ本来語だが,uncle, aunt, nephew, niece, cousin, grand-(father/mother) は基本語ではあるが借用語だ(あるいは2--3親等が基本的か否かの分かれ目か?).he -- his -- him は本来語だが,they, -- they -- them は借用語である.反対に,借用語が活躍すると予期される語彙領域に本来語が残っている例もある.例えば,ラテン語やギリシア語に占領されているキリスト教関連の語彙領域(「古英語期に借用されたラテン語」[2009-05-30-1])にあって,その中心を占めるはずの God はなぜ本来語のままなのか.heaven や hell も本来語である (Baugh and Cable 90--91) .ノルマン征服によりもたらされた大陸風の王侯貴族の慣習をとりまく語彙の場は court, noble, prince, royal などのフランス借用語で埋め尽くされたが,その中心を占めるはずの king と queen はなぜ本来語のままなのか.これらは,単純に基本語だから本来語を保ったという議論では済まされないのではないか,と疑わせる例である.どの語彙領域が借用を受けやすいかだけではなく,どの領域が借用を受けにくいのかを明らかにすることは,語彙史研究のみならず文化史研究の重要な課題だろう.
・ ポール・バケ 著,森本 英夫・大泉 昭夫 訳 『英語の語彙』 白水社〈文庫クセジュ〉,1976年.
・ Baugh, Albert C. and Thomas Cable. A History of the English Language. 5th ed. London: Routledge, 2002.
英語には数多くの類義語辞典 (thesaurus) があり,[2010-08-11-1]の記事「toilet の豊富な婉曲表現を WordNet と Visuwords でみる」で示したようにオンライン版辞書や類義語の視覚化ツールも少なからず存在する.歴史的類義語辞典としても,近年 HTOED (Historical Thesaurus of the Oxford English Dictionary) や TOE (A Thesaurus of Old English) が公開されており,活況を呈している.
共時的にも通時的にも英語語彙の研究環境は著しく整ってきているが,外国語としての英語の学習環境という観点からは類義語辞典の役割はこれまであまり目立ってこなかった.学習の観点からの類義語の解説については,OALD や LDOCE などの老舗学習者用英英辞書も力を入れてきており,発信用の英語学習にも役立つおもしろい解説が増えてきたが,類義語の列挙と解説に特化した学習者用類義語辞典というものはあまり出版されていなかった.唯一,American Heritage Thesaurus for Learners of English (2002) があったくらいだが,2008年になって標題の Oxford Learner's Thesaurus (OLT) が出版された.この辞書は私の手元にもあったが,これまで特に強い関心はなく,意識的に開いたことはほとんどなかった.だが,最近 Komuro and Ichikawa による OLT の辞書分析を読んで,学習者用類義語辞典に興味がわいてきた.辞書は特徴を知っておくことが重要なので,以下に OLT について知っておいてよい点を,Komuro and Ichikawa を参照しながらいくつか挙げておきたい.
・ OLT は,Oxford Thesaurus of English (2000, 2004) からの派生物ではなく,むしろ OALD7 (2005) との関係が強い (12) .実際に,OALD7 の類義語解説が多く OLT に反映されている.(つまり,最初から学習者向けにチューニングされており,平易でかゆいところに手が届く記述が期待され,実際にそのようになっている.)
・ OLT に限らないが,学習者用類義語辞典の主たる機能は,"(1) make users aware of different connotations or shades of meaning synonyms have and to (2) enable users to choose and use the most appropriate word, which may not be part of their (active) vocabulary, in order to express their idea" (14) .
・ 見出し語数は学習者向けに選ばれた1973個で,単語だけでなく複合語や句が見出し語となっている場合もある (16) .
・ 1つの見出し語に与えられている類義語の数は,最頻値をとると5--6個 (26) .多すぎず,少なすぎず,学習者にとって適切.
・ 挙げられている例文はおおむね適切で,CD-ROM版では各類義語に対して平均3.7個ほどの例文が挙げられている (29) .
・ 類義語間の区別にとりわけ重要な register のレーベルや解説が質量ともに充実している (35--45) .特に解説は読み物としておもしろく書かれている (45, 49) .
・ 意味の強度によって区別される類義語群について,視覚的な "synonym scales" なる提示法が導入されており,学習上,非常に効果的である (49--52) .
全体として Komuro and Ichikawa は "a groundbreaking learner's thesaurus (55) と高い評価を与えており,特に最後の "synonym scales" の評価については,私も実際に見てみたが同感.例えば,afraid の類義語の synonym scale は以下の通り.このように一覧されると,頭が整理される.
レビュー論文を読んでこれから積極的に OLT を利用してみたいと思った.また,英語学習に役に立ちそうであることは言うに及ばず,語彙論や意味論の研究に際しても,本格的な類義語辞典やその他の辞書を用いる前の見当づけやテーマ探しにも使えそうだという印象をもった.例えば,synonym scale を与えられている以下の126語の見出し語から適当な類義語群を選び出し,コーパスを用いて semantic_prosody の研究をするというのもおもしろそうだ.
admiration [n], afraid [a], anger [n], anger [v], angry [a], annoy [v], approval [n], bad [a], beautiful [a], cheap [a], childhood [n], close [a], cold [a], concern [n], convincing [a], crazy [a], crisis [n], defeat [v], delicious [a], delight [v], determine [v], dictate to sb [pv], disappoint [v], disapprove [v], disgusting [a], distress [n], embarrass [v], emotion [n], exciting [a], expose [v], fast [a], fat [a], fear [n], flush [v], frequent [a], friendship [n], frighten [v], frightening [a], frown [v], funny [a], gap [n], glad [a], happy [a], hate [v], hatred [n], high [av], hill [n], hot [a], hungry [a], hurt [v], hysterical [a], immediate [a], impress [v], inspire [v], interest [v], interested [a], interesting [a], ironic [a], like [v], likely [a], lonely [a], lose your temper [idiom], love [n], love [v], mad [a], magnificent [a], mean [a], mentally ill [a], minute [n], modern [a], negative [a], nice [a], odour [n], pain [n], painful [a], plain [a], please [v], pleasure [n], poor [a], possibility [n], praise [v], press [v], pressure [n], probably [adv], quite [adv], radical [a], rain [v], rape [v], recession [n], recommend [v], remarkable [a], respect [v], revenge [n], ridiculous [a], rough [a], rude [a], ruin [v], run [v], ruthless [a], sad [a], serious [a], shock [n], shock [v], show [v], small [a], smile [v], soak [v], sorry [a], star [n], strict [a], suppress [v], sure [a], surprise [v], take advantage of sb/sth [v], taste [n], tear [v], temper [n], tight [a], tired [a], ugly [a], unhappy [a], upset [a], violent [a], well [a], wet [a], worry [v]
・ American Heritage Thesaurus for Learners of English. Boston & New York: Houghton Mifflin Harcourt Publishing Company, 2002.
・ Oxford Learner's Thesaurus: A Dictionary of Synonyms. Oxford: OUP, 2008.
・ Komuro, Yuri and Yasuo Ichikawa. "An Analysis of the Oxford Learner's Thesaurus: A Dictionary of Synonyms." Lexicon 41 (2011): 11--59.
・ Oxford Advanced Learner's Dictionary. 7th ed. Oxford: OUP, 2005.
現代英語の語彙における本来語と借用語の比率については,本ブログでも何度か取り上げてきた.いくつかリンクを張っておこう.
・ [2010-12-31-1]: #613. Academic Word List に含まれる本来語の割合
・ [2010-06-30-1]: #429. 現代英語の最頻語彙10000語の起源と割合
・ [2010-05-16-1]: #384. 語彙数とゲルマン語彙比率で古英語と現代英語の語彙を比較する
・ [2010-03-02-1]: #309. 現代英語の基本語彙100語の起源と割合
・ [2009-11-15-1]: #202. 現代英語の基本語彙600語の起源と割合
・ [2009-11-14-1]: #201. 現代英語の借用語の起源と割合 (2)
・ [2009-08-15-1]: #110. 現代英語の借用語の起源と割合
語種の数量的な調査には,数え挙げる際のソースを何にするか,type-count か token-count か,どのくらいの語彙規模を扱うか,語源にまつわる不正確さをどのように処理するか,などの考慮すべき事項が様々あり,研究者によって結果がまちまちとなることがある.しかし,複数の調査を比べれば,およその平均値や全体像が見えてくるのも確かである.
先日参加してきた ICOME7 (The Seventh International Conference on Middle English) で,8月4日,OED3 の主幹語源学者 Philip Durkin 氏が "Some neglected aspects of Middle English lexical borrowing from (Anglo-)French" と題する講演で関連する話題について触れていたので,要点をメモしておく.
Durkin 氏は BNC から最頻1000語のリストを取り出し,語源分析した.その結果,英語本来語が489語,フランス・ラテン語が489語,ノルド語が32語,それ以外の言語が10語という数値が得られた.大規模コーパスの頻度リスト (see [2010-03-01-1]) を利用した語源調査はいつか自分でやろうと思っていたが,Durkin 氏のおかげでその労力を省くことができた(ありがとうございます!).
これにより,上記のリンクで示した諸調査と合わせて,type-count に基づく最頻100語,600語,1000語,2000語,3000語,4000語,5000語,6000語,7000語,8000語,9000語,10000語という12段階の語彙規模での語種別比率が得られたことになる.母体となる現代英語語彙の情報ソース,数え方,語種区分はそれぞれ異なっているのかもしれないが,一応の目安として以下で全体像を示したい.語種区分は English, French and/or Latin, Scandinavian, Other として4種類に統一した.
|
Test Your Vocab というサイトで,英語の語彙力診断テストが公開されていた.3分くらいで診断できるので,試してみた.見たことのある語でも語義がなかなか出てこないことを思い知らされた.結果として,私の語彙力は19,300語.この数値は,18歳以上の母語話者の下から10%の範囲に落ちる.15歳の英語母語話者の平均値でも23,303語というから,非母語学習者であるとはいえ,己の英語語彙力の乏しさに情けなさを感じた.地道に語彙力を増やさねばと感じた次第である.
ただ,点数以上に興味があるのは,この語彙力診断テストがどのような基準で作られており,内部でどのように計算されているのか,である.内部事情はまったく公開されていないが,研究プロジェクトの実験として設けられているサイトのようだから,事後であってもぜひ公開してもらいたいところである.というのは,Crystal (34--39) が示唆しているように,語彙力の計測は,何をもって語彙力とみなすか,何をもって語彙とみなすか,その定義にすべてがかかっているためである.特に「語彙」の覆う範囲を定めることが難しい.それは以下の問題があるからである.
(1) 語彙の基本単位である語 (word) の定義が,まずもって不明である (see [2011-03-28-1]) .複合語 (ex. flower pot, flower-pot or flowerpot?) ,句動詞 (ex. get at, get by, get in) ,idiom (ex. kick the bucket, go West ) は意味としてはひとまとまりだが,語としては1語と数えるのか否か,などの問題がある.
(2) ある語が多義語である場合,その語を見て語義を1つでも知っていればその語を知っているとみなすことができるのか,あるいはすべての語義を知っている必要があるのか.high tea, high priest, high season の high はそれぞれ異なる語義を表わすが,同じ1つの語とみなすべきか否か.
(3) ある地域変種,社会変種に特有の語彙は,語彙力診断にカウントされるべきか否か.口語,俗語,最新流行語,借用語,古語についてはどうか.「中心的な英語の語彙」に限るとしても,「中心的」の基準とは何か ([2010-12-29-1]の記事「Murray の語彙星雲」を参照).
(4) flu, hi-fi, AIDS, FBI, UFO などの各種の略語はどうか.
(5) 地名,人名などの固有名詞はどうか.固有名詞は英語に特有のものではないという理由でカウントする語彙に含まないとしても,例えばロンドンの官庁街 Whitehall は固有名詞であるばかりではなく「英国政府」を表わす普通名詞としても用いられる.
(6) 無数にある動植物名を含めた各種の専門用語はどうか.
Test Your Vocab がこれらの問題にどのような態度をとって診断テストを作成しているのかは,診断用に挙げられている単語リストからある程度推し量ることができるかもしれない.しかし,診断テスト作成の方針は,上記の理由により作成者によって互いに異なると思われ,別の診断テストがあれば別の基準で別の点数結果が出るだろう.
などと,自分の点数の言い訳をしても始まらない.まずは,20歳の平均値である25,337語を目指そう・・・.
・ Crystal, David. The English Language. 2nd ed. London: Penguin, 2002.
中英語期にフランス借用語が大量に流入してきた事実についてはすでに多くの記事で扱ってきた([2009-08-22-1]の記事「フランス借用語の年代別分布」ほかを参照).これにより英語の表現の可能性が広がったが,注目すべき表現として,英語本来語と対応するフランス借用語を並列させる2項イディオム (binomial idiom) の表現がある(バケ,p. 60).my heart and my corage, wepe and crye, huntynge and venerye の如くである.この表現は,本来語とフランス借用語の間に使用域 ( register ) の差のあることを利用した修辞的な技法ともとらえることもできるが(「英語語彙の三層構造」については[2010-03-27-1]の記事を参照),目新しい借用語の理解を容易にするための訳語として本来語を添えたとも考えられる.後者は,説明を要する語に注解 ( gloss ) を施すという古英語以来の習慣の一端と言えるかもしれない.これはまた,17世紀の難語辞書 (see [2010-12-27-1], [2010-11-24-1]) の登場にもつらなる言語文化的習慣である.近代以降では lord and master, my last will and testament などが慣用表現となっている.
なお,並列表現といっても,必ずしも and のような等位接続詞で結ばれているとは限らない.例えば court-yard (中庭)や mansion-house (邸宅)は英仏対応要素の直接複合であり,冗語的といえる.
借用語の流入は,単に既存の語を置きかえたり,語の種類を増やしたりすだけではなく,既存の語彙と連携して当該言語の表現可能性を高めている側面もあることを評価すべきだろう.関連して,英仏両要素が1語内に混合している hybrid の各記事(特に[2009-08-01-1]の「英語とフランス語の素材を活かした 混種語 ( hybrid )」)も参照.
・ ポール・バケ 著,森本 英夫・大泉 昭夫 訳 『英語の語彙』 白水社〈文庫クセジュ〉,1976年.
現代英語の最大の特徴の1つである cosmopolitan vocabulary については pde_characteristic を始めとする記事で,また時にそれを "asset" とみなす見方については批判的に[2009-09-27-1], [2010-05-22-1]の記事などで扱ってきた.関連して,現代英語語彙が借用語に満たされていることについては,[2010-05-16-1]にリンクを張った諸記事や loan_word の各記事で話題にしてきた.
英語の語彙がいかに世界的かをざっと知るには,[2009-11-14-1]の記事「現代英語の借用語の起源と割合 (2)」のグラフをみるのが手っ取り早いが,単語とその借用元言語を具体的にリスト化しておけば,なお手っ取り早い.そこで,主として Crystal ( The English Language, p. 40 and Encyclopedia, pp. 126--27 ) に基づき,他の例も多少付け加えながら,借用元言語で世界一周ツアーしてみたい.
Language | Words |
---|---|
Afrikaans | apartheid, gnu, impala, indri, kraal, mamba, trek, tse-tse |
Aleutian | parka |
American Indian | chipmunk, moccasin, pow wow, skunk, squaw, totem, wigwam |
Anglo-Saxon | God, Sunday, beer, crafty, gospel, house, rain, rainbow, sea, sheep, understand, wisdom |
Arabic | algebra, assassin, azimuth, emir, ghoul, harem, hashish, intifada, mohair, sheikh, sherbet, sultan, zero |
Araucanian | coypu, poncho |
Australian | boomerang, budgerigar, dingo, kangaroo, koala, wallaroo, wombat |
Brazilian | abouti, ai, birimbao, bossa nova, favela, jaguar, manioc, piranha |
Canadian Indian | pecan, toboggan |
Chinese | chopsuey, chow mein, cumquat, kaolin, ketchup, kung fu, litchi, sampan, tea, tycoon, typhoon, yen (=desire) |
Czech | howitzer, pistol, robot |
Dutch | bluff, cruise, easel, frolic, knapsack, landscape, poppycock, roster, slim |
Eskimo | anorak, igloo, kayak |
Finnish | sauna |
French | anatomy, aunt, brochure, castle, cellar, challenge, chocolate, crocodile, cushion, debt, dinner, entrance, fruit, garage, grotesque, increase, jewel, justice, languish, medicine, montage, moustache, passport, police, precious, prince, sacrifice, sculpture, sergeant, table, trespass, unique, venison, victory, vogue, voyeur |
Gaelic | banshee, brogue, galore, leprechaun |
German | angst, dachshund, gimmick, hamburger, hamster, kindergarten, lager, nix, paraffin, plunder, poodle, sauerkraut, snorkel, strafe, waltz, yodel, zinc |
Greek | anonymous, catastrophe, climax, coma, crisis, dogma, euphoria, lexicon, moussaka, neurosis, ouzo, pylon, schizophrenia, stigma, therm, thermometer, tonic, topic |
Haitian | barbecue, cannibal, canoe, peccary, potato, yucca |
Hawaiian | aloha, hula, lei, nene, ukulele |
Hebrew | bar mitzvah, kibbutz, kosher, menorah, shalom, shibboleth, targum, yom kippur, ziggurat |
Hindi | bungalow, chutney, dekko, dungaree, guru, gymkhana, jungle, pundit, pyjamas, sari, shampoo, thug |
Hungarian | cimbalom, goulash, hussar, paprika |
Icelandic | geyser, mumps, saga |
Irish | blarney, brat, garda, taoiseach, whiskey |
Italian | arcade, balcony, ballot, bandit, ciao, concerto, falsetto, fiasco, giraffe, lava, mafia, opera, scampi, sonnet, soprano, studio, timpani, traffic, violin |
Japanese | bonsai, geisha, haiku, hara-kiri, judo, kamikaze, karate, kimono, shogun, tycoon, zaitech |
Javanese | batik, gamelan, lahar |
Korean | hangul, kimchi, makkoli, ondol, won |
Latin | alibi, altar circus, aquarium, circus, compact, diocese, discuss, equator, focus, frustrate, genius, include, index, interim, legal, monk, nervous, onus, orbit, quiet, ulcer, ultimatum, vertigo |
Malagasy | raffia |
Malay | amok, caddy, gong, kapok, orang-outang, sago, sarong |
Maori | haka, hongi, kakapo, kiwi, pakeha, whare |
Nahuatl | axolotl, coyote, mescal, tomato, tortilla |
Norwegian | cosy, fjord, krill, lemming, ski, slalom |
Old Norse | both, egg, knife, low, sky, take, they, want |
Persian | bazaar, caravan, divan, shah, shawl, sofa |
Peruvian | condor, inca, llama, maté, puma, quinine |
Polish | horde, mazurka, zloty |
Polynesian | kava, poe, taboo, tapa, taro, tattoo |
Portuguese | buffalo, flamingo, marmalade, pagoda, veranda |
Quechuan | llama |
Russian | agitprop, borsch, czar, glasnost, intelligentsia, perestroika, rouble, samovar, sputnik, steppe, troika |
Sanskrit | swastika, yoga |
Scottish | caber, cairn, clan, lock, slogan |
Serbo-Croat | cravat, silvovitz |
Spanish | albatross, banana, bonanza, cafeteria, cannibal, canyon, cigar, cobra, cork, dodo, guitar, hacienda, hammock, junta, marijuana, marmalade, molasses, mosquito, potato, rodeo, sherry, sombrero, stampede, supremo |
Swahili | bongo, bwana, harmattan, marimba, safari, voodoo |
Swedish | ombudsman, tungsten, verve |
Tagalog | boondock, buntal, ylang-ylang |
Tamil | bandicoot, catamaran, curry, mulligatawny, pariah |
Tibetan | Koumiss, argali, lama, polo, shaman, sherpa, yak, yeti |
Tongan | taboo |
Turkish | aga, bosh, caftan, caviare, coffee, fez, jackal, kiosk, shish kebab, yoghurt |
Vietnamese | ao dai, nuoc mam |
Welsh | coracle, corgi, crag, eisteddfod, hwyl, penguin |
Yiddish | chutzpah, gelt, kosher, nosh, oy vay, schemozzle, schmaltz, schmuk |
英語史上最初の英英辞書と言われる Robert Cawdrey の A Table Alphabeticall (1604) については,[2010-12-21-1], [2010-12-22-1]の記事を始め,cawdrey の各記事で取り上げてきた.
[2010-12-27-1]の記事で概説したように17世紀は難語辞書の世紀だったが,その走りといえる Cawdrey の「難語」と,その後に続いた他の辞書編纂者の「難語」とは性質が異なる.後者を代表する Bullokar, Cockeram, Blount, Phillips の辞書は,Noyes (600) によれば "storehouses of difficult and elegant words exclusively" (赤字は引用者)だった.一方で,Cawdrey はあくまで "hard vsuall English wordes" あるいは "plaine English words" ( A Table Alphabeticall の初版タイトルページより.赤字は引用者.)を掲載したのである.彼はいたずらに難解な語ではなく,あくまで普段お目にかかる難語を収録し,辞書使用者の実用性を強く意識していたのである.これは,Cawdrey (と増補改訂者である息子の Thomas )が学校長であり教育者であったことと無縁ではない.当時の教育界のドンで英語辞書の編纂の必要性を訴えた Richard Mulcaster ([2010-07-12-1]) は,The First Part of the Elementarie (1582) で8000語ほどの単語リスト "Generall Table" を掲げたが,その多くが Cawdrey の辞書にも反映されている.この歴史的辞書の編纂が教育を目的とするものであったことが分かるだろう.
実際に A Table Alphabeticall を眺めてみると(こちらのオンライン版を参照),そのまま現代の上級英語学習者の語彙学習に役立ちそうな単語リストとなっている.現代の感覚でいうと,英検準1級?1級程度の語彙だろうか.綴字はいまだ完全には標準化していないが,案外と現代英語学習者にも使えそうな教育的な内容になっている.
また,[2010-12-22-1] の (4) で示したように,語源好きには嬉しいことに,Cawdrey は語源(といっても借用元言語の記述にすぎないが)を記載している.この粋な慣習は,Cawdrey が大いに参考にした Coote でも実践されていたが,後続の Bullokar や Cockeram では無視されていた.再開されたのは Blount の Glossographia (1656) からである (Noyes 602) .ここにも,Cawdrey の教育的な良識が感じられる.Noyes の Cawdrey 評を引用しよう.
It was unfortunate for the development of the English dictionary that succeeding lexicographers scorned the practical schoolmasters' tradition and focussed on the more eccentric and less permanent elements in the language. This attitude was, in fact, responsible for sidetracking the English dictionary for a century. (604)
・ Noyes, Gertrude E. "The First English Dictionary, Cawdrey's Table Alphabeticall." Modern Language Notes 58 (1943): 600--05.
何らかの基準で集めた英単語のリストを,一般的な頻度の順に並び替えたいことがある.例えば,[2011-03-22-1]で論じたように,頻度と不規則な振る舞いとの関係を調べたいときに,注目する語(群)の一般的な頻度を知る必要がある.この目的には,[2010-03-01-1]で紹介したような大規模な汎用コーパスに基づく頻度表が有用である.BNC lemma-pos list (122KB) や ANC word-tagset list (7.2MB) などで問題の語を一つひとつ検索し,頻度数や頻度順位を調べてゆけばよいが,語数が多い場合には面倒だ.そこで,上記2つの頻度表から,入力した語(群)の頻度と順位を取り出す CGI を作成した.
改行でもスペースでもカンマでもよいのだが,区切られた単語リストを以下のボックスに入力し,"Frequency Sort Go!" をクリックする.出力結果を頻度順位の高い順にソートする場合には,"sort by rank?" をオンにする(デフォルトでオン.オフにすると,入力順に出力される).例えば,現代標準英語に残る純粋に i-mutation を示す複数形は以下の7語のみである(複合語,二重複数,[2011-04-01-1]で話題にした sister(e)n は除く).これをコピーしてボックスに入力する.
foot, goose, louse, man, mouse, tooth, woman
昨日の記事[2011-02-22-1]に引き続き,COCA ( Corpus of Contemporary American English ) に基づく単語の頻度リストを利用したパイロット・スタディ.今回は,こちらで最近になって追加された最頻50万語のリストを用いて,昨日と同様の品詞別割合を調べた.昨日のリストは見出し語 ( lemma ) に基づいた最頻5000語,今日のリストは語形 ( word form ) に基づいた最頻50万語(正確には497187語)で,性格が異なることに注意したい.
昨日とほぼ同じ作業だが,今回は2万語ずつで階級を区切り,L1からL25までの階級のそれぞれにおいて noun, verb, adj., adv., others の5区分で品詞別割合を出した.(数値データはこのページのHTMLソースを参照.)
L6(12万語レベル)辺りから品詞別比率は安定期に入るといってよいだろう.L17(34万語レベル)辺りから変動期が始まるのが気になるが,階級幅を大きくしてみると(ならしてみると)直前のレベルから大きく逸脱していない.
[2011-02-16-1]の記事以来,形容詞の比率が気になっているが,今回のデータ全体から計算すると,0.1738という値がはじきだされた.昨日の lemma 調査では0.1678だったから,値は非常に近似している.ただし,名詞と動詞の lemma 対 word form の比率は,名詞が 0.5086 : 0.6985,動詞が 0.2000 : 0.1065 と大きく異なるので,形容詞の 0.1678 : 0.1738 という近似は偶然かもしれない.lemma 対 word form の品詞別割合には異なる傾向があるのかもしれないが,それでも大規模に調べると安定期と呼びうる区間が出現することは確かなようだ.
[2011-02-16-1]の記事で触れたように,中英語期のフランス借用語における形容詞比率は0.1768だった.今回の値0.1738と酷似しているが,主題の性質がまるで違うので,直接の関係を論じることは無理である.もとより昨日と今日の調査は,[2011-02-16-1]の調査とは無関係に始めたものである.しかし,偶然と思えるこの結果は,示唆的ではある.借用語彙といえば名詞が圧倒的なはずだと予想していたものの,フランス語や古ノルド語からはおよそ一定の割合の形容詞(それぞれ lemma 調査で0.1768と0.1817)が借用されていた.そして,その比率は時代が異なるとはいえ現代英語の比率と近似している.英語語彙全体における比率と借用語彙における比率が近似しているということは,もし偶然でないとしたら,何を意味するのだろうか.フランス借用語彙や古ノルド借用語彙が,英語に適応するような自然な比率で英語語彙へ溶け込んだということだろうか.これは,今回のパイロット・スタディの結果を受けての印象に基づく speculation にすぎない.今後も品詞別割合という観点に注目していきたい.
COCA ( Corpus of Contemporary American English ) に基づいた各種語彙リストが Corpus-based word frequency lists, collocates, and n-grams から入手できる.そのなかで最も基本的なリストが,こちらの最頻5000語リストである.列挙されているのは見出し語 ( lemma ) 単位で,順位はコーパスに現われる頻度と分散の関数で計算されている.UCREL CLAWS7 Tagset の品詞コード表に基づいた粗い品詞情報も付与されており,品詞別の頻度などを手軽に分析することができる.
今回は,500語ごとに区切って頻度の高い順にL1からL10までの階級を設け,それぞれの階級における品詞別割合を出した.品詞は開いた語類 ( open class ) を中心とし,noun, verb, adj., adv., others の5区分とした.(数値データはこのページのHTMLソースを参照.)
第1階級を除き,どの階級でも名詞が過半数を占めているのは予想できたことだが,第2階級以降に名詞の割合が思ったほど伸びていないことが分かった.動詞と形容詞が後半の階級でもおよそ一定の割合を占め続けているのも予想外だった.全体として,最頻5000語リストに限れば,名詞が飛び抜けつつも,開いた語類の内部比率はおよそ一定に保たれているといえよう.階級幅を様々に動かして試してみたが,およそ安定期に入るのは500語以降と見てよさそうだ.
[2011-02-16-1]の記事で中英語期のフランス借用語の品詞別割合をみたが,全体としての形容詞比率は0.1768だった.今回の現代英語の最頻5000語では,全体としての形容詞比率は0.1678.比べて意味のある数値かどうかは分からないが,英語(言語?)における品詞別比率の「安定感」のようなものはあるのだろうか.
COCA に基づくもの以外にオンラインで入手できる最頻英単語リストについては[2010-03-01-1]の記事を参照.頻度表を利用した別のパイロット・スタディとしては,単語の音節数を扱った[2010-04-17-1]の記事を参照.
古英語の語彙が現代までにどれだけ残存しているか,どれだけ消失したかについては[2010-07-21-1]の記事で話題にした.古英語語彙の大規模な消失は,英語が中英語期以降にフランス語を始めとする様々な外国語から語彙的な影響を受け,多くの本来語が借用語で置き換えられるに至ったとして説明されることが多いが,消失傾向を促進するある特徴が古英語語彙体系に内在していたと考えることもできるかもしれない.バケから,古英語語彙の消失について述べている箇所を引用しよう.
もう一つの消失の原因は,疑いもなく,同じ概念系統の語形の中に存在していた封建的関係である.ある語が消失していく度に,語群全体がそれとともに分解してきた.これは情熱を抱くに足る研究であり,ぜひとも奨励しておきたい.古期英語の実詞 þeod 「国民,種族」およびその複合語あるいは派生語は,発生的に þeoden 「首長,王子,王」および( geþeode 「(話し)ことば」と結びついていたが,それらの政治・文化上のすべての親族関係語とともに消えてしまった.Wer 「男,英雄,亭主」および werod 「大勢,軍団」についても同様である.この点について,古期英語辞典を引くこと以上に示唆を得るものはない.ある用語が衰えると語彙面全体が崩れ落ちてしまう.その原因は多様で,しばしば社会学的であったり,政治的であったりする.(22)
þeod は古英語では高頻度語かつ基本語であり,これに基づいた複合語や派生語が数多く存在した.þeod を中心とした関連語彙が,古英語話者の「国」観,「民族」観,ひいては世界観を表現していたといっても過言ではない.しかし,þeod という語自体が何らかの事情で徐々に衰退し,ついには消失してしまうと,独特な世界観を構成していた扇の要が壊れてしまうことになり,関連語彙もその存在基盤を失うことになる.はたして,þeod の世界観全体が忘れられることになるのである.皮肉なことに,古英語の語形成は基底となる語を元にした複合 ( composition ) と派生 ( derivation ) によって特徴づけられるために,基底語が消失してしまうと関連語彙も総崩れとなりがちだということである.
バケが基底語(主)と関連語彙(従)との関係を「封建的関係」と呼んでいるのは興味深い.君主が崩れることによって家臣すべてが総崩れとなり,封建制(=世界観)そのものが機能しなくなるという巧みな比喩が,この表現に隠されている.
基底となる þeod が消失した原因は様々だろうが,1つには次々に現われてきた類義語からの圧力が作用したと思われる.Historical Thesaurus of the Oxford English Dictionary によると,þeod の類義語は "the external world > the living world > people > people > [noun]" の項に見つけることができる.18語の歴史的類義語を初出年とともに提示しよう.
word | first year |
---|---|
thede | 855 |
folk | c888 |
lede | 971 |
mannish | OE |
birth | a1300 |
nation | c1330 |
people | a1375 |
tongue | 1382 |
race | 1572 |
family | 1582 |
the mass | 1621 |
public | 1709 |
nationality | 1832 |
peoplet | 1872 |
peoplehood | 1879 |
La Raza | 1927 |
ethnic minority (group) | 1945 |
ethnogenesis | 1962 |
日本語の「死語」は,英語でいう "dead language" と "obsolete word" の2つの語義を兼ねる.『明鏡国語辞典』によると,
(1) 昔は使われていたが,現在では使用されていない言語.古代ギリシア語・ヒッタイト語など.
(2) 昔は使われていたが,現在,一般には使用されなくなった語.廃語.
以下,この記事では (1) を「死語」,(2) を「廃語」と呼び分けることにする.死語については,このブログでも language_death の各記事で取り上げてきた.ある言語が死滅するという場合には,生物種の絶滅と同様に,センチメンタルな感情が伴うものである(と信じたい).言語にはその話者共同体の思想,文化,歴史が詰まっており,言語が消滅するということは(記録が残されていない限り)その知的遺産が永遠に失われるということである.言語の死は人類にとっての損失である.
一方,廃語についてはブログで明示的に話題にしたことはあまりなかった.言語の死に比べれば,単語レベルの消滅は通常センチメンタルな現象とはとらえられないだろう.言語そのものが消滅するわけではなく,小さな断片が失われるだけなので,至極当然かもしれない.しかし,単語にも言語共同体の思想,文化,歴史が凝縮されているのであり,その消滅は,取り戻すことの難しい知的遺産の消滅であると考えることができる.話題性の大小はあるものの,豊かな言語的感受性をもってすれば,死語も廃語も質的には同等の損失なのかもしれない.
このように思ったのは,豊かな言語的感受性を示すポール・バケの文章に出会ったからである.バケは,語の消失や語義の変化について次のように評している.
しかし消失の過程の期間がどうであれ,語の死滅は決定的と言わぬまでも現実のものであり,その死なるものが人間や文明に訪れるときと同じように,ここでも人の心を打つのである.この死とともに,ある世界全体が,あるいは文化的,感情的,概念的存在の一断片が姿を消していくのである.たとえある別の1語あるいは数語が遺棄された土地を引き受け,失われた語の意味領域を取戻すことがあるにせよ.たとえ意義の上から実際には何も失われていないにせよ,文脈はもはや同一ではなく,意味の移行がなされるのは数年のうちのことでしかない.それ故,すべてが変貌し,そして人々が変わり,世代もまた代わって,語の意味は,このしばしば無意識であるとはいえ,たゆみなき進化の影響を受けるのである.(16--17)
語の消失や語義の変化にいちいち感傷的になっていては言語生活を営むことすらおぼつかないと言ってしまえばそうなのだが,語の研究に関する限りこのような感受性は必要なのだろうなと思う.
さて,「廃」を表わす英語の obsolete は,ラテン語 obsolescere の過去分詞 obsolētus に由来し,16世紀に英語に借用された.ob- 「完全に」+ sol(ere) 「慣れる」 + ēscere 「?し始める」と形態分析され,その過去分詞形は全体として "grown out, worn out, fallen into disuse" ほどの意となる.OED では,廃語の見出しには短剣符 ( dagger or obelisk ) と呼ばれる「†」の標識がつけられる.短剣符は十字架の立った墓の象形に由来すると思われ,慣習的に没年を表わすのに用いられるので,廃語を標示するのにもふさわしいということだろうか.
余談だが,近年の日本語の死語(=廃語)を収集したサイト死語's HomePageを発見した.その「ナウな死語辞典」に収録されている語句の数々に共感を覚えた.あったなあ,あんな言葉,こんな言葉.
・ ポール・バケ 著,森本 英夫・大泉 昭夫 訳 『英語の語彙』 白水社〈文庫クセジュ〉,1976年.
英語の新語ウォッチには Paul McFedries によるサイト Word Spy が注目に値する.1996年以来,新語が日々追加されており,現時点で2750以上の新語が登録されている.最大の特徴は,ほとんどの新語(全体の約85%)について用例と出典が与えられており,多く(全体の約73%)は初出年も記されていることだ.
サイトを走査し,初出年の記載のある2019個について初出年ごとに数え上げてみたのが次の棒グラフである.連続して50例を超えているのは1987--2006年の20年間で,特に1990年代は層が厚い.
1962 ( 1) 1963 ( 1) 1964 ( 1) 1970 ( 1) 1972 ( 2) * 1973 ( 3) * 1975 ( 5) ** 1976 ( 8) **** 1977 ( 11) ****** 1978 ( 14) ******* 1979 ( 16) ******** 1980 ( 24) ************* 1981 ( 33) ****************** 1982 ( 32) ***************** 1983 ( 39) ********************* 1984 ( 38) ********************* 1985 ( 54) ****************************** 1986 ( 47) ************************** 1987 ( 59) ******************************** 1988 ( 66) ************************************ 1989 ( 67) ************************************* 1990 ( 77) ****************************************** 1991 ( 78) ******************************************* 1992 ( 83) ********************************************** 1993 ( 72) **************************************** 1994 (100) ******************************************************* 1995 (101) ******************************************************** 1996 (101) ******************************************************** 1997 ( 87) ************************************************ 1998 ( 78) ******************************************* 1999 (109) ************************************************************ 2000 ( 85) *********************************************** 2001 (111) ************************************************************* 2002 ( 87) ************************************************ 2003 ( 66) ************************************ 2004 ( 57) ******************************* 2005 ( 56) ******************************* 2006 ( 61) ********************************** 2007 ( 32) ***************** 2008 ( 33) ****************** 2009 ( 14) ******* 2010 ( 9) *****
今年もこの時期がやってきた.American Dialect Society による流行語大賞の公表の時期だ.2009年は[2010-01-14-1]の記事で紹介したように tweet が大賞に選ばれたが,2010年は app だった.
詳しくは1月7日付けのADS による公式発表とプレスリリース (PDF)を参照されたいが,問題の語の定義は以下の通りである.
"app" --- noun, an abbreviated form of application, a software program for a computer or phone operating system
app は日本語では「アプリ」としてすでに広く認知されている.この英単語は OED では初出1985年として見出し語に採用されており,決して新しい語ではない.しかし昨年はコンピュータだけでなく iPhone, iPad などの電子端末に対応するアプリケーションの需要が激増し,app store なるオンライン店舗も目立つようになってきた.2年続けてITサービス関連の語が受賞という事実に,時代の波を感じる(「IT」というかつての流行語はすでに古いかも).
他のノミネート語や部門ごとの受賞語を眺めてみると特にアメリカの,しかししばしば世界的な世相が分かる.Wikileaks や vuvuzela の如くである.ネット関連でよく使われる動詞としての trend "to exhibit a burst of online buzz" が MOST LIKELY TO SUCCEED 部門での受賞となったのもなるほどと思わせる.
ADS では Word of the Year for 2010 と合わせて,姉妹大賞である Name of the Year for 2010 の投票も行なわれた.後者を受賞したのは,本ブログの[2010-04-20-1]の記事でも触れた,アイスランドの火山 Eyafjalljökul だった.
ADS の 新語委員会委員長の Ben Zimmer は,[2010-08-11-1]の記事で紹介した Visual Thesaurus の製作責任者でもある.
[2011-01-03-1], [2011-01-04-1]の記事で,OED 検索語彙を初出世紀ごとに分類して数え上げるという作業を行なった.よく考えてみると,このような作業はこれまでにも様々な調査・研究で繰り返し行なってきたことである.通時的語彙研究の基礎作業として今後も繰り返し行なう作業だと思われるので,OED の出力結果をもとに世紀ごとに数え上げるためのツールを作っておくことにした.名付けて "OED Century-by-Century Sorter".
以下は使用方法の説明だが,The Oxford English Dictionary. 2nd ed. CD-ROM. Version 3.1. Oxford: OUP, 2004. での作業を前提としている.ヴァージョンが異なると動かないかもしれないのであしからず.
(1) OED の ADVANCED SEARCH 等により,特定の条件に該当する語彙リストを出力させる.
(2) 下のテキストボックスに,(1) の検索に適当につけた簡便なタイトルを,ピリオド1文字の後に続けて入力する.例えば ".alchemy" .これが見出し行となる.
(3) テキストボックスで改行後に,(1) の出力結果を丸ごとコピーして貼り付ける.OED での出力結果が1画面に収まらない場合には次ページに進んで累積コピーし,テキストボックスに累積して貼り付けてゆく.年代順にソートされていなくても可.
(4) 続けて別の検索を行なう場合には (1), (2), (3) の作業を繰り返す.テキストボックスには,貼り付けたテキストが累積されてゆくことになる.
(5) Go をクリックすると,各検索結果について世紀ごとにカウントされた表が現われる.
説明するよりも実例を見るのが早いので,こちらのテキストファイルを用意した.これは,OED の ADVANCED SEARCH で "language names" にそれぞれ Japanese, Chinese, Malay, Korean, Vietnamese を入れて検索した結果の語彙リストを上記の仕様で納めたもの.これらの言語からの借用語数を世紀ごとに把握するのが狙いである.もっとも,OED の検索機能の限界で,それなりの数の雑音が結果リストに混じっているのでその点には注意.この(ような仕様に則った)テキストをコピーして,以下のテキストボックスに貼り付け,Go をクリックすれば表が出力される.
CGI スクリプトは大雑把な仕様なので,およその傾向を知るためのツールとして参考までに.特に以下の点に注意.
・ 初出年が "a1866", "c1629", "15..", "?c1400" などとなっている語はそれぞれ19, 17, 16, 14世紀へ振り分けられる
・ 初出年の記載のない語は一括して「0世紀」として振り分けられる
(後記 2011/04/24(Sun):OED Online の Timeline 表示では,初出世紀の頻度をグラフ化までしてくれるので,今回の CGI よりも使い勝手がよい.ただし,CD-ROM版の OED で作業するときや,設定に細かいチューニングが必要な場合のために自作した.)
昨日の記事[2011-01-03-1]に引き続き,科学語彙など専門分野の語彙の初出世紀を OED で調べるという話題.近代以前に発展していた学術分野の語彙がどのような通時分布を示していたかについて,昨日は anatomy と math を例に挙げてグラフで示した.同じ手法で,やはり中世によく発達した music, astronomy, astrology, rhetoric, alchemy の各分野について語彙の初出世紀を整理してみた.definitions 欄に入れて検索した各分野の略記は "Mus.", "Astr." / "Astron.", "Astrol.", "Rhet.", "Alch." である.(数値データはこのページのHTMLソースを参照.)
いずれも前近代的な専門分野らしく,近代科学の語彙が爆発する19世紀ではなく,14世紀や16世紀に初出のピークが来ている.それにしても,alchemy を除いた4分野のグラフが驚くほどきれいに平行しているのは示唆的である.15世紀にこぞって落ち込んでいる理由は分析していないが,各分野の発展史を参照して説明されるものなのか,あるいは OED の資料としての何らかの特徴が反映されているがゆえなのか.alchemy に関しては専門用語そのものの数が多くないので断定はできないが,14, 15世紀辺りにピークが来ている.
OED が文化史の研究に利用できるということは耳にしていたが,今回いろいろと具体的に作業してみて実感がわいてきた.語彙体系は文化の索引である.
ルネサンス以降,近代英語期には科学語彙が爆発的に増殖した.特に19世紀は科学の発展がめざましく,おびただしい科学用語が出現することとなった.これには,18世紀後半から博物学でリンネの二名法が用いられるようになったことも影響している ( see [2010-09-21-1] ) .
科学の諸分野の発達とその語彙の増殖は連動していると考えられるので,OED で専門語彙の初出時期を調べてまとめれば,その分野の発展史の概略をつかむことができるのではないかと考えた.18世紀以前にすでに十分に発展していた分野もあるわけで,そのような分野では19世紀中の専門語彙の増殖は相対的に小さいはずである.そこで,18世紀以前に発展していたと分かっている解剖学と数学,19世紀に著しく発展したと分かっている化学と生物学に注目して,OED からそれぞれの分野からの専門用語を拾って整理してみた.
拾い方は,それぞれ ADVANCED SEARCH の definitions 欄に "Anat.", "Math.", "Chem.", "Biol." が含まれる語という粗い条件指定によるものであり,検索結果リストも逐一チェックはしていない.各語は初出年によって世紀ごとに振り分け,"a1866", "c1629", "15.." などはそれぞれ19, 17, 16世紀へ振り分けた.また,初出年の記載のないものは考慮から外している.このように大雑把な調査なので,あくまで参考までに.以下が,結果の表とグラフである.(数値データはこのページのHTMLソースを参照.)
chemistry と biology は19世紀に初出語彙のピークが来ているが,anatomy と math はそれぞれ17, 16世紀にピークがある.後者2分野は確かに19世紀にも山があるので,科学語彙が爆発した世紀という一般論は当てはまるが,個々の分野によって語彙増殖の傾向の異なることがわかる.
今回はすでに発展史の概略がよく知られている4分野を取り上げ,OED によってその語彙増殖を確認したにすぎないが,他の専門分野で同様の調査を施してみるとおもしろい結果が出るかもしれない.関連する話題として,SOED を用いた「1500--1900年における英語語彙の増加」について,[2009-11-16-1]を参照.
・ Crystal, David. The Cambridge Encyclopedia of the English Language. 2nd ed. Cambridge: CUP, 2003. 87.
昨日の記事[2010-12-30-1]で,Academic Word List (AWL) を導入した.この英語史ブログとして関心があるのは,AWL と銘打って収集されたこの語彙集のなかに本来語要素からなる語がどれだけ含まれているかという問題である.570語をざっと走査したら,以下の45語が挙がった.
acknowledge, albeit, aware, behalf, draft, forthcoming, furthermore, goal, hence, highlight, income, input, insight, layer, likewise, network, nevertheless, nonetheless, notwithstanding, offset, ongoing, outcome, output, overall, overlap, overseas, seek, shift, so-called, sole, somewhat, straightforward, tape, target, task, team, thereby, trend, undergo, underlie, undertake, welfare, whereas, whereby, widespread
570語中の45語で7.89%なので,予想通りに本来語の割合は少ない.しかし,数える前にはもっと小さい値が出るのではないかと踏んでいたので,意外に少なくないなと感じたのも事実である.Academic Word List というからには Greco-Latin の語がそれこそ100%に迫り,本来語は10語もあれば多いほうかと思い込んでいたのである.だが,本来語のリストを眺めていてなるほどど思った.out- や over- を接頭辞としてもつ実質的な語のカテゴリーが目立つ一方で,albeit, furthermore, hence, likewise, nevertheless, nonetheless, notwithstanding, thereby, whereas, whereby などの機能的・文法的なカテゴリーも目につく.forthcoming, ongoing, overall, so-called などの複合要素からなる形容詞も1カテゴリーをなしていると考えられるだろう.
ただし,本来語とはいっても古英語起源であるとは限らない.例えば,output などは1839年が初出である.上で最初に「本来語要素からなる語」と表現したのはそのためである.
なお,明確に本来語とはみなせないが Greco-Latin でもない語としては,古ノルド語からの借用語 bond, bulk, link, odd やオランダ語からの借用語 trigger があった.語源不詳のものとしては job もある.
現代英語の語彙数と起源別割合については,以下のリンクも参照.
・ [2010-06-30-1]: 現代英語の最頻語彙10000語の起源と割合
・ [2010-03-02-1]: 現代英語の基本語彙100語の起源と割合
・ [2009-11-15-1]: 現代英語の基本語彙600語の起源と割合
・ [2009-11-14-1]: 現代英語の借用語の起源と割合 (2)
英語教育や辞書学の分野で Academic Word List (AWL) という語彙集が知られている.1998年に Avril Coxhead が The Academic Corpus という350万語からなる独自コーパスをもとに英語教育用に開発した570語とその派生語(合わせて word family と呼ばれる)からなる語彙集で,高等教育で用いられる頻度の高い語からなっている.
もう少し詳しく AWL の語彙選定基準を記せば次のようになる.(1) 各 word family がコーパスの Arts, Commerce, Law, Science 部門のサブセットすべてにおいて生起し,かつ細分化された28分野のサブセットの過半数に生起する.(2) 各 word family の出現頻度がコーパス全体で100回を超える.(3) 各 word family がコーパスの各部門で最低10回は生起する.(4) GSL ( General Service List ) (1953) の最頻2000語は除く ( see [2010-03-02-1] ) . (5) 固有名詞は除く.(6) et al, etc, ibid などの最頻ラテン語表現は除く.
こうして厳選された語彙集が AWL で,AWL Headwords から閲覧およびダウンロードできる.word family の頻度の高い順に1から10の Sublists としてグループ分けされており,すべて合わせるとコーパス全体に生起する語の9.8%を覆うという.
最近の上級者用英英辞書は軒並み AWL の重要性を認識しているようだ.2006年出版の Longman Exams Dictionary を皮切りに,2007年の Longman Advanced American Dictionary, 2nd ed.,2009年 Longman Dictionary of Contemporary English, 5th ed. など売れ筋辞書でも AWL が考慮されている ( Dohi et al., p. 174 ) .Macmillan, Collins COBUILD 系でも同様である.目下の AWL の評価は Dohi et al. によると以下の通りである.
It remains to be seen whether Coxhead's AWL will continue to be used, will be revised or replaced in future advanced learners' dictionaries, because not all scholars concur with her AWL. . . . The AWL could be regarded for the time being as "a quick reference" for academic vocabulary until more research bears fruit . . . . (100)
関連して The AWL Highlighter なるツールがあり,ここに英文テキストを入れると,AWL 語彙をハイライトしてくれる.私が最近書いた英語論文のイントロ部の1235語で試してみたら,Sublist 10 までのレベルで128語がハイライトされた.これは全体の10.36%であり,academic 度は合格か!?
・ Dohi, Kazuo, Tetsuo Osada, Atsuko Shimizu, Yukiyoshi Asada, Rumi Takahashi, and Takashi Kanazashi. "An Analysis of Longman Dictionary of Contemporary English, Fifth Edition." Lexicon 40 (2010): 85--187.
Murray は OED 初版第1巻 (1884) の序文に寄せた "General Explanations" (xvii) で,英語語彙の広がりを次のように表現した.
. . . the English Vocabulary contains a nucleus or central mass of many thousand words whose 'Anglicity' is unquestioned; some of them only literary, some of them only colloquial, the great majority at once literary and colloquial, --- they are the Common Words of the language. But they are linked on every side with other words which are less and less entitled to this appellation, and which pertain ever more and more distinctly to the domain of local dialect, of the slang and cant of 'sets' and classes, of the peculiar technicalities of trades and processes, of the scientific terminology common to all civilised nations, of the actual languages of other lands and peoples. And there is absolutely no defining line in any direction: the circle of English language has a well-defined centre but no discernible circumference.
これを図示すると,以下のようになる(Murray の図をもとに作成).
Murray のこの語彙配置は,中心部には星が集まっているが周辺部に向かうにつれて星がまばらになり闇へと消えてゆく星雲に喩えられる.また,この図は,上から下へ向かって LITERARY, COMMON, COLLOQUIAL, SLANG と語彙の基本的な階層関係を示している点でもすぐれている.
世界一の規模を誇る,茫漠たる英語の語彙を論じるにあたっては何らかの理論的な枠組みが必要だが,Murray のこの "nebulous masses" のイメージはその枠組みとして有用だろう.もちろん様々な微調整は必要かもしれない.例えば LITERARY の上方に ARCHAIC や OBSOLETE という方向の矢印を追加的に想定してもよいかもしれないし,固有名詞はこの図の背後あるいは別次元に存在していると考える必要があるだろう.新語は新たに生まれる星に喩えられるが,星雲のどの辺りに生まれるかは定かではない,等々.
・Hughes, G. A History of English Words. Oxford: Blackwell, 2000. 2--3.
Powered by WinChalow1.0rc4 based on chalow