hellog〜英語史ブログ     ChangeLog 最新     カテゴリ最新     前ページ 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 次ページ / page 12 (15)

lexicology - hellog〜英語史ブログ

最終更新時間: 2019-10-13 11:14

2011-09-18 Sun

#874. 現代英語の新語におけるソース言語の分布 [loan_word][lexicology][pde][pde_language_change][statistics]

 昨日の記事「現代英語の新語における複合と派生のバランス」 ([2011-09-17-1]) で取り上げた Bauer の調査は,現代英語の新語を構成する要素の起源,つまりソース言語をも考慮に入れている (32--33, 34--36) .(データはHTMLソースを参照.)
 新語における借用比率は,1880--1913, 1914--38, 1939--82年の3期にわたり 31.4% -> 22.3% -> 19.2% と大きく目減りしている.現代英語においては,中英語や初期近代英語に比べ,全体的に借用に依存する程度が急減しているのがわかる.借用元言語ごとに状況を見てみよう.以下のグラフは,Bauer (35) に掲載されている表に基づいて作成したものである.

Source of Loanwords over a Century

 統計的には Fr. (French) と Grmnc (Other Germanic) において p < 0.05 のレベルで減少の有意差が認められるものの,特定のソース言語が全体的な減少に関与しているというよりは,ソース言語にかかわらず全般的に減少傾向が続いているものと読める.
 注意すべきは,1880--1913年の Other カテゴリーが際立っていることだ.ここには,オーストラリア,ポリネシア,アメリカの土着言語からの借用が多く含まれているという.なぜこの時期にこれらの言語からの借用が多かったかという問題は,別途調査して考察する必要があるだろう.
 Bauer の第3期の終了年である1982年より,約30年が経過している.以後,英語の借用離れは続いているのだろうか.これも興味深い問いである.

 ・ Bauer, Laurie. Watching English Change: An Introduction to the Study of Linguistic Change in Standard Englishes in the Twentieth Century. Harlow: Longman, 1994.

[ | 固定リンク | 印刷用ページ ]

2011-09-17 Sat

#873. 現代英語の新語における複合と派生のバランス [romancisation][compound][derivation][lexicology][pde][word_formation][productivity][statistics][pde_language_change]

 英語語彙の歴史は,供給源という観点から,大雑把に次のように概括される.古英語では複合 (composition) と派生 (derivation) が盛んだったが,中英語から初期近代英語にかけては借用 (borrowing) が著しく,後期近代英語以降は再び複合と派生が伸張してきた.この語彙史の流れを受けて,現代は新語の供給源を,借用よりも既存要素(それ自体は本来語とは限らない)の再利用に多く負っている時代ということになる.では,現代英語を特徴づけるとされる複合と派生の2つの語形成では,どちらがより生産性が高いといえるだろうか.Potter (69--70) は,両者のバランスはよく取れていると評価している.

German and Dutch, like ancient Greek, make greater use of composition (or compounding) than derivation (of affixation). French and Spanish, on the other hand, like classical Latin, prefer derivation to composition. Present-day English is making fuller use of both composition and derivation than at any previous time in its history.


 もちろん,両者のバランスが取れているからといって他言語よりも優れた言語ということにはまったくならない.ただし,ゲルマン語派とロマンス語派の語形成の特徴を兼ね備えていることにより,英語がいずれの立場からも「近い」言語と感じられるという効果はあるかもしれない(関連する議論は[2010-05-27-1]の記事「英語のロマンス語化についての評」を参照).ゲルマン系でもありロマンス系でもあるという現代英語の特徴は,語形成に限らず語彙全体にも言えることである.
 さて,Potter は上記のように複合と派生の好バランスを指摘したが,生産性を量的に測ったわけではなく,他の主要なヨーロッパ語あるいは古い英語との比較において評価したにすぎない.この点についてより客観的に調査したのが,Bauer (32--33, 36--39) だ.Bauer は The Supplement to the Oxford English Dictionary (1972--86) を用いた無作為標本調査で,対象に選ばれた本来語要素から成る新語1559語を初出年により (1) 1880--1913, (2) 1914--38, (3) 1939--82 の3期に区分して,造語法別に語を数えた.区別された造語法とは,Abbreviations, Blends, Shortenings, Compounds, Prefixation, Suffixation, Names, Neo-classical compounds, Simultaneous prefix and suffix, Other の10種類である.
 Bauer (38) の掲げた表のデータを Log-Likelihood Tester, Ver. 2 に投げ込んで統計処理してみた(データはHTMLソースを参照;グラフは以下を参照.).全体として時期別の差は p < 0.05 のレベルで有意であり,分布の通時的変化が観察されると言ってよいだろう.次に造語法別に変化を見てみると,Abbreviations が p < 0.01 のレベルで有意な増加を示し,Suffixation と Neo-classical compounds がそれぞれ p < 0.05 のレベルで有意な減少を示した.その他の造語法については,3期にわたる揺れは誤差の範囲内ということになる.Bauer (37--38) は,Blends の増加を有意であると示唆しており,しばしば指摘される同趣旨の傾向を支持しているようだが,計算上は p < 0.05 のレベルでも有意差は認められなかったので注意が必要である([2011-01-18-1]の記事「blending の拡大」を参照).

Processes of Word-Formation: Changes over a Century

 複合系 (Compounds, Neo-classical compounds) と 派生系 (Prefixation, Suffixation, Simultaneous prefix and suffix) で比べると,3時期を通じて後者の割合は前者の割合の2.7倍程度で圧倒している(以下のグラフを参照).数値的には,派生のほうにバランスが偏っているようだ.

Composition and Derivation: Changes over a Century

 ・ Bauer, Laurie. Watching English Change: An Introduction to the Study of Linguistic Change in Standard Englishes in the Twentieth Century. Harlow: Longman, 1994.
 ・ Potter, Simon. Changing English. London: Deutsch, 1969.

[ | 固定リンク | 印刷用ページ ]

2011-09-09 Fri

#865. 借用語を受容しにくい語彙領域は何か [french][loan_word][lexicology]

 バケ (66) は,中英語期のフランス語彙の大量借用について概説しながら,次のような印象的な指摘をしている.

フランス語によってひどく影響を受けた語彙場と並んで,フランス語によって,ほとんど,あるいは全然特質化されてこなかった場を究明しうることは感激であるといえよう.


 中英語期にフランス語の語彙的影響がいかに大きかったかという議論は無数にあるが,その中にあって英語が影響を受けなかった語彙領域は何かと問う視点は新鮮である.中英語のフランス語に限らず,英語史を通じて諸言語より甚大な語彙的影響を受けながらも,英語語彙は本来語要素を25%程度は保ってきた([2011-08-20-1]の記事「現代英語の語彙の起源と割合」を参照).ラテン語であればキリスト教用語,フランス語であれば法律用語や貴族用語,イタリア語であれば音楽用語など,借用語が特定の語彙領域に顕著である事実については,英語史のどの概説書でも述べられている.しかし,逆に本来語が生きながらえた語彙領域は何かという観点からの記述は,基本語や機能語に言及する以外では稀である.
 だが,基本語や機能語であっても借用語に置換される例はいくらでもある.father, mother, brother, sister, son, daughter, child は基本語かつ本来語だが,uncle, aunt, nephew, niece, cousin, grand-(father/mother) は基本語ではあるが借用語だ(あるいは2--3親等が基本的か否かの分かれ目か?).he -- his -- him は本来語だが,they, -- they -- them は借用語である.反対に,借用語が活躍すると予期される語彙領域に本来語が残っている例もある.例えば,ラテン語やギリシア語に占領されているキリスト教関連の語彙領域(「古英語期に借用されたラテン語」[2009-05-30-1])にあって,その中心を占めるはずの God はなぜ本来語のままなのか.heavenhell も本来語である (Baugh and Cable 90--91) .ノルマン征服によりもたらされた大陸風の王侯貴族の慣習をとりまく語彙の場は court, noble, prince, royal などのフランス借用語で埋め尽くされたが,その中心を占めるはずの kingqueen はなぜ本来語のままなのか.これらは,単純に基本語だから本来語を保ったという議論では済まされないのではないか,と疑わせる例である.どの語彙領域が借用を受けやすいかだけではなく,どの領域が借用を受けにくいのかを明らかにすることは,語彙史研究のみならず文化史研究の重要な課題だろう.

 ・ ポール・バケ 著,森本 英夫・大泉 昭夫 訳 『英語の語彙』 白水社〈文庫クセジュ〉,1976年.
 ・ Baugh, Albert C. and Thomas Cable. A History of the English Language. 5th ed. London: Routledge, 2002.

Referrer (Inside): [2013-10-02-1]

[ | 固定リンク | 印刷用ページ ]

2011-08-22 Mon

#847. Oxford Learner's Thesaurus [lexicography][dictionary][thesaurus][lexicology][synonym][semantic_prosody]

 英語には数多くの類義語辞典 (thesaurus) があり,[2010-08-11-1]の記事「toilet の豊富な婉曲表現を WordNet と Visuwords でみる」で示したようにオンライン版辞書や類義語の視覚化ツールも少なからず存在する.歴史的類義語辞典としても,近年 HTOED (Historical Thesaurus of the Oxford English Dictionary)TOE (A Thesaurus of Old English) が公開されており,活況を呈している.
 共時的にも通時的にも英語語彙の研究環境は著しく整ってきているが,外国語としての英語の学習環境という観点からは類義語辞典の役割はこれまであまり目立ってこなかった.学習の観点からの類義語の解説については,OALDLDOCE などの老舗学習者用英英辞書も力を入れてきており,発信用の英語学習にも役立つおもしろい解説が増えてきたが,類義語の列挙と解説に特化した学習者用類義語辞典というものはあまり出版されていなかった.唯一,American Heritage Thesaurus for Learners of English (2002) があったくらいだが,2008年になって標題の Oxford Learner's Thesaurus (OLT) が出版された.この辞書は私の手元にもあったが,これまで特に強い関心はなく,意識的に開いたことはほとんどなかった.だが,最近 Komuro and Ichikawa による OLT の辞書分析を読んで,学習者用類義語辞典に興味がわいてきた.辞書は特徴を知っておくことが重要なので,以下に OLT について知っておいてよい点を,Komuro and Ichikawa を参照しながらいくつか挙げておきたい.

 ・ OLT は,Oxford Thesaurus of English (2000, 2004) からの派生物ではなく,むしろ OALD7 (2005) との関係が強い (12) .実際に,OALD7 の類義語解説が多く OLT に反映されている.(つまり,最初から学習者向けにチューニングされており,平易でかゆいところに手が届く記述が期待され,実際にそのようになっている.)
 ・ OLT に限らないが,学習者用類義語辞典の主たる機能は,"(1) make users aware of different connotations or shades of meaning synonyms have and to (2) enable users to choose and use the most appropriate word, which may not be part of their (active) vocabulary, in order to express their idea" (14) .
 ・ 見出し語数は学習者向けに選ばれた1973個で,単語だけでなく複合語や句が見出し語となっている場合もある (16) .
 ・ 1つの見出し語に与えられている類義語の数は,最頻値をとると5--6個 (26) .多すぎず,少なすぎず,学習者にとって適切.
 ・ 挙げられている例文はおおむね適切で,CD-ROM版では各類義語に対して平均3.7個ほどの例文が挙げられている (29) .
 ・ 類義語間の区別にとりわけ重要な register のレーベルや解説が質量ともに充実している (35--45) .特に解説は読み物としておもしろく書かれている (45, 49) .
 ・ 意味の強度によって区別される類義語群について,視覚的な "synonym scales" なる提示法が導入されており,学習上,非常に効果的である (49--52) .

 全体として Komuro and Ichikawa は "a groundbreaking learner's thesaurus (55) と高い評価を与えており,特に最後の "synonym scales" の評価については,私も実際に見てみたが同感.例えば,afraid の類義語の synonym scale は以下の通り.このように一覧されると,頭が整理される.

Synonym Scale of

 レビュー論文を読んでこれから積極的に OLT を利用してみたいと思った.また,英語学習に役に立ちそうであることは言うに及ばず,語彙論や意味論の研究に際しても,本格的な類義語辞典やその他の辞書を用いる前の見当づけやテーマ探しにも使えそうだという印象をもった.例えば,synonym scale を与えられている以下の126語の見出し語から適当な類義語群を選び出し,コーパスを用いて semantic_prosody の研究をするというのもおもしろそうだ.

admiration [n], afraid [a], anger [n], anger [v], angry [a], annoy [v], approval [n], bad [a], beautiful [a], cheap [a], childhood [n], close [a], cold [a], concern [n], convincing [a], crazy [a], crisis [n], defeat [v], delicious [a], delight [v], determine [v], dictate to sb [pv], disappoint [v], disapprove [v], disgusting [a], distress [n], embarrass [v], emotion [n], exciting [a], expose [v], fast [a], fat [a], fear [n], flush [v], frequent [a], friendship [n], frighten [v], frightening [a], frown [v], funny [a], gap [n], glad [a], happy [a], hate [v], hatred [n], high [av], hill [n], hot [a], hungry [a], hurt [v], hysterical [a], immediate [a], impress [v], inspire [v], interest [v], interested [a], interesting [a], ironic [a], like [v], likely [a], lonely [a], lose your temper [idiom], love [n], love [v], mad [a], magnificent [a], mean [a], mentally ill [a], minute [n], modern [a], negative [a], nice [a], odour [n], pain [n], painful [a], plain [a], please [v], pleasure [n], poor [a], possibility [n], praise [v], press [v], pressure [n], probably [adv], quite [adv], radical [a], rain [v], rape [v], recession [n], recommend [v], remarkable [a], respect [v], revenge [n], ridiculous [a], rough [a], rude [a], ruin [v], run [v], ruthless [a], sad [a], serious [a], shock [n], shock [v], show [v], small [a], smile [v], soak [v], sorry [a], star [n], strict [a], suppress [v], sure [a], surprise [v], take advantage of sb/sth [v], taste [n], tear [v], temper [n], tight [a], tired [a], ugly [a], unhappy [a], upset [a], violent [a], well [a], wet [a], worry [v]


 ・ American Heritage Thesaurus for Learners of English. Boston & New York: Houghton Mifflin Harcourt Publishing Company, 2002.
 ・ Oxford Learner's Thesaurus: A Dictionary of Synonyms. Oxford: OUP, 2008.
 ・ Komuro, Yuri and Yasuo Ichikawa. "An Analysis of the Oxford Learner's Thesaurus: A Dictionary of Synonyms." Lexicon 41 (2011): 11--59.
 ・ Oxford Advanced Learner's Dictionary. 7th ed. Oxford: OUP, 2005.

[ | 固定リンク | 印刷用ページ ]

2011-08-20 Sat

#845. 現代英語の語彙の起源と割合 [lexicology][loan_word][statistics][bnc][corpus]

 現代英語の語彙における本来語と借用語の比率については,本ブログでも何度か取り上げてきた.いくつかリンクを張っておこう.

 ・ [2010-12-31-1]: #613. Academic Word List に含まれる本来語の割合
 ・ [2010-06-30-1]: #429. 現代英語の最頻語彙10000語の起源と割合
 ・ [2010-05-16-1]: #384. 語彙数とゲルマン語彙比率で古英語と現代英語の語彙を比較する
 ・ [2010-03-02-1]: #309. 現代英語の基本語彙100語の起源と割合
 ・ [2009-11-15-1]: #202. 現代英語の基本語彙600語の起源と割合
 ・ [2009-11-14-1]: #201. 現代英語の借用語の起源と割合 (2)
 ・ [2009-08-15-1]: #110. 現代英語の借用語の起源と割合

 語種の数量的な調査には,数え挙げる際のソースを何にするか,type-count か token-count か,どのくらいの語彙規模を扱うか,語源にまつわる不正確さをどのように処理するか,などの考慮すべき事項が様々あり,研究者によって結果がまちまちとなることがある.しかし,複数の調査を比べれば,およその平均値や全体像が見えてくるのも確かである.
 先日参加してきた ICOME7 (The Seventh International Conference on Middle English) で,8月4日,OED3 の主幹語源学者 Philip Durkin 氏が "Some neglected aspects of Middle English lexical borrowing from (Anglo-)French" と題する講演で関連する話題について触れていたので,要点をメモしておく.
 Durkin 氏は BNC から最頻1000語のリストを取り出し,語源分析した.その結果,英語本来語が489語,フランス・ラテン語が489語,ノルド語が32語,それ以外の言語が10語という数値が得られた.大規模コーパスの頻度リスト (see [2010-03-01-1]) を利用した語源調査はいつか自分でやろうと思っていたが,Durkin 氏のおかげでその労力を省くことができた(ありがとうございます!).
 これにより,上記のリンクで示した諸調査と合わせて,type-count に基づく最頻100語,600語,1000語,2000語,3000語,4000語,5000語,6000語,7000語,8000語,9000語,10000語という12段階の語彙規模での語種別比率が得られたことになる.母体となる現代英語語彙の情報ソース,数え方,語種区分はそれぞれ異なっているのかもしれないが,一応の目安として以下で全体像を示したい.語種区分は English, French and/or Latin, Scandinavian, Other として4種類に統一した.

LevelEnglishFrench/LatinScandinavianOther
100 (GSL)92%3%5%0%
600 (LDOCE3)474544
1000 (BNC)46.948.93.21.0
1000 (Williams)831322
2000 (Williams)345727
3000 (Williams)2960110
4000 (Williams)2762110
5000 (Williams)276418
6000 (Williams)2761210
7000 (Williams)2362213
8000 (Williams)2659213
9000 (Williams)2558215
10000 (Williams)2560114
Etymological Breakdown of the Most Frequent Words


 上から3つ目と4つ目の棒グラフは,同じ最頻1000語レベルでの比較だが,3つ目は上述の Durkin の BNC 調査によるもの,4つ目は[2010-06-30-1]の記事で示した Williams のものである.著しい差異が生じたが,これも調査方法が異なるがゆえだろうか.注意して解釈する必要があるが,この点を除けば全体としてなだらかに推移し,最終的には本来語25%,ラテン・フランス語60%,それ以外が15%という数値におよそ落ち着くようだ.

[ | 固定リンク | 印刷用ページ ]

2011-08-08 Mon

#833. 語彙力診断テスト [lexicology]

 Test Your Vocab というサイトで,英語の語彙力診断テストが公開されていた.3分くらいで診断できるので,試してみた.見たことのある語でも語義がなかなか出てこないことを思い知らされた.結果として,私の語彙力は19,300語.この数値は,18歳以上の母語話者の下から10%の範囲に落ちる.15歳の英語母語話者の平均値でも23,303語というから,非母語学習者であるとはいえ,己の英語語彙力の乏しさに情けなさを感じた.地道に語彙力を増やさねばと感じた次第である.
 ただ,点数以上に興味があるのは,この語彙力診断テストがどのような基準で作られており,内部でどのように計算されているのか,である.内部事情はまったく公開されていないが,研究プロジェクトの実験として設けられているサイトのようだから,事後であってもぜひ公開してもらいたいところである.というのは,Crystal (34--39) が示唆しているように,語彙力の計測は,何をもって語彙力とみなすか,何をもって語彙とみなすか,その定義にすべてがかかっているためである.特に「語彙」の覆う範囲を定めることが難しい.それは以下の問題があるからである.

 (1) 語彙の基本単位である (word) の定義が,まずもって不明である (see [2011-03-28-1]) .複合語 (ex. flower pot, flower-pot or flowerpot?) ,句動詞 (ex. get at, get by, get in) ,idiom (ex. kick the bucket, go West ) は意味としてはひとまとまりだが,語としては1語と数えるのか否か,などの問題がある.
 (2) ある語が多義語である場合,その語を見て語義を1つでも知っていればその語を知っているとみなすことができるのか,あるいはすべての語義を知っている必要があるのか.high tea, high priest, high seasonhigh はそれぞれ異なる語義を表わすが,同じ1つの語とみなすべきか否か.
 (3) ある地域変種,社会変種に特有の語彙は,語彙力診断にカウントされるべきか否か.口語,俗語,最新流行語,借用語,古語についてはどうか.「中心的な英語の語彙」に限るとしても,「中心的」の基準とは何か ([2010-12-29-1]の記事「Murray の語彙星雲」を参照).
 (4) flu, hi-fi, AIDS, FBI, UFO などの各種の略語はどうか.
 (5) 地名,人名などの固有名詞はどうか.固有名詞は英語に特有のものではないという理由でカウントする語彙に含まないとしても,例えばロンドンの官庁街 Whitehall は固有名詞であるばかりではなく「英国政府」を表わす普通名詞としても用いられる.
 (6) 無数にある動植物名を含めた各種の専門用語はどうか.

 Test Your Vocab がこれらの問題にどのような態度をとって診断テストを作成しているのかは,診断用に挙げられている単語リストからある程度推し量ることができるかもしれない.しかし,診断テスト作成の方針は,上記の理由により作成者によって互いに異なると思われ,別の診断テストがあれば別の基準で別の点数結果が出るだろう.
 などと,自分の点数の言い訳をしても始まらない.まずは,20歳の平均値である25,337語を目指そう・・・.

 ・ Crystal, David. The English Language. 2nd ed. London: Penguin, 2002.

Referrer (Inside): [2019-07-09-1] [2013-04-07-1]

[ | 固定リンク | 印刷用ページ ]

2011-07-26 Tue

#820. 英仏同義語の並列 [french][loan_word][register][lexicology][hybrid][binomial][lexical_stratification]

 中英語期にフランス借用語が大量に流入してきた事実についてはすでに多くの記事で扱ってきた([2009-08-22-1]の記事「フランス借用語の年代別分布」ほかを参照).これにより英語の表現の可能性が広がったが,注目すべき表現として,英語本来語と対応するフランス借用語を並列させる2項イディオム (binomial idiom) の表現がある(バケ,p. 60).my heart and my corage, wepe and crye, huntynge and venerye の如くである.この表現は,本来語とフランス借用語の間に使用域 ( register ) の差のあることを利用した修辞的な技法ともとらえることもできるが(「英語語彙の三層構造」については[2010-03-27-1]の記事を参照),目新しい借用語の理解を容易にするための訳語として本来語を添えたとも考えられる.後者は,説明を要する語に注解 ( gloss ) を施すという古英語以来の習慣の一端と言えるかもしれない.これはまた,17世紀の難語辞書 (see [2010-12-27-1], [2010-11-24-1]) の登場にもつらなる言語文化的習慣である.近代以降では lord and master, my last will and testament などが慣用表現となっている.
 なお,並列表現といっても,必ずしも and のような等位接続詞で結ばれているとは限らない.例えば court-yard (中庭)や mansion-house (邸宅)は英仏対応要素の直接複合であり,冗語的といえる.
 借用語の流入は,単に既存の語を置きかえたり,語の種類を増やしたりすだけではなく,既存の語彙と連携して当該言語の表現可能性を高めている側面もあることを評価すべきだろう.関連して,英仏両要素が1語内に混合している hybrid の各記事(特に[2009-08-01-1]の「英語とフランス語の素材を活かした 混種語 ( hybrid )」)も参照.

 ・ ポール・バケ 著,森本 英夫・大泉 昭夫 訳 『英語の語彙』 白水社〈文庫クセジュ〉,1976年.

[ | 固定リンク | 印刷用ページ ]

2011-05-23 Mon

#756. 世界からの借用語 [loan_word][lexicology][pde_characteristic][world_languages]

 現代英語の最大の特徴の1つである cosmopolitan vocabulary については pde_characteristic を始めとする記事で,また時にそれを "asset" とみなす見方については批判的に[2009-09-27-1], [2010-05-22-1]の記事などで扱ってきた.関連して,現代英語語彙が借用語に満たされていることについては,[2010-05-16-1]にリンクを張った諸記事や loan_word の各記事で話題にしてきた.
 英語の語彙がいかに世界的かをざっと知るには,[2009-11-14-1]の記事「現代英語の借用語の起源と割合 (2)」のグラフをみるのが手っ取り早いが,単語とその借用元言語を具体的にリスト化しておけば,なお手っ取り早い.そこで,主として Crystal ( The English Language, p. 40 and Encyclopedia, pp. 126--27 ) に基づき,他の例も多少付け加えながら,借用元言語で世界一周ツアーしてみたい.

LanguageWords
Afrikaansapartheid, gnu, impala, indri, kraal, mamba, trek, tse-tse
Aleutianparka
American Indianchipmunk, moccasin, pow wow, skunk, squaw, totem, wigwam
Anglo-SaxonGod, Sunday, beer, crafty, gospel, house, rain, rainbow, sea, sheep, understand, wisdom
Arabicalgebra, assassin, azimuth, emir, ghoul, harem, hashish, intifada, mohair, sheikh, sherbet, sultan, zero
Araucaniancoypu, poncho
Australianboomerang, budgerigar, dingo, kangaroo, koala, wallaroo, wombat
Brazilianabouti, ai, birimbao, bossa nova, favela, jaguar, manioc, piranha
Canadian Indianpecan, toboggan
Chinesechopsuey, chow mein, cumquat, kaolin, ketchup, kung fu, litchi, sampan, tea, tycoon, typhoon, yen (=desire)
Czechhowitzer, pistol, robot
Dutchbluff, cruise, easel, frolic, knapsack, landscape, poppycock, roster, slim
Eskimoanorak, igloo, kayak
Finnishsauna
Frenchanatomy, aunt, brochure, castle, cellar, challenge, chocolate, crocodile, cushion, debt, dinner, entrance, fruit, garage, grotesque, increase, jewel, justice, languish, medicine, montage, moustache, passport, police, precious, prince, sacrifice, sculpture, sergeant, table, trespass, unique, venison, victory, vogue, voyeur
Gaelicbanshee, brogue, galore, leprechaun
Germanangst, dachshund, gimmick, hamburger, hamster, kindergarten, lager, nix, paraffin, plunder, poodle, sauerkraut, snorkel, strafe, waltz, yodel, zinc
Greekanonymous, catastrophe, climax, coma, crisis, dogma, euphoria, lexicon, moussaka, neurosis, ouzo, pylon, schizophrenia, stigma, therm, thermometer, tonic, topic
Haitianbarbecue, cannibal, canoe, peccary, potato, yucca
Hawaiianaloha, hula, lei, nene, ukulele
Hebrewbar mitzvah, kibbutz, kosher, menorah, shalom, shibboleth, targum, yom kippur, ziggurat
Hindibungalow, chutney, dekko, dungaree, guru, gymkhana, jungle, pundit, pyjamas, sari, shampoo, thug
Hungariancimbalom, goulash, hussar, paprika
Icelandicgeyser, mumps, saga
Irishblarney, brat, garda, taoiseach, whiskey
Italianarcade, balcony, ballot, bandit, ciao, concerto, falsetto, fiasco, giraffe, lava, mafia, opera, scampi, sonnet, soprano, studio, timpani, traffic, violin
Japanesebonsai, geisha, haiku, hara-kiri, judo, kamikaze, karate, kimono, shogun, tycoon, zaitech
Javanesebatik, gamelan, lahar
Koreanhangul, kimchi, makkoli, ondol, won
Latinalibi, altar circus, aquarium, circus, compact, diocese, discuss, equator, focus, frustrate, genius, include, index, interim, legal, monk, nervous, onus, orbit, quiet, ulcer, ultimatum, vertigo
Malagasyraffia
Malayamok, caddy, gong, kapok, orang-outang, sago, sarong
Maorihaka, hongi, kakapo, kiwi, pakeha, whare
Nahuatlaxolotl, coyote, mescal, tomato, tortilla
Norwegiancosy, fjord, krill, lemming, ski, slalom
Old Norseboth, egg, knife, low, sky, take, they, want
Persianbazaar, caravan, divan, shah, shawl, sofa
Peruviancondor, inca, llama, maté, puma, quinine
Polishhorde, mazurka, zloty
Polynesiankava, poe, taboo, tapa, taro, tattoo
Portuguesebuffalo, flamingo, marmalade, pagoda, veranda
Quechuanllama
Russianagitprop, borsch, czar, glasnost, intelligentsia, perestroika, rouble, samovar, sputnik, steppe, troika
Sanskritswastika, yoga
Scottishcaber, cairn, clan, lock, slogan
Serbo-Croatcravat, silvovitz
Spanishalbatross, banana, bonanza, cafeteria, cannibal, canyon, cigar, cobra, cork, dodo, guitar, hacienda, hammock, junta, marijuana, marmalade, molasses, mosquito, potato, rodeo, sherry, sombrero, stampede, supremo
Swahilibongo, bwana, harmattan, marimba, safari, voodoo
Swedishombudsman, tungsten, verve
Tagalogboondock, buntal, ylang-ylang
Tamilbandicoot, catamaran, curry, mulligatawny, pariah
TibetanKoumiss, argali, lama, polo, shaman, sherpa, yak, yeti
Tongantaboo
Turkishaga, bosh, caftan, caviare, coffee, fez, jackal, kiosk, shish kebab, yoghurt
Vietnameseao dai, nuoc mam
Welshcoracle, corgi, crag, eisteddfod, hwyl, penguin
Yiddishchutzpah, gelt, kosher, nosh, oy vay, schemozzle, schmaltz, schmuk


 ・ Crystal, David. The English Language. 2nd ed. London: Penguin, 2002.
 ・ Crystal, David. The Cambridge Encyclopedia of the English Language. 2nd ed. Cambridge: CUP, 2003.

[ | 固定リンク | 印刷用ページ ]

2011-04-23 Sat

#726. 現代でも使えるかもしれない教育的な Cawdrey の辞書 [lexicography][cawdrey][mulcaster][lexicology]

 英語史上最初の英英辞書と言われる Robert Cawdrey の A Table Alphabeticall (1604) については,[2010-12-21-1], [2010-12-22-1]の記事を始め,cawdrey の各記事で取り上げてきた.
 [2010-12-27-1]の記事で概説したように17世紀は難語辞書の世紀だったが,その走りといえる Cawdrey の「難語」と,その後に続いた他の辞書編纂者の「難語」とは性質が異なる.後者を代表する Bullokar, Cockeram, Blount, Phillips の辞書は,Noyes (600) によれば "storehouses of difficult and elegant words exclusively" (赤字は引用者)だった.一方で,Cawdrey はあくまで "hard vsuall English wordes" あるいは "plaine English words" ( A Table Alphabeticall の初版タイトルページより.赤字は引用者.)を掲載したのである.彼はいたずらに難解な語ではなく,あくまで普段お目にかかる難語を収録し,辞書使用者の実用性を強く意識していたのである.これは,Cawdrey (と増補改訂者である息子の Thomas )が学校長であり教育者であったことと無縁ではない.当時の教育界のドンで英語辞書の編纂の必要性を訴えた Richard Mulcaster ([2010-07-12-1]) は,The First Part of the Elementarie (1582) で8000語ほどの単語リスト "Generall Table" を掲げたが,その多くが Cawdrey の辞書にも反映されている.この歴史的辞書の編纂が教育を目的とするものであったことが分かるだろう.
 実際に A Table Alphabeticall を眺めてみると(こちらのオンライン版を参照),そのまま現代の上級英語学習者の語彙学習に役立ちそうな単語リストとなっている.現代の感覚でいうと,英検準1級〜1級程度の語彙だろうか.綴字はいまだ完全には標準化していないが,案外と現代英語学習者にも使えそうな教育的な内容になっている.
 また,[2010-12-22-1] の (4) で示したように,語源好きには嬉しいことに,Cawdrey は語源(といっても借用元言語の記述にすぎないが)を記載している.この粋な慣習は,Cawdrey が大いに参考にした Coote でも実践されていたが,後続の Bullokar や Cockeram では無視されていた.再開されたのは Blount の Glossographia (1656) からである (Noyes 602) .ここにも,Cawdrey の教育的な良識が感じられる.Noyes の Cawdrey 評を引用しよう.

It was unfortunate for the development of the English dictionary that succeeding lexicographers scorned the practical schoolmasters' tradition and focussed on the more eccentric and less permanent elements in the language. This attitude was, in fact, responsible for sidetracking the English dictionary for a century. (604)


 ・ Noyes, Gertrude E. "The First English Dictionary, Cawdrey's Table Alphabeticall." Modern Language Notes 58 (1943): 600--05.

Referrer (Inside): [2016-03-05-1] [2014-10-13-1]

[ | 固定リンク | 印刷用ページ ]

2011-04-05 Tue

#708. Frequency Sorter CGI [corpus][bnc][statistics][web_service][cgi][lexicology][plural]

 何らかの基準で集めた英単語のリストを,一般的な頻度の順に並び替えたいことがある.例えば,[2011-03-22-1]で論じたように,頻度と不規則な振る舞いとの関係を調べたいときに,注目する語(群)の一般的な頻度を知る必要がある.この目的には,[2010-03-01-1]で紹介したような大規模な汎用コーパスに基づく頻度表が有用である.BNC lemma-pos list (122KB) や ANC word-tagset list (7.2MB) などで問題の語を一つひとつ検索し,頻度数や頻度順位を調べてゆけばよいが,語数が多い場合には面倒だ.そこで,上記2つの頻度表から,入力した語(群)の頻度と順位を取り出す CGI を作成した.
 改行でもスペースでもカンマでもよいのだが,区切られた単語リストを以下のボックスに入力し,"Frequency Sort Go!" をクリックする.出力結果を頻度順位の高い順にソートする場合には,"sort by rank?" をオンにする(デフォルトでオン.オフにすると,入力順に出力される).例えば,現代標準英語に残る純粋に i-mutation を示す複数形は以下の7語のみである(複合語,二重複数,[2011-04-01-1]で話題にした sister(e)n は除く).これをコピーしてボックスに入力する.

foot, goose, louse, man, mouse, tooth, woman


     sort by rank?


 まず,BNC lemma-pos list による出力だが,この頻度表は約1億語の BNC 全体から,頻度にして800回以上現われる,上位6318位までの見出し語 ( lemma ) を収録している.したがって,それよりも頻度の下回る goose, louse については空欄となっている.頻度と不規則性の相関関係を考える際に参考になるだろう.
 次に,ANC word-tagset list による出力が続くが,この頻度表は BNC のものよりも規模が大きく,かつきめ細かい.合計22,164,985語を有する ANC (American National Corpus) から,Penn Treebank Tagset によってクラス付与された単位で語形が列挙されたリストである.タグセットが細かいので読みにくいし,自動タグ付与に起因するエラーも少なからず含まれているが,BNC のものよりも低頻度の語(形)を収録しているので,gooselouse の頻度情報も現われる.こちらの頻度表では WORD FORM ごとの頻度も確認できるため,直接 geeselice の頻度も確かめられる.
 当初 Frequency Sorter の用途として想定していたのは,上記の不規則複数形を示す語群などの頻度と順位の一括調査だったが,他にも用途はあるかもしれない.以下に,思いつきをメモ.

 ・ 1単語から使えるので,like のような多品詞語を入力して,品詞(あるいはタグ付与されたクラス)ごとの頻度を取り出せる.
 ・ ヒット数だけを確認したい場合には,いちいちコーパスを立ち上げる必要がない.
 ・ 論文やプレゼンで,ある目的で集めた数百語の単語リストの中から典型的な例,分かりやすい例を10個ほど示したいときなど,頻度の高い10個を選べばよい.例えば,[2011-03-29-1]で列挙した sur- を接頭辞にもつ単語リストのうち,例示に最もふさわしい10個を選ぶなどの目的に.頻度に基づいた順番のほうが,ランダム順やアルファベット順よりも親切なことが多いだろう(今後,本ブログ執筆に活用する予定).
 ・ 英米それぞれの代表的なコーパスに基づく頻度表を利用しているので,綴字や形態などの頻度の英米差を確認するのに使える.
 ・ (実際には lemmatisation が必要だが)適当な英文を放り込んでみて,妙に頻度の低い語が含まれていないかを調べる.頻度のツールなので,その他,教育・学習目的にいろいろと使えるかもしれない.

[ | 固定リンク | 印刷用ページ ]

2011-02-23 Wed

#667. COCA 最頻50万語で品詞別の割合は? [lexicology][corpus][french][loan_word][adjective][statistics][coca]

 昨日の記事[2011-02-22-1]に引き続き,COCA ( Corpus of Contemporary American English ) に基づく単語の頻度リストを利用したパイロット・スタディ.今回は,こちらで最近になって追加された最頻50万語のリストを用いて,昨日と同様の品詞別割合を調べた.昨日のリストは見出し語 ( lemma ) に基づいた最頻5000語,今日のリストは語形 ( word form ) に基づいた最頻50万語(正確には497187語)で,性格が異なることに注意したい.
 昨日とほぼ同じ作業だが,今回は2万語ずつで階級を区切り,L1からL25までの階級のそれぞれにおいて noun, verb, adj., adv., others の5区分で品詞別割合を出した.(数値データはこのページのHTMLソースを参照.)

Form-Based POS Ratios by COCA

 L6(12万語レベル)辺りから品詞別比率は安定期に入るといってよいだろう.L17(34万語レベル)辺りから変動期が始まるのが気になるが,階級幅を大きくしてみると(ならしてみると)直前のレベルから大きく逸脱していない.
 [2011-02-16-1]の記事以来,形容詞の比率が気になっているが,今回のデータ全体から計算すると,0.1738という値がはじきだされた.昨日の lemma 調査では0.1678だったから,値は非常に近似している.ただし,名詞と動詞の lemma 対 word form の比率は,名詞が 0.5086 : 0.6985,動詞が 0.2000 : 0.1065 と大きく異なるので,形容詞の 0.1678 : 0.1738 という近似は偶然かもしれない.lemma 対 word form の品詞別割合には異なる傾向があるのかもしれないが,それでも大規模に調べると安定期と呼びうる区間が出現することは確かなようだ.
 [2011-02-16-1]の記事で触れたように,中英語期のフランス借用語における形容詞比率は0.1768だった.今回の値0.1738と酷似しているが,主題の性質がまるで違うので,直接の関係を論じることは無理である.もとより昨日と今日の調査は,[2011-02-16-1]の調査とは無関係に始めたものである.しかし,偶然と思えるこの結果は,示唆的ではある.借用語彙といえば名詞が圧倒的なはずだと予想していたものの,フランス語や古ノルド語からはおよそ一定の割合の形容詞(それぞれ lemma 調査で0.1768と0.1817)が借用されていた.そして,その比率は時代が異なるとはいえ現代英語の比率と近似している.英語語彙全体における比率と借用語彙における比率が近似しているということは,もし偶然でないとしたら,何を意味するのだろうか.フランス借用語彙や古ノルド借用語彙が,英語に適応するような自然な比率で英語語彙へ溶け込んだということだろうか.これは,今回のパイロット・スタディの結果を受けての印象に基づく speculation にすぎない.今後も品詞別割合という観点に注目していきたい.

[ | 固定リンク | 印刷用ページ ]

2011-02-22 Tue

#666. COCA 最頻5000語で品詞別の割合は? [lexicology][corpus][statistics][n-gram][coca]

 COCA ( Corpus of Contemporary American English ) に基づいた各種語彙リストが Corpus-based word frequency lists, collocates, and n-grams から入手できる.そのなかで最も基本的なリストが,こちらの最頻5000語リストである.列挙されているのは見出し語 ( lemma ) 単位で,順位はコーパスに現われる頻度と分散の関数で計算されている.UCREL CLAWS7 Tagset の品詞コード表に基づいた粗い品詞情報も付与されており,品詞別の頻度などを手軽に分析することができる.
 今回は,500語ごとに区切って頻度の高い順にL1からL10までの階級を設け,それぞれの階級における品詞別割合を出した.品詞は開いた語類 ( open class ) を中心とし,noun, verb, adj., adv., others の5区分とした.(数値データはこのページのHTMLソースを参照.)

Lemma-Based POS Ratios by COCA

 第1階級を除き,どの階級でも名詞が過半数を占めているのは予想できたことだが,第2階級以降に名詞の割合が思ったほど伸びていないことが分かった.動詞と形容詞が後半の階級でもおよそ一定の割合を占め続けているのも予想外だった.全体として,最頻5000語リストに限れば,名詞が飛び抜けつつも,開いた語類の内部比率はおよそ一定に保たれているといえよう.階級幅を様々に動かして試してみたが,およそ安定期に入るのは500語以降と見てよさそうだ.
 [2011-02-16-1]の記事で中英語期のフランス借用語の品詞別割合をみたが,全体としての形容詞比率は0.1768だった.今回の現代英語の最頻5000語では,全体としての形容詞比率は0.1678.比べて意味のある数値かどうかは分からないが,英語(言語?)における品詞別比率の「安定感」のようなものはあるのだろうか.
 COCA に基づくもの以外にオンラインで入手できる最頻英単語リストについては[2010-03-01-1]の記事を参照.頻度表を利用した別のパイロット・スタディとしては,単語の音節数を扱った[2010-04-17-1]の記事を参照.

[ | 固定リンク | 印刷用ページ ]

2011-02-04 Fri

#648. 古英語の語彙と廃語 [oe][lexicology][word_formation][thesaurus][synonym]

 古英語の語彙が現代までにどれだけ残存しているか,どれだけ消失したかについては[2010-07-21-1]の記事で話題にした.古英語語彙の大規模な消失は,英語が中英語期以降にフランス語を始めとする様々な外国語から語彙的な影響を受け,多くの本来語が借用語で置き換えられるに至ったとして説明されることが多いが,消失傾向を促進するある特徴が古英語語彙体系に内在していたと考えることもできるかもしれない.バケから,古英語語彙の消失について述べている箇所を引用しよう.

もう一つの消失の原因は,疑いもなく,同じ概念系統の語形の中に存在していた封建的関係である.ある語が消失していく度に,語群全体がそれとともに分解してきた.これは情熱を抱くに足る研究であり,ぜひとも奨励しておきたい.古期英語の実詞 þeod 「国民,種族」およびその複合語あるいは派生語は,発生的に þeoden 「首長,王子,王」および〔ママ〕geþeode 「(話し)ことば」と結びついていたが,それらの政治・文化上のすべての親族関係語とともに消えてしまった.Wer 「男,英雄,亭主」および werod 「大勢,軍団」についても同様である.この点について,古期英語辞典を引くこと以上に示唆を得るものはない.ある用語が衰えると語彙面全体が崩れ落ちてしまう.その原因は多様で,しばしば社会学的であったり,政治的であったりする.(22)


 þeod は古英語では高頻度語かつ基本語であり,これに基づいた複合語や派生語が数多く存在した.þeod を中心とした関連語彙が,古英語話者の「国」観,「民族」観,ひいては世界観を表現していたといっても過言ではない.しかし,þeod という語自体が何らかの事情で徐々に衰退し,ついには消失してしまうと,独特な世界観を構成していた扇の要が壊れてしまうことになり,関連語彙もその存在基盤を失うことになる.はたして,þeod の世界観全体が忘れられることになるのである.皮肉なことに,古英語の語形成は基底となる語を元にした複合 ( composition ) と派生 ( derivation ) によって特徴づけられるために,基底語が消失してしまうと関連語彙も総崩れとなりがちだということである.
 バケが基底語(主)と関連語彙(従)との関係を「封建的関係」と呼んでいるのは興味深い.君主が崩れることによって家臣すべてが総崩れとなり,封建制(=世界観)そのものが機能しなくなるという巧みな比喩が,この表現に隠されている.
 基底となる þeod が消失した原因は様々だろうが,1つには次々に現われてきた類義語からの圧力が作用したと思われる.Historical Thesaurus of the Oxford English Dictionary によると,þeod の類義語は "the external world > the living world > people > people > [noun]" の項に見つけることができる.18語の歴史的類義語を初出年とともに提示しよう.

wordfirst year
thede855
folkc888
lede971
mannishOE
birtha1300
nationc1330
peoplea1375
tongue1382
race1572
family1582
the mass1621
public1709
nationality1832
peoplet1872
peoplehood1879
La Raza1927
ethnic minority (group)1945
ethnogenesis1962


 þeod という語の消失は,実際には徐々に進行しており,1400年くらいまでは使用されていた.上の表を眺めると,þeod は突如消えたわけではなく,中英語期に他の類義語とのせめぎ合いのなかで徐々に忘れられていったというシナリオが描けそうである.

 ・ ポール・バケ 著,森本 英夫・大泉 昭夫 訳 『英語の語彙』 白水社〈文庫クセジュ〉,1976年.

Referrer (Inside): [2011-05-28-1]

[ | 固定リンク | 印刷用ページ ]

2011-02-01 Tue

#645. 死語と廃語 [language_death][lexicology]

 日本語の「死語」は,英語でいう "dead language" と "obsolete word" の2つの語義を兼ねる.『明鏡国語辞典』によると,

(1) 昔は使われていたが、現在では使用されていない言語。古代ギリシア語・ヒッタイト語など。
(2) 昔は使われていたが、現在、一般には使用されなくなった語。廃語。


 以下,この記事では (1) を「死語」,(2) を「廃語」と呼び分けることにする.死語については,このブログでも language_death の各記事で取り上げてきた.ある言語が死滅するという場合には,生物種の絶滅と同様に,センチメンタルな感情が伴うものである(と信じたい).言語にはその話者共同体の思想,文化,歴史が詰まっており,言語が消滅するということは(記録が残されていない限り)その知的遺産が永遠に失われるということである.言語の死は人類にとっての損失である.
 一方,廃語についてはブログで明示的に話題にしたことはあまりなかった.言語の死に比べれば,単語レベルの消滅は通常センチメンタルな現象とはとらえられないだろう.言語そのものが消滅するわけではなく,小さな断片が失われるだけなので,至極当然かもしれない.しかし,単語にも言語共同体の思想,文化,歴史が凝縮されているのであり,その消滅は,取り戻すことの難しい知的遺産の消滅であると考えることができる.話題性の大小はあるものの,豊かな言語的感受性をもってすれば,死語も廃語も質的には同等の損失なのかもしれない.
 このように思ったのは,豊かな言語的感受性を示すポール・バケの文章に出会ったからである.バケは,語の消失や語義の変化について次のように評している.

しかし消失の過程の期間がどうであれ,語の死滅は決定的と言わぬまでも現実のものであり,その死なるものが人間や文明に訪れるときと同じように,ここでも人の心を打つのである.この死とともに,ある世界全体が,あるいは文化的,感情的,概念的存在の一断片が姿を消していくのである.たとえある別の1語あるいは数語が遺棄された土地を引き受け,失われた語の意味領域を取戻すことがあるにせよ.たとえ意義の上から実際には何も失われていないにせよ,文脈はもはや同一ではなく,意味の移行がなされるのは数年のうちのことでしかない.それ故,すべてが変貌し,そして人々が変わり,世代もまた代わって,語の意味は,このしばしば無意識であるとはいえ,たゆみなき進化の影響を受けるのである.(16--17)



 語の消失や語義の変化にいちいち感傷的になっていては言語生活を営むことすらおぼつかないと言ってしまえばそうなのだが,語の研究に関する限りこのような感受性は必要なのだろうなと思う.
 さて,「廃」を表わす英語の obsolete は,ラテン語 obsolescere の過去分詞 obsolētus に由来し,16世紀に英語に借用された.ob- 「完全に」+ sol(ere) 「慣れる」 + ēscere 「〜し始める」と形態分析され,その過去分詞形は全体として "grown out, worn out, fallen into disuse" ほどの意となる.OED では,廃語の見出しには短剣符 ( dagger or obelisk ) と呼ばれる「†」の標識がつけられる.短剣符は十字架の立った墓の象形に由来すると思われ,慣習的に没年を表わすのに用いられるので,廃語を標示するのにもふさわしいということだろうか.
 余談だが,近年の日本語の死語(=廃語)を収集したサイト死語's HomePageを発見した.その「ナウな死語辞典」に収録されている語句の数々に共感を覚えた.あったなあ,あんな言葉,こんな言葉.

 ・ ポール・バケ 著,森本 英夫・大泉 昭夫 訳 『英語の語彙』 白水社〈文庫クセジュ〉,1976年.

Referrer (Inside): [2016-03-18-1]

[ | 固定リンク | 印刷用ページ ]

2011-01-16 Sun

#629. 英語の新語サイト Word Spy [lexicology][neologism][link][web_service]

 英語の新語ウォッチには Paul McFedries によるサイト Word Spy が注目に値する.1996年以来,新語が日々追加されており,現時点で2750以上の新語が登録されている.最大の特徴は,ほとんどの新語(全体の約85%)について用例と出典が与えられており,多く(全体の約73%)は初出年も記されていることだ.
 サイトを走査し,初出年の記載のある2019個について初出年ごとに数え上げてみたのが次の棒グラフである.連続して50例を超えているのは1987--2006年の20年間で,特に1990年代は層が厚い.

	1962 (  1) 
	1963 (  1) 
	1964 (  1) 
	1970 (  1) 
	1972 (  2) *
	1973 (  3) *
	1975 (  5) **
	1976 (  8) ****
	1977 ( 11) ******
	1978 ( 14) *******
	1979 ( 16) ********
	1980 ( 24) *************
	1981 ( 33) ******************
	1982 ( 32) *****************
	1983 ( 39) *********************
	1984 ( 38) *********************
	1985 ( 54) ******************************
	1986 ( 47) **************************
	1987 ( 59) ********************************
	1988 ( 66) ************************************
	1989 ( 67) *************************************
	1990 ( 77) ******************************************
	1991 ( 78) *******************************************
	1992 ( 83) **********************************************
	1993 ( 72) ****************************************
	1994 (100) *******************************************************
	1995 (101) ********************************************************
	1996 (101) ********************************************************
	1997 ( 87) ************************************************
	1998 ( 78) *******************************************
	1999 (109) ************************************************************
	2000 ( 85) ***********************************************
	2001 (111) *************************************************************
	2002 ( 87) ************************************************
	2003 ( 66) ************************************
	2004 ( 57) *******************************
	2005 ( 56) *******************************
	2006 ( 61) **********************************
	2007 ( 32) *****************
	2008 ( 33) ******************
	2009 ( 14) *******
	2010 (  9) *****

 [2011-01-10-1]の記事で American Dialect Society による2010年の流行語大賞の話題を取り上げたが,そのノミネート語の多くは Word Spy で発見できなかった.ただし,MOST LIKELY TO SUCCEED 部門でノミネートされた hacktivisttelework はしっかりと掲載されていた.
 掲載基準など詳しいことは分からないが,American Dialect Society の定期刊行誌 American Speech の新語記事 "Among the New Words" と合わせて,直近数十年の新語の傾向を探る資料として活用することができるかもしれない.

Referrer (Inside): [2011-09-21-1]

[ | 固定リンク | 印刷用ページ ]

2011-01-10 Mon

#623. 2010年の英語流行語大賞 [lexicology][ads][woy]

 今年もこの時期がやってきた.American Dialect Society による流行語大賞の公表の時期だ.2009年は[2010-01-14-1]の記事で紹介したように tweet が大賞に選ばれたが,2010年は app だった.
 詳しくは1月7日付けのADS による公式発表プレスリリース (PDF)を参照されたいが,問題の語の定義は以下の通りである.

"app" --- noun, an abbreviated form of application, a software program for a computer or phone operating system


 app は日本語では「アプリ」としてすでに広く認知されている.この英単語は OED では初出1985年として見出し語に採用されており,決して新しい語ではない.しかし昨年はコンピュータだけでなく iPhone, iPad などの電子端末に対応するアプリケーションの需要が激増し,app store なるオンライン店舗も目立つようになってきた.2年続けてITサービス関連の語が受賞という事実に,時代の波を感じる(「IT」というかつての流行語はすでに古いかも).
 他のノミネート語や部門ごとの受賞語を眺めてみると特にアメリカの,しかししばしば世界的な世相が分かる.Wikileaksvuvuzela の如くである.ネット関連でよく使われる動詞としての trend "to exhibit a burst of online buzz" が MOST LIKELY TO SUCCEED 部門での受賞となったのもなるほどと思わせる.
 ADS では Word of the Year for 2010 と合わせて,姉妹大賞である Name of the Year for 2010 の投票も行なわれた.後者を受賞したのは,本ブログの[2010-04-20-1]の記事でも触れた,アイスランドの火山 Eyafjalljökul だった.
 ADS の 新語委員会委員長の Ben Zimmer は,[2010-08-11-1]の記事で紹介した Visual Thesaurus の製作責任者でもある.

Referrer (Inside): [2011-01-18-1] [2011-01-16-1]

[ | 固定リンク | 印刷用ページ ]

2011-01-05 Wed

#618. OED の検索結果から語彙を初出世紀ごとに分類する CGI [lexicology][oed][cgi][web_service]

 [2011-01-03-1], [2011-01-04-1]の記事で,OED 検索語彙を初出世紀ごとに分類して数え上げるという作業を行なった.よく考えてみると,このような作業はこれまでにも様々な調査・研究で繰り返し行なってきたことである.通時的語彙研究の基礎作業として今後も繰り返し行なう作業だと思われるので,OED の出力結果をもとに世紀ごとに数え上げるためのツールを作っておくことにした.名付けて "OED Century-by-Century Sorter".
 以下は使用方法の説明だが,The Oxford English Dictionary. 2nd ed. CD-ROM. Version 3.1. Oxford: OUP, 2004. での作業を前提としている.ヴァージョンが異なると動かないかもしれないのであしからず.

 (1) OED の ADVANCED SEARCH 等により,特定の条件に該当する語彙リストを出力させる.
 (2) 下のテキストボックスに,(1) の検索に適当につけた簡便なタイトルを,ピリオド1文字の後に続けて入力する.例えば ".alchemy" .これが見出し行となる.
 (3) テキストボックスで改行後に,(1) の出力結果を丸ごとコピーして貼り付ける.OED での出力結果が1画面に収まらない場合には次ページに進んで累積コピーし,テキストボックスに累積して貼り付けてゆく.年代順にソートされていなくても可.
 (4) 続けて別の検索を行なう場合には (1), (2), (3) の作業を繰り返す.テキストボックスには,貼り付けたテキストが累積されてゆくことになる.
 (5) Go をクリックすると,各検索結果について世紀ごとにカウントされた表が現われる.

 説明するよりも実例を見るのが早いので,こちらのテキストファイルを用意した.これは,OED の ADVANCED SEARCH で "language names" にそれぞれ Japanese, Chinese, Malay, Korean, Vietnamese を入れて検索した結果の語彙リストを上記の仕様で納めたもの.これらの言語からの借用語数を世紀ごとに把握するのが狙いである.もっとも,OED の検索機能の限界で,それなりの数の雑音が結果リストに混じっているのでその点には注意.この(ような仕様に則った)テキストをコピーして,以下のテキストボックスに貼り付け,Go をクリックすれば表が出力される.
 CGI スクリプトは大雑把な仕様なので,およその傾向を知るためのツールとして参考までに.特に以下の点に注意.

 ・ 初出年が "a1866", "c1629", "15..", "?c1400" などとなっている語はそれぞれ19, 17, 16, 14世紀へ振り分けられる
 ・ 初出年の記載のない語は一括して「0世紀」として振り分けられる

(後記 2011/04/24(Sun):OED Online の Timeline 表示では,初出世紀の頻度をグラフ化までしてくれるので,今回の CGI よりも使い勝手がよい.ただし,CD-ROM版の OED で作業するときや,設定に細かいチューニングが必要な場合のために自作した.)


[ | 固定リンク | 印刷用ページ ]

2011-01-04 Tue

#617. 近代英語期以前の専門5分野の語彙の通時分布 [scientific_english][lexicology][oed][statistics]

 昨日の記事[2011-01-03-1]に引き続き,科学語彙など専門分野の語彙の初出世紀を OED で調べるという話題.近代以前に発展していた学術分野の語彙がどのような通時分布を示していたかについて,昨日は anatomy と math を例に挙げてグラフで示した.同じ手法で,やはり中世によく発達した music, astronomy, astrology, rhetoric, alchemy の各分野について語彙の初出世紀を整理してみた.definitions 欄に入れて検索した各分野の略記は "Mus.", "Astr." / "Astron.", "Astrol.", "Rhet.", "Alch." である.(数値データはこのページのHTMLソースを参照.)

Development of Vocabulary in Five Pre-Modern Areas

 いずれも前近代的な専門分野らしく,近代科学の語彙が爆発する19世紀ではなく,14世紀や16世紀に初出のピークが来ている.それにしても,alchemy を除いた4分野のグラフが驚くほどきれいに平行しているのは示唆的である.15世紀にこぞって落ち込んでいる理由は分析していないが,各分野の発展史を参照して説明されるものなのか,あるいは OED の資料としての何らかの特徴が反映されているがゆえなのか.alchemy に関しては専門用語そのものの数が多くないので断定はできないが,14, 15世紀辺りにピークが来ている.
 OED が文化史の研究に利用できるということは耳にしていたが,今回いろいろと具体的に作業してみて実感がわいてきた.語彙体系は文化の索引である.


Referrer (Inside): [2011-01-05-1]

[ | 固定リンク | 印刷用ページ ]

2011-01-03 Mon

#616. 近代英語期の科学語彙の爆発 [scientific_english][lexicology][oed][statistics]

 ルネサンス以降,近代英語期には科学語彙が爆発的に増殖した.特に19世紀は科学の発展がめざましく,おびただしい科学用語が出現することとなった.これには,18世紀後半から博物学でリンネの二名法が用いられるようになったことも影響している ( see [2010-09-21-1] ) .
 科学の諸分野の発達とその語彙の増殖は連動していると考えられるので,OED で専門語彙の初出時期を調べてまとめれば,その分野の発展史の概略をつかむことができるのではないかと考えた.18世紀以前にすでに十分に発展していた分野もあるわけで,そのような分野では19世紀中の専門語彙の増殖は相対的に小さいはずである.そこで,18世紀以前に発展していたと分かっている解剖学と数学,19世紀に著しく発展したと分かっている化学と生物学に注目して,OED からそれぞれの分野からの専門用語を拾って整理してみた.
 拾い方は,それぞれ ADVANCED SEARCH の definitions 欄に "Anat.", "Math.", "Chem.", "Biol." が含まれる語という粗い条件指定によるものであり,検索結果リストも逐一チェックはしていない.各語は初出年によって世紀ごとに振り分け,"a1866", "c1629", "15.." などはそれぞれ19, 17, 16世紀へ振り分けた.また,初出年の記載のないものは考慮から外している.このように大雑把な調査なので,あくまで参考までに.以下が,結果の表とグラフである.(数値データはこのページのHTMLソースを参照.)

Development of Scientific Vocabulary in Four Scientific Areas

 chemistry と biology は19世紀に初出語彙のピークが来ているが,anatomy と math はそれぞれ17, 16世紀にピークがある.後者2分野は確かに19世紀にも山があるので,科学語彙が爆発した世紀という一般論は当てはまるが,個々の分野によって語彙増殖の傾向の異なることがわかる.
 今回はすでに発展史の概略がよく知られている4分野を取り上げ,OED によってその語彙増殖を確認したにすぎないが,他の専門分野で同様の調査を施してみるとおもしろい結果が出るかもしれない.関連する話題として,SOED を用いた「1500--1900年における英語語彙の増加」について,[2009-11-16-1]を参照.

 ・ Crystal, David. The Cambridge Encyclopedia of the English Language. 2nd ed. Cambridge: CUP, 2003. 87.

[ | 固定リンク | 印刷用ページ ]

2010-12-31 Fri

#613. Academic Word List に含まれる本来語の割合 [lexicology][loan_word][statistics][academic_word_list]

 昨日の記事[2010-12-30-1]で,Academic Word List (AWL) を導入した.この英語史ブログとして関心があるのは,AWL と銘打って収集されたこの語彙集のなかに本来語要素からなる語がどれだけ含まれているかという問題である.570語をざっと走査したら,以下の45語が挙がった.

acknowledge, albeit, aware, behalf, draft, forthcoming, furthermore, goal, hence, highlight, income, input, insight, layer, likewise, network, nevertheless, nonetheless, notwithstanding, offset, ongoing, outcome, output, overall, overlap, overseas, seek, shift, so-called, sole, somewhat, straightforward, tape, target, task, team, thereby, trend, undergo, underlie, undertake, welfare, whereas, whereby, widespread


 570語中の45語で7.89%なので,予想通りに本来語の割合は少ない.しかし,数える前にはもっと小さい値が出るのではないかと踏んでいたので,意外に少なくないなと感じたのも事実である.Academic Word List というからには Greco-Latin の語がそれこそ100%に迫り,本来語は10語もあれば多いほうかと思い込んでいたのである.だが,本来語のリストを眺めていてなるほどど思った.out- や over- を接頭辞としてもつ実質的な語のカテゴリーが目立つ一方で,albeit, furthermore, hence, likewise, nevertheless, nonetheless, notwithstanding, thereby, whereas, whereby などの機能的・文法的なカテゴリーも目につく.forthcoming, ongoing, overall, so-called などの複合要素からなる形容詞も1カテゴリーをなしていると考えられるだろう.
 ただし,本来語とはいっても古英語起源であるとは限らない.例えば,output などは1839年が初出である.上で最初に「本来語要素からなる語」と表現したのはそのためである.
 なお,明確に本来語とはみなせないが Greco-Latin でもない語としては,古ノルド語からの借用語 bond, bulk, link, odd やオランダ語からの借用語 trigger があった.語源不詳のものとしては job もある.
 現代英語の語彙数と起源別割合については,以下のリンクも参照.

 ・ [2010-06-30-1]: 現代英語の最頻語彙10000語の起源と割合
 ・ [2010-03-02-1]: 現代英語の基本語彙100語の起源と割合
 ・ [2009-11-15-1]: 現代英語の基本語彙600語の起源と割合
 ・ [2009-11-14-1]: 現代英語の借用語の起源と割合 (2)

[ | 固定リンク | 印刷用ページ ]

Powered by WinChalow1.0rc4 based on chalow