過去2日間の記事で,語源を活用した学習法を紹介してきた(「#3696. ボキャビルのための「最も役に立つ25の語のパーツ」」 ([2019-06-10-1]) と「#3697. 印欧語根 *spek- に由来する英単語を探る」 ([2019-06-11-1]) ).中田氏による近著『英単語学習の科学』の第11章「語源で覚える英単語」でも「語源学習法」の効用が説かれている.
英単語は出現頻度によって,(1) 高頻度語,(2) 中頻度語,(3) 低頻度語の3つのグループに分類できます.中頻度語と低頻度語は,リーディングやリスニングにおける出現頻度があまり高くないため,文脈から自然に習得することは困難であり,意図的に学習することが欠かせません.中頻度語と低頻度語を覚えるには,その多く(約3分の2)がラテン語・ギリシア語起源であるため「語源学習法」が有効です.また,学術分野で頻度が高い英単語を集めた Academic Word List (Coxhead, 2000) の約90%もラテン語・ギリシア語起源なので,語源学習法が役に立ちます.(73)
特に中級以上の英語学習者にとって,語源学習法が有効である理由が説得力をもって示されている.中田は,章末において語源学習法のポイントを次のようにまとめている.
・ 英単語をパーツに分解し,パーツの意味を組み立ててその単語の意味を理解する学習法を「語源学習法」と呼ぶ.語源学習法は特に,中頻度語・低頻度語および学術的な英単語の学習に効果的である.
・ 語源学習法には,(1) 単語の長期的な記憶保持が可能になる,(2) 未知語の意味を推測するヒントになる,(3) 単語の体系的・効率的な学習が可能になる,といった利点がある.
・ 既知語やカタカナ語を手がかりにして,数多くの語のパーツを効率的に学習できる.特に,「最も役に立つ25の語のパーツ」は重要.
中田はさらに別の箇所で「無味乾燥になりがちな単語学習を,興味深い発見の連続に変えてくれる」 (75--76) とも述べている.
さらにもう2点ほど地味な利点を付け加えておきたい.1つは,語種の判別ができるようになることだ.主としてラテン語・ギリシア語からなる「パーツ」を多数学ぶことによって,初見の単語でも,ラテン語・ギリシア語のみならずフランス語,スペイン語,イタリア語などを含めたロマンス系諸語からの借用語であるのか,あるいはゲルマン系の本来語であるのか,ある程度判別できるようになる.借用語か本来語かという違いは,語感の形式・略式の差異ともおよそ連動するし,強勢位置に関する規則とも関係してくるので,語種を大雑把にでも判別できることには実用的な意味がある.
もう1つは,借用元の言語も当然ながら学びやすくなるということだ.とりわけ第2外国語としてフランス語なりスペイン語なりのロマンス系諸語を学んでいるのであれば,英語学習と合わせて一石二鳥の成果を得られる.
最近では,語源学習法に基づいた英単語集として,清水健二・すずきひろし(著)『英単語の語源図鑑』(かんき出版,2018年)が広く読まれているようだ.なお,私もこの7月より朝日カルチャーセンター新宿教室にて「英語の歴史と語源」と題するシリーズ講座を開始する予定(cf. 「#3687. 講座「英語の歴史と語源」が始まります」 ([2019-06-01-1])).こちらはボキャビルそのものを主たる目標としているわけではないものの,その知識は当然ながらボキャビルのためにも役立つはずである.
なお,上の第1引用にある Academic Word List については,「#612. Academic Word List」 ([2010-12-30-1]) と「#613. Academic Word List に含まれる本来語の割合」 ([2010-12-31-1]) も参照.
・ 中田 達也 『英単語学習の科学』 研究社,2019年.
COCA ( Corpus of Contemporary American English ) を運営する Mark Davies 氏が,[2012-01-08-1]の記事「#986. COCA の "WORD AND PHRASE . INFO"」で紹介した機能 (Frequency List) に加え,英文を投げ込むとCOCAベースで各語に関する諸情報を色づけして返してくれるサービス WORD AND PHRASE . INFO, ANALYZE TEXT を公開した.
適当な英文を投げ込むと,各単語が頻度レベルによって色分けされた状態で返される.上位500語までの超高頻度語は青,3,000語までの高頻度語は緑,それ以下の頻度の語は黄色で示されるほか,academic word が赤字として返される.文章内でのそれぞれの割合も示され,その語彙リストを出すことも容易だ.各語はクリッカブルで,クリックすると用例のサンプルが KWIC で右下ペインに表示される.また,左下ペインには類義語が現われる.以下は,昨日の記事「#1040. 通時的変化と共時的変異」 ([2012-03-02-1]) に引用した英文を投げ込んでのスクリーンショット.
英文を書くときには collocation や synonym を調べながら書くことが多いので,使い方次第では英作文学習に威力を発揮しそうだ.ある文章の academic 度を判定するのにも使える.Academic Word List に含まれる語彙の含有度ということでいえば,[2010-12-30-1]の記事「#612. Academic Word List」で挙げた The AWL Highlighter も類似ツールだ.
昨日の記事[2010-12-30-1]で,Academic Word List (AWL) を導入した.この英語史ブログとして関心があるのは,AWL と銘打って収集されたこの語彙集のなかに本来語要素からなる語がどれだけ含まれているかという問題である.570語をざっと走査したら,以下の45語が挙がった.
acknowledge, albeit, aware, behalf, draft, forthcoming, furthermore, goal, hence, highlight, income, input, insight, layer, likewise, network, nevertheless, nonetheless, notwithstanding, offset, ongoing, outcome, output, overall, overlap, overseas, seek, shift, so-called, sole, somewhat, straightforward, tape, target, task, team, thereby, trend, undergo, underlie, undertake, welfare, whereas, whereby, widespread
570語中の45語で7.89%なので,予想通りに本来語の割合は少ない.しかし,数える前にはもっと小さい値が出るのではないかと踏んでいたので,意外に少なくないなと感じたのも事実である.Academic Word List というからには Greco-Latin の語がそれこそ100%に迫り,本来語は10語もあれば多いほうかと思い込んでいたのである.だが,本来語のリストを眺めていてなるほどど思った.out- や over- を接頭辞としてもつ実質的な語のカテゴリーが目立つ一方で,albeit, furthermore, hence, likewise, nevertheless, nonetheless, notwithstanding, thereby, whereas, whereby などの機能的・文法的なカテゴリーも目につく.forthcoming, ongoing, overall, so-called などの複合要素からなる形容詞も1カテゴリーをなしていると考えられるだろう.
ただし,本来語とはいっても古英語起源であるとは限らない.例えば,output などは1839年が初出である.上で最初に「本来語要素からなる語」と表現したのはそのためである.
なお,明確に本来語とはみなせないが Greco-Latin でもない語としては,古ノルド語からの借用語 bond, bulk, link, odd やオランダ語からの借用語 trigger があった.語源不詳のものとしては job もある.
現代英語の語彙数と起源別割合については,以下のリンクも参照.
・ [2010-06-30-1]: 現代英語の最頻語彙10000語の起源と割合
・ [2010-03-02-1]: 現代英語の基本語彙100語の起源と割合
・ [2009-11-15-1]: 現代英語の基本語彙600語の起源と割合
・ [2009-11-14-1]: 現代英語の借用語の起源と割合 (2)
英語教育や辞書学の分野で Academic Word List (AWL) という語彙集が知られている.1998年に Avril Coxhead が The Academic Corpus という350万語からなる独自コーパスをもとに英語教育用に開発した570語とその派生語(合わせて word family と呼ばれる)からなる語彙集で,高等教育で用いられる頻度の高い語からなっている.
もう少し詳しく AWL の語彙選定基準を記せば次のようになる.(1) 各 word family がコーパスの Arts, Commerce, Law, Science 部門のサブセットすべてにおいて生起し,かつ細分化された28分野のサブセットの過半数に生起する.(2) 各 word family の出現頻度がコーパス全体で100回を超える.(3) 各 word family がコーパスの各部門で最低10回は生起する.(4) GSL ( General Service List ) (1953) の最頻2000語は除く ( see [2010-03-02-1] ) . (5) 固有名詞は除く.(6) et al, etc, ibid などの最頻ラテン語表現は除く.
こうして厳選された語彙集が AWL で,AWL Headwords から閲覧およびダウンロードできる.word family の頻度の高い順に1から10の Sublists としてグループ分けされており,すべて合わせるとコーパス全体に生起する語の9.8%を覆うという.
最近の上級者用英英辞書は軒並み AWL の重要性を認識しているようだ.2006年出版の Longman Exams Dictionary を皮切りに,2007年の Longman Advanced American Dictionary, 2nd ed.,2009年 Longman Dictionary of Contemporary English, 5th ed. など売れ筋辞書でも AWL が考慮されている ( Dohi et al., p. 174 ) .Macmillan, Collins COBUILD 系でも同様である.目下の AWL の評価は Dohi et al. によると以下の通りである.
It remains to be seen whether Coxhead's AWL will continue to be used, will be revised or replaced in future advanced learners' dictionaries, because not all scholars concur with her AWL. . . . The AWL could be regarded for the time being as "a quick reference" for academic vocabulary until more research bears fruit . . . . (100)
関連して The AWL Highlighter なるツールがあり,ここに英文テキストを入れると,AWL 語彙をハイライトしてくれる.私が最近書いた英語論文のイントロ部の1235語で試してみたら,Sublist 10 までのレベルで128語がハイライトされた.これは全体の10.36%であり,academic 度は合格か!?
・ Dohi, Kazuo, Tetsuo Osada, Atsuko Shimizu, Yukiyoshi Asada, Rumi Takahashi, and Takashi Kanazashi. "An Analysis of Longman Dictionary of Contemporary English, Fifth Edition." Lexicon 40 (2010): 85--187.
現代英語の最頻英単語は何か.この話題についてはコーパス言語学,辞書学,計算機の発展により,様々な頻度表が作られてきた.ウェブ上でも簡単に手に入るので,いくつか代表的なリストや情報源へのリンクを掲げておく.語彙研究に活用したい.
[主要な頻度表]
・ GSL ( General Service List ): 最頻2000語を掲げたリスト.出版が1953年と古いが,現在でも広く参照されているリスト.
・ AWL ( Academic Word List ): 学術テキストに限定した最頻語リスト.2000年に出版され,GSLに含まれる語と重複しないように選ばれた570語を掲載.10のサブリストに分かれている.AWL の前身となる,1984年に出版された808語のリスト UWL ( University Word List ) も参照.
・ BNC Word Frequency Lists: BNC ( The British National Corpus ) による最頻6318語のリスト.頻度表の直接ダウンロードはこちらから.
・ Top 1000 words in UK English: 18人の著者,29作品,460万語のコーパスから抽出したイギリス英語の最頻1000語リスト.
・ Brown Corpus List: Brown Corpus によるアルファベット順リスト.
・ The Longman Defining Vocabulary: LDOCE の1988年版の定義語彙リスト.2000語以上.
[他のリストへのリンク集]
・ Work/Frequency List: 様々な頻度表へのリンク集.(2010/09/10(Fri)現在リンク切れ)
・ Famous Frequency Lists: 様々な頻度表へのリンク集.
・ Basic English and Common Words: ML上の最頻語頻度表についての議論.
[アルファベットの文字の頻度表]
・ Letter Frequencies (rankings for various languages): いくつかのランキング表がある.BNCでは "etaoinsrhldcumfpgwybvkxjqz" の順とある.
(後記 2010/03/07(Sun):American National Corpus に基づいた頻度表を見つけた.Written と Spoken で分別した頻度表もあり.)
(後記 2010/04/12(Mon):COLT: The Bergen Corpus Of London Teenage Language に基づいた最頻1000語のリストを見つけた.)
(後記 2011/02/14(Mon):Corpus of Contemporary American English (COCA) に基づいた Corpus-based word frequency lists, collocates, and n-grams を見つけた.Top 5,000 lemma, Top 500,000 word forms など.)
Powered by WinChalow1.0rc4 based on chalow