hellog〜英語史ブログ     前の日     次の日     最新     2010-10     検索ページへ     ランダム表示    

hellog〜英語史ブログ / 2010-10-14

01 02 03 04 05 06 07 08 09 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31

2010-10-14 Thu

#535. OED の引用データをコーパスとして使えるか (2) [oed][corpus]

 [2010-10-10-1]の記事では,Hoffmann の論文を参照して,OED の引用データは若干の注意は必要だが十分にコーパスとなりうるのではないかという説を見た.一方で,OED の引用は若干ではなく相当の注意を払わないと危ないという厳しい説がある.Brewer によれば,OED の引用データを,各時代を代表するコーパスとみなすことには慎重であるべきだという.Brewer は先行論文を参照しつつ様々な証拠を挙げて議論しているが,主なものを下にまとめてみる.

 (1) 特定の文学作家,文学作品の引用が不釣り合いに多い.被引用数トップ5の作家は,Shakespeare, Walter Scott, Milton, Wycliffe, Chaucer.Shakespeare のカバー率は100%に近いと言われ,引用数は33304例を数える.第5位の Chaucer からの引用は11902例.被引用数トップの作品は,予想通りに聖書.第2位は1300年頃に書かれた長詩 Cursor Mundi で12772例を数える.有名な作家・作品についてはコンコーダンスが手に入りやすいために,引用が採用されやすいという事情があるという (45--47) .引用は言語を代表しているというよりも,編纂者の選択を表わしているというべきである.

Any inferences drawn from the OED coverage about the significance of these writers for the development and illustration of the English lexicon are flawed ones: the exceptionally full representation of their language in the dictionary is due at least as much to the lexicographers' consultation of the concordances as to the intrinsic qualities of these writers' diction. (51)


 (2) 引用数を年代別にプロットすると c1581--1610 に引用が急激に増えている.また,19世紀前半も引用がうなぎ登りに増えている.この点については[2010-10-10-1]の (4) でも触れた.前者の時期については Shakespeare の引用が多いことと深く関連しており,必ずしもその時代の言語を代表しているということにはならないのではないか (47, 58) .後者の時期については,OED 制作のすぐ前の時代であり,必然的に容易に手に入る典拠の数が多いからである.

 (3) 15世紀以前では 1291--1300, 1391--1400 の時期に引用のピークがあるが,1つには年代が不明確な作品については区切りのよい世紀の変わり目に切り上げたり切り下げたりすることがあり,それが反映された結果だという.別の理由としては,1300年頃に Robert of Gloucester (3222例)や Cursor Mundi (10771例)が,1400年頃に Trevisa (6750例)が集中したせいである (57--58) .

 (4) OED に採用される見出し語は英語国のボランティア読者による単語収集とそのメモが元になっているが,ボランティアは普通でない語や普通でない意味を特に注意して集めるように指示されていた.". . . this resulted in partial reading and uneven representation of sources" (50).

 (5) OED には初期近代英語期の辞書等から直接引用している見出し語が多くあるが,その辞書等の見出し語がすべて収録されているわけでなく,見出し語が取捨選択されている形跡がある.ある調査によると,1/5ほどが OED には収録されずに切り捨てられたという.ここでは,編纂者の恣意的な判断,おそらくは19世紀の進化観に裏打ちされた規範主義的な判断が入っていると考えられる (52--52) .

 [2010-10-10-1]とあわせて OED の引用データをコーパスとしてみなしてよいかどうかについて賛否両論を見たが,1000年の歴史英語をカバーする扱いやすい通時コーパスが他に公開されていない以上,上に挙げたような点を意識したうえで OED を注意して用いる,ということ以外に答えはないように思える.

 ・ Brewer, Charlette. "OED Sources." Lexicography and the OED: Pioneers in the Untrodden Forest. Ed. Lynda Mugglestone. Oxford: OUP, 2000. 40--58.

[ 固定リンク | 印刷用ページ ]

2024 : 01 02 03 04 05 06 07 08 09 10 11 12
2023 : 01 02 03 04 05 06 07 08 09 10 11 12
2022 : 01 02 03 04 05 06 07 08 09 10 11 12
2021 : 01 02 03 04 05 06 07 08 09 10 11 12
2020 : 01 02 03 04 05 06 07 08 09 10 11 12
2019 : 01 02 03 04 05 06 07 08 09 10 11 12
2018 : 01 02 03 04 05 06 07 08 09 10 11 12
2017 : 01 02 03 04 05 06 07 08 09 10 11 12
2016 : 01 02 03 04 05 06 07 08 09 10 11 12
2015 : 01 02 03 04 05 06 07 08 09 10 11 12
2014 : 01 02 03 04 05 06 07 08 09 10 11 12
2013 : 01 02 03 04 05 06 07 08 09 10 11 12
2012 : 01 02 03 04 05 06 07 08 09 10 11 12
2011 : 01 02 03 04 05 06 07 08 09 10 11 12
2010 : 01 02 03 04 05 06 07 08 09 10 11 12
2009 : 01 02 03 04 05 06 07 08 09 10 11 12

最終更新時間: 2024-02-28 16:15

Powered by WinChalow1.0rc4 based on chalow