hellog〜英語史ブログ     ChangeLog 最新     カテゴリ最新     前ページ 1 2 3 次ページ / page 2 (3)

dictionary - hellog〜英語史ブログ

最終更新時間: 2019-10-13 11:14

2013-09-22 Sun

#1609. Cawdrey の辞書をデータベース化 [cawdrey][lexicography][dictionary][cgi][web_service][inkhorn_term][lexicology]

 英語史上初の英英辞書 Robert Cawdrey の A Table Alphabeticall (1604) について,cawdrey の各記事で話題にしてきた.オンライン版をもとに,語彙項目記述を検索可能とするために,簡易データベースをこしらえた.半ば自動でテキストを拾ってきたものなので細部にエラーがあるかもしれないが,とりあえず使えるようにした.
 データベースの内容をブラウザ上でテキスト形式にて閲覧したい方は,こちらをどうぞ(あるいはテキストファイルそのものはこちら).

    


 以下,使用法の説明.SQL対応で,テーブル名は "cawdrey" として固定.select 文のみ有効.フィールドは7項目で,ID (整理番号),LEMMA (登録語),INITIAL (登録後の頭文字1文字),LENGTH (登録後の文字数),LANGUAGE (借用元言語),DEFINITION (定義語句),DEF_WC (定義語句の語数).典型的な検索式を例として挙げておこう.

# データベース全体を表示
select * from cawdrey

# 登録語をイニシャルにしたがってカウント
select INITIAL, count(*) from cawdrey group by INITIAL

# 登録語を文字数にしたがってカウント
select LENGTH, count(*) from cawdrey group by LENGTH

# 登録語を語源にしたがってカウント
select LANGUAGE, count(*) from cawdrey group by LANGUAGE

# 語源と語の長さの関係
select LANGUAGE, avg(LENGTH) from cawdrey group by LANGUAGE

# 登録語を定義語数にしたがってカウント
select DEF_WC, count(*) from cawdrey group by DEF_WC

# 語源と定義語数の関係
select LANGUAGE, avg(DEF_WC) from cawdrey group by LANGUAGE

# 定義に "(k)" (kind of) を含むもの
select LEMMA, DEFINITION from cawdrey where DEFINITION like '%(k)%'

# 定義に " or " を含むもの
select LEMMA, DEFINITION from cawdrey where DEFINITION like '% or %'

# 定義に " and " を含むもの
select LEMMA, DEFINITION from cawdrey where DEFINITION like '% and %'

# 定義がどんな句読点で終わっているか集計
select substr(DEFINITION, -1, 1), count(*) from cawdrey group by substr(DEFINITION, -1, 1)



 ・ ポール・バケ 著,森本 英夫・大泉 昭夫 訳 『英語の語彙』 白水社〈文庫クセジュ〉,1976年.

[ | 固定リンク | 印刷用ページ ]

2013-04-22 Mon

#1456. John Walker の A Critical Pronouncing Dictionary (1791) [orthoepy][pronunciation][dictionary][lexicography][rp][prescriptive_grammar][walker][bl]

 後期近代英語期,主として18世紀に英語の規範を作った個人名を挙げよと言われたら,辞書(綴字)は Samuel Johnson (1709--84),文法は Robert Lowth (1710-87),では発音は誰か.
 答えは,John Walker (1732--1807) である.彼の著わした A Critical Pronouncing Dictionary (1791) は,正しい権威ある発音を求めた18世紀のイギリス庶民たちに確かな道しるべを与えた.初版以降,100版以上を重ねて人気を博し,英米では "Elocution Walker" と呼ばれるまでに至った.18世紀末に Walker が定着させ方向づけた正音主義路線は,19世紀末から20世紀にかけて容認発音 (RP = Received Pronunciation) が生み出される基盤を提供し,現代標準英語にまで大きな影響を及ぼしている.
 辞書の表題は例によって長い."A Critical Pronouncing Dictionary and Expositor of the English Language: to which are prefixed Principles of English Pronunciation: Rules to be Observed by the Natives of Scotland, Ireland, and London, for Avoiding their Respective Peculiarities; and Directions to Foreigners for Acquiring a Knowledge of the Use of this Dictionary." 表題の表現が示すとおり,ロンドン中心の相当に凝り固まった規範主義である.序文でもロンドン発音こそが "undoubtedly the best" と断言しているが,ロンドンとはいっても Cockney 発音は例外であり,スコットランドやアイルランドの発音を引き合いに出しながら Cockney を "a thousand times more offensive and disgusting" と糾弾している.
 Walker の辞書の発音解説は実に詳細で,例えば drama の語義説明は22語ほどで終わっているが,発音説明は770語に及ぶ詳しさだ.収録語数36,600語は,ライバル辞書ともいえる Thomas Sheridan の A General Dictionary of the English Language (1780) の約38,000語には少々及ばないが,発音説明の詳細さは比較にならない.
 British Library の English Timeline にある Walker's correct pronunciation より,見出し語 "BACK" で始まる辞書のページ画像を閲覧できる.以上,Crystal (52) および寺澤 (19--20) を参照して執筆した.
 正音主義の伝統については,「#571. orthoepy」 ([2010-11-19-1]) を参照.

 ・ Crystal, David. Evolving English: One Language, Many Voices. London: The British Library, 2010.
 ・ 寺澤 芳雄(編) 『辞書・世界英語・方言』 研究社英語学文献解題 第8巻.研究社.2006年.

[ | 固定リンク | 印刷用ページ ]

2013-03-21 Thu

#1424. CELEX2 [corpus][dictionary][statistics][frequency][lexicology]

 英単語の頻度に関連する諸研究(Betty Phillips など)で,CELEX という語彙データベースが使用されているのを見かけることがある.現在取りかかっている研究で,巨大コーパスに基づいた信頼できる語彙頻度統計が必要になったので,郵送料込みで350ドルするこの高価なデータベースを入手してみた.現行版は第2版であり,CELEX2 として購入できる.(なお,予想していなかったが,入手した CD-ROM には,LDC99T42 というデータベースも含まれていた.ここには tagged Brown Corpus, Wall Street Journal, Switchboard tagged など Treebank 系のコーパスが入っている.)
 さて,CELEX2 には,英語語彙に関する複数のデータベースが納められている.それぞれのデータベースには,正書法,音韻,音節,形態,統語の各観点から,見出し語 (lemma) あるいは語形 (wordform) ごとに,ソース・コーパス内での頻度等の情報が格納されている.具体的には,次の11のデータベースが利用可能である.

 ect (English Corpus Types)
 efl (English Frequency, Lemmas)
 efs (English Frequency, Syllables)
 efw (English Frequency, Wordforms)
 eml (English Morphology, Lemmas)
 emw (English Morphology, Wordforms)
 eol (English Orthography, Lemmas)
 eow (English Orthography, Wordforms)
 epl (English Phonology, Lemmas)
 epw (English Phonology, Wordforms)
 esl (English Syntax, Lemmas)

 見出し語あるいは語形ごとの token 頻度の取り出しに強いデータベースという認識で購入したが,実際には,含まれている情報の種類は驚くほど豊富で,11のデータベースすべてを合わせたフィールド数はのべ250以上に及ぶ.行数は efl で52,447行,efw で160,595行という巨大さだ.検索用の SQLite DB をこしらえたら,容量にして90MBを超えてしまった.
 CELEX2 のソースは,辞書情報については Oxford Advanced Learner's Dictionary (1974) 及び Longman Dictionary of Contemporary English (1978) であり,頻度情報については 1790万語からなる COBUILD/Birmingham corpus である.このコーパスの構成は,1660万語 (92.74%) が書き言葉コーパス,130万語 (7.26%) が話し言葉コーパスで,前者を構成する284テキストのうち44テキスト (15.49%) がアメリカ英語である.しかし,これらのアメリカ英語はほとんどがイギリス英語の綴字に直されていることに注意したい.
 CELEX2 における "lemma" の定義は,以下の5点に依存する.

 (1) orthography of the wordforms: peek vs peak
 (2) syntactic class: meet (adj.) vs meet (adv.)
 (3) inflectional paradigm: water (v.) vs water (n.)
 (4) morphological structure: rubber (someone or something that rubs) vs rubber (the elastic substance)
 (5) pronunciation of the wordforms: recount [ˈriː-kaʊnt] vs recount [rɪ-ˈkaʊnt]

 したがって,通常異なる lexeme として扱われる bank (土手)と bank (銀行)などは,CELEX2 では同一の lemma として扱われているので注意が必要である.
 このように CELEX2 は非常に強力な語彙頻度データベースだが,その他にも語彙頻度研究に資するデータベースやツールは存在する.本ブログで触れたものとしては,frequency statistics lexicology の各記事や,特に以下の記事が参考になるだろう.

 ・ 「#308. 現代英語の最頻英単語リスト」 ([2010-03-01-1])
 ・ 「#607. Google Books Ngram Viewer」 ([2010-12-25-1])
 ・ 「#708. Frequency Sorter CGI」 ([2011-04-05-1])
 ・ 「#1159. MRC Psycholinguistic Database Search」 ([2012-06-29-1])

 ・ Baayen R. H., R. Piepenbrock and L. Gulikers. CELEX2. CD-ROM. Philadelphia: Linguistic Data Consortium, 1996.

[ | 固定リンク | 印刷用ページ ]

2013-03-17 Sun

#1420. Johnson's Dictionary の特徴と概要 [dictionary][johnson][lexicography]

 「#898. OED2Web3 の比較対照表」 ([2011-10-12-1]) で現代を代表する2大英語辞書の特徴を比較したが,今回は近代英語を代表する Samuel Johnson (1709--84) の A Dictionary of the English Language (2 vols. London: J. & P. Knapton et al., 1755) の特徴をかいつまんで紹介したい.以下は,寺澤(編),pp. 15--19 及び Crystal による同辞書に関するイントロを参考にした.
 1747年,当時すでに文豪としてならしていた Johnson は,"The Plan of A Dictionary of the English Language" を発表し,辞書編纂の意欲を示していた.パトロンからの支援も特にない状態で,6名の助手とともに地道な辞書編纂作業が始められた.結果としてできた辞書の初版は,約3万9千語の収録語数を誇り(1773年の第4版は約4万2,700語),引用文は約11万6千を数える全2巻,約2,500ページの大辞典となった.
 Johnson の辞書の最大の特徴を2つ挙げれば,(1) 各単語の語義ごとに引用例文を加えたこと,(2) 語義を細分化して,適切な定義で示したことである.(1) については,他言語では先例があったものの,英語辞書史上,画期的な試みであり,Johnson が純正な英語の純粋な源泉とみなした王政復古以降の作家群から採録されている.具体的には,Philip Sidney (1554--86), Richard Hooker (c1554--1600), Francis Bacon (1561--1626), Walter Raleigh (c1552--1618), William Shakespeare (1564--1616), Edmund Spenser (c1552--99), John Milton (1608--74), John Dryden (1631--1700), Joseph Addison (1672--1719) などで,計500を超える著者から引用されている(うち,Shakespeare, Dryden, Addison, Bacon で引用の3分の1を占める).原典を参照せずに,Johnson が博覧強記により引用したものも多かったという.
 (2) については,動詞 take を例にとれば,他動詞と自動詞で合わせて134の語義にまで分類しており,先行する Bailey の辞書 (1730) の対応箇所が6行しかないのに比べると,桁違いの細かさである.豊富な引用文例に基づいた定義にも定評があり,OED なども (J.) として Johnson の定義をしばしば借用しているほどである.古典的に有名な oats の定義 "grain, which in England is generally given to horses, but in Scotland supports the people" は,Johnson の個性と主観,独断と偏見を示すものとされているが,確かにそのような例も散見されるものの,概して簡潔で的確な定義が与えられている.
 他の特徴としては,強勢母音の直後に強勢記号が付されていること(ただし,これは先行の Bailey に帰すべき新機軸),語源情報が必ずしも正確でないこと(William Jones に先立つこと30年という時代を考えればやむを得ないか),百科辞典的な知識を盛り込もうとする態度などが挙げられるが,"Plan" を読めばよく分かるように近代辞書に求められるほとんどの項目が盛り込まれているといってよく,Johnson の斬新さが際立つ.
 この辞書は,1810年までに10版を重ね,1815--18年には J. H. Todd による改訂版(1827年に第2版)も著わされた.Johnson 以降 OED に至るまでは,辞書編纂活動は Johnson の補完という意味合いが強く,優に100年以上にわたり英語辞書界に君臨した歴史的な辞書といってよいだろう.Johnson の辞書に基づいて,ドイツ語,イタリア語,ベンガル語との2カ国語辞典が編纂されたように,海外への影響力も甚大だった.
 また,出版の翌年1756年には,簡約版全2巻が出版された.概して忠実な簡略化がなされており,親版よりも検索に便利なため,18世紀を通じて親版を上回って人気を博した.1815年までに14版を重ね,しばしば増刷された.
 さて,Crystal が Johnson の辞書から4000語を選りすぐった選集が,出版の250年の節目にあたる2005年に出版された."Plan" 及び "Preface" とともに手軽に参照できるので,最近は机上に置いて,たまに引いている.

 ・ Johnson, Samuel. A Dictionary of the English Language: An Anthology. Selected, Edited and with an Introduction by David Crystal. London: Penguin, 2005.
 ・ 寺澤 芳雄(編) 『辞書・世界英語・方言』 研究社英語学文献解題 第8巻.研究社.2006年.

[ | 固定リンク | 印刷用ページ ]

2012-10-18 Thu

#1270. 類義語ネットワークの可視化ツールと類義語辞書 [web_service][thesaurus][link][synonym][dictionary][polysemy]

 [2010-08-11-1]の記事「#471. toilet の豊富な婉曲表現を WordNet と Visuwords でみる」で,オンラインで利用できる類義語ネットワークの可視化ツールを2点紹介したが,同趣旨のツールとして WordNet のデータベースに基づいた Graph Words を追加したい.以下に,関連するツールのリンクを挙げておく.

 ・ Graph Words: フリー.出力がシンプル.
 ・ Visuwords: フリー.出力が凝っている.
 ・ Visual Thesaurus: 有料だがトライアルあり.出力が凝っている.

 あわせて,今では通常の類義語辞典もオンラインで豊富にアクセスできるが,いくつか挙げておこう.
 
 ・ Merriam-Webster Thesaurus: 語義ごとに豊富な類義語群が得られる.
 ・ The Free Online Dictionary, Thesaurus and Encyclopedia: 語義もついており,単語学習によい.
 ・ Thesaurus.com: 手早く類義語リストを得られる.
 ・ HyperDictionary.com: 上に同じ.

 類義語リストを簡便に得られるスタンドアロンの辞書ソフトウェアとしては,以下のものを利用することがある.

 ・ WordWeb:英語辞書ソフトウェアとして人気がある.
 ・ TheSage's English Dictionary and Thesaurus:インターフェースがきれい.
 
 歴史英語類義語辞典は,以下の二つ.

 ・ HTOED (Historical Thesaurus of the Oxford English Dictionary)
 ・ TOE (A Thesaurus of Old English)

 類義語ネットワークの可視化ツールをいじっているうちに,単にキーワードに関連する語彙のネットワークを示すものとしてだけでなく,キーワードの語義の広がりを示すものとして利用することができることを発見した.例えば,Graph Words で多義語 "star" のネットワークを覗いてみると,およそ区別される語義ごとに枝のグループができていることがわかる.各語義が,単語置換による示唆というかたちではあるが,荒っぽく「定義」されているといえる(以下,拡大は画像をクリック).

Graph Words for "star"

 "star" のような多義語については,類義語可視化ツールは語義の広がりを見せてくれる,辞書代わりのツールとしても有効なのではないか.

Referrer (Inside): [2013-03-29-1]

[ | 固定リンク | 印刷用ページ ]

2012-07-31 Tue

#1191. Pronunciation Search [pronunciation][web_service][cgi][ame][dictionary]

 綴字ではなく発音で引ける(電子)辞書はいくつかあるが,ある発音をもつ語を一覧にするなどの目的には,今ひとつ使い勝手が悪い.特に,本格的なリストを作るというよりは,軽く単語例を列挙したいなどの日常的な目的には,もっと簡便に使える検索ツールが欲しい.そこで,Grady Ward's Moby からダウンロードできる Moby Pronunciator の圧縮ファイルに含まれている,無償で無制限に利用可能な発音データベース The Carnegie Mellon Pronouncing Dictionary を下敷きにした発音検索ツールを作成した.このデータベースは110935個のエントリーからなるアメリカ英語の発音辞書である(3MB以上あるデータファイルはこちら).

    


 検索の指定は,Carnegie Mellon Pronouncing Dictionary の発音表記に対して正規表現で与えるという仕様である.発音表記の凡例は以下の通り.音素間は半角スペースで区切られている.また,強勢は母音表記に続く 0 (no stress), 1 (primary stress), 2 (secondary stress) で示される.例えば,dictionary の発音表記は,"D IH1 K SH AH0 N EH2 R IY0" などとなる.なお,発音検索は,[2012-06-29-1]の記事で公開した「#1159. MRC Psycholinguistic Database Search」の機能の1部を利用することもできる.

PhonemeExampleTranslation
AAoddAA D
AEatAE T
AHhutHH AH T
AOoughtAO T
AWcowK AW
AYhideHH AY D
BbeB IY
CHcheeseCH IY Z
DdeeD IY
DHtheeDH IY
EHEdEH D
ERhurtHH ER T
EYateEY T
FfeeF IY
GgreenG R IY N
HHheHH IY
IHitIH T
IYeatIY T
JHgeeJH IY
KkeyK IY
LleeL IY
MmeM IY
NkneeN IY
NGpingP IY NG
OWoatOW T
OYtoyT OY
PpeeP IY
RreadR IY D
SseaS IY
SHsheSH IY
TteaT IY
THthetaTH EY T AH
UHhoodHH UH D
UWtwoT UW
VveeV IY
WweW IY
YyieldY IY L D
ZzeeZ IY
ZHseizureS IY ZH ER

[ | 固定リンク | 印刷用ページ ]

2012-07-18 Wed

#1178. MED Spelling Search [dictionary][cgi][web_service]

 MED (Middle English Dictionary) が2001年にオンライン化されてから,中英語の研究環境はとてつもなく便利になった.見出し語と異綴りの検索に関しては,通常のインターフェースのほか正規表現対応インターフェースも用意されており,自由度が高い.
 しかし,いずれの検索結果の出力も,見出し語とそのエントリーへのリンクが張られているだけで,異綴りの種類を一覧したい場合には不便である.それを確認するには,いちいちエントリーの本文へ飛ばなければならない.そこで,Perl5相当の正規表現に対応し,出力結果で見出し語とともに異綴りも確認できる検索ツールを作成した.綴字に注目したMED検索にどうぞ.
 検索対象は,辞書の各エントリーの "headword and forms" 部分である.正規表現検索では,辞書上の母音に付された長音記号や短音記号のは無視される.<æ, Æ> は <A>, <þ, Þ, ð, ð> は <T>, <ȝ, Ȝ> は <3>, <œ> は <O> として検索文に指定できる.例として,一般の見出し語検索には "^taken\b" を,-li 副詞を一覧するには "li\b \(adv\.\)" を指定(前後の引用符は除く).

    

Referrer (Inside): [2014-11-19-1] [2013-04-16-1]

[ | 固定リンク | 印刷用ページ ]

2012-07-03 Tue

#1163. オンライン語彙データベース DICT.ORG [web_service][dictionary][lexicology][link]

 The DICT Development Group による DICT.ORG は,ウェブ上の様々な語彙データベースや辞書を利用するための統一的な仕様を提供するサービスである.登録されている語彙データベースを利用するインターフェースはこちら
 辞書というよりは語彙データベースと呼ぶ方が適切なのは,ある語の定義や発音などを与えてくれるというよりは,ある条件(主として綴字上の条件)を満たす語の一覧を作成するのが得意だからだ.ある特定の目的で行なわれる語彙研究のために,単語リストを準備するのに役立つ.
 DICT.ORG で利用できる辞書はオンライン上で公開されている無料のものが多いが,語彙データベースとしての使用を前提とすれば,機能的には十分である.条件指定の方法("strategy" と呼ばれる;以下参照)は,電子辞書などでお馴染みの,綴字の完全一致,前方一致,後方一致,部分一致のほか,正規表現も完全にサポートしており,近似した綴字の語を取り出す Levenshtein distance 検索や Soundex algorithm 検索も実装されている.

 Strategy   Description
---------   -----------
    first : Match the first word within headwords
    exact : Match headwords exactly
       re : POSIX 1003.2 (modern) regular expressions
     last : Match the last word within headwords
  nprefix : Match prefixes (skip, count)
  soundex : Match using SOUNDEX algorithm
      lev : Match headwords within Levenshtein distance one
     word : Match separate words within headwords
   suffix : Match suffixes
   regexp : Old (basic) regular expressions
substring : Match substring occurring anywhere in a headword
   prefix : Match prefixes

 出力が非常にシンプルであり,まさに語の一覧という体裁なので,この一覧を拾い上げて,別の語彙ツールに投げ込むという使い方もできる.語彙研究に役立つツールを開発するためのベースとして利用できるのではないか.ウェブ上のインターフェースのほか,ローカルからは,Perl で書かれた dict というクライアントなどを経由して利用できる.
 DICT.ORG からは,英語の語彙データベースや辞書への役立つリンクが張られていて便利.特に Dictionary Database SiteOther Database InformationLinguistic Data Resources on the Internet: Dictionaries, Lexica, and Lexical Resources の情報が有用.

Referrer (Inside): [2018-08-24-1]

[ | 固定リンク | 印刷用ページ ]

2012-01-08 Sun

#986. COCA の "WORD AND PHRASE . INFO" [coca][corpus][dictionary][synonym][collocation][semantic_prosody][intensifier][web_service]

 COCA ( Corpus of Contemporary American English ) を運営する Mark Davies 氏が,年末に,COCAベースで語に関する諸情報を一覧できるサービス WORD AND PHRASE . INFO を公開した.語(lemma 頻度で上位60,000語以内に限る)を入力すると,ジャンルごとの生起頻度やそのコンコーダンス・ラインはもとより,WordNet に基づいた定義や類義語群までが画面上に現われる.ほとんどの項目がクリック可能で,さらなる機能へとアクセスできる.インターフェースが直感的で使いやすい.
 類義語研究や collocation 研究には相当に役立つ仕様になったのではないか.例えば,semantic_prosody を扱った[2011-03-12-1]の記事「#684. semantic prosody と文法カテゴリー」で,強意語 utterly, absolutely, perfectly, totally, completely, entirely, thoroughly についての研究を紹介したが,WORD AND PHRASE . INFO で utterly を入力すれば,これらの類義語群が左下ウィンドウに一覧される.あとは,各語をクリックしてゆくだけで,頻度や collocation の詳細が得られる.このような当たりをつけるのに効果を発揮しそうだ.

utterly by WORD AND PHRASE . INFO

Referrer (Inside): [2012-03-03-1]

[ | 固定リンク | 印刷用ページ ]

2011-12-05 Mon

#952. Etymology Search [etymology][dictionary][cgi][web_service][metathesis][blend][dissimilation]

search mode: non-regex regex
search range: word-form definition (in one-line regex only)


 [2010-04-03-1]英語語源情報ぬきだしCGIの上位互換である,[2010-04-23-1]英語語源情報ぬきだしCGI(一括版)のさらに上位互換となる,多機能版「Etymology Search」を作成した.情報源は引き続き Online Etymology Dictionary
 今回の版で新しいのは,通常の語形による検索に加えて正規表現による検索も可能にしたこと,見出し語とは別に定義(語源解説)内の検索を可能にしたことだ.
 初期設定のとおりに "non-regex" かつ "word-form" として検索すると,通常の見出し語検索となる.カンマや改行で区切られた複数の単語を指定すれば,対応する語源記述が得られる.
 search mode として "regex" を指定すると,perl5 相当の正規表現(改行区切りで複数指定可)を用いた検索が可能となる.正規表現を駆使すれば,語形の一部のみにマッチさせて,多数の語を拾い出すことも可能だ.
 さらに,search range に "definition (in one-line regex)" を指定すれば,定義(語源解説)内の文字列を対象として検索できる.この機能では,search mode の値にかかわらず,自動的に正規表現検索(改行区切りにより複数の正規表現を指定することは不可)となるので注意."(?i)" を正規表現の先頭に付加すれば,case-intensive の機能となる.例えば,次のような検索例は有用かもしれない.

 ・ 音位転換を経た(かもしれない)語を一覧
   (?i)\bmetathesis
 ・ かばん語(かもしれない)例を一覧
   (?i)\bblend(s|ed|ing|ings)\b
 ・ 異化を経た(かもしれない)語を一覧
   (?i)\bdissimilat
 ・ 日本語からの借用語(かもしれない)語を一覧
   (?i)\bJapanese\b

Referrer (Inside): [2014-04-20-1]

[ | 固定リンク | 印刷用ページ ]

2011-11-20 Sun

#937. 語形成の生産性 (3) [productivity][morphology][word_formation][affix][dictionary]

 [2011-11-18-1], [2011-11-19-1]に引き続き,語形成の生産性について.生産性の議論には様々な側面があるということを見てきたが,具体的に生産性を測る段には,何をどう測ればよいのだろうか.例えば,形容詞から名詞を作る接尾辞 -ness による語形成の生産性を測定するにはどうすればよいのか.
 単純に考えると,辞書を参照して -ness 語を数え上げるという方法が挙げられるかもしれない.しかし,これでは正確に生産性を測ることはできない.なぜだろうか.

 (1) 辞書ごとに掲載されている -ness 語の数はまちまちである.[2011-11-05-1]の記事「#922. の定義がなぜ難しいか (5)」を始めとして の各記事で触れたように,辞書はそれぞれ独自の方針で編纂されており,どれを選択するかによって数え上げる語数が著しく異なる可能性がある.
 (2) 生産性は,問題の接辞を含む既存の語の数に依存するというよりは,むしろその接辞の添加によって派生される潜在的な語の数に依存すると考えられる.潜在的な語は辞書には載っていないので,辞書を参照しても無意味である.
 (3) 生産性の高い語形成は,音韻・意味において透明性の高い(=予測可能性の高い)語形成であり ([2011-11-18-1]) ,予測可能性が高いということは,その語が辞書に掲載される必要も薄く,実際に掲載されることが少ないということである.一方,生産性の低い語形成は,音韻・意味において透明性の低い(=予測可能性の低い)語形成であり,その語はぜひとも辞書に掲載されるべき語であるということになる.つまり,以下の逆説が成立する."[L]ess productive processes would be represented by more entries in the dictionary than more productive processes!" (Lieber 66) .

 例えば,手持ちのどの辞書も bovine (ウシの)に対応する派生名詞 bovineness を掲載していないが,だからといって -ness がその分だけ生産性が低いかといえば,むしろ逆である.辞書にいちいち掲載する必要がないほどに,-ness による名詞派生が音韻的にも意味的にも透明だということであり,それだけ生産性が高いということだろう.
 生産性を正確に測ることが難しいのは,それが「過去の実績」ではなく「将来性を見込んだ潜在力」の指標だからである.

 ・ Lieber, Rochelle. Introducing Morphology. Cambridge: CUP, 2010.

[ | 固定リンク | 印刷用ページ ]

2011-11-05 Sat

#922. の定義がなぜ難しいか (5) [word][dictionary][lexicography][mental_lexicon]

 標題の話題について,##910,911,912,921 の記事の続編.言語学の研究者は例外なく辞書好き人間だが,辞書が絶対的ではないということもよく知っている.自分が語とは何かという究極の問いに対する答えを知らないにもかかわらず,辞書編纂に関わる可能性すらあるからだ.
 市販の辞書 (dictionary) は,理論と現実の妥協の産物であり,脳内の語彙目録 (lexicon) を反映しているわけではない.前者は,あくまで現実的な諸事情を反映した便宜的な語彙リストである.というのは,辞書編纂者は,編集に際して以下の条件に縛られるからである.Lieber (27) より,辞書編纂者が考慮しなければならない要点を引用しよう.

 ・ the size of the dictionary, which determines the number of words it can hold;
 ・ the intended audience of the dictionary (adults, children, language learners, etc.);
 ・ whether a word has a sufficiently broad base of usage;
 ・ whether it's likely to last;
 ・ whether it's too specialized or technical for the intended audience;
 ・ for a word borrowed from another language, whether it's assimilated enough to be considered part of English.


 近年の online dictionary の興隆により,紙幅の都合という従来の辞書の旧弊は克服されつつある.しかし,online とはいえども,辞書としてある種の読者を対象とする以上,他の条件は満たさざるを得ない.
 市販の辞書は多かれ少なかれ複数の言語使用者をターゲットにするが,mental lexicon は言語使用者一人ずつに存在するものである.この両者を調和させるということ自体が,無理な注文なのかもしれない.dictionary と (mental) lexicon という用語の間に横たわる考え方の違いを認識することが重要である.

 ・ Lieber, Rochelle. Introducing Morphology. Cambridge: CUP, 2010.

Referrer (Inside): [2014-07-20-1] [2011-11-20-1]

[ | 固定リンク | 印刷用ページ ]

2011-11-04 Fri

#921. の定義がなぜ難しいか (4) [word][dictionary][lexicography][oed][mental_lexicon]

 [2011-10-26-1]の記事「#912. の定義がなぜ難しいか (3)」の (2) で触れたが,辞書には意味が不詳であるにもかかわらず見出し語として掲げられているものがありうる.語の意味が不詳であるということは辞書編纂者の情報収集の問題であるという可能性は排除できないにせよ,その語が一般的に知られていない語であるということは恐らく間違いないだろう.
 OED では,そのような語が少なくとも77個は登録されている.以下は,OED の定義部検索で "meaning obscure" あるいは "obscure meaning" というキーワードにより引き出された語である.Lieber (26) では,OED での同種の検索により87語が引き出されたとしているが,ここには語義の1つのみが意味不明というものも含まれている.それを手作業で排除した結果の77語だ.

cremitoried (ppl. a.), †emporture (v.), †gestyll (v.), †leary (a.), †leg-saw, †minority waiter, notchet, †rag (v.4), †reordi (a.), †reprobitant (a.), †resaille, †residence (v.), †rok, †romb (v.), †rompering, †rownfol(d, †rubell, †rum (n.3), †ruvell, †ryne2, scuncheon anglers, -crest, †sheer-point, short-coat vicarage, †shreake, shuffle-breeches, †sidder (v.), †sithy-coat, †skyvald, †slampamb, †slope (v.3), †smazky (a.), †spanner2, †sparth2, †spen (n.), †spencer (v.), †spene (n.), †sperring (vbl. n.), †sperware, †splet (n.), †splete, †spleyer, †spyccard, †squaleote (v.), †squalm, †squirgliting (a.), †start-rope, †strothe (a.), †threte (n.), †thwerl (v.), †traythly (adv.), †trice (n.3), umbershoot, †unbrede (v.), †uncape (v.), †underdrawn (ppl. a.), †uniable (a.), †unthwyuond (pres. pple.), †untwitten (ppl. a.), †val-dunk, †ver (n.2), †verge-salt, †verling-line, †versing box, †very(e), †vezon, †viridary (a.), †vitremyte, †vounde (a.), †vowgard, †vrycloth, †wandclot, †way-flax, Welsh brief, †werder, †wesel, †wranchevel, †wrast (? n.)


 71語が廃語というのが現実だが,要点はこのような語が辞書にエントリーされているという事実があることである.dictionary の見出し語と mental lexicon の登録が必ずしも一致しないということは,これらの例からも明らかだろう.語とは何かという問いへの答えを辞書編集者に任せるわけにはいかないということを示す好例だ.

 ・ Lieber, Rochelle. Introducing Morphology. Cambridge: CUP, 2010.

Referrer (Inside): [2014-07-20-1]

[ | 固定リンク | 印刷用ページ ]

2011-10-26 Wed

#912. の定義がなぜ難しいか (3) [morphology][terminology][word_formation][word][dictionary][lexicology][hapax_legomenon][ghost_word]

 [2011-10-24-1], [2011-10-25-1]に引き続き,語の定義の難しさを垣間見る記事の第3弾.語を定義する最も単純な方法,語の範囲を限定する最も直感的な方法は,辞書を参照することだろうと思われるかもしれない.辞書の見出し語はすべて「語」のはずであり,大型辞書を参照すれば当該言語の語の目録 (lexicon) を作成することができる,と.しかし,語の範囲を限定する際に,辞書に頼ってはならないいくつかの理由がある.Lieber (13--15) に拠って,列挙しよう.

 (1) 辞書は,編集者によってある方針に基づいて編まれている.編集者の想定する語の定義によっては収録語彙の範囲に差が生じる可能性があり,実際に,語に対する考え方は辞書間で異なっていることが普通である.差別用語や専門用語を掲載するかどうか,俗語や古語はどうか,新語はどの程度社会に浸透していれば収録可とみなせるか,接辞は語に含まれるか,派生語や複合語はどこまで納めるか,等々の決定において,各辞書編集者は独自の方針をもっている.世界最大の英語辞書 OED であっても,事情は変わらない.また,参照者においてもどの辞書を選ぶかという決定は恣意的である.辞書に語の定義を委ねることは,問題を一段階さかのぼらせたにすぎず,問題の解決になっていない.
 (2) 辞書には,一度しか文証されない語(臨時語,nonce word, hapax legomenon)が収録されている場合がある.例えば,OED では umbershoot という語が見出し語として挙げられており,James Joyce の Ulysses からの唯一の例が引かれているが,定義欄に "a word of obscure meaning" とある.果たして,これを実際的な意味において語とみなしてよいのだろうか.文豪 Joyce だから許されるのか,一般の話者の発する臨時語はどうなのか.
 (3) 誤植,勘違い,民間語源などにより,間違えて辞書に忍び込んでしまった幽霊語 (ghost word) なる語がある.OED には,ambassady なる hapax legomenon が収録されているが,これは ambassade の単純な綴り間違い,あるいは誤植ではないかと考えられている.辞書を盲信すると,実在しないかもしれない語を語としてみなす誤りが生じうる.特殊で意図的な幽霊語として,"mountweazel" 語と呼ばれるものがある.これは,辞書編纂者が他の辞書編纂者による辞書の著作権侵害を見破るために,意図的に密かに挿入した幽霊語であり,実在の語ではない.このような mountweazel 語の存在は,辞書を絶対的な語彙目録として用いることの危険を物語っている.
 辞書やその他の権威は,"Is xyz a word?" という問いに必ずしも正しい答えを与えてくれるとは限らないことが分かるだろう.

 ・ Lieber, Rochelle. Introducing Morphology. Cambridge: CUP, 2010.

[ | 固定リンク | 印刷用ページ ]

2011-10-13 Thu

#899. Web3 の permissiveness [lexicography][webster][dictionary][variation][diatone]

 この2日間の記事 ([2011-10-11-1], [2011-10-12-1]) で,米国最大の英語辞書 Web3 の特徴を見てきた.出版当時の評価を一言で表わせば,現代の英語辞書史上,最も descriptive で,最も permissive な辞書だったということになるだろう.
 こと発音記述に関しては,昨日の記事で記した通り「変種を詳しく示し,非標準音も併記(30種を超える場合もある);優先発音を必ずしも明示せず」であり,何でもありという印象を受ける.実際に,最近,問題のある語のアクセント位置を複数の辞書によって調べるという作業を行なっていたのだが,Web3 の variation の豊富さは群を抜いていた.Web3 が規範的な発音を知るという目的に向いていないことを痛切に感じた.
 具体的に述べると,本ブログでも何度か扱ってきた強勢の「名前動後」化が疑われる語について (see diatone) ,この1世紀の間の強勢の変化を辞書によって追おうとした.英米両変種を扱ったが,アメリカ英語からは以下の4つの辞書で強勢の記述を比較した.

 ・ Web1913 = Webster's Revised Unabridged Dictionary. Ed. Noah Porter. Online version published on 9 January 1997 at http://machaut.uchicago.edu/websters . Merriam, 1913.
 ・ PDAE = Kenyon, John Samuel and Thomas Albert Knott, eds. A Pronouncing Dictionary of American English. Springfield, Mass.: Merriam, 1951.
 ・ Web3 = Gove, Philip Babcock, ed. Webster's Third New International Dictionary of the English Language, Unabridged. Springfield, MA: G. & C. Merriam, 1961. (In this survey I used the CD-ROM version [2000] based on the 1961 unabridged edition.)
 ・ AHD4 = The American Heritage Dictionary of the English Language. 4th ed. \ Boston: Houghton Mifflin, 2006.

 以下は,名前動後化の傾向を示唆する14語について,辞書ごとに強勢の記述をまとめたものである."o" は "oxytone"(後の音節に強勢あり),"p" は "paroxytone" (前の音節に強勢あり)を示す.Web3 では,"p, o" や "o, p" が多く,どちらに強勢をおいても可と言わんばかりである.調査の姿勢としては,とりわけ規範的な発音を重視するという方針があったわけではないのだが,正直なところ,ここまで permissive な記述を示されると解釈に差し支えると,困った次第である.結局,論文 (forthcoming) では辞書の規範主義と記述主義について一言述べずにはいられなかった・・・.

WORDPOSWeb1913PDAEWeb3AHD4
declinenounooo, po
declineverboooo
dismountnoun--oop
dismountverboooo
disputenounooo, po
disputeverboooo
employnounooo, po
employverboooo
entailnounooo, po
entailverboooo
rebuffnounooo, po
rebuffverboooo
replaynoun--op, op
replayverb--ooo
reportnounooo, po
reportverboooo
retortnounoooo, p
retortverboooo
retouchnounoop, oo, p
retouchverboooo
revisenounooop, o
reviseverboooo
romancenounoo, po, po, p
romanceverbooo, po
surmisenounoo, po, po
surmiseverboooo
trajectnounopp--
trajectverboooo

[ | 固定リンク | 印刷用ページ ]

2011-10-12 Wed

#898. OED2Web3 の比較対照表 [lexicography][webster][dictionary][oed]

 昨日の記事「#897. Web3 の出版から50年」 ([2011-10-11-1]) で,アメリカの英語辞書の最高峰である Web3 の評判について言及したが,イギリスにおける最大の英語辞書 OED2 と比較するとどのような特徴があるだろうか.特徴の異同を手近においておくと便利だと思ったので,寺澤 (44--45) に掲載されている対照表を以下に掲載する.このように一覧すると,違いがよく見えてくる.

 OED2Web3
出版年(巻数)19281(12+1巻),(New Suppl. 1986, 4巻),19892(20巻)19091, 19342, 19613
総頁数約22,000頁2,662頁(2002年版では2,806頁)
版型30×22.5cm32.5×24.0cm
収録語数約46万4千語(うち主見出し語約35万)約46万語(2002年版では約47万6千)(Web2: 55万〜66万)
用例用例約240万約20万
編集方針歴史的原理;規範性 (prescriptive) [史的言語学の影響];年代順の語義配列;初出年を語義ごとに明示非歴史的;客観的記述主義[構造言語学の影響];(一応)年代順の語義配列;初出年を明示せず
見出し語1150年以後の語すべて収録と称する1755年以後の語を収録(ただし古語・廃語約2万語を含む)(Web2: 1500年以降,ただし Chaucer を含む);科学技術用語重視(ISVラベル);句動詞を立項
篤志文献閲読(協力)者英800名,米400〜500名,約100万枚(1928年版);約100名(1986年版)なし
引用(用例)文学作品重視(約240万例);Shakes. 33,303;Bible 5,725;Milton 12,485意味を明らかにするのに役立つ文例
用法レベル (register)詳細指示位相づけに消極的(colloq, informal, illit., erron. などは用いず);また《英》《豪》《カナダ》などに対してとくに《米》を用いない
語源編集時期の制約はあるが詳細な情報を与える簡潔記述
発音標準英音(国際音標文字による表記)変種を詳しく示し,非標準音も併記(30種を超える場合もある);優先発音を必ずしも明示せず
語形変化各世紀の異綴り形を示す(方言,廃用の語形明示)非標準形も併記
語義詳細な意味区分(set (v.) 20頁,154区分)百科事典的説明を随時加える (cf. hotel) (set (v.) 1頁未満)
図解なし約3千点(Web2 では約12万),色刷り図解を含む
地名・人名なしgazetteer 約3万6千;biographical 約1万3千


 ・ 寺澤 芳雄(編) 『辞書・世界英語・方言』 研究社英語学文献解題 第8巻.研究社.2006年.

Referrer (Inside): [2013-03-17-1] [2011-10-13-1]

[ | 固定リンク | 印刷用ページ ]

2011-10-11 Tue

#897. Web3 の出版から50年 [lexicography][webster][dictionary]

 Web3 として知られる,良くも悪くも画期的なアメリカの誇る最大の辞書は,今年で出版50周年を迎えた.50周年の区切りに,20世紀の英語辞書界に大論争を巻き起こしたこの歴史的な辞書について,新たなレビュー記事が New York Times に寄稿された.Geoffrey Numberg 氏によるその記事は, When a Dictionary Could Outrage でオンラインにて閲読できる.
 Web3 をめぐる大論争は,規範主義的 (prescriptive) な辞書として非常に評価の高かった先行版と比べ,記述主義的 (descriptive) な辞書へと様変わりした,その方針転換を巡っての言語文化論争だった.伝統的にアメリカでは辞書に規範を求める風潮が強かったが,Web3 の編集者 Gove は,当時の記述的構造言語学の潮流に乗ることを選んだ.確かに,Web3 の記述には構造言語学の隙のない精密な手法が反映されており,言語学者からの評価は現在に至るまで高い.アメリカ辞書史において初めての「ことばの辞書」だという評も聞かれる.しかし,アメリカ英語を象徴する権威と規範のある辞書の新版を望んでいた当時の一般の消費者にとっては,Gove の寝返りは裏切り行為と映った.アメリカ英語話者の多くが求めていた辞書は,引けば間違いなく正しい語法をすぐに得られる,正用集としての辞書だったが,Web3 は正用も誤用も混ぜ合わせたかのような,非標準的な語法にあまりに寛容な,あまりに記述的な辞書として現われたのである.
 両立場のあいだで激しい議論が繰り広げられた.出版に先立つ前評判が高かったことが大論争の火種に油を注ぐことになったが,出版の翌年1962年には62編の論評が発表されたというから,反響の大きさが知れる.しばしば失敗作とのレッテルを貼られ,Web3 にとっては苦難の時代の始まりとなったが,辞書と規範という悩み深い問題を大々的に提起したこと自体が,アメリカにおける Webster 辞書の威信を物語っているように思われる.
 Web3 論争の歴史的意義について,Numberg 氏は次の2点をもって総括している.

It introduced the words "prescriptivist" and "descriptivist" into the cultural conversation, and fixed the battle lines for the ritualized squabble over standards that persists across media old and new.


[T]he furor over Webster's Third also marked the end of an era. It's a safe bet that no new dictionary will ever incite a similar uproar, whatever it contains. . . . [N]ow all is legitimated under the rubric of pop culture.


 Web3 によって,記述主義がアメリカの英語辞書界のみならず広くアメリカの論壇にも知れ渡ることになった.しかし,英語辞書に限定しても,規範主義が駆逐されたわけではなく,依然として辞書の規範的権威は大きいという事実は変わっていない.記述と規範 --- 極めて扱いの難しいこの言語文化上の問題を提起して50年,目下 Web4 の編纂が始まっているところである.
 オンラインで,2009年の Ain't That the Truth: Webster's Third: The Most Controversial Dictionary in the English Language なるレビュー記事も見つけたので,参照されたい.

 ・ Gove, Philip Babcock, ed. Webster's Third New International Dictionary of the English Language, Unabridged. Springfield, MA: G. & C. Merriam, 1961.
 ・ 寺澤 芳雄(編) 『辞書・世界英語・方言』 研究社英語学文献解題 第8巻.研究社.2006年.43--45頁.

[ | 固定リンク | 印刷用ページ ]

2011-08-22 Mon

#847. Oxford Learner's Thesaurus [lexicography][dictionary][thesaurus][lexicology][synonym][semantic_prosody]

 英語には数多くの類義語辞典 (thesaurus) があり,[2010-08-11-1]の記事「toilet の豊富な婉曲表現を WordNet と Visuwords でみる」で示したようにオンライン版辞書や類義語の視覚化ツールも少なからず存在する.歴史的類義語辞典としても,近年 HTOED (Historical Thesaurus of the Oxford English Dictionary)TOE (A Thesaurus of Old English) が公開されており,活況を呈している.
 共時的にも通時的にも英語語彙の研究環境は著しく整ってきているが,外国語としての英語の学習環境という観点からは類義語辞典の役割はこれまであまり目立ってこなかった.学習の観点からの類義語の解説については,OALDLDOCE などの老舗学習者用英英辞書も力を入れてきており,発信用の英語学習にも役立つおもしろい解説が増えてきたが,類義語の列挙と解説に特化した学習者用類義語辞典というものはあまり出版されていなかった.唯一,American Heritage Thesaurus for Learners of English (2002) があったくらいだが,2008年になって標題の Oxford Learner's Thesaurus (OLT) が出版された.この辞書は私の手元にもあったが,これまで特に強い関心はなく,意識的に開いたことはほとんどなかった.だが,最近 Komuro and Ichikawa による OLT の辞書分析を読んで,学習者用類義語辞典に興味がわいてきた.辞書は特徴を知っておくことが重要なので,以下に OLT について知っておいてよい点を,Komuro and Ichikawa を参照しながらいくつか挙げておきたい.

 ・ OLT は,Oxford Thesaurus of English (2000, 2004) からの派生物ではなく,むしろ OALD7 (2005) との関係が強い (12) .実際に,OALD7 の類義語解説が多く OLT に反映されている.(つまり,最初から学習者向けにチューニングされており,平易でかゆいところに手が届く記述が期待され,実際にそのようになっている.)
 ・ OLT に限らないが,学習者用類義語辞典の主たる機能は,"(1) make users aware of different connotations or shades of meaning synonyms have and to (2) enable users to choose and use the most appropriate word, which may not be part of their (active) vocabulary, in order to express their idea" (14) .
 ・ 見出し語数は学習者向けに選ばれた1973個で,単語だけでなく複合語や句が見出し語となっている場合もある (16) .
 ・ 1つの見出し語に与えられている類義語の数は,最頻値をとると5--6個 (26) .多すぎず,少なすぎず,学習者にとって適切.
 ・ 挙げられている例文はおおむね適切で,CD-ROM版では各類義語に対して平均3.7個ほどの例文が挙げられている (29) .
 ・ 類義語間の区別にとりわけ重要な register のレーベルや解説が質量ともに充実している (35--45) .特に解説は読み物としておもしろく書かれている (45, 49) .
 ・ 意味の強度によって区別される類義語群について,視覚的な "synonym scales" なる提示法が導入されており,学習上,非常に効果的である (49--52) .

 全体として Komuro and Ichikawa は "a groundbreaking learner's thesaurus (55) と高い評価を与えており,特に最後の "synonym scales" の評価については,私も実際に見てみたが同感.例えば,afraid の類義語の synonym scale は以下の通り.このように一覧されると,頭が整理される.

Synonym Scale of

 レビュー論文を読んでこれから積極的に OLT を利用してみたいと思った.また,英語学習に役に立ちそうであることは言うに及ばず,語彙論や意味論の研究に際しても,本格的な類義語辞典やその他の辞書を用いる前の見当づけやテーマ探しにも使えそうだという印象をもった.例えば,synonym scale を与えられている以下の126語の見出し語から適当な類義語群を選び出し,コーパスを用いて semantic_prosody の研究をするというのもおもしろそうだ.

admiration [n], afraid [a], anger [n], anger [v], angry [a], annoy [v], approval [n], bad [a], beautiful [a], cheap [a], childhood [n], close [a], cold [a], concern [n], convincing [a], crazy [a], crisis [n], defeat [v], delicious [a], delight [v], determine [v], dictate to sb [pv], disappoint [v], disapprove [v], disgusting [a], distress [n], embarrass [v], emotion [n], exciting [a], expose [v], fast [a], fat [a], fear [n], flush [v], frequent [a], friendship [n], frighten [v], frightening [a], frown [v], funny [a], gap [n], glad [a], happy [a], hate [v], hatred [n], high [av], hill [n], hot [a], hungry [a], hurt [v], hysterical [a], immediate [a], impress [v], inspire [v], interest [v], interested [a], interesting [a], ironic [a], like [v], likely [a], lonely [a], lose your temper [idiom], love [n], love [v], mad [a], magnificent [a], mean [a], mentally ill [a], minute [n], modern [a], negative [a], nice [a], odour [n], pain [n], painful [a], plain [a], please [v], pleasure [n], poor [a], possibility [n], praise [v], press [v], pressure [n], probably [adv], quite [adv], radical [a], rain [v], rape [v], recession [n], recommend [v], remarkable [a], respect [v], revenge [n], ridiculous [a], rough [a], rude [a], ruin [v], run [v], ruthless [a], sad [a], serious [a], shock [n], shock [v], show [v], small [a], smile [v], soak [v], sorry [a], star [n], strict [a], suppress [v], sure [a], surprise [v], take advantage of sb/sth [v], taste [n], tear [v], temper [n], tight [a], tired [a], ugly [a], unhappy [a], upset [a], violent [a], well [a], wet [a], worry [v]


 ・ American Heritage Thesaurus for Learners of English. Boston & New York: Houghton Mifflin Harcourt Publishing Company, 2002.
 ・ Oxford Learner's Thesaurus: A Dictionary of Synonyms. Oxford: OUP, 2008.
 ・ Komuro, Yuri and Yasuo Ichikawa. "An Analysis of the Oxford Learner's Thesaurus: A Dictionary of Synonyms." Lexicon 41 (2011): 11--59.
 ・ Oxford Advanced Learner's Dictionary. 7th ed. Oxford: OUP, 2005.

[ | 固定リンク | 印刷用ページ ]

2010-12-22 Wed

#604. 最初の英英辞書 A Table Alphabeticall (2) [lexicography][dictionary][punctuation][inkhorn_term][cawdrey]

 昨日の記事[2010-12-21-1]に引き続き,Robert Cawdrey (1537/38--1604) の A Table Alphabeticall (1604) の話題.この史上初の一般向け英英辞書には,当時の英語やそれが社会のなかに置かれていた状況を示唆する様々な情報の断片が含まれている.A Table Alphabeticall にまつわるエトセトラとでもいうべき雑多な話題を以下に記そう.

 (1) [2010-12-04-1]の記事で引用したように,タイトルページには,この辞書が一般庶民のために難しい日常語を易しい英語で解説することを旨としていることが明言されている.しかし,その下に続く1節も,本辞書の出版意図を探る上で重要なので,初版から引用しよう.

Whereby they may the more easilie and better vnderstand many hard English wordes, which they shall heare or read in Scriptures, Sermons, or elswhere, and also be made able to vse the same aptly themselues.


 ここでは,Cawdrey が辞書編纂者である以前に村の聖職者であったこと,しかも頑固な Puritan として教会当局に目をつけられて裁判沙汰にもなっていたことが関係している.聖書などにも含まれる難語をいかにして一般聴衆によく理解させるかに腐心していた説教師 Cawdrey の一面が垣間見られる.実際に,宗教関係の用語の多くが見出し語として採用されている ( Simpson 15 ) .

 (2) Siemens の分析によると,定義部の文体に,見出し語の品詞ごとに一定の構造が認められる.これは辞書史を論じる上でも重要な視点である.Siemens の論文は Siemens: Lexicographical Method in Cawdrey で閲覧可能.

 (3) 辞書内で使われている綴字には緩やかな標準化の方向が感じられるが ( see [2010-12-04-1] ) ,句読法 ( punctuation ) にはそれが感じられない.例えば,定義を終えるのにピリオドの場合もあれば,セミコロンの場合もあり,何もない場合も多い ( Simpson 22 ) .

 (4) 語源情報が貧弱.同時代の辞書でも語源情報は同じように貧弱であり,その時代としては無理もない.見出し語は無印であればラテン語借用語であることが前提とされ,フランス語やギリシア語の場合には省略記号が付される.このように提供側言語が示されるのみで,それ以上の語源情報は与えられていない.

 (5) Cawdrey 自身,ynckhorne termes を序文 "To the Reader" で攻撃している(赤字は転記者).

SVch as by their place and calling, (but especially Preachers) as haue occasion to speak publiquely before the ignorant people, are to bee admonished, that they neuer affect any strange ynckhorne termes, but labour to speake so as is commonly receiued, and so as the most ignorant may well vnderstand them: . . . .


 (6) 当然ながら見出し語はアルファベット順に並んでいるが,驚くことに当時の読者にとってはこれは自明のことではなかったようだ.というのは,Cawdrey は序文 "To the Reader" で辞書の引き方の指示を次のようにしているからである.

If thou be desirous (general Reader) rightly and readily to vnderstand, and to profit by this Table, and such like, then thou must learne the Alphabet, to wit, the order of the Letters as they stand, perfecty without booke, and where euery Letter standeth: as (b) neere the beginning, (n) about the middest, and (t) toward the end. Nowe if the word, which thou art desirous to finde, begin with (a) then looke in the beginning of this Table, but if with (v) looke towards the end. Againe, if thy word beginne with (ca) looke in the beginning of the letter (c) but if with (cu) then looke toward the end of that letter. And so of all the rest. &c.


 (7) 初版では2543語が見出しに採用されたが,続く1609, 1613, 1617年の版ではそれぞれ3009, 3086, 3264語へと増補された(2版以降に Cawdrey 自身が関わった形跡がないことから,初版直後に亡くなったのではないかと推測されている).John Bullokar の An English Expositor: Teaching the Interpretation of the hardest words used in our language (1616) が現われてからは,A Table Alphabeticall の人気は一気に衰えたようである ( Simpson 29 ) .

 (8) 初版に基づいてHTML化された電子版,本辞書の解説,参考文献が A Table Alphabeticall of Hard Usual English Words (R. Cawdrey, 1604) で入手可能である.

 ・ Simpson, John. The First English Dictionary, 1604: Robert Cawdrey's A Table Alphabeticall. Oxford: Bodleian Library, 2007.
 ・ Bately, Janet. "Cawdrey, Robert (b. 1537/8?, d. in or after 1604)." Oxford Dictionary of National Biography. Online ed. Ed. Lawrence Goldman. Oxford: OUP. Accessed on 19 Dec. 2010.

[ | 固定リンク | 印刷用ページ ]

2010-12-21 Tue

#603. 最初の英英辞書 A Table Alphabeticall (1) [lexicography][dictionary][inkhorn_term][cawdrey]

 [2010-11-24-1], [2010-12-04-1]の記事で,Robert Cawdrey (1537/38--1604) の A Table Alphabeticall (1604) が,英語史上,英英辞書の第1号であることを紹介した.Simpson (18) によれば,"As far as is known, it [A Table Alphabeticall] is the first dictionary published in book form addressed to the general reader which defines 'usual' English words in English." ということである.今回は,Simpson のこの引用を参照して,A Table Alphabeticall が最初の英英辞書であるということは何を意味するのかを考えてみたい.
 まず第1に,英単語を見出しとする初の monolingual 辞書であるという点 ( "English words in English" ) が重要である.少し考えてみればすぐに分かることだが,羅英辞書,仏英辞書,伊英辞書などの2カ国語辞書 ( bilingual dictionary ) の出版のほうが,1言語辞書 ( monolingual dictionary ) の出版よりも早い.辞書の本来の目的は,未知の外国語単語を既知の自国語単語へ翻訳することであるからだ.たとえ辞書という立派な体裁をなしていなくとも,対訳単語リストの形で本の付録などについていたものを合わせると,すでに2カ国語辞書といえるものは出版されていた.しかし,英英辞書は Cawdrey のものが初だったのである.ただし,A Table Alphabeticall が bilingual dictionary と monolingual dictionary の中間的な辞書であったことは確かである.というのは,含まれている見出し語はすべてラテン語を中心とした借用語であり,それをわかりやすい英単語へ翻訳するというのがこの辞書の意図だったからである.ちなみに,大陸の他の言語ではすでに同種の1言語辞書はいくつか出版されており,あくまで「英英」として最初のものであったことを指摘しておきたい.
 第2に,"'usual' English words" を取りあげ,読者層として "the general reader" を想定した点.(1) で1言語辞書としては最初のものであった述べたが,専門語辞書であれば先行する1言語辞書は存在した.しかし,後者は当然専門家向けであり,一般大衆向けの1言語辞書は存在しなかった.16世紀の終わりまでに inkhorn terms ( see inkhorn_term ) を含めた大量の難解な日常語が蓄積されてきたことにより,一般向けに難しい日常語を解説する辞書の需要が増してきた.このタイミングで出版されたのが A Table Alphabeticall だったのである.
 上の2点から,Cawdrey にとって先行するお手本はいくつか存在していたことが分かる.例えば,[2010-07-12-1]の記事で触れた Edmund Coote の出版した The English schoole-maister: teaching all his scholers, the order of distinct reading, and true writing our English tongue (1596) や,Thomas Thomas の Dictionarium Linguae Latinae et Anglicanae (1587) は,見出しや定義に関して頻繁に参照された形跡がある(ある推計によると Cawdrey は見出し語の17--18%を両者に拠っている; see Siemens: Lexicographical Method in Cawdrey. ).こうしてみると,A Table Alphabeticall は Cawdrey の完全なオリジナルとはいえないのかもしれないが,歴史上の「最初の」という形容は,時代の潮流に乗り,人々の要求をつかんで,あるものを形として残した場合に与えられる称号なのだろう.この難語解説辞書の出版は,Cawdrey が Rutland (現在の Leicestershire の一部)の村の聖職者として,日々,人々にわかりやすく説教をする必要を感じていたこととも無関係ではない.時代の流れと人生の志とがかみ合ったときに,この歴史的な著作が世に現われたのである.

 ・ Simpson, John. The First English Dictionary, 1604: Robert Cawdrey's A Table Alphabeticall. Oxford: Bodleian Library, 2007.

[ | 固定リンク | 印刷用ページ ]

Powered by WinChalow1.0rc4 based on chalow