ルネサンス期のラテン・ギリシア語熱に浮かされたかのような「インク壺語」 (inkhorn_term) について,本ブログでも様々に取り上げてきた(とりわけ「#478. 初期近代英語期に湯水のように借りられては捨てられたラテン語」 ([2010-08-18-1]),「#1408. インク壺語論争」 ([2013-03-05-1]),「#1409. 生き残ったインク壺語,消えたインク壺語」 ([2013-03-06-1]),「#1410. インク壺語批判と本来語回帰」 ([2013-03-07-1]),「#2479. 初期近代英語の語彙借用に対する反動としての言語純粋主義はどこまで本気だったか?」 ([2016-02-09-1]),「#3438. なぜ初期近代英語のラテン借用語は増殖したのか?」 ([2018-09-25-1]) を参照).
インク壺語は同時代からしばしば批判や風刺の対象とされてきたが,劇作家 Ben Jonson も,1601年に初上演された The Poetaster のなかでチクリと突いている.Crispinus という登場人物が催吐剤を与えられ,小難しい単語を「吐く」というくだりである.吐かれた順にリストしていくと,次のようになる (Johnson 192; †は現代英語で廃語) .
retrograde, reciprocall, incubus, †glibbery, †lubricall, defunct, †magnificate, spurious, †snotteries, chilblaind, clumsie, barmy, froth, puffy, inflate, †turgidous, ventosity, oblatrant, †obcaecate, furibund, fatuate, strenuous, conscious, prorumped, clutch, tropological, anagogical, loquacious, pinnosity, †obstupefact
OED では,pinnosity を除くすべての単語が見出し語として立てられている.しかし,このなかには Jonson の劇でしか使われていない1回きりの単語も含まれている.現代でも普通に通用するものもあるにはあるが,確かに立て続けに吐かれてはかなわない単語ばかりである.典型的なインク壺語のリストとして使えそうだ.
・ Johnson, Keith. The History of Early English: An Activity-Based Approach. Abingdon: Routledge, 2016.
先日,東北大学大学院情報科学研究科「言語変化・変異研究ユニット」主催の第3回ワークショップ「内省判断では得られない言語変化・変異の事実と言語理論」に参加してきた(主催の先生方,大変お世話になりました!).形態論がご専門の東北大学の長野明子先生の発表「英語の接頭辞 a- の生産性の変化について」では,接辞の生産性 (productivity) の諸問題や測定法について非常に分かりやすく説明していただいた.今回の記事では,長野先生の許可を得て,そのときのハンドアウトから「生産性に関する仮説」を要約したい.
接辞の生産性には availability と profitability が区別される.前者は,その接辞を用いた語形成規則が存在することを指し,それにより形成される潜在的な語がある状態をいう.それに対して後者は,その語形成規則が実際に使用され,単語として具現化している状態をいう.つまり,接辞の生産性を考える際には,新語を作る潜在能力と実際に新語を作った顕在能力を区別しておく必要がある.
接辞の生産性の測定ということになると,潜在能力たる availability の測定は難しい.実際の単語として具現化されていないのだから,客観的に測りようがないのである.したがって,せめて顕在能力である profitability を測り,そこから availability を推し量ってみよう,ということになる.profitability の主要な測定法として3つほどが提案されている.いずれも,コーパスや辞書を用いることが前提となっている.
(1) その接辞をもつ派生語のタイプ数.端的には辞書に登録されていたり,コーパスで文証される単語の語彙素 (lexeme) レベルで数えた個数.
(2) 特定期間での,その接辞をもつ新語の数.
(3) その接辞の派生語が hapax_legomenon である確率.ある程度の規模のコーパスにある派生語が1度しか現われないということと,その語形成の生産性の高さとは相関関係にあるとされている(see 「#938. 語形成の生産性 (4)」 ([2011-11-21-1])).
(1), (2), (3) の測定法には一長一短あり,どれが最も優れているかを決めることはたやすくない.また,これらで測定できる profitability と最終的に求めたい availability との間にいかなる関係があるのかもよく分かっていない.例えば,(1) の値が高くとも availability は高くないとみなせる例がある.例えば,接尾辞 -th, -ment をもつ単語のタイプ数は多いが,現在,生産性のある接辞とはみなすことができないだろう (cf. 「#1787. coolth」 ([2014-03-19-1])) .逆に,(2) の値が低かったとしても,それをもってすぐに availability も低いだろうと予測するのは早計と考えられるケースもある(名詞+動詞の複合など).また,(3) で高い値を示すとしても,母語話者の直観的な生産性とは矛盾するケースがあるようだ.
母語話者の直観として,生産性なるものがあるらしいことは確かだろう.しかし,それを客観的に測定するにはどうすればよいのか,理論的にも実践的にも問題は残されている.
生産性の問題については,本ブログでも以下の記事その他で扱ってきたので要参照.「#935. 語形成の生産性 (1)」 ([2011-11-18-1]),「#936. 語形成の生産性 (2)」 ([2011-11-19-1]),「#937. 語形成の生産性 (3)」 ([2011-11-20-1]),「#938. 語形成の生産性 (4)」 ([2011-11-21-1]),「#876. 現代英語におけるかばん語の生産性は本当に高いか?」 ([2011-09-20-1]),「#940. 語形成の生産性と創造性」 ([2011-11-23-1]),「#2363. hapax legomenon」 ([2015-10-16-1]) .
昨日の記事「#2362. haplology」 ([2015-10-15-1]) でギリシア語の haplo- (one, single) に触れたが,この語根に関連してもう1つ文献学や辞書学の用語としてしばしば出会う hapax (legomenon) を取り上げよう.ある資料のなかで(タイプ数えではなくトークン数えで)1度しか用いられていない語(句)を指す.ギリシア語の hapax (once) + legomenon (something said) からなる複合語だ.複数形は hapax legomena という.
"nonce word" を hapax legomenon と同義としている辞書もあるが,前者は「臨時語」と訳され「その時限りに用いる語」を指す.nonce-word は新語の臨時的な生産性を念頭に用いられることが多いのに対し,hapax legomenon は文献に現われる回数が1度であることに焦点が当てられているという違いが感じられる.nonce (その場限りの)という語の語源については,「#1306. for the nonce」 ([2012-11-23-1]) を参照.
hapax legomenon は,聖書の注釈との関連で,しばしば言及されてきた歴史がある.OED によると英語における初例は1692年のことで,"J. Dunton Young-students-libr. 242/1 There are many words but once used in Scripture, especially in such a sence, and are called the Apax legomena." とある.
文献学や語源学において,hapax legomenon はしばしば問題となる.その語の語源はおろか,意味すら不明であることが少なくない.語彙論や辞書学では,それを一人前の「語」として認めてよいのか,何かの間違いではないか,辞書に掲載すべきか否か,という頭の痛い問題がある (see 「#912. 語の定義がなぜ難しいか (3)」 ([2011-10-26-1])) .一方で,語形成やその生産性という観点からは,hapax legomenon は重要な考察対象となる.というのは,1度だけ臨時的に出現するためには,話者の生産的な語形成機構が前提とされなければならないからである (see 「#938. 語形成の生産性 (4)」 ([2011-11-21-1])) .
だが,実際のところ halax legomenon は決して少なくない.このことは,ジップの法則に照らせば驚くべきことではないだろう (see 「#1101. Zipf's law」 ([2012-05-02-1]), 「#1103. GSL による Zipf's law の検証」 ([2012-05-04-1])) .英語の例としては,Chaucer の用いたnortelrye (education) や Shakespeare の honorificabilitudinitatibus, また Dickens の sassigassity (audacity?) などが挙げられる.
[2011-11-18-1], [2011-11-19-1], [2011-11-20-1]と,語形成の生産性の問題について理解を深めてきた.辞書を利用した生産性の測定はうまく行かないらしいことはわかったが,他にはどのような測定法があり得るだろうか.これまでに,次のような2つの提案がなされている (Lieber 66--67) .
(1) ある接辞添加により潜在的に形成され得る語の総数 (A) を出し,次にその接辞添加により実際に形成された語の総数 (B) を出し,A における B の割合を算出する.例えば,形容詞の基体に付加されて名詞を形成する接尾辞 -ness の場合,形容詞の総数が A となり,実際に文証される -ness 語の総数が B となる.
しかし,この測定法には問題がある.まず,形容詞の総数を把握することは難しい.辞書を参照するということになれば,昨日の記事[2011-11-20-1]で取り上げた諸問題の再来である.実際に文証される -ness 語の総数についても同様だ.-esque 語についていえば,[2011-11-19-1]の記事で触れた通り,この接尾辞は基体に主として多音節の固有名詞を要求するが,この条件に当てはまる基体の数を数え上げることは不可能に近い(まさか,世界人名辞典を参照する!?).
さらに,-esque に見られるような基体に課せられる諸制限は生産性の程度に影響するのであるから,基体に名詞を要求するという以外に制限のない -ness のような接辞の生産性との差異が浮き立つような測定法でなければならない.この測定法では,-esque のA値と -ness のA値に大差がある場合,その差が算入されないという問題がある.
(2) 巨大コーパスを用いて,token frequency に基づいて hapax legomenon の割合を算出する方法.従来の考え方とはまったく異なるこのアプローチは,生産的な語形成に見られる透明性 (transparency) と出現頻度の関係についての知見に基づいている.[2011-11-18-1]で述べたように,生産性の低い語形成は音韻的・意味的に透明性の低い語を生み出す.透明性の低い語は,辞書に (dictionary にも mental lexicon にも)登録されやすい,つまり語彙化 (lexicalize) されやすい.語彙化された語は,語彙化されていない語に比べて,平均してコーパス内のトークン頻度が高いという特徴が見られる.逆から見ると,生産性の高い語形成は透明性も高いゆえに,語彙化されることが少なく,平均してコーパス内のトークン頻度は低い傾向がある.実際のところ,コーパス内に1回しか現われない hapax legomenon である可能性も高い.
この知見に基づき,-ness の生産性の算出を考えてみよう.コーパス内に現われる -ness 語をトークン頻度で数え上げ,これを A とする.この中で hapax legomenon である -ness 語の数を B とする.A における B の比率を取れば,-ness の生産性(少なくとも,生産性を指し示すなにがしかの特徴)の指標となるだろう.
Baayen and Lieber で採用されたこの測定法は,生産性の完璧な指標ではないとしても,母語話者の直感する生産性を比較的よく反映していると考えられる.
・ Lieber, Rochelle. Introducing Morphology. Cambridge: CUP, 2010.
・ Baayen, Harald and Rochelle Lieber. "Productivity and English Derivation: A Corpus-Based Study." Linguistics 29 (1991): 801--43.
[2011-10-24-1], [2011-10-25-1]に引き続き,語の定義の難しさを垣間見る記事の第3弾.語を定義する最も単純な方法,語の範囲を限定する最も直感的な方法は,辞書を参照することだろうと思われるかもしれない.辞書の見出し語はすべて「語」のはずであり,大型辞書を参照すれば当該言語の語の目録 (lexicon) を作成することができる,と.しかし,語の範囲を限定する際に,辞書に頼ってはならないいくつかの理由がある.Lieber (13--15) に拠って,列挙しよう.
(1) 辞書は,編集者によってある方針に基づいて編まれている.編集者の想定する語の定義によっては収録語彙の範囲に差が生じる可能性があり,実際に,語に対する考え方は辞書間で異なっていることが普通である.差別用語や専門用語を掲載するかどうか,俗語や古語はどうか,新語はどの程度社会に浸透していれば収録可とみなせるか,接辞は語に含まれるか,派生語や複合語はどこまで納めるか,等々の決定において,各辞書編集者は独自の方針をもっている.世界最大の英語辞書 OED であっても,事情は変わらない.また,参照者においてもどの辞書を選ぶかという決定は恣意的である.辞書に語の定義を委ねることは,問題を一段階さかのぼらせたにすぎず,問題の解決になっていない.
(2) 辞書には,一度しか文証されない語(臨時語,nonce word, hapax legomenon)が収録されている場合がある.例えば,OED では umbershoot という語が見出し語として挙げられており,James Joyce の Ulysses からの唯一の例が引かれているが,定義欄に "a word of obscure meaning" とある.果たして,これを実際的な意味において語とみなしてよいのだろうか.文豪 Joyce だから許されるのか,一般の話者の発する臨時語はどうなのか.
(3) 誤植,勘違い,民間語源などにより,間違えて辞書に忍び込んでしまった幽霊語 (ghost word) なる語がある.OED には,ambassady なる hapax legomenon が収録されているが,これは ambassade の単純な綴り間違い,あるいは誤植ではないかと考えられている.辞書を盲信すると,実在しないかもしれない語を語としてみなす誤りが生じうる.特殊で意図的な幽霊語として,"mountweazel" 語と呼ばれるものがある.これは,辞書編纂者が他の辞書編纂者による辞書の著作権侵害を見破るために,意図的に密かに挿入した幽霊語であり,実在の語ではない.このような mountweazel 語の存在は,辞書を絶対的な語彙目録として用いることの危険を物語っている.
辞書やその他の権威は,"Is xyz a word?" という問いに必ずしも正しい答えを与えてくれるとは限らないことが分かるだろう.
・ Lieber, Rochelle. Introducing Morphology. Cambridge: CUP, 2010.
Powered by WinChalow1.0rc4 based on chalow