[2011-11-18-1], [2011-11-19-1], [2011-11-20-1]と,語形成の生産性の問題について理解を深めてきた.辞書を利用した生産性の測定はうまく行かないらしいことはわかったが,他にはどのような測定法があり得るだろうか.これまでに,次のような2つの提案がなされている (Lieber 66--67) .
(1) ある接辞添加により潜在的に形成され得る語の総数 (A) を出し,次にその接辞添加により実際に形成された語の総数 (B) を出し,A における B の割合を算出する.例えば,形容詞の基体に付加されて名詞を形成する接尾辞 -ness の場合,形容詞の総数が A となり,実際に文証される -ness 語の総数が B となる.
しかし,この測定法には問題がある.まず,形容詞の総数を把握することは難しい.辞書を参照するということになれば,昨日の記事[2011-11-20-1]で取り上げた諸問題の再来である.実際に文証される -ness 語の総数についても同様だ.-esque 語についていえば,[2011-11-19-1]の記事で触れた通り,この接尾辞は基体に主として多音節の固有名詞を要求するが,この条件に当てはまる基体の数を数え上げることは不可能に近い(まさか,世界人名辞典を参照する!?).
さらに,-esque に見られるような基体に課せられる諸制限は生産性の程度に影響するのであるから,基体に名詞を要求するという以外に制限のない -ness のような接辞の生産性との差異が浮き立つような測定法でなければならない.この測定法では,-esque のA値と -ness のA値に大差がある場合,その差が算入されないという問題がある.
(2) 巨大コーパスを用いて,token frequency に基づいて hapax legomenon の割合を算出する方法.従来の考え方とはまったく異なるこのアプローチは,生産的な語形成に見られる透明性 (transparency) と出現頻度の関係についての知見に基づいている.[2011-11-18-1]で述べたように,生産性の低い語形成は音韻的・意味的に透明性の低い語を生み出す.透明性の低い語は,辞書に (dictionary にも mental lexicon にも)登録されやすい,つまり語彙化 (lexicalize) されやすい.語彙化された語は,語彙化されていない語に比べて,平均してコーパス内のトークン頻度が高いという特徴が見られる.逆から見ると,生産性の高い語形成は透明性も高いゆえに,語彙化されることが少なく,平均してコーパス内のトークン頻度は低い傾向がある.実際のところ,コーパス内に1回しか現われない hapax legomenon である可能性も高い.
この知見に基づき,-ness の生産性の算出を考えてみよう.コーパス内に現われる -ness 語をトークン頻度で数え上げ,これを A とする.この中で hapax legomenon である -ness 語の数を B とする.A における B の比率を取れば,-ness の生産性(少なくとも,生産性を指し示すなにがしかの特徴)の指標となるだろう.
Baayen and Lieber で採用されたこの測定法は,生産性の完璧な指標ではないとしても,母語話者の直感する生産性を比較的よく反映していると考えられる.
・ Lieber, Rochelle. Introducing Morphology. Cambridge: CUP, 2010.
・ Baayen, Harald and Rochelle Lieber. "Productivity and English Derivation: A Corpus-Based Study." Linguistics 29 (1991): 801--43.
Powered by WinChalow1.0rc4 based on chalow