「#643. 独立した音節として発音される -ed 語尾をもつ過去分詞形容詞」 ([2011-01-30-1]), 「#712. 独立した音節として発音される -ed 語尾をもつ過去分詞形容詞 (2)」 ([2011-04-09-1]), 「#752. 他動詞と自動詞の特殊な過去分詞形容詞」 ([2011-05-19-1]) で関連する話題に触れたが,現代英語には過去分詞の用法に応じて2つの異なる形態を示す drunk / drunken, bent / bended, proved / proven, beloved / belovèd のようなペアがある.短い前者は叙述的に,1音節分長い後者は限定的に用いられる傾向がある.以前の記事では,リズムと関連づけて,この使い分けについて論じた.
上記のペアはいずれも動詞の過去分詞形容詞の例だが,動詞由来ではない形容詞にも,2つの異形態をもつ例が近代英語に見られた.両者がどの程度関連するかはわからないが,使い分けがあるという点で類似しているので紹介したい.two / twain, my / mine, thy / thine, old / olden の各ペアにおいて,後者の形態は語尾に /n/ を含む分だけ長いという形態上の特徴があるが,用法としても後者は前者に比べていくぶん癖がある.荒木・宇賀治 (462) を参照して,それぞれの特徴をまとめよう.
(1) two / twain
twain は古英語 tweġen の男性主格・対格の形態に由来し,two は対応する女性・中性の形態に由来する.twain は two とともに中英語を通じて広く用いられ,近代英語期に入ってからも,(i) 名詞の後置修飾語として,(ii) 代名詞の後置同格語として,(iii) 叙述用法として,用いられていた.twain は two に押され続けてはきたが,用法を狭めながらも近代英語まで生き延びたことになる.
・ I have receivyd twaine your lettres. (1554 Cdl. Pole in Eng. Hist. Rev.)
・ lovers twain (MND. V. i. 151)
・ O Perdita, what have we twain forgot! (Wint. IV. iv. 673)
・ I must become a borrower of the night For a dark hour or twain. (Mac. III. i. 26--27)
・ Thou and my bosom henceforth shall be twain. (Rom. III. v. 240)
twain が脚韻のために利用されやすかったことは言うまでもない.
(2) my / mine, thy / thine
それぞれ古英語の人称代名詞の属格形 mīn, þīn に遡る.所有を表わす限定用法において,各ペアの前者の形態 my, thy では子音の前位置で /n/ が脱落したもので,後者の形態 mine, thine では母音の前で /n/ が保持されたものである.この使い分けは,13世紀頃から18世紀初期まで続いた.一方,単独で用いられる叙述用法では,mine, thine の /n/ を有する形態だけが選ばれ,現在に至る.
(3) old / olden
olden は15世紀前半に初出したが,常に頻度の低い異形態だった.Shakespeare では1度のみ "Blood hath been shed ere now, i' the olden time," (Mac. III. iv. 75) として現われ,おそらくここから the olden time という表現が広まったものと思われる.Scott にも olden times という例が見られる.19世紀に例外的に叙述用法が生じたが,現代英語では原則としてもっぱら上記の限定句内で用いられる.
いずれのペアでも長い形態には /n/ が語末に加えられているが,実際に音節を増やす(したがってリズムに関与しうると考えられる)のは (3) のみである.(3) では2音節の olden が限定用法としての使用に限られており,これは ##643,712 で示したリズムによる説明に合致する.(1), (2) では,音節は追加しないものの /n/ を付した長い形態のほうが,むしろ限定用法を失ってきたのが,(3) に比して対照的である.
・ 荒木 一雄,宇賀治 正朋 『英語史IIIA』 英語学大系第10巻,大修館書店,1984年.
昨日の記事「#1562. 韻律音韻論からみる yod-dropping」 ([2013-08-06-1]) で,説明抜きで音節構造 (syllable structure) の分析を示したが,今日は Hogg and McCully (35--38) に拠って,音節構造の教科書的な概説を施したい.以下では,grind /graind/ という1音節語の音節構造を例に取る.
最も直感的な分析方法は,音節を構成する各分節音をフラットに並べる下図の (1) の方法である.ただし,音声学的にも音韻論的にも,母音と子音とを区別することは前提としておいてよいと思われるので,その標示は与えてある.
(1) を一見して明らかなように,子音は子音どうしの結合をなし,母音は母音どうしの結合をなすのが通常である.したがって,それぞれをグループ化して音節内での位置に応じてラベルをつけることは自然である.音節の始まりを担当する子音群を Onset,本体を占める母音群を Nucleus,終わりを担当する子音群を Coda と分けることが一般的に行なわれている.これが,(2) の分析である.
この段階でも有効な音節構造の分析はできるが,さらに階層化を進めると,理論上,便利である.(3) のように Nucleus と Coda をまとめる Rhyme を設定し,Onset に対応させるという分析が広く受け入れられている.
では,(3) のような一見すると複雑な階層化がなぜ理論的に有意味なのだろうか.1つは,Onset には独自の制限がかかっているということがある.英語では /graind/ という音連続は許されるが,例えば */pfraind/ は許されない.これは,Onset /pfr/ にかかっている子音連続の制限ゆえであり,Onset より右の部分の構造からは独立した理由によるものである.同様に,brim, bread, bran, brock, brunt と *bnim, *bnead, *bnan, *bnock, *bnunt を比較すれば,問題は Onset が /br/ か */bn/ かにかかっているのであり,その後の部分は全体の可否に影響していないことがわかるだろう.また,Rhyme という語そのものが示すとおり,脚韻の伝統により,この単位が直感的にもまとまりをなすものだという認識は強い.
さらに,Rhyme (あるいはそれより下のレベル)の分岐の仕方により,多くの音韻過程や強勢が記述できるという利点がある.分岐していれば重い音節 (heavy syllable) であると言われ,分岐していなければ軽い音節 (light syllable) であると言われる.Nucleus と Coda の構造に別々に言及せずとも,Rhyme 以下の構造として一括して言及できるので,Rhyme というレベルの設定は説明の経済性に資する.
以上の理由で,Onset に対して Rhyme を区別する合理性はあるといえる.しかし,Rhyme 以下を Nucleus と Coda へ区分せずに,音をフラットに横並びにする音韻論など,(3) の変種といえるものもあることに注意したい.いずれも合理的に音韻や韻律の分析を可能にするための仮説であり,道具立てである.
・ Hogg, Richard and C. B. McCully. Metrical Phonology: A Coursebook. Cambridge: CUP, 1987.
現代英語には /juː/ という上昇2重母音 (rising diphthong) がある.英語変種によっても異なるが,この2重母音にはいくつかの特徴がある.そのうちの共時的な変異と通時的な変化に関わる特徴として,「#841. yod-dropping」 ([2011-08-16-1]) がある.時に /juː/ から /j/ が脱落し,/uː/ として実現される音韻過程のことだ.
現在進行中の yod-dropping を記述・説明するのに,Hogg and McCully (42--45) で述べられている metrical phonology (韻律音韻論)による分析が利用できるかもしれないと思ったので,紹介しておきたい.子音 X + /juː/ からなる音節は,下図の左の基底構造をもっていると分析される.
次に,この基底構造の Nucleus における /i/ が,/j/ として Onset へ移動すると想定する.引き続き,/i/ が移動したことによって空いた Nucleus の第1の位置に,後続の /u/ のコピーが作り出される.
このように分析する利点はいくつかある.まず,基底構造の Onset に /Xj/ を想定してしまうと,cue /kjuː/, few /fjuː/ などでは問題ないが,new /njuː/, lewd /ljuː/ などでは問題が生じる.なぜならば2モーラからなる Onset において第1モーラの聞こえ度は無声摩擦音と同等かそれ以下でないといけないという一般的な制限があるからである.この制限に従えば,/n/ や /l/ は聞こえ度が高すぎるために,Onset の第1モーラとなることはできないはずだ.しかし,実際には第1モーラになっているので,これは例外的に派生したものとして分析する必要があることになる.
また,この分析は /Xj/ の後には長母音しか生起し得ないことと符合する.というのは,Nucleus の第2モーラには /i/ か /u/ しか起こり得ず,それが前位置にコピーされることをこの分析は要求しているからである.
さらに,clue, drew, threw など,もともと Onset が2モーラ(2子音結合)からなる場合には,/j/ が左へ移動してゆくための空きスペースがないために,/j/ 自身が最終的に脱落してしまうと説明することができる.つまり,子音連続の直後の yod-dropping が必須であることをうまく説明する.
変異としての yod-dropping は,英語変種によっても異なるが,dew, enthuse, lewd, new, suit, tune などの語における /j/ の有無の揺れによって示される.共時的にも通時的にも,yod-dropping の起こりやすさは先行する子音 X が何であるかによってある程度は決まることが知られているが,これをいかに上の分析に組み込むことができるかが次の課題となるだろう.
・ Hogg, Richard and C. B. McCully. Metrical Phonology: A Coursebook. Cambridge: CUP, 1987.
音節 (syllable) には様々な定義が与えられうるが,広く受け入れられているものとして,分節音の音声的な聞こえ度 (sonority) に依存する定義がある.聞こえ度そのものは,"the overall loudness of a sound relative to others of the same pitch, stress and duration" (Crystal 442) のように定義される.各分節音が本来的にもつ聞こえやすさの程度と解釈できる.
分節音の聞こえ度の測定は様々になされており,その値については実験ごとに詳細は異なるかもしれないが,おおまかな分類や順位については研究者のあいだで一致をみている.その1例として,Hogg and McCully (33) に挙げられている英語の分節音の sonority scale を示そう.
Sounds | Sonority values | Examples |
---|---|---|
low vowels | 10 | /a, ɑ/ |
mid vowels | 9 | /e, o/ |
high vowels | 8 | /i, u/ |
flaps | 7 | /r/ |
laterals | 6 | /l/ |
nasals | 5 | /n, m, ŋ/ |
voiced fricatives | 4 | /v, ð, z/ |
voiceless fricatives | 3 | /f, θ, s/ |
voiced stops | 2 | /b, d, g/ |
voiceless stops | 1 | /p, t, k/ |
Word | Pronunciation | Sonority values | Peaks = Syllables |
---|---|---|---|
modest | /modest/ | 5-9-2-9-3-1 | 2 |
complain | /compleːn/ | 1-9-5-1-6-9-5 | 2 |
petty | /peti/ | 1-9-1-8 | 2 |
elastic | /əlæstik/ | 8-6-10-3-1-8-1 | 3 |
elasticity | /iːlæstisiti/ | 9-6-10-3-1-8-3-8-1-8 | 5 |
petrol | /petrəl/ | 1-9-1-7-9-6 | 2 |
button | /bʌtn/ | 2-9-1-5 | 2 |
bottle | /botl/ | 2-9-1-6 | 2 |
[I]n any syllable, there is a segment constituting a sonority peak that is preceded and/or followed by a sequence of segments with progressively decreasing sonority values. (Crystal 442)
音節によって山の頂点の高さはまちまちだが,典型的に「谷山谷」のきれいな分布になるということを,SSG は示している.onset が s で始まる子音群 (ex. sp-, st-, sk-) の場合などではこの原則は規則的に破られることが知られているが,これを除けば SSG は英語において非常に安定した原則である.
・ Crystal, David, ed. A Dictionary of Linguistics and Phonetics. 6th ed. Malden, MA: Blackwell, 2008. 295--96.
・ Hogg, Richard and C. B. McCully. Metrical Phonology: A Coursebook. Cambridge: CUP, 1987.
「#1424. CELEX2」 ([2013-03-21-1]) で紹介した巨大データベースで何かしてみようと考え,Version 2 で新たに加えられた音節頻度 (English Frequency, Syllables) のサブデータベースにより,現代英語で最も多い音節タイプのランキングを得た.
これは,CELEX2 のもとになっているコーパス全体のうち,7.26%を構成する約130万語の話し言葉サブコーパスから引き出された音節頻度であり,タイプ頻度ではなくトークン頻度によるものである.つまり,話し言葉におけるある単語の頻度が高ければ,その分,その単語に含まれる音節タイプの頻度も高くなるということである.例えば,of を構成する "Ov" (= /ɒv/) と表現される音節は,第4位の頻度である.なお,強勢の有無は考慮せずに頻度を数えている.
以下のリストに挙げる音素表記は,IPA ではなく CELEX 仕様の独特の表記なので,先に対応表を挙げておこう.
では,以下にランキング表でトップ50位までを掲載する.高頻度の単音節語の音節タイプがそのまま上位に反映されていて,あまりおもしろい表ではないが,何かの役に立つときもあるかもしれない.
Rank | Syllable | Frequency |
---|---|---|
1 | eI | 72971 |
2 | Di: | 60967 |
3 | tu: | 31446 |
4 | Ov | 30108 |
5 | In | 29906 |
6 | &nd | 28709 |
7 | aI | 23822 |
8 | lI | 19728 |
9 | @ | 19566 |
10 | rI | 14356 |
11 | ju: | 12598 |
12 | dI | 12465 |
13 | D&t | 12118 |
14 | It | 11504 |
15 | wOz | 10834 |
16 | fO:r* | 9778 |
17 | Iz | 9517 |
18 | tI | 9161 |
19 | fO | 9042 |
20 | Sn, | 8969 |
21 | hi: | 8928 |
22 | r@n | 8638 |
23 | bi: | 8505 |
24 | bI | 7936 |
25 | nI | 7068 |
26 | wID | 7046 |
27 | On | 7030 |
28 | &z | 6919 |
29 | O:l | 6569 |
30 | h&d | 6240 |
31 | E | 6165 |
32 | bl, | 6021 |
33 | sI | 5836 |
34 | @U | 5824 |
35 | t@r* | 5687 |
36 | &t | 5652 |
37 | hIz | 5564 |
38 | bVt | 5416 |
39 | mI | 5397 |
40 | s@ | 5391 |
41 | nOt | 5357 |
42 | D@r* | 5339 |
43 | I | 5283 |
44 | tId | 5259 |
45 | DeI | 5162 |
46 | IN | 5063 |
47 | t@ | 5053 |
48 | s@U | 4974 |
49 | baI | 4894 |
50 | h&v | 4769 |
Please note that the English corpus used by CELEX for deriving these frequencies contains only 7.3% spoken material. This means there is a rather tenuous relationship between the full frequency figures, which are based on written forms, and the syllable frequencies, which merely refer to phonemic conversions of these graphemic transcriptions. Of course it could be argued that frequencies of syllables, as lexical sub-units, are less liable to get skewed from differences in medium than full words, but it has to be taken into account that NO FIRM EVIDENCE ABOUT SPOKEN FREQUENCIES can be derived from these data.
「#944. ration と reason」 ([2011-11-27-1]) で,フランス語とラテン語から借用された2重語 (doublet) の例をいくつか見た.reason -- ration, treason -- tradition, poison -- potion, lesson -- lection といったペアである.Schmitt and Marsden (87) に他の例が挙がっていたので,下に示したい.左列は中英語期に先に入っていたものでフランス語,右列は初期近代英語期に改めて借用されたラテン語である.
French (in ME) | Latin (in EModE) |
---|---|
armor | armature |
chamber | camera |
choir | chorus |
frail | fragile |
gender | genus |
jealous | zealous |
prove | probe |
strait | strict |
strange | extraneous |
treasure | thesaurus |
昨日の記事「#1160. MRC Psychological Database より各種統計を視覚化」 ([2012-06-30-1]) の (3) で,英語語彙を音節数により分別して,それぞれの頻度を出した.それによると,対象となった92767語の語彙全体における1音節語,2音節語,3音節語,4音節語の占める割合は,それぞれ13.46%,35.40%,29.91%,15.26%であり,合わせて94.03%に達する.とりわけ2音節語と3音節語を合わせて65.31%である.9万余という大規模な語彙で調査する限り,英語語彙の3分の2近くは2--3音節語であるということになる.
一方,##348,349,355 の記事では,BNC や COLT のコーパスを用いて,最も頻度の高い数百語から数千語を対象に音節数調査を行なった.調査対象となる語彙の規模は格段に小さく,それに従って音節数別の割合も変わる.1音節語と2音節語が優勢であり,最大の6000語規模の調査でもこの2種類だけで68.7%を占める(「#349. BNC Word Frequency List による音節数の分布調査 (2)」 ([2010-04-11-1]) のグラフを参照).対象とする語彙規模により,優勢な占有率を示す音節数が変動することがわかるが,全般的に,英語語彙においては1--3音節語が主要であることは間違いないだろう.
では,日本語の語彙について,音節数別の割合はどうだろうか.加藤ほか (80) では,林大氏による『日本語アクセント辞典』の見出し語形に基づく拍数の分布の調査結果が要約されている.辞典の見出し語形であるから対称語彙は数万語の規模と思われる.以下のような結果が出た.
1拍 | 2拍 | 3拍 | 4拍 | 5拍 | 6拍 | 7拍 | 8拍 | 9拍 | 10拍 | 計 |
0.3 | 4.8 | 22.7 | 38.8 | 17.7 | 11.0 | 3.3 | 1.2 | 0.2 | 0.1 | 100 |
[2012-06-28-1], [2012-06-29-1]と連日紹介してきた MRC Psycholinguistic Database に基づいて,4つの英語語彙統計を図示したい.原データファイルの仕様に示されている統計表をもとにグラフを作成しただけだが,別のコーパスに基づいて類似した調査を行なってきたものもあるので,比較に値するだろう.数値データは,HTMLソースを参照.
(1) 文字数による頻度
(2) 音素数による頻度
(参考)
・ [2012-02-13-1]: 「#1022. 英語の各音素の生起頻度」
(3) 音節数による頻度
(参考)
・ [2010-04-09-1]: 「#347. 英単語の平均音節数はどのくらいか?」
・ [2010-04-10-1]: 「#348. BNC Word Frequency List による音節数の分布調査」
・ [2010-04-11-1]: 「#349. BNC Word Frequency List による音節数の分布調査 (2)」
・ [2010-04-17-1]: 「#355. COLT Word Frequency List による音節数の分布調査」
(4) 品詞による頻度
(参考)
・ [2012-06-02-1]: 「#1132. 英単語の品詞別の割合」
・ [2011-02-23-1]: 「#667. COCA 最頻50万語で品詞別の割合は?」
・ [2011-02-22-1]: 「#666. COCA 最頻5000語で品詞別の割合は?」
・ [2011-02-16-1]: 「#660. 中英語のフランス借用語の形容詞比率」
その他,語彙の頻度や,語種別の割合については以下の記事も参照.
・ [2010-03-01-1]: 「#308. 現代英語の最頻英単語リスト」
・ [2011-08-20-1]: 「#845. 現代英語の語彙の起源と割合」
・ [2012-01-07-1]: 「#985. 中英語の語彙の起源と割合」
昨日の記事[2012-06-08-1]に続いて,binomial (2項イディオム)の構成要素の順序と音声的条件の話題.昨日は「1音節語 and 第1音節に強勢のある2音節語」という構成の binomial が多く存在することを見た.この著しい傾向の背景には,強弱強弱のリズムに適合するということもあるが,Bolinger の指摘するように,「短い語 and 長い語」という一般的な順序にも符合するという要因がある.もっとも典型的な長短の差異は2要素の音節数の違いということだが,音節数が同じ(単音節の)場合には,長短の差異は音価の持続性や聞こえ度の違いとしてとらえることができる.Bolinger の表現でいえば,"openness and sonorousness" (40) の違いである.
分節音を "open and sonorous" 度の高いほうから低いほうへと分類すると,(1) 母音,(2) 有声持続音,(3) 有声閉鎖音・破擦音,(4) 無声持続音,(5) 無声閉鎖音・破擦音,となる.この観点から「短い語 and 長い語」を言い換えれば,「openness and sonorousness の低い語 and 高い語」ということになろう.Bolinger (40--44) は,現実には存在しない語により binomial 形容詞をでっちあげ,構成要素の順序を替えて,英語母語話者の被験者にどちらが自然かを選ばせた."He lives in a plap and plam house." vs "He lives in a plam and plap house." のごとくである.結果は,統計的に必ずしも著しいものではなかったが,ある程度の傾向は見られたという.
でっちあげた binomial による実験以上に興味深く感じたのは,p. 40 の注記に挙げられていた一連の頭韻表現である(関連して,[2011-11-26-1]の記事「#943. 頭韻の歴史と役割」を参照).flimflam, tick-tock, rick-rack, shilly-shally, mishmash, fiddle-faddle, riffraff, seesaw, knickknack. ここでは,2要素の並びは,それぞれの母音の聞こえ度が「低いもの+高いもの」の順序になっている.この順序については,phonaesthesia の観点から,心理的に「近いもの+遠いもの」とも説明できるかもしれない (see ##207,242,243) .
音節数,リズム,聞こえ度,頭韻,phonaesthesia 等々,binomial という小宇宙には英語の音の不思議がたくさん詰まっているようだ.
・ Bolinger, D. L. "Binomials and Pitch Accent." Lingua (11): 34--44.
[2012-02-12-1]の記事「#1021. 英語と日本語の音素の種類と数」では,音素という単位で両言語の一覧を掲げたが,音節という単位ではどうだろうか.今回は,日本語の拍の一覧表を示したい.以下,出典は金田一 (90) .
a | i | u | e | o | ja | ju | jo | (je) | wa | (wi) | (we) | wo |
ha | hi | hu | he | ho | hja | hju | hjo | (hje) | (hwa) | (hwi) | (hwe) | (hwo) |
ga | gi | gu | ge | go | gja | gju | gjo | (gwa) | ||||
ka | ki | ku | ke | ko | kja | kju | kjo | (kwa) | ||||
ŋa | ŋi | ŋu | ŋe | ŋo | ŋja | ŋju | ŋjo | |||||
da | (di) | (du) | de | do | (dju) | |||||||
ta | (ti) | (tu) | te | to | (tju) | |||||||
na | ni | nu | ne | no | nja | nju | njo | |||||
ba | bi | bu | be | bo | bja | bju | bjo | |||||
pa | pi | pu | pe | po | pja | pju | pjo | |||||
ma | mi | mu | me | mo | mja | mju | mjo | |||||
za | zi | zu | ze | zo | zja | zju | zjo | (zje) | ||||
sa | si | su | se | so | sja | sju | sjo | (sje) | ||||
(ca) | ci | cu | (ce) | (co) | cja | cju | cjo | (cje) | ||||
ra | ri | ru | re | ro | rja | rju | rjo | |||||
N | T | R |
「30分」は half an hour と表現されるが,特に米語や形容詞で修飾される環境では a (good) half hour とも用いられる.しかし,冠詞の前に数量形容詞が置かれる例は,他にも all the boys, both the books, many a time などがあり共通の統語的特徴を示している.この統語的特徴の背後には,韻律的な要因が働いているように思われる.上記の例のいずれも,この語順を取ることで強弱格 ( trochee ) となり,英語の一般的なリズムによく適合する.このように語順を整序したり,意味統語的に必要のない冠詞などの無強勢の音節を挿入することによって韻律を整えるという例は,英語では少なくない.
Bolinger (151--53) は韻律の都合によって説明されうる代替構文をペア(ただし一部非文も含む)で掲げている.右側がより韻律的な代替表現である.
an aloof person vs. an aloof kind of person It's a compact book. vs. It's a compact little book. a half hour vs. half an hour without doubt vs. without a doubt mother mine vs. pal o' mine Outside these I have no preference. vs. Outside of these I have no preference. Beware the Ides of March vs. Beware of Brutus a little bread vs. a bit of bread a dozen eggs vs. a gross of eggs a morsel bread vs. a piece of bread I dare not tell her. vs. We dare to judge. He dared adventure himself. vs. The players dared to satirise. the lessons these things have taught us vs. the lessons these things have taught to all of us He's gone fishing. vs. He's gone a-fishing. Why did you have to go tell her? vs. Why did you have to go and tell her? Who was it that told you? vs. Who was it told you? a quite long report vs. quite a long report *very a long report vs. a very long report *a so pretty girl vs. so pretty a girl so pretty a girl vs. such a pretty girl *a that pretty girl vs. that pretty a girl *a too remote place vs. too remote a place *an enough good reason vs. a good enough reason a good enough reason vs. a reason good enough
[2011-04-09-1]の記事「独立した音節として発音される -ed 語尾をもつ過去分詞形容詞 (2)」や[2011-06-12-1]の記事「過去分詞形容詞 -ed の非音節化」などでも触れたように,韻律は多くの場合,積極的に語順の変更を促す要因というよりは,別の要因によって引き起こされている一般的な変化の方向に多少なりとも抗い,ともすれば消えていく可能性のある代替的な語順を保持させる要因として作用していると考えられる.韻律による説明は,例外が多く「規則」と呼ぶには弱すぎるが,おそらく英語に限らず言語に普遍的に作用していると考えられるほどに応用範囲が広く「傾向」以上の説明力は有しているのではないか.
a Jàpanese stúdent などにおける強勢の back shifting や,Amelia's love makes the burning sand grow green beneath him and the stunted shrubs to blossom. における最後の不定詞標示 to の挿入など,韻律の関わると目される事例は数多い.
・ Bolinger, Dwight L. "Pitch Accent and Sentence Rhythm." Forms of English: Accent, Morpheme, Order. Ed. Isamu Abe and Tetsuya Kanekiyo. Tokyo: Hakuou, 1965. 139--80.
aged, beloved, crooked, dogged, jagged, learned, naked, ragged, wicked, wretched などの過去分詞形容詞が2音節として発音される件について,[2011-01-30-1]の記事に補足する.先日の記事では,なぜこのような一部の語群でのみ,第2音節の母音が保持されたかについて疑問を呈した.いずれも高頻度語とはいえず ( Frequency Sorter で確認済み),頻度は関係なさそうだ.ただし,限定用法と叙述用法の差が関与している可能性があることは,記事の最後で示唆した.
形容詞としての用法の違いが音節の問題にどのように関与しうるかを理解するには,韻律 ( prosody ) ,リズムの都合 ( eurythmy ) という観点を導入する必要がある.限定用法として用いられる形容詞は,通常,直後に名詞がくる.直前にはアクセントの弱い冠詞や指示詞のあることが多い.典型的な例として a lovely girl を考えると,アクセントが弱強弱強と続く弱強格 ( iamb ) で現われる.これは,英語で最も典型的で耳に心地よい韻律の1つである.この位置にくる限定形容詞が第1音節にアクセントをもつ2音節であるほうが,英語の韻律上,都合がよいことがわかるだろう.aged, naked, wicked など問題の語群は,まさにこのような「都合のよい」音節構造をなしている.しかも,多くが主として限定用法に用いられる.my aged aunt, their beloved Ireland, a crooked nose, the jagged edges, a learned journal, a naked body, a ragged jacket, a wicked witch, the wretched animal など.英語の過去分詞語尾ではないが,-id 語尾をもつラテン借用語 solid, squalid, timid, vivid における第2音節も,おそらく同じ理由で保持されたと考えられる (Minkova 327--28) .
過去分詞形容詞の語尾に -ed だけでなく -en も含めると,叙述用法 ( predicative use ) と限定用法 ( attributive use ) のそれぞれで用いられる形態の差はより鮮明になる.Minkova (327) に挙げられている例を以下に示そう.
PREDICATIVE | ATTRIBUTIVE |
---|---|
The case is proved. | a proven case |
The sailor is drunk. | a drunken sailor |
His knee is bent. | one bended knee |
The main had burst. | a bursted main |
Quirk et al. (7.19) によると,通常,以下の過去分詞形容詞は語尾の -ed を /ɪd/ と発音し,音節を追加する.
aged, beloved, crooked, dogged, jagged, learned, naked, ragged, wicked, wretched
ただし,aged /ˈeɪdʒɪd/ は my aged father のように限定的に人の年齢を表わすときや the aged 「老人たち」の場合に使われ,人の形容でなく aged wine などと用いれば /ˈeɪdʒd/ の発音になる.beloved は,my beloved son の場合には /bɪˈlʌvɪd/ だが,She was beloved by everyone. のように動詞としての性格が強ければ /bɪˈlʌvd/ となる.また,a learned professor 「博学な教授」や a learned journal 「学術雑誌」では /ˈlɚːnɪd/ だが,a learned skill 「経験によって身につけた技術」では /lɚːnd/ である.使い分けはなかなか難しい.
本来は,規則的な過去分詞形(及び過去形)の語尾 -ed は,綴字に示されている通り,母音を伴って独立音節として発音されていた.中尾 (320--21) によれば,中英語では弱まった母音で /əd/ と発音されていたが,この母音は北部方言では13世紀から,それ以外の方言でも14世紀から消失していった.この語中音削除 ( syncopation ) は,-ed のみならず -es, -eth, -est, -en, -er などの語末形態素でも広く生じた音声変化である.ただし,消失自体はゆっくりとした過程であり,15世紀には大規模に進行したが,17世紀頃まで母音を保つ例もあった.
母音が現在まで保たれたものとしては,歯擦音 ( sibilant ) や歯破裂音で終わる語幹に接続する場合 ( ex. kisses, houses, edges, hated, ended ) が規則的な例外といえる.他には,過去分詞形容詞に副詞語尾 -ly の接続した assumedly, assuredly, supposedly などがある.これは,3子音の連続を避けるための音便として説明できるだろう.
上記のリストに掲げた一部の過去分詞形容詞で母音が保持された理由はよく分からない.とりわけ頻度が高い語群でもないので,頻度は関係なさそうだ.ただし,いずれも限定用法の形容詞として使われるという共通点があり,beloved の限定・叙述用法の発音の違いからも示唆されるとおり,用法が関与しているということは言えそうである.これについては,The driver is drunk と the drunken driver の比較などが参考になるかもしれない.
・ Quirk, Randolph, Sidney Greenbaum, Geoffrey Leech, and Jan Svartvik. A Comprehensive Grammar of the English Language. London: Longman, 1985.
・ 中尾 俊夫 『音韻史』 英語学大系第11巻,大修館書店,1985年.
昨日の記事[2010-04-16-1]で触れたように,COLT ベースの音節数分布調査をパイロット・スタディとして実施してみた.以下が結果.[2010-04-10-1], [2010-04-11-1]の BNC ベースの調査結果と比較するにはこちらのページへ.
BNC ベースの結果と比べて,100語,200語,500語,1000語(976語)のいずれのレベルでも,COLT のほうが平均音節数は少ない.1000語(976語)レベルで比べると,COLT は単音節語と二音節語だけで93%をカバーしているが,BNC はそのカバー率は約10%ほど少ない.口語コーパスに限定した COLT とそうでない BNC の差が関与していると考えられる.
少し変わり種のコーパスとして,COLT: The Bergen Corpus Of London Teenage Language を紹介する.1993年におけるロンドンの若者(13歳から17歳)の話し言葉を収集したコーパスで,約50万語からなる.31人のロンドン各地・各階層の男子女子の会話を,合計50時間だけ録音し,文字に起こしたものである.BNC ( The British National Corpus ) にも組み込まれているコーパスだ.語類情報や休止などの韻律情報がタグ付けされており,若者言葉によって先導される言語変化の調査や語用論的な研究において実績がある.
コーパス自体は有料だが,上記のHPから手に入る COLT による最頻1000語のリスト が目を引いた.COLT に現れる表記語 ( graphic word ) の最頻リストで,lemmatise されていない.要するに,do と did,laugh と laughing などは別々にカウントされている.
今回,このコーパスに目を付けたのは,先日[2010-04-10-1], [2010-04-11-1]でパイロット・スタディとしておこなった「BNC Word Frequency List による音節数の分布調査」の COLT 版を試してみようと思ったからである.BNC による音節数分布調査では,書き言葉と話し言葉の両方を対象とし,lemmatise された基底形 ( base form ) での頻度表を用いたが,COLT を用いれば,大きく異なった条件のもとで類似した調査をおこなうことができる( COLT が BNC の一部になっていることを考慮しても).具体的には,話し言葉に限定された,表記語に基づく頻度表をベースとして音節数の分布を調べられる.
注意を要するのは,COLT の頻度表には unclear, nv, singing など,地の文の語ではなくタグ名として使われている語もうっかり数えられてしまっていることだ.したがって,この種の語は手作業で除去し,最終的に有効最頻語976語のリストが得られた.これをもとにして,音節数の分布をいざ探ってみることにする.結果は,明日.
今回は,昨日の記事[2010-04-10-1]で扱った音節数に関するデータを,角度を変えて見てみたい.100語レベルから6000語レベルまでの各頻度レベルの数値を標準化して,単音節語から7音節音語までの相対頻度を比べられるようにしたものである.(数値データはこのページのHTMLソースを参照.)
昨日のグラフだけでは読み取りにくかったいくつかのポイントが見えてきた.
・ 対象語彙が大きくなればなるほど単音節語の比率は減少するが,1000語レベル以上からの減り幅は比較的小さい
・ 2音節語の比率は,1000語レベル以上ではほとんど変化していない
・ 500語レベル以上からは3音節語と4音節語が存在感を増してくる
・ とはいえ,2000語レベル以上からは相対的な分布の変化は小さく,全体として安定しつつあるように見える
昨日の記事[2010-04-09-1]に続く話題.BNC Word Frequency List の6318語の見出し語化された ( lemmatised ) 最頻語リストを材料として,音節数の分布がどのようになっているかを調査してみた.
まずはリストを頻度順に眺めてみるだけで,ある程度の検討はついた.[2010-03-02-1]の記事「現代英語の基本語彙100語の起源と割合」からも明らかなとおり,最頻基本語にはゲルマン系の本来語が多い.このことは,単音節語が多いということにもつながる.しかし,リストを下って頻度のより低い語に目をやると,徐々に2音節語,3音節語が目につくようになってくる.したがって,頻度で上位どのくらいまでを対象にするかによって,音節数の相対的な分布は変わってくることが予想される.そこで,まず6318語すべての音節数を出した上で,最頻100語,200語,500語,1000語,2000語,3000語,4000語,5000語,6000語というレベルで音節数の分布を調査した.レベル間の比較が可能となるようにグラフ化したのが下図である.(数値データはこのページのHTMLソースを参照.)
このグラフからいくつかの興味深い事実を読み取ることができる.
・ どのレベルでも単音節語が最も多い
・ 対象語彙が大きくなればなるほど,2音節語数が単音節語数に肉薄する
・ 英語語彙の圧倒的多数が単音節語か2音節語である
・ 対象語彙が大きくなればなるほど,平均音節数が漸増する
・ いずれにせよ英単語の平均音節数はせいぜい2音節ほどである
今回は最頻約6000語レベルの語彙で調査したが,対象語彙をどんどん大きくしてゆくとどのような結果が出るのか,おおいに気になった.やがては2音節語が単音節語を追い抜き,平均音節数も漸増を続けるのだろうか? あるいは平均音節数がこれ以上は変わらないという限界点が存在するのだろうか? non-lemmatised な語彙リストを材料にすると平均音節数はどのくらい変化するのだろうか? 次々に疑問が生じた.
ちなみに,最頻5000語レベルで初めて現れる7音節語が一つある.英語の平均音節数からすると異常に長い超多音節語だが,比較的よくお目にかかる単語ということになる.何であるか,想像できるだろうか? 答えは,4657番目に現れる
telecommunication
(←クリック)である.なるほど?.
ここ数ヶ月のあいだに取り組んでいる研究課題と関連して,標題の問いについて調査する必要が生じている.この問いの背後にある問題意識としては,単語の語源別の平均音節数を比較して,たとえば「ゲルマン系の単語はロマンス系の単語よりも○音節だけ短い」などという統計的な数値を得たいと思っているのだが,この問題は何段階かに分けてアプローチしてゆくのがよさそうである.標題の問いのままでは適切な問題設定とはいえないいくつかの理由がある.
一つは,言語学で最も悪名高い問題の一つである「単語とは何か」という問いに関係する.わかりやすい例として,合成語 ( compound ) を考えるとよい.school boy は1語なのだろうか,2語なのだろうか? さらに,固有名詞の New York City はどうだろうか? いずれも綴字上の慣習により複数の語とみなすこともできるが,一方で意味のまとまりとしては一つであるから1語だという理屈も成り立ちうる.kick the bucket のようなイディオムはどうだろうか? [2010-02-07-1], [2010-02-08-1]で触れた crane のような多義語 ( polysemy ) は,語義ごとに別の語と考えることもできるのではないか? 英単語の平均音節を考えるにあたっても,こうした基本的な問題は避けて通れない.
二つ目の理由は,英語語彙というときの範囲の問題である.OED には50万語ほどがエントリーされているが,辞書の保守性を考慮すると,実際にはその倍の語彙があるのではないかともいわれている.平均値を出すからには,理想的にはありったけの単語を考慮に入れることが必要である.となると,[2009-06-30-1]の記事でみた pneumonoultramicroscopicsilicovolcanoconiosis のような極端な語(19音節)も含めることになる.だが,そもそも現代英語語彙の総覧が存在しない以上,どこまで含めてどこから含めないかの判断は恣意的にならざるをえない.実際的な研究に際しては,どこかで強引に切る必要がある.
三つ目は,同一の語でも,変種によって1音節程度の増減が起こりうるという問題である.[2010-03-08-1]で触れたように,secretary は典型的な英米発音のあいだで音節数の揺れがある.もっとも,この問題は対象とする変種を定めてしまえば,上記の二つの問題ほど大きな問題にはならないかもしれない.
一つ目,二つ目の問題については当面の根本的な解決策はないが,そんなに難しいことを言っていては仕方がないというのも確かである.具体的に調査を進めてみようと思うと,[2010-03-01-1]で紹介した最頻英単語リスト辺りからスタートするのがよさそうである.ひとまずは,BNC Word Frequency List の6318語のリストから始めてみようと思う.
・ 齊藤 俊雄,中村 純作,赤野 一郎 編 『英語コーパス言語学?基礎と実践?』 研究社,1998年.110--13頁.
Powered by WinChalow1.0rc4 based on chalow