複合語のうち,中に動詞的な要素を含まず,名詞と名詞,あるいは名詞と形容詞の要素からなるものを1次複合名詞と呼ぶ.竝木 (56--57) より,英語と日本語からの例を挙げてみよう.とりわけ2要素間の意味関係に注目されたい.
a. 2番目の名詞が最初の名詞に似ているもの
catfish (ナマズ),eggplant (ナス);こうもり傘,ほうき星
b. 2番目の名詞が最初の名詞の用途を表すもの
ashtray (灰皿),birdcage (鳥かご);目薬,歯ブラシ
c. 2番目の名詞が最初の名詞の一部であるもの
doorknob (ドアの取っ手),pianokey (ピアノの鍵盤);目頭,矢じり
d. 2番目の名詞が最初の名詞を作り出すもの
honeybee (ミツバチ),silkworm (カイコ);サトウカエデ
e. 最初の単語が形容詞で2番目が名詞であるもの
darkroom (暗室),blackboard (黒板);青信号,赤辛抱
第1要素を○,第2要素を△とすると,次のようにまとめられるだろうか.
a. ○のような△
b. ○のための△
c. ○の△
d. ○を作る△
e. ○な△
ただし,これは典型的な2要素間の意味関係を例示したものにすぎない.複合語にはその他の様々な意味関係があり得る.例えば「#4856. 長い複合語 --- farm produce delivery truck repair shop」 ([2022-08-13-1]) より student film society committee scandal や「一人親方組合」などの例はどうだろうか.要素間の意味関係はきれいに整理できないくらい多様である.
・ 竝木 崇康 「第2章 形態論」『日英対照 英語学の基礎』(三原 健一・高見 健一(編著),窪薗 晴夫・竝木 崇康・小野 尚久・杉本 孝司・吉村 あき子(著)) くろしお出版,2013年.
昨日の記事「#4855. 複合語の認定基準 --- blackboard は複合語で black board は句」 ([2022-08-12-1]) に続き,複合語 (compound) の話題.現代英語期に存在感を増してきた語形成の1つに長い名詞連鎖の複合がある.多くの情報を狭いスペースに詰め込みたいという情報化社会のニーズを反映しているのだろう,World Heath Organization, Trades union congress centenary, New York City Ballet School instructor, railway station waiting room murder inquiry verdict など枚挙にいとまがない.新聞などを漁れば,いくらでも例を集めることができそうだ(cf. 「#399. 現代英語に起こっている言語変化」 ([2010-05-31-1]),「#629. 英語の新語サイト Word Spy」 ([2011-01-16-1]),「#860. 現代英語の変化と変異の一覧」 ([2011-09-04-1])).
竝木 (52--53) は,英語と日本語より長い複合語の例を挙げながら,その「繰り返し可能」 (recursive) な性質に注目している.
・ farm produce delivery truck repair shop (農場で採れた成果物配達用トラックの修理店)
・ student film society committee scandal inquiry (学生映画協会委員会のスキャンダルの調査)
・ bathroom towel rack designer training (浴室用タオル掛けのデザイナー養成)
・ bathroom towel rack designer training program committee (浴室用タオル掛けのデザイナー養成計画委員会)
・ 一人親方組合作り
・ 地方公務員制度調査研究会報告
・ 中高年労働移動支援特別助成金
・ 南関東地区震災応急対策活動要領
両言語とも,このように要素を数珠つなぎにしていくらでも長い複合語を作り出していくことができる.これが "recursive" の意味である.原則として最後に現われる要素(下線部)が意味的な主要部となり,複合語の性質を定めることになる.
戯れに,上記の最後の例で,さらにどこまで長くつなげられるか挑戦してみた.「南関東地区震災応急対策活動要領執筆作業部会副会長失踪事件担当刑事宛書簡集編纂事業支援募金口座解約騒動」というのはいかがでしょう(recursive なのでキリがなく50文字で止めました).
・ 竝木 崇康 「第2章 形態論」『日英対照 英語学の基礎』(三原 健一・高見 健一(編著),窪薗 晴夫・竝木 崇康・小野 尚久・杉本孝司・吉村 あき子(著)) くろしお出版,2013年.
独立した語を複数組み合わせて,新たな1つの語を作り出す語形成を複合 (compounding) といい,そのようにして形成されたものを複合語 (compound) という.複合(語)の分類については「#924. 複合語の分類」 ([2011-11-07-1]),「#2652. 複合名詞の意味的分類」 ([2016-07-31-1]) を参照されたい.
今回は,複合語と句 (phrase) がどのように区別されるのかという問題を取り上げる.両者とも独立した語を複数組み合わせて作るという点では同じだが,一般に複合語は形態的な単位であり,句は統語的な単位であると区別してとらえられる.例えば,black board (黒い板)は句で blackboard (黒板)は複合語と判断されるが,どのように区別されるのだろうか.なお,綴字上2要素間にスペースが置かれているかどうかは慣習的な正書法の問題にすぎず,本質的な決め手とはならないことを先に述べておく.
複合語の認定基準について,竝木 (39) より3点を示そう.
a. 意味に関する基準(普遍的なもの)
2つ(またはそれ以上)の単語がまとまりをなすとき,全体の意味が部分の意味から合成的に得られない場合,そのまとまりは複合語である.(意味の非合成性)
b. 形態に関する基準(普遍的なもの)
2つの単語がまとまりをなすとき,両者の間に他の要素を入れられない場合や,最初の単語のみを修飾する単語が付けられない場合,そのまとまりは複合語である.(形態的な緊密性)
c. 音韻的な基準(個別言語に特有で,ここでは英語の場合)
2つの単語がまとまりをなすとき,第1強勢が最初の単語に置かれる場合,そのまとまりは複合語である.
black board と blackboard の具体的なペアで上記の基準を確認してみよう.black (黒い)と board (板)という2つの独立した単語とその意味を知っていれば,意味の足し算により black board の意味「黒い板」を容易に割り出すことができる.しかし,blackboard は一般的な黒い板ではなく,学校教室での授業など特定の用途のために使われるモノにつけられた名前である.だから,実際には緑色に近かったとしても blackboard ということができる.blackboard は単純な意味の足し算によって予想することができない特殊な意味をもつのである(意味の非合成性).
次に,句である black board については very black board や blacker board のように black の意味を強調・比較させることができるが,複合語である blackboard については *very blackboard や *blackerboard のようにすることは許されない.複合語を構成する2要素の関係があまりに緊密だからである(形態的な緊密性).
最後に,句の blàck bóard と複合語の bláckbòard とでは,強勢の置かれる部分が異なる.前者は一般的な句の強勢パターンに従い,後者は一般的な語の強勢パターンに従っている.
上記の複合語の認定基準は,当然ながら語 (word) そのものの認定基準と重なるところが多い.この関連する問題については「#910. 語の定義がなぜ難しいか (1)」 ([2011-10-24-1]),「#911. 語の定義がなぜ難しいか (2)」 ([2011-10-25-1]),「#912. 語の定義がなぜ難しいか (3)」 ([2011-10-26-1]),「#921. 語の定義がなぜ難しいか (4)」 ([2011-11-04-1]),「#922. 語の定義がなぜ難しいか (5)」 ([2011-11-05-1]) を要参照.
・ 竝木 崇康 「第2章 形態論」『日英対照 英語学の基礎』(三原 健一・高見 健一(編著),窪薗 晴夫・竝木 崇康・小野 尚久・杉本 孝司・吉村 あき子(著)) くろしお出版,2013年.
単語を分かち書き (distinctiones) するか続け書き (scriptura continua) するかは,文字文化ごとに異なっているし,同じ文字文化でも時代や用途によって変わることがあった.英語では分かち書きするのが当然と思われているが,古英語や中英語では単語間にスペースがほとんど見られない文章がザラにあった(cf 「#3798. 古英語の緩い分かち書き」 ([2019-09-20-1])).逆に日本語では続け書きするのが当然と思われているが,幼児や初級学習者用に書かれた平仮名のみの文章では,読みやすくするために意図的に分かち書きされることもある(cf. 「#1112. 分かち書き (1)」 ([2012-05-13-1])).
一般的にいえば,漢字のような表語文字や仮名のような音節(モーラ)文字は続け書きされることが多いのに対し,単音文字(アルファベット)は分かち書きされることが多い.しかし,これはあくまで類型論上の傾向にすぎない.書き言葉において大事なことは,何らかの方法で語と語の境界が示されることである.単語間にスペースをおくというやり方は,それを実現する数々の方法の1つにすぎない.
語境界を明示するためであれば,何もスペースにこだわる必要はない.世界の文字文化を見渡すと,例えば北セム諸語の碑文においては中点や縦線などで語を区切るという方法が実践されていたし,エジプト象形文字で人名を枠で囲むカルトゥーシュ (cartouche) のような方法もあった(中点については「#3044. 古英語の中点による分かち書き」 ([2017-08-27-1]) も参照).
また,語末が常に(あるいはしばしば)特定の文字や字形で終わるという規則があれば,その文字や字形が語境界を示すことになり,分かち書きなどの他の方法は特に必要とならない.実際,ギリシア語では語末に少数の特定の文字しか現われないため,分かち書きは必須ではなかった.ヘブライ語やアラビア語などでは,同一文字素であっても語末に用いられるか,それ以外に用いられるかにより異なる字形をもつ文字体系もある.
日本語の漢字かな交じり文では,漢字で書かれることの多い自立語と平仮名で書かれることの多い付属語が交互に繰り返されるという特徴をもつ.そのために典型的には平仮名から漢字に切り替わるところが語境界と一致する.部分的にではあれ,語境界の見分け方が確かにあるということだ.
最後に「#1114. 草仮名の連綿と墨継ぎ」 ([2012-05-15-1]) で見たように,書き手が特定の言語単位(例えば語)を書き終えたところでいったん筆を上げるなどの慣習を発達させることがある.すると,その途切れの跡がそのまま語境界を示すことにもなる.
このように古今東西の文字文化を眺めてみると,語境界を表わす方法は多種多様である.英語で見慣れている分かち書きが唯一絶対の方法ではないことを銘記しておきたい.そもそも英語や西洋言語の書記における分かち書きの習慣自体が,歴史的には後の発展なのだから(cf . 「#1903. 分かち書きの歴史」 ([2014-07-13-1])).
・ Daniels, Peter T. "The History of Writing as a History of Linguistics." Chapter 2 of The Oxford Handbook of the History of Linguistics. Ed. Keith Allan. Oxford: OUP, 2013. 53--69.
私たちは,非表音文字を含む日本語の書記において続け書き (scriptura continua) がなされるのに慣れており,特に問題を感じていない.しかし,最たる表音文字であるアルファベットを用いる言語圏で,もし続け書きがなされていたらと想像すると,頭が痛くなる.実際には,連日の記事で取り上げてきたように,それが古典ギリシア語や古典ラテン語では常態だったのではあるが (cf. 「#3929. なぜギリシアとローマは続け書きを採用したか? (1)」 ([2020-01-29-1]),「#3930. なぜギリシアとローマは続け書きを採用したか? (2)」 ([2020-01-30-1]),「#3931. 語順の固定化と分かち書き」 ([2020-01-31-1])) .
現代人の感覚からすると,アルファベットの分かち書き (distinctiones) という発明は当たり前すぎて,疑ったこともない.分かち書きがなかったらどうなるのだろうかと想像することすらしない.しかし,よくよく考えてみると,分かち書きにより語の区切りが明確に分かるというのは実にありがたいことである.続け書きでは,読み手がいちいち語の区切りを判断しなければならない.字面が連綿と続くページのなかで,ある語を検索しようとするとき,分かち書きと続け書きでは,検索スピードが天と地ほど異なるだろう.分かち書きは,語の検索という作業に革命的な能率をもたらすのだ.
さらに,語の検索を主たるサービスとして提供する辞書 (dictionary) や語彙集 (glossary) や各種の索引を考えてみよう.現代の辞書では,語彙項目がアルファベット順などの決められた順序で,行頭に見出しとして立てられているからこそ検索しやすいのであって,もし延々と連なる続け書きされた文字列のなかから目的の語彙項目の見出しを探さなければならないとしたら,そもそも検索サービスの用を足していないとみなされるだろう.辞書や索引は分かち書きが前提とされているのである.このことは当たり前すぎて気づきすらしなかったことだ.
このような点に注意を向けさせてくれたのは,Saenger (90) の指摘である.古代的な続け書きが解消され,中世的な分かち書きが発達してきて初めて,用が足りる辞書的なものが現われたのだという.同様に,アルファベット順に並べるという実践も,本質的には中世以降に出現した発想といっていいだろう.
It is difficult to imagine an alphabetical dictionary functioning as a reference tool when written in scriptura continua, even after the codex had supplanted the scroll. For the Greeks and Romans, alphabetical order was chiefly an aid to grammarians in assembling collections of grammatical definitions, such as that of Pompeius Festus, and as a mnemonic tool for relatively short lists of names. The alphabetical principle was never used to facilitate rapid consultation, as in modern indexes.
分かち書き,アルファベット順,辞書編纂というのは,すべて関わりがあるということだ.関連して,「#603. 最初の英英辞書 A Table Alphabeticall (1)」 ([2010-12-21-1]),「#604. 最初の英英辞書 A Table Alphabeticall (2)」 ([2010-12-22-1]),「#1451. 英語史上初のコンコーダンスと完全アルファベット主義」 ([2013-04-17-1]),「#2930. 以呂波引きの元祖『色葉字類抄』」 ([2017-05-05-1]),「#3365. 以呂波引きの元祖『色葉字類抄』 (2)」 ([2018-07-14-1]) も参照.
・ Saenger, P. Space Between Words: The Origins of Silent Reading. Stanford, CA: Stanford UP, 1997.
連日引用している Space Between Words: The Origins of Silent Reading の著者 Saenger は,中世後期に分かち書き (distinctiones) の慣習が改めて発達してきた背景には,ラテン語から派生したロマンス系諸言語の語順の固定化も一枚噛んでいたのではないかと論じている.
比較的緩やかだったラテン語の語順が,フランス語などに発展する過程でSVO等の基本語順へ固定化していったことにより,読者の語(句)境界に対する意識が強くなってきたのではないかという.また語順の固定化と並行して屈折の衰退という言語変化が進行しており,後者も読者の語(句)の認識の仕方に影響を与えていただろうと考えられる.そして,もう一方の分かち書きの発達も,当然ながら語(句)境界の認識の問題と密接に関わる.これらの現象はいずれも語(句)境界の同定を重視するという方向性を共有しており,互いに補完し合う関係にあったのではないか.さらには,このような複合的な要因が相俟って黙読や速読の習慣も発達してきたにちがいない,というのが Saenger 流の議論展開だ.
興味深い論点の1つは,文章を読解するにあたっての短期記憶に関するものである.語順が比較的自由で,かつ続け書きをする古典ラテン語においては,読者は1文を構成する長い文字列をじっくり解読していかければならない.文字を最後まで追いかけた上で,逆走し,全体の意味を確認する必要がある.この読み方では読者の短期記憶にも重い負担がかかることになるだろう.そこで,朗々と読み上げることによってその負担をいくらか軽減しようとしていると考えることもできる.
一方,中世ラテン語やロマンス諸語などのように,ある程度語順が定まっており,かつ分かち書きがなされていれば,文中で次にどのような要素がくるか予想しやすくなると同時に,単語を逐一自力で切り分ける面倒からも解放されるために,短期記憶にかかる負担が大幅に減じる.わざわざ朗々と読み上げなくとも,速やかに読解できるのだ.語順の自由さと続け書きは平行的であり,語順の固定化と分かち書きも,向きは180度異なるものの,やはり平行的ということである.
もう1つのおもしろい議論は,ちょうど屈折の衰退(と語順の固定化)が広く文法の堕落だと考えられてきたのと同様に,続け書きから分かち書きへのシフトも言語生活上の堕落だと考えられてきた節があるということだ.統語論の問題と書記法の問題は,このようにペアでとらえられてきたようだ.
Saenger (17) のまとめの文は次の通り.
The evolution of rigorous conventions, both of word order and of word separation, had the similar and complementary physiological effect of enhancing the medieval reader's ability to comprehend written text rapidly and silently by facilitating lexical access.
・ Saenger, P. Space Between Words: The Origins of Silent Reading. Stanford, CA: Stanford UP, 1997.
昨日の記事 ([2020-01-29-1]) に引き続き,なぜギリシアとローマが,それ以前の地中海世界で普通に行なわれていた分かち書き (distinctiones) を捨て,代わりに続け書き (scriptura continua) を作用したかという問題について.
Saenger によれば,この問題に迫るには,読むという行為に対する現代的な発想を脇に置き,古代の読書習慣とその社会的文脈を理解する必要があるという.端的にいえば,現代人はみな黙読や速読に慣れており,何よりも「読みやすさ」を重視するが,古代ギリシアやローマの限られた人口の読み手にとって,読む行為とは口頭の音読のことであり,現代的な「読みやすさ」を追求する姿勢はなかったのだという.以下,Saenger の解説を聞いてみよう (11--12) .
. . . the ancient world did not possess the desire, characteristic of the modern age, to make reading easier and swifter because the advantages that modern readers perceive as accruing from ease of reading were seldom viewed as advantages by the ancients. These include the effective retrieval of information in reference consultation, the ability to read with minimum difficulty a great many technical logical, and scientific texts, and the greater diffusion of literacy throughout all social strata of the population. We know that the reading habits of the ancient world, which were profoundly oral and rhetorical by physiological necessity as well as by taste, were focused on a limited and intensely scrutinized canon of literature. Because those who read relished the mellifluous metrical and accentual patterns of pronounced text and were not interested in the swift intrusive consultation of books, the absence of interword space in Greek and Latin was not perceived to be an impediment to effective reading, as it would be to the modern reader, who strives to read swiftly. Moreover, oralization, which the ancients savored aesthetically, provided mnemonic compensation (through enhanced short-term aural recall) for the difficulty in gaining access to the meaning of unseparated text. Long-term memory of texts frequently read aloud also compensated for the inherent graphic and grammatical ambiguities of the languages of late antiquity.
Finally, the notion that the greater portion of the population should be autonomous and self-motivated readers was entirely foreign to the elitist literate mentality of the ancient world. For the literate, the reaction to the difficulties of lexical access arising from scriptura continua did not spark the desire to make script easier to decipher, but resulted instead in the delegation of much of the labor of reading and writing to skilled slaves, who acted as professional readers and scribes. It is in the context of a society with an abundant supply of cheap, intellectually skilled labor that ancient attitudes toward reading must be comprehended and the ready and pervasive acceptance of the suppression of word separation throughout the Roman Empire understood.
引用の最後に示唆されているように,古代人は続け書きにシフトすることで,読みにくさをあえて高めようとした,という言い方さえできるのかもしれない.この観点は,中世後期に再び分かち書きへと回帰していく過程を理解する上でも示唆的である.関連して「#1903. 分かち書きの歴史」 ([2014-07-13-1]) も参照.
・ Saenger, P. Space Between Words: The Origins of Silent Reading. Stanford, CA: Stanford UP, 1997.
アルファベットの分かち書き (distinctiones) と続け書き (scriptura continua) の問題については,最近では「#3926. 分かち書き,表語性,黙読習慣」 ([2020-01-26-1]) で,それ以前にも distinctiones の各記事で取り上げてきた.
Saenger (9) によると,アルファベットに母音表記の慣習が持ち込まれる以前の地中海世界では,スペースによるか点によるかの違いこそあれ,分かち書きが普通に行なわれていた.ところが,ギリシア語において母音表記が可能となるに及び,続け書きが生まれたという.これを時系列で整理すると次のようになる.
まず,アルファベット使用の初期から分かち書きは普通にあった.ところが,ギリシア・ローマ時代にそれが廃用となり,代わって続け書きが一般化した.ローマ帝国が崩壊し,中世後期の8世紀頃になると分かち書きが改めて導入され,その後徐々に一般化して現代に至る.
分かち書きは現在では当然視されているが,母音表記を享受し始めた古典時代の間に,その慣習が一度廃れた経緯があるということだ.では,なぜ母音表記の導入により,私たちにとって明らかに便利に思われる分かち書きが廃用となり,むしろ読みにくいと思われる続け書きが発達したのだろうか.Saenger (9--10) によれば,母音表記と続け書きの間には密接な関係があるという.
The uninterrupted writing of ancient scriptura continua was possible only in the context of a writing system that had a complete set of signs for the unambiguous transcription of pronounced speech. This occurred for the first time in Indo-European languages when the Greeks adapted the Phoenician alphabet by adding symbols for vowels. The Greco-Latin alphabetical scripts, which employed vowels with varying degrees of modification, were used for the transcription of the old forms of the Romance, Germanic, Slavic, and Hindu tongues, all members of the Indo-European language group, in which words were polysyllabic and inflected. For an oral reading of these Indo-European languages, the reader's immediate identification of words was not essential, but a reasonably swift identification and parsing of syllables was fundamental. Vowels as necessary and sufficient codes for sounds permitted the reader to identify syllables swiftly within rows of uninterrupted letters. Before the introduction of vowels to the Phoenician alphabet, all the ancient languages of the Mediterranean world---syllabic or alphabetical, Semitic or Indo-European---were written with word separation by either space, points, or both in conjunction. After the introduction of vowels, word separation was no longer necessary to eliminate an unacceptable level of ambiguity.
Throughout the antique Mediterranean world, the adoption of vowels and of scriptura continua went hand in hand. The ancient writings of Mesopotamia, Phoenicia, and Israel did not employ vowels, so separation between words was retained. Had the space between words been deleted and the signs been written in scriptura continua, the resulting visual presentation of the text would have been analogous to a modern lexogrammatic puzzle. Such written languages might have been decipherable, given their clearly defined conventions for word order and contextual clues, but only after protracted cognitive activity that would have made fluent reading as we know it impractical. While the very earliest Greek inscriptions were written with separation by interpuncts, points placed at midlevel between words, Greece soon thereafter became the first ancient civilization to employ scriptura continua. The Romans, who borrowed their letter forms and vowels from the Greeks, maintained the earlier Mediterranean tradition of separating words by points far longer than the Greeks, but they, too, after a scantily documented period of six centuries, discarded word separation as superfluous and substituted scriptura continua for interpunct-separated script in the second century A.D.
ここで展開されている議論について,私はよく理解できていない.母音表記の導入の結果,音節が同定しやすくなったという理屈がよくわからない.また,仮にそれが本当だったとして,文字の読み手が従来の分かち書きではなく続け書きにシフトしたとしても何とか解読できる,という点までは理解できるが,なぜ続け書きに積極的にシフトしたのかは不明である.上の議論は,消極的な説明づけにすぎないように思われる.
母音文字を発明してアルファベットを便利にしたギリシア人が,読みにくい続け書きにシフトしたというのは,何か矛盾しているように感じられる.実際,この問題は多くの論者を悩ませ続けてきたようだ (Saenger 10)
ギリシア人による母音文字の導入という文字史上の画期的な出来事については,「#423. アルファベットの歴史」 ([2010-06-24-1]) や「#2092. アルファベットは母音を直接表わすのが苦手」 ([2015-01-18-1]) を参照.
・ Saenger, P. Space Between Words: The Origins of Silent Reading. Stanford, CA: Stanford UP, 1997.
高島 (43) による漢字論を読んでいて,漢字という表語文字の一つひとつは,英語などでいうところの綴字に相当するという点で,Chinese character ではなく Chinese spelling と呼ぶ方が適切である,という目の覚めるような指摘にうならされた.
漢字というのは,その一つ一つの字が,日本語の「い」とか「ろ」とか,あるいは英語の a とか b とかの字に相当するのではない.漢字の一つ一つの字は,英語の一つ一つの「つづり」(スペリング)に相当するのである.「日」は sun もしくは day に,「月」は moon もしくは month に相当する.英語の一つ一つの単語がそれぞれ独自のつづりを持つように,漢語の一つ一つの単語はそれぞれ独自の文字を持つのである.であるからして,漢字のことを英語で Chinese characters (シナ語の文字)と言うけれど,むしろ Chinese spellings (シナ語のつづり)と考えたほうがよい.
ときどき,英語のアルファベットはたったの二十六字で,それで何でも書けるのに,漢字は何千もあるからむずかしい,と言う人があるが,こういうことを言う人はかならずバカである.漢字の「日」は sun や day にあたる.「月」は moon や month にあたる.この sun だの moon だののつづりは,やはり一つ一つおぼえるほかない.知れきったことである.漢語で通常もちいられる字は三千から五千くらいである.英語でも通常もちいられる単語の数は三千から五千くらいである.おなじくらいなのである.それで一つ一つの漢字があらわしているのは一つの意味を持つ一つの音節であり,「日」にせよ「月」にせよその音は一つだけなのだから,むしろ英語のスペリングよりやさしいかもしれない.
確かに,この見解は多くの点で優れている.アルファベットの <a>, <b>, <c> 等の各文字は,漢字でいえば言偏や草冠やしんにょう等の部首(あるいはそれより小さな部品や一画)に相当し,それらが適切な方法で組み合わされることによって,初めてその言語の使用者にとって最も基本的で有意味な単位と感じられる「語」となる.「語」という単位にまでもっていくための部品統合の手続きを「綴り」と呼ぶとすれば,確かに <sun> も <sunshine> も <日> も <陽> もいずれも「綴り」である.アルファベットにしても漢字にしても,当面の目標は「語」という単位を表わすことである点で共通しているのだから,概念や用語も統一することが可能である.
文字の最重要の機能の1つが表語機能 (logographic function) であることは,すでに本ブログの多くの箇所で述べてきたが(例えば,以下の記事を参照),英語の綴字と漢字が機能的な観点から同一視できるという高島の発想は,改めて文字表記の表語性の原則をサポートしてくれるもののように思われる.
・ 「#284. 英語の綴字と漢字の共通点」 ([2010-02-05-1])
・ 「#285. 英語の綴字と漢字の共通点 (2)」 ([2010-02-06-1])
・ 「#1332. 中英語と近代英語の綴字体系の本質的な差」 ([2012-12-19-1])
・ 「#1386. 近代英語以降に確立してきた標準綴字体系の特徴」 ([2013-02-11-1])
・ 「#2043. 英語綴字の表「形態素」性」 ([2014-11-30-1])
・ 「#2344. 表意文字,表語文字,表音文字」 ([2015-09-27-1])
・ 「#2389. 文字体系の起源と発達 (1)」 ([2015-11-11-1])
・ 「#2429. アルファベットの卓越性という言説」 ([2015-12-21-1])
・ 高島 俊男 『漢字と日本人』 文藝春秋社,2001年.
現代の英語の書記では当然視されている分かち書き (distinctiones) が,古い時代には当然ではなく,むしろ続け書き (scriptio continua) が普通だったことについて,「#1903. 分かち書きの歴史」 ([2014-07-13-1]) で述べた.実際,古英語の碑文などでは語の区切りが明示されないものが多いし,古英語や中英語の写本においても現代風の一貫した分かち書きはいまだ達成されていない.
だが,分かち書きという現象そのものがなかったわけではない.「#572. 現存する最古の英文」 ([2010-11-20-1]) でみた最初期のルーン文字碑文ですら,語と語の間に空白ではなくとも小丸が置かれており,一種の分かち書きが行なわれていたことがわかるし,7世紀くらいまでには写本に記された英語にしても,語間の空白挿入は広く行なわれていた.ポイントは,「広く行なわれていた」ことと「現代風に一貫して行なわれていた」こととは異なるということだ.分かち書きへの移行は,古い続け書きの伝統の上に新しい分かち書きの方法が徐々にかぶさってきた過程であり,両方の書き方が共存・混在した期間は長かったのである.英語の句読法 (punctuation) の歴史について一般に言えるように,語間空白の規範は中世期中に定められることはなく,あくまで書き手個人の意志で自由にコントロールしてよい代物だった.
書き手には空白を置く置かないの自由が与えられていただけではなく,空白を置く場合に,どれだけの長さのスペースを取るかという自由も与えられていた.ちょうど現代英語の複合語において,2要素間を離さないで綴るか (flowerpot),ハイフンを挿入するか (flower-pot),離して綴るか (flower pot) が,書き手の判断に委ねられているのと似たような状況である.いや,現代の場合にはこの3つの選択肢しかないが,中世の場合には空白の微妙な量による調整というアナログ的な自由すら与えられていたのである.例えば,語より大きな統語的単位や意味的単位をまとめあげるために長めの空白が置かれたり,形態素レベルの小単位の境を表わすのに僅かな空白が置かれるなど,書き手の言語感覚が写本上に精妙に反映された.
Crystal (11-12) はこの状況を,Ælfric の説教からの例を挙げて説明している.
Very often, some spaces are larger than others, probably reflecting a scribe's sense of the way words relate in meaning to each other. A major sense-break might have a larger space. Words that belong closely together might have a small one. It's difficult to show this in modern print, where word-spaces tend to be the same width, but scribes often seemed to think like this:
we bought a cup of tea in the cafe
The 'little' words, such as prepositions, pronouns, and the definite article, are felt to 'belong' to the following content words. Indeed, so close is this sense of binding that many scribes echo earlier practice and show them with no separation at all. Here's a transcription of two lines from one of Ælfric's sermons, dated around 990.
þærwæronðagesewene twegenenglas onhwitumgẏrelū;
þær wæron ða gesewene twegen englas on hwitum gẏrelū;
'there were then seen two angels in white garments'
Eacswilc onhisacennednẏsse wæronenglasgesewene'.
Eacswilc on his acennednẏsse wæron englas gesewene'.
'similarly at his birth were angels seen'
The word-strings, separated by spaces, reflect the grammatical structure and units of sense within the sentence.
話し言葉では,休止 (pause) や抑揚 (intonation) の調整などを含む各種の韻律的な手段でこれと似たような機能を果たすことが可能だが,書き言葉でその方法が与えられていたというのは,むしろ現代には見られない中世の特徴というべきである.関連して「#1910. 休止」 ([2014-07-20-1]) も参照.
・ Crystal, David. Making a Point: The Pernickety Story of English Punctuation. London: Profile Books, 2015.
Ullmann (43--44) に,語 (word) をみる視点として,標記の対立が挙げられている.一見すると,この対立は語の意味が具体的か抽象的か,名詞でいえば具体名詞か抽象名詞かという対立のことかと想像されるが,実際には Ullmann は形態的な観点から concrete と abstract という形容詞を用いている.Ullmann (43--44) の "the contrast between 'concrete' and 'abstract' word-structure" に関する説明をみてみよう.
In Latin and other highly inflected languages it often happens that a word does not exist in an abstract state, as a pure designation of the thing it stands for: there is annus, nominative singular, annum, accusative singular, annorum, genitive plural, etc., but no single form denoting the idea of 'year' as such, without specifying its function in the sentence. In this sense, the Latin word is concrete, i.e. grammatically determined, whereas the French an or the English year are abstract, grammatically neutral until they are embedded in a specific utterance.
この観点からすると,ラテン語に比較される形態論を有する古英語の語はたいてい concrete であり,対する現代英語の語はたいてい abstract ということになる.現代英語の stone は形態論的に抽象的に「石」(日本語の語もたいてい抽象的なのでそのままパラレルに訳を当てることができる)を表わすことができるが,古英語の stān は「石」を表わすのみならず,統語的な情報,すなわち主格(あるいは対格)であることを同時に示している.むしろ,統語的な情報を示すことなく,単に抽象的に「石」を表わす方法がないと言ってもよい.常により具体的な多くの情報をも含まざるを得ないという点で,古英語の stān なり,その屈折形である stānes, stāne, stānas, stāna, stānum なりは,具体的な語であるといえる.
このような具体的な語は,抽象的に参照したいとき,例えば辞書やグロッサリーを編纂するときには,少々悩ましい問題を提示する.どの形を見出し語として選べばよいかを決めなければならないからだ.多くの人にとって主格の形態を選ぶのが通常の感覚かもしれないが,これは語学学習を通じて主格形態が代表形であると慣らされているだけかもしれない.確かに理論的にも主格が他の格に比して卓越している,したがって代表形として選ばれて然るべきである,ということは議論できるのかもしれないが,最も適切であるかどうかはどのように決めればよいのか.例えば,日常的には困るかもしれないが,生成文法における抽象的な基底形,つまり実際に発話において生じるのことのない形態を,辞書の見出しに立てるということも理論上はありうる.また,古英語の動詞は,現代のフランス語やドイツ語などと同様に,不定詞形を見出しに立てるのが慣習だが,例えば直説法1人称単数現在の形態で掲げて悪い理由はないように思える.
考えてみれば,現代英語の語も古英語と比較すれば抽象的であるというだけで,名詞には複数屈折もあるし,動詞には各種の屈折形がある.したがって,見出しの形には,やはりある程度具体的な語が選ばれているとも考えられる.例えば,stone は,単数の非所有格を示している限りにおいて,具体的である.この点では,完璧に抽象的な語というのは得がたいのかもしれない.生成文法家であれば,言語にかかわらず concrete word とは surface form のことであり,abstract word とは underlying form のことであると一般的に理解するのだろう.
・ Ullmann, Stephen. Semantics: An Introduction to the Science of Meaning. 1962. Barns & Noble, 1979.
言語学・韻律論における休止 (pause) あるいは休止現象 (pausal phenomena) とは,話者が発話の途中におく無音区間である.生理学的な観点からみれば,休止は発話中の息継ぎのために必要な時間とも言えるし,次の発話のための準備の時間とも言えるだろう.言語学的な観点からみると,言語音が発せられないのだから何も機能を果たさないかのように考えられそうだが,それは誤りである.黙説や無言が修辞的な効果をもちうるように,休止もまた言語学的な機能を果たす.
佐藤 (57) によれば,休止とは「話し手にとって,プロミネンスと連動して効果をあげるための無音区間であり,聞き手にとって,聴取した内容を整理し,記憶を強化するために必要な時間」と定義される.この定義では,休止が話し手の産出,聞き手の理解に重要な役割を果たしていることが明示されている.統語上,意味上,談話上のプロミネンス(卓立)を標示するのを前後からサポートする機能といえるだろう.
休止のもつもう1つの言語学的機能は,文法的な境界を標示することである (Crystal 355) .話者は,文の構造上の切れ目で休止を入れることにより,聞き手の分析にかかる負担を減らしてあげることができる.Crystal はこの機能を juncture pause と呼んでいるが,橋本萬太郎の用語でいえば「#976. syntagma marking」 ([2011-12-29-1]) に相当するだろう.この機能は強勢や抑揚など他の韻律的な手段によっても実現されうるのだから,休止も,音声上はゼロであるとはいえ,これらの手段と同列に位置づけるのが妥当だろう.
また,通常の発話では一語一語の間に休止を入れているわけではないが,潜在的にはどの語境界(場合によっては形態素境界)にも休止を置くことができるので,語 (word) を同定する潜在的機能をもっているともいえる.これは potential pause と呼ばれる.この概念は,語の内部で休止を置くことが絶対にできないということを含意するものではないが,語の内部よりは語の境界で休止するほうがずっと普通であることは間違いない.語(の境界)を定義するということは言語学上の最大の難問の1つだということを「#910. 語の定義がなぜ難しいか (1)」 ([2011-10-24-1]),「#911. 語の定義がなぜ難しいか (2)」 ([2011-10-25-1]),「#912. 語の定義がなぜ難しいか (3)」 ([2011-10-26-1]),「#921. 語の定義がなぜ難しいか (4)」 ([2011-11-04-1]),「#922. 語の定義がなぜ難しいか (5)」 ([2011-11-05-1]) の記事で扱ってきたが,休止という「言語らしくない」現象がこの問題に鍵を与えてくれるというのが興味深い.
休止がより長く,より意図的に置かれると,それは談話的・修辞的な意味を帯び始め,黙説や無言というカテゴリーへ移行するだろう.ここでは考察を割愛するが,改めて論じるべき休止のもう1つの言語学的な機能である.
なお,広い意味での休止は,文字通りの無音のもの (silent pause) だけでなく,ah や er などのつなぎ語 (filler) として実現される有音の休止 (filled pause) も含みうる.filled pause は,上述の構造的な機能 (juncture pause) からは少なくとも部分的に独立しており,もっぱら躊躇を示すので,区別して hesitation pause と呼ぶこともある.
・ 佐藤 武義(編著) 『展望 現代の日本語』 白帝社,1996年.
・ Crystal, David, ed. A Dictionary of Linguistics and Phonetics. 6th ed. Malden, MA: Blackwell, 2008. 295--96.
lexeme (語彙素)はこのブログでもたまに出してきた術語だが,正確に定義しようとすると難しい.「#22. イディオムと英語史」 ([2009-05-20-1]) でも説明を濁してきた.今回は,ずばり定義とまではいかないが,いくつかの英語学辞典等を参照して,どのような言語単位であるかを整理したい.lexeme に迫るにはいくつかのアプローチがある.
(1) morpheme (形態素)や word (語)と比較される形式の単位として.morpheme の定義は,「#886. 形態素にまつわる通時的な問題」 ([2011-09-30-1]) で触れたように,決定版はないが,Bloomfield の古典的な定義によれば "a linguistic form which bears no partial phonetic-semantic resemblance to any other form" (Section 10.2) である.word の定義は,##910,911,912,921,922 で取り上げたように,さらに難しい.だが,いずれも意味を有する形式的な単位であることには違いない.lexeme も同様に形式の単位である.その形式には意味も付随しているが,lexeme はあくまでその形式と意味の融合体である記号のうちの形式の部分を指す.では,morpheme, word, lexeme のあいだの違いはどこにあるのか.例えば,understand は1語だが,2つの形態素 under- と -stand から成るといえる.しかし,その語の意味は2つの形態素の意味の和にはなっておらず,意味上は全体として1つの塊と見なさざるを得ない.ここでは,形式の単位と意味の単位とがきれいに対応していないということになる.同様に,put up with というイディオムは,3形態素かつ3語から成っているが,意味の単位としてはやはり1つの塊である.ここでも,形式の単位と意味の単位とが食い違っている.そこで,understand も put up with も分解できない1つの意味をもつのだから,形式的にも対応する1つの単位を設定するのが妥当ではないかという考え方が生じる.これが lexeme である.今や UNDERSTAND や PUT UP WITH は,それぞれ1つの lexeme として参照することができるようになった(lexeme は大文字で表記するのが慣例).
(2) 1つの語類のみに属する基底形として.water には名詞と動詞がある.つまり,同じ語ではあるが,異なる2つの語類に属していることになる.名詞としての water と動詞としての water を別扱いすることができるように,word とは異なる lexeme という単位を立てると便利である.単数形 water や複数形 waters は 名詞 lexeme としての WATER の実現形であり,原形 water,三単現形 waters,過去形 watered,-ing 形 watering などは動詞 lexeme としての WATER の実現形である.
(3) 実現される異なる語形をまとめあげるための代表形として.go, goes, went, going, going はそれぞれ形態こそ異なるが,基底にある lexeme は GO である.この観点からの lexeme は,headword, citation form, lemma などと呼び替えることも可能である.
直感的にいえば,辞書において,見出しあるいは追い込み見出しとして登録されており,意味が与えられていれば便利だと思われるような形式の単位といっておけばよさそうだが,厳密な定義は難しい.学者(学派)によって様々な定義が提起されているという点では,morpheme, word, lexeme のような言語単位を表わす術語の扱いは厄介である.なお,lexeme という単位を意識して編纂された野心的な学習者用英英辞書として,Cambridge International Dictionary of English (1995) を挙げておこう.
・ Bloomfield, Leonard. Language. 1933. Chicago and London: U of Chicago P, 1984.
・ Pearce, Michael. The Routledge Dictionary of English Language Studies. Abingdon: Routledge, 2007.
lexeme (語彙素)はこのブログでもたまに出してきた術語だが,正確に定義しようとすると難しい.「#22. イディオムと英語史」 ([2009-05-20-1]) でも説明を濁してきた.今回は,ずばり定義とまではいかないが,いくつかの英語学辞典等を参照して,どのような言語単位であるかを整理したい.lexeme に迫るにはいくつかのアプローチがある.
(1) morpheme (形態素)や word (語)と比較される形式の単位として.morpheme の定義は,「#886. 形態素にまつわる通時的な問題」 ([2011-09-30-1]) で触れたように,決定版はないが,Bloomfield の古典的な定義によれば "a linguistic form which bears no partial phonetic-semantic resemblance to any other form" (Section 10.2) である.word の定義は,##910,911,912,921,922 で取り上げたように,さらに難しい.だが,いずれも意味を有する形式的な単位であることには違いない.lexeme も同様に形式の単位である.その形式には意味も付随しているが,lexeme はあくまでその形式と意味の融合体である記号のうちの形式の部分を指す.では,morpheme, word, lexeme のあいだの違いはどこにあるのか.例えば,understand は1語だが,2つの形態素 under- と -stand から成るといえる.しかし,その語の意味は2つの形態素の意味の和にはなっておらず,意味上は全体として1つの塊と見なさざるを得ない.ここでは,形式の単位と意味の単位とがきれいに対応していないということになる.同様に,put up with というイディオムは,3形態素かつ3語から成っているが,意味の単位としてはやはり1つの塊である.ここでも,形式の単位と意味の単位とが食い違っている.そこで,understand も put up with も分解できない1つの意味をもつのだから,形式的にも対応する1つの単位を設定するのが妥当ではないかという考え方が生じる.これが lexeme である.今や UNDERSTAND や PUT UP WITH は,それぞれ1つの lexeme として参照することができるようになった(lexeme は大文字で表記するのが慣例).
(2) 1つの語類のみに属する基底形として.water には名詞と動詞がある.つまり,同じ語ではあるが,異なる2つの語類に属していることになる.名詞としての water と動詞としての water を別扱いすることができるように,word とは異なる lexeme という単位を立てると便利である.単数形 water や複数形 waters は 名詞 lexeme としての WATER の実現形であり,原形 water,三単現形 waters,過去形 watered,-ing 形 watering などは動詞 lexeme としての WATER の実現形である.
(3) 実現される異なる語形をまとめあげるための代表形として.go, goes, went, going, going はそれぞれ形態こそ異なるが,基底にある lexeme は GO である.この観点からの lexeme は,headword, citation form, lemma などと呼び替えることも可能である.
直感的にいえば,辞書において,見出しあるいは追い込み見出しとして登録されており,意味が与えられていれば便利だと思われるような形式の単位といっておけばよさそうだが,厳密な定義は難しい.学者(学派)によって様々な定義が提起されているという点では,morpheme, word, lexeme のような言語単位を表わす術語の扱いは厄介である.なお,lexeme という単位を意識して編纂された野心的な学習者用英英辞書として,Cambridge International Dictionary of English (1995) を挙げておこう.
・ Bloomfield, Leonard. Language. 1933. Chicago and London: U of Chicago P, 1984.
・ Pearce, Michael. The Routledge Dictionary of English Language Studies. Abingdon: Routledge, 2007.
標題の話題について,##910,911,912,921 の記事の続編.言語学の研究者は例外なく辞書好き人間だが,辞書が絶対的ではないということもよく知っている.自分が語とは何かという究極の問いに対する答えを知らないにもかかわらず,辞書編纂に関わる可能性すらあるからだ.
市販の辞書 (dictionary) は,理論と現実の妥協の産物であり,脳内の語彙目録 (lexicon) を反映しているわけではない.前者は,あくまで現実的な諸事情を反映した便宜的な語彙リストである.というのは,辞書編纂者は,編集に際して以下の条件に縛られるからである.Lieber (27) より,辞書編纂者が考慮しなければならない要点を引用しよう.
・ the size of the dictionary, which determines the number of words it can hold;
・ the intended audience of the dictionary (adults, children, language learners, etc.);
・ whether a word has a sufficiently broad base of usage;
・ whether it's likely to last;
・ whether it's too specialized or technical for the intended audience;
・ for a word borrowed from another language, whether it's assimilated enough to be considered part of English.
近年の online dictionary の興隆により,紙幅の都合という従来の辞書の旧弊は克服されつつある.しかし,online とはいえども,辞書としてある種の読者を対象とする以上,他の条件は満たさざるを得ない.
市販の辞書は多かれ少なかれ複数の言語使用者をターゲットにするが,mental lexicon は言語使用者一人ずつに存在するものである.この両者を調和させるということ自体が,無理な注文なのかもしれない.dictionary と (mental) lexicon という用語の間に横たわる考え方の違いを認識することが重要である.
・ Lieber, Rochelle. Introducing Morphology. Cambridge: CUP, 2010.
[2011-10-26-1]の記事「#912. 語の定義がなぜ難しいか (3)」の (2) で触れたが,辞書には意味が不詳であるにもかかわらず見出し語として掲げられているものがありうる.語の意味が不詳であるということは辞書編纂者の情報収集の問題であるという可能性は排除できないにせよ,その語が一般的に知られていない語であるということは恐らく間違いないだろう.
OED では,そのような語が少なくとも77個は登録されている.以下は,OED の定義部検索で "meaning obscure" あるいは "obscure meaning" というキーワードにより引き出された語である.Lieber (26) では,OED での同種の検索により87語が引き出されたとしているが,ここには語義の1つのみが意味不明というものも含まれている.それを手作業で排除した結果の77語だ.
†cremitoried (ppl. a.), †emporture (v.), †gestyll (v.), †leary (a.), †leg-saw, †minority waiter, notchet, †rag (v.4), †reordi (a.), †reprobitant (a.), †resaille, †residence (v.), †rok, †romb (v.), †rompering, †rownfol(d, †rubell, †rum (n.3), †ruvell, †ryne2, scuncheon anglers, -crest, †sheer-point, short-coat vicarage, †shreake, shuffle-breeches, †sidder (v.), †sithy-coat, †skyvald, †slampamb, †slope (v.3), †smazky (a.), †spanner2, †sparth2, †spen (n.), †spencer (v.), †spene (n.), †sperring (vbl. n.), †sperware, †splet (n.), †splete, †spleyer, †spyccard, †squaleote (v.), †squalm, †squirgliting (a.), †start-rope, †strothe (a.), †threte (n.), †thwerl (v.), †traythly (adv.), †trice (n.3), umbershoot, †unbrede (v.), †uncape (v.), †underdrawn (ppl. a.), †uniable (a.), †unthwyuond (pres. pple.), †untwitten (ppl. a.), †val-dunk, †ver (n.2), †verge-salt, †verling-line, †versing box, †very(e), †vezon, †viridary (a.), †vitremyte, †vounde (a.), †vowgard, †vrycloth, †wandclot, †way-flax, Welsh brief, †werder, †wesel, †wranchevel, †wrast (? n.)
71語が廃語というのが現実だが,要点はこのような語が辞書にエントリーされているという事実があることである.dictionary の見出し語と mental lexicon の登録が必ずしも一致しないということは,これらの例からも明らかだろう.語とは何かという問いへの答えを辞書編集者に任せるわけにはいかないということを示す好例だ.
・ Lieber, Rochelle. Introducing Morphology. Cambridge: CUP, 2010.
[2011-10-24-1], [2011-10-25-1]に引き続き,語の定義の難しさを垣間見る記事の第3弾.語を定義する最も単純な方法,語の範囲を限定する最も直感的な方法は,辞書を参照することだろうと思われるかもしれない.辞書の見出し語はすべて「語」のはずであり,大型辞書を参照すれば当該言語の語の目録 (lexicon) を作成することができる,と.しかし,語の範囲を限定する際に,辞書に頼ってはならないいくつかの理由がある.Lieber (13--15) に拠って,列挙しよう.
(1) 辞書は,編集者によってある方針に基づいて編まれている.編集者の想定する語の定義によっては収録語彙の範囲に差が生じる可能性があり,実際に,語に対する考え方は辞書間で異なっていることが普通である.差別用語や専門用語を掲載するかどうか,俗語や古語はどうか,新語はどの程度社会に浸透していれば収録可とみなせるか,接辞は語に含まれるか,派生語や複合語はどこまで納めるか,等々の決定において,各辞書編集者は独自の方針をもっている.世界最大の英語辞書 OED であっても,事情は変わらない.また,参照者においてもどの辞書を選ぶかという決定は恣意的である.辞書に語の定義を委ねることは,問題を一段階さかのぼらせたにすぎず,問題の解決になっていない.
(2) 辞書には,一度しか文証されない語(臨時語,nonce word, hapax legomenon)が収録されている場合がある.例えば,OED では umbershoot という語が見出し語として挙げられており,James Joyce の Ulysses からの唯一の例が引かれているが,定義欄に "a word of obscure meaning" とある.果たして,これを実際的な意味において語とみなしてよいのだろうか.文豪 Joyce だから許されるのか,一般の話者の発する臨時語はどうなのか.
(3) 誤植,勘違い,民間語源などにより,間違えて辞書に忍び込んでしまった幽霊語 (ghost word) なる語がある.OED には,ambassady なる hapax legomenon が収録されているが,これは ambassade の単純な綴り間違い,あるいは誤植ではないかと考えられている.辞書を盲信すると,実在しないかもしれない語を語としてみなす誤りが生じうる.特殊で意図的な幽霊語として,"mountweazel" 語と呼ばれるものがある.これは,辞書編纂者が他の辞書編纂者による辞書の著作権侵害を見破るために,意図的に密かに挿入した幽霊語であり,実在の語ではない.このような mountweazel 語の存在は,辞書を絶対的な語彙目録として用いることの危険を物語っている.
辞書やその他の権威は,"Is xyz a word?" という問いに必ずしも正しい答えを与えてくれるとは限らないことが分かるだろう.
・ Lieber, Rochelle. Introducing Morphology. Cambridge: CUP, 2010.
昨日の記事[2011-10-24-1]に引き続き,語の定義の難しさを垣間見る記事の第2弾.英語の正書法には,語と語の間に空白を入れる習慣があるので,語の定義は自明のように思われるかもしれない.しかし,英語に限らず言語一般について語を定義づけようとするのであれば,各言語の正書法の習慣に依存した定義は不適切である(正書法ですら,flower pot ~ flower-pot ~ flowerpot などの揺れが示すとおり,語の区切りは不明確である).そもそも書き言葉をもたない言語も多いのだから,話し言葉を基準にした語の定義がなされなければならない(言語学における話し言葉の優位性については,[2011-05-15-1]の記事「#748. 話し言葉と書き言葉」を参照).
Crystal (240--41) は,話し言葉で語を見分ける基準として,これまでに提案されてきたものを紹介している.以下に,解説を加えながら要約しよう.
(1) 話し言葉で考えると,英語の正書法の空白に相当するものは発話上の休止 (pause) だが,自然の発話では語と語の間は流れるように連続することが多く,語を見分けるための基準として休止に頼る方法は見た目ほどうまくゆかない.ある文を,意識的に休止を入れながらゆっくりと読み上げるようにと話者に指示するテストにおいては,おおむね語の区切りで休止が入るが,必ずしもそうではない場合がある.例えば,The three little pigs went to the market. において,mar/ket と語中に休止の入る可能性がある.
(2) 語を適当に追加・削除・置換せよというテストにおいては,例えば The big pig once went straight to the market. などが得られ,追加・削除・置換の生じる位置に語と語の区切りがあると想定できるかもしれない.これは,語の主たる特徴としてしばしば言及される中断不可能性 (uninterruptibility) に関するテストだが,abso-blooming-lutely のような例外のあることはよく知られている.
(3) アメリカ構造言語学による「語とは "minimal free form" である」とする定義があるが,the や of は実際には独立して現れることはほとんどない.他の語とともに現れるという点では,拘束形態素 (bound morpheme) に近い.
(4) 語の内部でのみ作用する音韻規則があり,その規則が適用される範囲の内外を分ける境界線が,語と語の区切りと一致するではないか.諸言語の強勢の位置に関する規則や母音調和の規則は語の内部にのみ適用されることが多いので,これを利用するという方法だが,実際には例外も多い.
(5) 意味単位の区切りが語と語の区切りに一致するのではないか.しかし,昨日の記事[2011-10-24-1]で触れたとおり,idiom は複数の語から成って初めて1つの意味単位に対応する.意味の単位と語の単位が必ずしも連動していない証拠である.
誰もが直感的に知っているものに漏れのない科学的な定義を与えるということは,難しい.
・ Crystal, David. How Language Works. London: Penguin, 2007.
語 (word) をいかに定義するかという問題は,言語学の最大の難問の1つといってよい.語は,いまだに明確な定義を与えられていない.形態素 (morpheme) についても事情は同じである.関連する議論は,以下の記事でも触れてきたので参照されたい.
・ #886. 形態素にまつわる通時的な問題: [2011-09-30-1]
・ #700. 語,形態素,接辞,語根,語幹,複合語,基体: [2011-03-28-1]
・ #554. cranberry morpheme: [2010-11-02-1]
さて,一般的な感覚で語を話題にする場合には,次の2つの条件を与えておけば語の定義として十分だろうと思われる (Carstairs-McCarthy 5) .
(a) 予測不可能な (unpredictable) 意味を有し,辞書に列挙される必要があること
(b) 句や文を形成するための構成要素 (building-block) であること
しかし,この2つの条件を満たしていれば語と呼んでよいかというと,厳密には漏れがある.
dioecious を例にとろう.日常的な感覚ではこれはれっきとした語である.まず,The plant is dioecious. あるいは a dioecious plant などと使え,句や文を構成する要素であるから,(b) の条件は満たしている.また,ほとんどの読者がこの語の意味(生物学の専門用語で「雌雄異体の」の意味)を知らなかったと思われるが,そのことは意味が予測不可能であるという (a) の条件を満たしていることを表わしている.しかし,いったんこの語を知ってしまえば,dioeciously や dioeciousness という派生形の意味は予測可能だろう.ここで (a) の条件が満たされなくなるわけだが,dioeciously や dioeciousness も diocious と同じ資格で語としてみなすのが通常の感覚だろう.たとえ辞書には列挙されないとしても,である.
別の例として,keep tabs on は「?に気をつける」という idiom を取りあげよう.この表現は,通常の感覚では3つの語から構成されていると捉えられ,論理的には語そのものではなく語より大きい単位とみなされている.つまり,(b) の条件を満たしていないことが前提となっているが,idiom の常として意味は予測不可能であり,(a) の条件は満たしている.idiom よりも大きな文に相当する単位でありながら,その意味が予測不可能なことわざ (proverb) も同様である.
上の2つの例は,問題の表現が (a), (b) の条件 をともに満たしていて初めて語とみなせるのか,どちらかを満たしていればよいのか,あるいは条件の設定そのものに難があるのか,という疑問を抱かせる.Carstairs-McCarthy は,(a) を満たしている単位を lexical item,(b) を満たしている単位を専門的な意味での word として用い,区別の必要を主張している (12--13) .
以上,語の定義の難しさを垣間見る記事の第1弾.
・ Carstairs-McCarthy, Andrew. An Introduction to English Morphology. Edinburgh: Edinburgh UP, 2002.
Powered by WinChalow1.0rc4 based on chalow