hellog〜英語史ブログ

#838. 言語体系とエントロピー[entropy][functionalism][information_theory][functional_load]

2011-08-13

 昨日の記事「言語変化における therapy or pathogeny」 ([2011-08-12-1]) を書きながら,言語における「全快」状態あるいは「罹病」状態とは何かを考えていた.言語学の常識として「個別言語はそれが供する言語共同体の要求をほぼ完全に満たすものであり,その話者にとってはほぼ完璧な記号体系である」という考え方がある.これは,各言語がその話者にとっては常に「全快」に近い状態にあるということを意味する.この考え方でいけば,完全無欠とは言わずとも「罹病」状態にある言語は存在しないということになる.ここでは「その話者にとって」という視点が重要であり,あくまで相対的な基準で「全快」に近いということである (相対的な言語観については,[2011-06-06-1]の記事「Martinet にとって言語とは?」を参照).また,外部の者が複数の言語を絶対的な基準で比べて,A言語のほうがB言語よりも「健全」であるなどと決めることはできないということにもなる.そもそも,言語的にどのような状態であれば「健全」であるかについて客観的な基準を決めることは難しいだろう.
 しかし,主観的評価の込もりがちな「健全」や「全快」という表現を避け,絶対的な基準で量化できる項目に着目してその尺度でA言語とB言語を比較評価するということは可能かもしれない.例えば,体系の対称性 (symmetry) ,均衡性 (balancedness) ,経済性 (economy) というものが量化できるのであれば,それらの指標をもって,仮に部分的に言語体系のの「健全性」を論じるということはできるかもしれない.[2010-02-14-1]の記事「言語の難易度は測れるか」の議論とも関係するが,音韻論や形態論など部門別に考えるということであれば,さらに量化はしやすいだろう.[2011-08-11-1]の記事「機能負担量」で説明した functional load の考え方は音韻論から生み出された量的な概念だが,書記素論や形態論など他の部門にも応用することは可能かもしれない(もっとも音韻論のように高度に構造化された部門ではないと実践は難しそうだが).
 言語体系の「健全性」を評価する観点として,上で対称性,均衡性,経済性といった特性を挙げてみたが,もう1つの特性として,現代世界のキーワードでもあるエントロピー (entropy) を考えてみるのもおもしろい.エントロピーとは体系としての乱雑さの度合いを指し,値が低いほど体系が秩序だっていることを示す.もともとは熱力学の用語だが,情報理論に広く応用されており,言語理論への応用の道も開かれているといえる.言語体系のエントロピーの測定法を編み出すことは容易ではないだろうが,単純にいって,体系としての規則性が増せばエントロピーが減少し,不規則性が増せばエントロピーが増大すると表現することはできる.
 例えば,言語変化には「音声変化は規則的に生じるが形態論に不規則性をもたらし,類推に基づく形態変化は不規則に生じるが形態論の規則性をもたらす」傾向が見られるが,エントロピーの用語を用いれば「形態論において,規則的な音声変化はエントロピーを増大させ,不規則的な類推作用はエントロピーを減少させる」と換言できる(関連して,[2011-03-19-1]の記事「語尾音消失と形態クラス」で取り上げた語尾音の消失と保持の例や,[2010-11-03-1]の記事「2種類の analogy」の議論を参照).
 私は詳しくないが,生成文法に基盤を置く音韻論や natural morphology などの分野では,言語変化を記述・説明するのに,その過程の自然さの度合いが考慮される.「自然さ」という特性も,エントロピー,対称性,均衡性,経済性などと同様に,体系の「健全性」を匂わす特性の1つである."natural", "balanced", "economical", "simple", "therapy" などという表現には否応なしに価値観や評価が含まれてしまうが,"entropy" には熱力学の法則とだけあって科学的な響きがあるし,時代のキーワードとはいえ,いまだ手垢がついていないように思える.
 熱力学の第2法則によれば,「物質とエネルギーは一つの方向のみに,すなわち使用可能なものから使用不可能なものへ,あるいは利用可能なものから利用不可能なものへ,あるいはまた,秩序化されたものから,無秩序化されたものへと変化する」(リフキン,p. 45).つまり,ある領域でエントロピーが減少しているように見えても,必ず他の領域でそれ以上にエントロピーが増大しており,全体として宇宙のエントロピーは増大の一途をたどるということである.現代物理学が絶対的な真理として認めているのはこの法則だけだと言われるほどの強い法則だ.では,宇宙の体系と言語の体系は類似しているのだろうか.もしそうだと仮定すると,昨日の記事「言語変化における therapy or pathogeny」 ([2011-08-12-1]) で問題になった Schendl (69) の "therapeutic changes in one part of the grammar may create imbalance in another part" の maymust と読みなおさなければならないことになる.だが,幸いなことに,エントロピーの法則は形而下の世界のみに適用されるという.言語変化の議論では may ほどの解釈でよいのかもしれない.

 ・ ジェレミー・リフキン 著,竹内 均 訳 『改訂新版 エントロピーの法則』 祥伝社,1990年.
 ・ Schendl, Herbert. Historical Linguistics. Oxford: OUP, 2001.

[ | 固定リンク | 印刷用ページ ]

#1089. 情報理論と言語の余剰性[information_theory][linguistics][redundancy][entropy][history_of_linguistics]

2012-04-20

 情報理論 (information theory) は戦後に発達した比較的新しい科学研究だが,言語学はその成果を様々な形で享受してきた.情報の送り手と受け手の問題,コード化の問題,予測可能性 (predictability) の問題,そして何よりも言語の顕著な特徴の1つである余剰性 (redundancy) の問題について,言語学が情報理論から学べることは多い.
 情報理論と人工頭脳工学 (cybernetics) の基礎理論は Shannon and Weaver の著作によって固まったとされ,これは言語学史においても有意義な位置を占めている(イヴィッチ,pp. 164--71).しかし,この著作は高度に数学的であり,一般の言語学者が読んで,その成果を言語学へ還元するということは至難の業のようだ.このような場合には,言語学者による書評が役に立つ.アメリカの言語学者 Hockett の書いているレビューを読んでみた.
 Shannon and Weaver 自体が難解なのだから,その理論のレビューもある程度は難解とならざるをえない.評者の Hockett が情報理論の考え方を言語学へ応用する可能性について論じている部分では,言語学としても非常に高度な内容となっている.書評を完全に理解できたとは言い難いが,言語の余剰性およびエントロピー (entropy) についての議論はよく理解できた.
 Hockett はたいへん大まかな試算であるとしながらも,ある発話の音韻的な情報量と音声的な情報量の比は1:1000ほどの開きがあり,仮に音韻論的単位のみを意思疎通に不可欠な単位とみなすのであれば,言語音の余剰性は99.9%にのぼるとしている (85) .情報理論でいうエントロピー (entropy) は,"1 - redundancy" と定義されるので,言語音のエントロピーは0.1%である.言語は,ある言い方をすれば非効率,別の言い方をすれば予測可能性の高い種類の情報体系ということができるだろう.
 情報が物理的に伝達される際には,多かれ少なかれ必ず雑音 (noise) が含まれてしまう.したがって,情報伝達が意図された通りに遂行されるためには,雑音による影響に耐えられるだけの安全策が必要となる.言語にとって,余剰性こそがその安全策である.Hockett 曰く,"channel noise is never completely eliminable, and redundancy is the weapon with which it can be combatted" (75) .このように考えると,言語音の余剰性99.9%(あるいはこれに近似する高い値)は,いかに言語が慎重に雑音対策を施された安全設計の情報体系であるかを示す指標といえるだろう.

The high linguistically relevant redundancy of the speech signal can be interpreted not as a sign of low efficiency, but as an indication of tremendous flexibility of the system to accommodate to the widest imaginable variety of noise conditions. (Hockett 85)


 情報理論の立場から,特に余剰性という観点から言語を見始めると,それは言語のあらゆる側面に関わってくる要素だということがわかってくる.言語の余剰性について,明日の記事で詳しく見ることにする.

 ・ ミルカ・イヴィッチ 著,早田 輝洋・井上 史雄 訳 『言語学の流れ』 みすず書房,1974年.
 ・ Hockett, Charles F. "Review of The Mathematical Theory of Communication by Claude L. Shannon; Warren Weaver." Language 29.1 (1953): 69--93.
 ・ Shannon, Claude L. and Warren Weaver. The Mathematical Theory of Communication. Urbana: U of Illinois P, 1949.

[ | 固定リンク | 印刷用ページ ]

#1090. 言語の余剰性[redundancy][linguistics][entropy][information_theory][paralinguistics]

2012-04-21

 ヒトの言語の著しい特徴として,以前の記事で「#766. 言語の線状性」 ([2011-06-02-1]) と「#767. 言語の二重分節」 ([2011-06-03-1]) を取り上げてきたが,もう1つの注目すべき特徴としての余剰性 (redundancy) については,明示的に取り上げたことがなかった.今日は,昨日の記事「#1089. 情報理論と言語の余剰性」 ([2012-04-20-1]) を受けて,この特徴について説明したい.
 言語による意味の伝達に最小限に必要とされる以上の記号的要素が用いられるとき,そこに余剰性が含まれているといわれる.言語の余剰性は一見すると無駄で非効率に思われるが,昨日の記事で述べたように,言語使用に伴う種々の雑音 (noise) に対する強力な武器を提供している.急ハンドルの危険を防止するハンドルの遊びと言い換えてもよいし,無用の用と考えてもよい.また,言語の余剰性は,言語習得にも欠かせない.言語構造上また言語使用上の余剰性が十分にあれば未知の言語要素でも意味の予測が可能であり,実際に言語習得者はこの機構を利用して,言語内的・外的な文脈からヒントを得ながら,意味の見当をつけてゆくのである.
 余剰性という観点から言語を見始めると,それは言語のあらゆる側面に関わってくる要素だということがわかる.まず,昨日の記事で触れたように,音声と音素の情報量の差に基づく余剰性がある.言語の伝達には数十個の分節された音素を区別すれば事足りるが,その実現は音声の連続体という形を取らざるを得ず,そこには必要とされるよりも約千倍も多くの音声信号が否応なしに含まれてしまう.
 音韻体系にみられる対立 (opposition) に関係する余剰性もある.英語において,音素 /n/ は有声歯茎鼻音だが,鼻音である以上は有声であることは予測可能であり,/n/ の記述に声の有無という対立を設定する必要はない.これは,余剰規則 (redundancy rule) と呼ばれる.
 音素配列にも余剰性がある.語頭の [s] の直後に来る無声破裂音は必ず無気となるので,無気であることをあえて記述する必要はない([2011-02-18-1]の記事「#662. sp-, st-, sk- が無気音になる理由」を参照).予測可能であるにもかかわらず精密に記述することは不経済だからである.しかし,言語使用の現場で,語頭の [s] は何らかの雑音で聞こえなかったが,直後の [t] は無気として聞こえた場合,直前に [s] があったに違いないと判断し,補うことができるかもしれない.このように,余剰性は安全装置として機能する.
 音素配列に似た余剰性は,綴字規則にも見られる.例えば,英語では頭字語などの稀な例外を除いて,<q> の文字の後には必ず <u> が来る.<u> はほぼ完全に予測可能であり,情報量はゼロである.
 形態論や統語論における余剰性の例として,These books are . . . . というとき,主語が複数であることが3語すべてによって示されている.It rained yesterday. では,過去であることが2度示されている.英語史上の話題である二重複数 (double_plural),二重比較級 (double_comparative),二重否定 ([2010-10-28-1], [2012-01-10-1]) なども,余剰性の問題としてみることができる.
 そのほか,類義語を重ねる with might and main, without let or hindrance や,電話などでアルファベットの文字を伝える際の C as in Charley などの表現も余剰的であるし,Yes と言いながら首を縦に振るといった paralinguistic な余剰性もある.
 余剰性と予測可能性 (predictability) は相関関係にあり,また予測可能性は構造の存在を前提とする.したがって,言語に余剰性があるということは,言語に構造があるということである.ここから,余剰性を前提とする情報理論と,構造を前提とする構造言語学とが結びつくことになった.構造言語学の大家 Martinet の主張した言語の経済性の原理でも,余剰性の重要性が指摘されている (183--85) .
 情報理論と言語の余剰性の関係については,Hockett (76--89) を参照.

 ・ Martinet, André. Éléments de linguistique générale. 5th ed. Armand Colin: Paris, 2008.
 ・ Hockett, Charles F. "Review of The Mathematical Theory of Communication by Claude L. Shannon; Warren Weaver." Language 29.1 (1953): 69--93.

[ | 固定リンク | 印刷用ページ ]

#1587. 印欧語史は言語のエントロピー増大傾向を裏付けているか?[drift][unidirectionality][synthesis_to_analysis][entropy][i-mutation][origin_of_language]

2013-08-31

 英語史のみならずゲルマン語史,さらには印欧語史の全体が,言語の単純化傾向を示しているように見える.ほとんどすべての印欧諸語で,性・数・格を始め種々の文法範疇の区分が時間とともに粗くなってきているし,形態・統語においては総合から分析へと言語類型が変化してきている.印欧語族に見られるこの駆流 (drift) については,「#656. "English is the most drifty Indo-European language."」 ([2011-02-12-1]) ほか drift の各記事で話題にしてきた.
 しかし,この駆流を単純化と同一視してもよいのかという疑問は残る.むしろ印欧祖語は,文法範疇こそ細分化されてはいるが,その内部の体系は奇妙なほどに秩序正しかった.印欧祖語は,現在の印欧諸語と比べて,音韻形態的な不規則性は少ない.言語は時間とともに allomorphy を増してゆくという傾向がある.例えば i-mutation の歴史をみると,当初は音韻過程にすぎなかったものが,やがて音韻過程の脈絡を失い,純粋に形態的な過程となった.結果として,音韻変化を受けていない形態と受けた形態との allomorphy が生まれることになり,体系内の不規則性(エントロピー)が増大した([2011-08-13-1]の記事「#838. 言語体系とエントロピー」を参照).さらに後になって,類推作用 (analogy) その他の過程により allomorphy が解消されるケースもあるが,原則として言語は時間とともにこの種のエントロピーが増大してゆくものと考えることができる.
 だが,印欧語の歴史に明らかに見られると上述したエントロピーの増大傾向は,はたして額面通りに認めてしまってよいのだろうか.というのは,その出発点である印欧祖語はあくまで理論的に再建されたものにすぎないからである.もし再建者の頭のなかに言語はエントロピーの増大傾向を示すものだという仮説が先にあったとしたら,結果として再建される印欧祖語は,当然ながらそのような仮説に都合のよい形態音韻論をもった言語となるだろう.
 実際に Comrie のような学者は,そのような仮説をもって印欧祖語をとらえている.Comrie (253) が想定しているのは,"an earlier stage of language, lacking at least many of the complexities of at least many present-day languages, but providing an explicit account of how these complexities could have arisen, by means of historically well-attested processes applied to this less complex earlier state" である.ここには,言語はもともと単純な体系として始まったが時間とともに複雑さを増してきたという前提がある.Comrie のこの前提は,次の箇所でも明確だ.

[I]t is unlikely that the first human language started off with the complexity of Insular Celtic morphophonemics or West Greenlandic morphology. Rather, such complexities arose as the result of the operation of attested processes --- such as the loss of conditioning of allophonic variation to give morphophonemic alternations or the grammaticalisation of lexical items to give grammatical suffixes --- upon an earlier system lacking such complexities, in which invariable words followed each other in order to build up the form corresponding to the desired semantic content, in an isolating language type lacking morphophonemic alternation. (250)


 再建された祖語を根拠にして言語変化の傾向を追究することには慎重でなければならない.ましてや,先に傾向ありきで再建形を作り出し,かつ前提とすることは,さらに危ういことのように思える.Comrie (247) は印欧祖語再建に関して realist の立場([2011-09-06-1]) を明確にしているから,エントロピーが極小である言語の実在を信じているということになる.controversial な議論だろう.

 ・ Comrie, Barnard. "Reconstruction, Typology and Reality." Motives for Language Change. Ed. Raymond Hickey. Cambridge: CUP, 2003. 243--57.

Referrer (Inside): [2013-09-01-1]

[ | 固定リンク | 印刷用ページ ]

#1693. 規則的な音韻変化と不規則的な形態変化[entropy][phonetics][analogy][morphology][i-mutation]

2013-12-15

 残念ながら,どの文献で読んだかは失念したが,「音韻変化は規則的に生じるが形態論に不規則性をもたらし,形態変化は不規則に生じるが形態論に規則性をもたらす」という謂いがある.音韻変化と形態変化(典型的には類推作用)の特徴をうまく言い表したものである.「#838. 言語体系とエントロピー」 ([2011-08-13-1]) の記事では,同じことを「形態論において,規則的な音声変化はエントロピーを増大させ,不規則的な類推作用はエントロピーを減少させる」と換言した(関連して,「#1674. 音韻変化と屈折語尾の水平化についての理論的考察」 ([2013-11-26-1]) も参照).
 具体例を1つ挙げよう.「#157. foot の複数はなぜ feet か」 ([2009-10-01-1]) で取り上げたように,foot (sg.) vs feet (pl.) は現代英語では形態的に不規則ととらえられている.大部分の名詞が屈折形態素 {s} を付加するという規則で複数形を作ることに照らせば,確かに不規則といって然るべきである.しかし,この不規則性の由来を探ると,i-mutation と呼ばれる規則的な音韻変化に行き着く.規則的な過程であれば,その結果も規則的になるはずではないかと疑われるかもしれないが,音韻変化でいう規則性とは多くの場合条件つき規則性であるというのがミソである.foot -- feet の場合には,後続音節に前舌高母音 /i/ が含まれることが条件である.しかも,この /i/ が後に消失してしまうという,さらなる音韻変化が作用した結果,件の複数形は予想不可能な形態をもつに至ってしまった.以上をまとめれば,音韻変化の規則性とはあくまで条件つきの規則性であることが多く,さらにそのような音韻変化が複数重なることにより,実際上は予測不可能な形態に至ってしまうものなのである.これで,上記の謂いの前半部分「音韻変化は規則的に生じるが形態論に不規則性をもたらす」が説明される.
 次に,後半部分「形態変化は不規則に生じるが形態論に規則性をもたらす」に移ろう.foot -- feet と同様に,古英語では「本」を表わす bōc の複数(主格・対格)形は i-mutation の効果で bēc という形態だった.そのまま現代英語に伝わっていれば,*beech などとなっていたはずだが,この語に関しては類推 (analogy) の作用により,大多数の -s 複数形に呑み込まれ,中英語以降に books と「規則化」した.ここでは類推という典型的な形態変化の過程が結果として規則性をもたらしたことになるが,bōc には働き,fōt には働かなかったという意味で,単発的である.どの語に働くのか予測不可能なのであるから,その点では不規則である.
 規則的な音韻変化が形態論に不規則性をもたらし,その不規則性を部分的に修復するかのように,形態変化が不規則に作用する.音韻変化はさながら自然的,機械的,無意識的であり,形態変化はさながら人為的,選択的,意識的である,と対比できようか.このような相反する機構がシーソーのように繰り返し作動し,言語変化を駆動しているのだろう.
 音韻変化と形態変化の特性の対比について,タンバ (56) が似たようなことを述べている.時期と時間的長さという点においても,2つの変化の間に明確な対比があるという指摘は重要だろう.

音素は,規則的な音韻法則によって変化するが,その法則はある時期ある一定のあいだだけに適用されるものである.一方,形態素は不規則に変化し,その変化は時期,時間的長さによって限定されない.


 ・ イレーヌ・タンバ 著,大島 弘子 訳 『[新版]意味論』 白水社〈文庫クセジュ〉,2013年.

[ | 固定リンク | 印刷用ページ ]