zipfs_law / hellog～英語史ブログ

最終更新時間: 2026-07-15 01:27

2022-02-11 Fri

■ #4673. 言語の統計的必然性と偶然性 [chaos_theory][complex_system][computational_linguistics][statistics][zipfs_law]

　本ブログでは，言語と複雑系，カオス理論，フラクタルの関係について，complex_system や chaos_theory などの記事で紹介してきた．しかし，とても関心はあるものの，私の頭の理解が伴っていかない分野のようで，なかなか深入りできない．文系頭にももう少し理解しやすい形で，上記の分野（一般的には数量言語学）の本などがあればよいのになぁと思っていたところ，昨年，田中久美子（著）『言語とフラクタル --- 使用の集積の中にある偶然と必然』が出版された．読みたいと思いつつ積ん読していたのだが，ようやくページ開く機会を得た．おもしろい．
　なぜ私がこれまで深入りできなかったのか．その辺りの理由も，導入部から教えてくれていて，とても嬉しい（田中，pp. 10--11）．

複雑系科学は自然・社会的な系に適用されてきたが，言語を捉える探求は，その中でも亜流であり，限定的であるといわざるをえない．その主な理由としては，物理学的方法論の対象は広いとはいってもまず自然であり，結果は人の解釈に依存しないものを目指すことがある．一方，言語の研究は，人の解釈を前提とした単語や文を探究してきた．統計力学的な方法論は，意味や解釈をめぐって，言語とは相性がよいとはいえなかったのである．その中で，物理学出身の研究者が言語を探究した報告があちこちに散乱しており，それは言語の諸研究の側からは見えない．本書はそのような既存研究に多くを拠っている．

　とてもよく分かった．例えば Zipf's Law (cf. zipfs_law) という著名な語彙統計学上の法則ですら，突っ込んだ議論を読みたいと思えば，言語学から一歩外に出なければならない．多くの普通の言語学の徒にとって，なかなか手を出せないのである．
　では，なぜ私は，理解するのが難しいと分かっていながらも，言語と複雑系などとの関係に心ひかれるのだろうか．その辺りのモヤモヤしたところも，田中 (11) が解消してくれた．

言語データを解析すると，統計的言語普遍としての性質が普遍的に立ち現れる．この事実から，統計的言語普遍は，言語が生み出す神秘の一つのように捉えられてきた側面がある．しかし，本書でも見るように，その因果関係はおそらく逆であると思われる．言語が統計的普遍を生み出すというよりは，統計的な性質がまずあり，言語はおそらくその性質を前提として成立している．つまり，統計的言語普遍は，言語を実現する前提となっていると思われる．ならばこの統計的必然性は，単語や統語構造などといった言語の諸性質に影響を及ぼしているはずである．そして，統計的必然の中で言語がどのような特殊性を持っているかを理解することは，言語の本質を捉える一つの手立てとなると思われる．

　どこまでが言語の（統計的）必然なのかが分かれば，そこから逸脱したものこそが言語における偶然だと知れるだろう．そして，後者こそ，人間が言語に込めた意図を反映しているものである可能性が高い．田中 (5) は，このことを「Mallarmé の賽」として示している．

かつて，詩人 Stéphane Mallarmé が，詩作において「賽を投じる」ことに言及している〔中略〕．「賽の一投は偶然を決して廃さない」との Mallarmé のことばは，純粋な統計としては自明なだけであるが，言語や詩作についてとなると難しい．言葉が発せられる背景には意図があることが多く，偶然だけに基づくとは考えにくい．Mallarmé は，言葉を使うことも，賽を投じるように偶然性を廃さないことを暗示し，偶然性をふまえた言葉のアートを試行したかにみえる．意図があって発話する場合にも，文や単語を生成する時に偶然が排除できないなら，言語行為には偶然性と必然性が混ざっているだろう．言語の統計的特性を知ることで，言葉が前提とする偶然性について明らかになる．その残滓の中に，意図など人間の要因の本質がかすかに見えはしまいか．

　私自身がなぜ言語の統計学に惹かれているのか，その辺りが読み進めるうちにどんどん分かってきたのが嬉しい．

　・田中久美子　『言語とフラクタル --- 使用の集積の中にある偶然と必然』　東京大学出版会，2021年．

Referrer (Inside): [2022-02-13-1]

	Min.	1st Qu.	Median	Mean	3rd Qu.	Max.
Top_100	1.0	2.0	3.0	3.1	4.0	5.0
Top_200	1.00	3.00	4.00	3.77	4.00	10.00
Top_500	1.000	4.000	4.000	4.498	5.000	10.000
Top_1K	1.000	4.000	5.000	4.968	6.000	15.000
Top_2K	1.000	4.000	5.000	5.406	7.000	15.000
Top_5K	1.000	5.000	6.000	6.014	7.000	16.000
Top_10K	1.000	5.000	6.000	6.488	8.000	16.000
Top_20K	1.000	5.000	7.000	6.954	8.000	17.000
Top_50K	1.000	6.000	7.000	7.622	9.000	20.000

zipfs_law - hellog～英語史ブログ

■ #4673. 言語の統計的必然性と偶然性 [chaos_theory][complex_system][computational_linguistics][statistics][zipfs_law]

■ #4245. 頻度と漸近双曲線 (A-curve) [lexical_diffusion][zipfs_law][frequency][statistics][language_change][uniformitarian_principle]

■ #4129. 「コロナ禍と英語」ならこれしかないでしょ！ --- OED の記事より [oed][neologism][zipfs_law][covid]

■ #3254. 高頻度がもたらす縮小効果と保存効果 [frequency][grammaticalisation][auxiliary_verb][suppletion][zipfs_law]

■ #3174. 高頻度語はスペリングが短い (2) [frequency][spelling][orthography][zipfs_law][statistics][lexicology][corpus]

■ #3173. 高頻度語はスペリングが短い (1) [frequency][spelling][orthography][zipfs_law][statistics][lexicology][corpus][three-letter_rule]

■ #3130. 複雑系言語学 [chaos_theory][complex_system][variety][zipfs_law][language_change][contact][methodology]

■ #2875. 英語語彙の頻度分布の格差をジニ係数とローレンツ曲線でみる [lexicology][statistics][frequency][zipfs_law][corpus]

■ #2363. hapax legomenon [hapax_legomenon][terminology][lexicology][lexicography][word_formation][productivity][bible][zipfs_law][frequency][corpus][shakespeare][chaucer]

■ #2178. 新グライス学派語用論の立場からみる意味の一般化と特殊化 [semantic_change][pragmatics][cooperative_principle][implicature][zipfs_law][information_theory][hyponymy]

■ #2096. SUBTLEX-US Word Frequency List [frequency][statistics][corpus][lexicology][zipfs_law][cgi][web_service]

■ #1970. 多義性と頻度の相関関係 [polysemy][zipfs_law][information_theory][frequency][statistics]

■ #1103. GSL による Zipf's law の検証 [lexicology][statistics][frequency][zipfs_law][corpus]

■ #1102. Zipf's law と語の新陳代謝 [information_theory][frequency][statistics][zipfs_law][shortening][language_change]

■ #1101. Zipf's law [information_theory][frequency][statistics][language_change][zipfs_law][shortening][pragmatics][zipfs_law]

■ #1101. Zipf's law [information_theory][frequency][statistics][language_change][zipfs_law][shortening][pragmatics][zipfs_law]