hellog〜英語史ブログ     前の日     次の日     最新     2022-02     検索ページへ     ランダム表示    

hellog〜英語史ブログ / 2022-02-16

01 02 03 04 05 06 07 08 09 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28

2022-02-16 Wed

#4678. 言語における塊現象と長相関 [complex_system][computational_linguistics][statistics][frequency][information_structure][article][terminology]

 言語には,他の多くの自然・社会現象にもみられる「塊現象」というものが観察される.田中 (98) の説明を引用する.

その傾向は一言で言えば「塊現象」,つまり単語が固まって現れること,ある単語が一旦現れるとしばらくの間は頻繁に出現する一方で,それを過ぎるとほとんど出現しなくなる傾向があることとして直感的に捉えることができる.塊現象が見られる系列では,短い間隔が続いた後には短い間隔が現れ,また逆に長い間隔が続いた後には長い間隔が現れる可能性が高い.このような言語の塊現象の要因の一つは,当然のことながら文脈の変化にある.
 塊現象は,自然,金融など,さまざまな複雑系においてはよく知られる〔中略〕.たとえば,大雨や地震が固まって現れることは経験を通して誰しも知っているだろう.社会的な対象においても,たとえば,株取引には,ある取引が引き金となって,関連する取引が行われるため,やはり塊現象が生じることが知られる.同様に,単語もある単語が引き金となり,その単語ならびに関連する単語の塊が出現する.


 説明されてみれば,もっともという現象ではある.この塊現象の一般的な研究には歴史があるが,言語に応用した研究は少ないようだ.解析法としては,大きく分けて「長相関」と「ゆらぎ」に着目する2種類があるという.ここでは前者を見ていこう.
 「長相関」による解析は,「ある系列中の,二つの部分列の相関が,その部分列の距離 s に依存してどのように変化するかを調べる解析」である(田中,p. 99).互いに離れた2つの部分列の内部構造が類似していれば長相関があるということになる(cf. 「#4675. 言語と複雑系」 ([2022-02-13-1]) で言及した「長期記憶」).
 英語における最頻語である定冠詞 the について,長い文章で長相関解析を試みると,どうやら弱い長相関があるようだ(田中,p. 105).しかし,あくまで弱い長相関があるにとどまり,細かくみれば the にすらある程度の塊現象がみられることが判明する.驚くことに,the も現われるときは固まって現われ,現われないときにはしばらく現われない,ということがある程度観察されるのである.田中 (109)は,先行研究に従い,この事実を次のように解釈している.

k 個の短い間隔があると,続く k + 1番目の間隔も短く,k 個の長い間隔があると,それに続く k + 1番目の間隔も長い傾向にある.短い間隔が続くことは,対象となる単語が固まって現れることを示している.〔中略〕このような塊現象の背景には文脈の変化がある.the については,まず不定冠詞を中心として一般的な概念を導入し,その後,導入された概念について議論が行われ,その際は the が多用される.


 これは,談話における情報構造 (information_structure) に着目した,the についての塊現象の読み解きといってよいだろう.

 ・ 田中 久美子 『言語とフラクタル --- 使用の集積の中にある偶然と必然』 東京大学出版会,2021年.

Referrer (Inside): [2022-02-17-1]

[ 固定リンク | 印刷用ページ ]

2025 : 01 02 03 04 05 06 07 08 09 10 11 12
2024 : 01 02 03 04 05 06 07 08 09 10 11 12
2023 : 01 02 03 04 05 06 07 08 09 10 11 12
2022 : 01 02 03 04 05 06 07 08 09 10 11 12
2021 : 01 02 03 04 05 06 07 08 09 10 11 12
2020 : 01 02 03 04 05 06 07 08 09 10 11 12
2019 : 01 02 03 04 05 06 07 08 09 10 11 12
2018 : 01 02 03 04 05 06 07 08 09 10 11 12
2017 : 01 02 03 04 05 06 07 08 09 10 11 12
2016 : 01 02 03 04 05 06 07 08 09 10 11 12
2015 : 01 02 03 04 05 06 07 08 09 10 11 12
2014 : 01 02 03 04 05 06 07 08 09 10 11 12
2013 : 01 02 03 04 05 06 07 08 09 10 11 12
2012 : 01 02 03 04 05 06 07 08 09 10 11 12
2011 : 01 02 03 04 05 06 07 08 09 10 11 12
2010 : 01 02 03 04 05 06 07 08 09 10 11 12
2009 : 01 02 03 04 05 06 07 08 09 10 11 12

最終更新時間: 2025-01-19 21:09

Powered by WinChalow1.0rc4 based on chalow