hellog〜英語史ブログ     ChangeLog 最新    

frequency - hellog〜英語史ブログ

最終更新時間: 2025-06-06 08:58

2025-01-18 Sat

#5745. アルファベットの文字頻度 [corpus][link][alphabet][frequency][statistics][letter_frequency][bnc][morse_code]

 AからZまでのアルファベット文字のなかで,最も頻度の高い文字,低い文字は何か.この文字頻度 (letter_frequency) の話題については,「#308. 現代英語の最頻英単語リスト」 ([2010-03-01-1]) の下部に Letter Frequencies (rankings for various languages) へのリンクを挙げたとおり,様々な言語やコーパスでの順位表が作り出されている.例えば,BNC に依拠すると "etaoinsrhldcumfpgwybvkxjqz" の順位表が得られる.
 Crystal (277) には,The Cambridge Encyclopedia (1st ed.) の全テキスト,150万語をコーパスとした文字頻度表が掲げられている.累積頻度順位 (Cumulative) のみならず,文学,宗教,政治,物理学,化学の各々のテーマごとの頻度や Morse code (morse_code) の頻度も合わせて示されている.以下のグラフは,X軸に沿って累積頻度順 (= "eatinorslhdcmufpgbywvkxjq") に文字を並べ,Y軸を各テーマ内での頻度割合(百分率)としたものである(頻度表はソース HTML を参照).


letter_frequency.png



 累積頻度順に照らしてテーマごとの特徴を見てみるとと,政治が最も標準的である.文学と政治がそれに続く.標準から遠ざかっていくのが,化学,物理学,そして Morse code となる.
 個々の文字をみると興味深い点が多々ある.相対的に宗教では <h> が多く (holy?) <l> が少ないこと,文学では <w> が多いことは何を意味するのだろうか? 物理学や化学はラテン・ギリシア語系の単語が多く含まれているために,その他一般とは若干異なる文字頻度を示しているのかもしれない.人工的な Morse code は,他のテーマとは目に見えて異なる線を描いていることがわかる.

 ・ Crystal, D. The Cambridge Encyclopedia of the English Language. 3rd ed. CUP, 2018.

[ 固定リンク | 印刷用ページ ]

2024-07-14 Sun

#5557. 秋元実治(著)『増補 文法化とイディオム化』(ひつじ書房,2014年) [toc][grammaticalisation][idiomatisation][idiom][composite_predicate][syntax][lexicology][frequency][lexicalisation][preposition][phrasal_verb][voicy][heldio]


秋元 実治 『増補 文法化とイディオム化』 ひつじ書房,2014年.



 先日,秋元実治先生(青山学院大学名誉教授)と標記の書籍を参照しつつ対談しました.そして,その様子を一昨日 Voicy heldio で「#1139. イディオムとイディオム化 --- 秋元実治先生との対談 with 小河舜さん」として配信しました.中身の濃い,本編で22分ほどの対談回なっております.ぜひお時間のあるときにお聴きください.



 秋元実治(著)『増補 文法化とイディオム化』(ひつじ書房,2014年)については,これまでもいくつかの記事で取り上げてきており,とりわけ「#1975. 文法化研究の発展と拡大 (2)」 ([2014-09-23-1]) で第1章の目次を挙げましたが,今回は今後の参照のためにも本書全体の目次を掲げておきます.近日中に対談の続編を配信する予定です.



改訂版はしがき
はしがき

理論編
  第1章  文法化
    1.1  序
    1.2  文法化とそのメカニズム
      1.2.1  語用論的推論 (Pragmatic inferencing)
      1.2.2  漂白化 (Bleaching)
    1.3  一方向性 (Unidirectionality)
      1.3.1  一般化 (Generalization)
      1.3.2  脱範疇化 (Decategorialization)
      1.3.3  重層化 (Layering)
      1.3.4  保持化 (Persistence)
      1.3.5  分岐化 (Divergence)
      1.3.6  特殊化 (Specialization)
      1.3.7  再新化 (Renewal)
    1.4  主観化 (Subjectification)
    1.5  再分析 (Reanalysis)
    1.6  クラインと文法化連鎖 (Grammaticalization chains)
    1.7  文法化とアイコン性 (Iconicity)
    1.8  文法化と外適応 (Exaptation)
    1.9  文法化と「見えざる手」 (Invisible hand) 理論
    1.10  文法化と「偏流」 (Drift) 論
  
  第2章  イディオム化
    2.1  序
    2.2  イディオムとは
    2.3  イディオム化
    2.4  イディオム化の要因
      2.4.1  具体的から抽象的
      2.4.2  脱範疇化 (Decategorialization)
      2.4.3  再分析 (Reanalysis)
      2.4.4  頻度性 (Frequency of occurrence)
    2.5  イディオム化,文法化及び語彙化

分析例
  第1章  初期近代英語における複合動詞の発達
    1.1  序
    1.2  先行研究
    1.3  データ
    1.4    複合動詞のイディオム的特徴
      1.4.1  Give
      1.4.2  Take
    1.5  ジャンル間の比較: The Cely LettersThe Paston Letters
    1.6  結論

  第2章  後期近代英語における複合動詞
    2.1  序
    2.2  先行研究
    2.3  データ
    2.4  構造の特徴
    2.5  関係代名詞化
    2.6  各動詞の特徴
      2.6.1  Do
      2.6.2  Give
      2.6.3  Have
      2.6.4  Make
      2.6.5  Take
    2.7  複合動詞と文法化
    2.8  結論
  
  第3章  Give イディオムの形成
    3.1  序
    3.2  先行研究
    3.3  データ及び give パタンの記述
    3.4  本論
      3.4.1  文法化とイディオム形成
      3.4.2  再分析と意味の漂白化
      3.4.3  イディオム化
      3.4.4  名詞性
      3.4.5  構文と頻度性
    3.4  本論
      3.4.1  文法化とイディオム形成
      3.4.2  再分析と意味の漂白化
      3.4.3  イディオム化
      3.4.4  名詞性
      3.4.5  構文と頻度性
    3.5  結論

  第4章  2つのタイプの受動構文
    4.1  序
    4.2  先行研究
    4.3  データ
    4.4  イディオム化
    4.5  結論

  第5章  再帰動詞と関連構文
    5.1  序
    5.2  先行研究
    5.3  データ
      5.3.1  Content oneself with
      5.3.2  Avail oneself of
      5.3.3  Devote oneself to
      5.3.4  Apply oneself to
      5.3.5  Attach oneself to
      5.3.6  Address oneself to
      5.3.7  Confine oneself to
      5.3.8  Concern oneself with/about/in
      5.3.9  Take (it) upon oneself to V
    5.4  再帰動詞と文法化及びイディオム化
    5.5  再起動し,受動化及び複合動詞
      5.5.1  Prepare
      5.5.2  Interest
    5.6  結論

  第6章  Far from の文法化,イディオム化
    6.1  序
    6.2  先行研究
    6.3  データ
    6.4  文法化とイディオム化
      6.4.1  文法化
      6.4.2  意味変化と統語変化の関係:イディオム化
    6.5  結論

  第7章  複合前置詞
    7.1  序
    7.2  先行研究
    7.3  データ
    7.4  複合前置詞の発達
      7.4.1  Instead of
      7.4.2  On account of
    7.5  競合関係 (Rivalry)
      7.5.1  In comparison of/in comparison with/in comparison to
      7.5.2  By virtue of/in virtue of
      7.5.3  In spite of/in despite of
    7.6  談話機能の発達
    7.7  文法化,語彙化,イディオム化
    7.8  結論

  第8章  動詞派生前置詞
    8.1  序
    8.2  先行研究
    8.3  データ及び分析
      8.3.1  Concerning
      8.3.2  Considering
      8.3.3  Regarding
      8.3.4  Relating to
      8.3.5  Touching
    8.4  動詞派生前置詞と文法化
    8.5  結論
  
  第9章  動詞 pray の文法化
    9.1  序
    9.2  先行研究
    9.3  データ
    9.4  15世紀
    9.5  16世紀
    9.6  17世紀
    9.7  18世紀
    9.8  19世紀
    9.9  文法化
      9.9.1  挿入詞と文法化
      9.9.2  丁寧標識と文法化
    9.10  結論

  第10章  'I'm afraid' の挿入詞的発達
    10.1  序
    10.2  先行研究
    10.3  データ及びその文法
    10.4  文法化---Hopper (1991) を中心に
    10.5  結論

  第11章  'I dare say' の挿入詞的発達
    11.1  序
    11.2  先行研究
    11.3  データの分析
    11.4  文法化と文体
    11.5  結論

  第12章  句動詞における after と forth の衰退
    12.1  序
    12.2  For による after の交替
      12.2.1  先行研究
      12.2.2  動詞句の選択と頻度
      12.2.3  After と for の意味・機能の変化
    12.3  Forth の衰退
      12.3.1  先行研究
      12.3.2  Forth と共起する動詞の種類
      12.3.3  Out による forth の交替
    12.4  結論

  第13章  Wanting タイプの動詞間に見られる競合 --- desire, hope, want 及び wish を中心に ---
    13.1  序
    13.2  先行研究
    13.3  昨日変化
      13.3.1  Desire
      13.3.2  Hope
      13.3.3  Want
      13.3.4  Wish
    13.4  4つの動詞の統語的・意味的特徴
      13.4.1  従属節内における法及び時制
        13.4.1.1  Desire + that/Ø
        13.4.1.2  Hope + that/Ø
        13.4.1.3  Wish + that/Ø
      13.4.2  Desire, hope, want 及び wish と to 不定詞構造
      13.4.3  That の省略
    13.5  新しいシステムに至る変化及び再配置
    13.6  結論

結論

補章

参考文献

索引
  人名索引
  事項索引




 ・ 秋元 実治 『増補 文法化とイディオム化』 ひつじ書房,2014年.

[ 固定リンク | 印刷用ページ ]

2024-01-18 Thu

#5379. blend は形態理論や韻律理論にとっても有意義な現象である [blend][morphology][frequency][word_formation][prosody][analogy]

 近年,英語語彙に blend (混成語)が激増している事実については,すでに hellog でも繰り返し取り上げてきた.

 ・ 「#631. blending の拡大」 ([2011-01-18-1])
 ・ 「#876. 現代英語におけるかばん語の生産性は本当に高いか?」 ([2011-09-20-1])
 ・ 「#4369. Brexit --- 現代の病理と遊びの語形成」 ([2021-04-13-1])

 一見すると blend は人目を引く言葉遊びにすぎず,形態論上あくまで周辺的な現象にとどまると思われるかもしれない.しかし,近年の英語語形成におけるその生産性の高さは,従来の見方を変えつつある.例えば,Fertig (70) は,混成という語形成が理論的な意義をもつことを次のように力説している.

   Blends are often treated as a marginal phenomenon (Haspelmath and Sims 2010:40). Aronoff discusses them under the heading 'oddities' and considers them 'words which have no recognizable internal structure or constituents'; they are 'opaque, and hence uncommon' (1976: 20). Recent developments suggest that Aronoff may have had the relationship between opacity and frequency backwards here. Blends may have been rather opaque in 1976 precisely because they were still relatively uncommon. Today, at least in English, blends (of certain types) can hardly be called uncommon, and we generally seem to have little trouble parsing and processing them. As we will see in §7.3.8, this issue of the relationship between the frequency of a morphological pattern and its transparency/opacity has implications for some fundamental theoretical issues of great relevance to morphological change.
   To the extent that some types of blending have become productive and predictable morphological operations in present-day English, it is no longer accurate to classify them as non-proportional. They amount to a kind of compounding with the two elements overlapping in accordance with well defined constraints. Within Paul's proportional theory, they could thus be handled by an extension of the (syntagmatic) proportional equations that he proposes for syntax (see §6.2 below). Blending as a type of word formation would fit even more easily into certain other theories of morphology. Insights and analytical tools from Prosodic Morphology (McCarthy and Prince 1995) have made it clear that (most) blends absolutely do have 'recognizable internal structure'. They are a type of non-concatenative morphology. Instead of combining two words into a linear string as in compounding, blends superimpose one word onto the prosodic structure of another (Piñeros 1998, 2004).


 従来,混成語は形態論的には内部構造が不透明とみなされてきた.しかし,それは混成による語形成の生産性がまだ低かったために十分に解明されておらず,「不透明」とのレッテルを貼られてきただけなのではないか.混成語が横溢している現在,使用者もすっかり慣れ,むしろ透明性が高くなってきたといえるのではないか.そして,遅ればせながら,形態理論や音韻理論による解明のメスが入り始めたのではないか,とそのような議論である.
 韻律形態論 (Prosodic Morphology) という分野が提唱されているようであり,さらに「#3722. 混成語は右側主要部の音節数と一致する」 ([2019-07-06-1]) でみた通り,混成語に特徴的な韻律上の制限も確かにあるようだ.今後の混成語言語学の展開に期待したい.

 ・ Fertig, David. Analogy and Morphological Change. Edinburgh: Edinburgh UP, 2013.

Referrer (Inside): [2025-01-01-1]

[ 固定リンク | 印刷用ページ ]

2023-11-12 Sun

#5312. 「ゆる言語学ラジオ」最新回は「不規則動詞はなぜ存在するのか?」 [yurugengogakuradio][verb][inflection][conjugation][sobokunagimon][frequency][voicy][heldio][youtube][link][notice][numeral][suppletion][analogy]

 昨日,人気 YouTube/Podcast チャンネル「ゆる言語学ラジオ」の最新回が配信されました.今回は英語史ともおおいに関係する「不規則動詞はなぜ存在するのか?【カタルシス英文法_不規則動詞】#280」です.



 ゆる言語学ラジオの水野太貴さんには,拙著,Voicy 「英語の語源が身につくラジオ」 (heldio),および YouTube チャンネル「井上逸兵・堀田隆一英語学言語学チャンネル」のいくつかの関連コンテンツに言及していただきました.抜群の発信力をもつゆる言語学ラジオさんに,この英語史上の第一級の話題を取り上げていただき,とても嬉しいです.このトピックの魅力が広く伝わりますように.
 概要欄に掲載していただいたコンテンツ等へのリンクを,こちらにも再掲しておきます.

 ・ 拙著 『英語の「なぜ?」に答えるはじめての英語史』(研究社,2016年)
 ・ 拙著 『英語史で解きほぐす英語の誤解 --- 納得して英語を学ぶために』(中央大学出版部,2011年)
 ・ heldio 「#58. なぜ高頻度語には不規則なことが多いのですか?」
 ・ YouTube 「新説! go の過去形が went な理由」 (cf. 「#4774. go/went は社会言語学的リトマス試験紙である」 ([2022-05-23-1]))
 ・ YouTube 「英語の不規則活用動詞のひきこもごも --- ヴァイキングも登場!」 (cf. hellog 「#4810. sing の過去形は sang でもあり sung でもある!」 ([2022-06-28-1]))
 ・ YouTube 「昔の英語は不規則動詞だらけ!」 (cf. 「#4807. -ed により過去形を作る規則動詞の出現は革命的だった!」 ([2022-06-25-1]))
 ・ heldio 「#9. first の -st は最上級だった!」
 ・ heldio 「#10. third は three + th の変形なので準規則的」
 ・ heldio 「#11. なぜか second 「2番目の」は借用語!」

 「不規則動詞はなぜ存在するのか?」という英語に関する素朴な疑問から説き起こし,補充法 (suppletion) の話題(「ヴィヴァ・サンバ!」)を導入した後に,不規則形の社会言語学的意義を経由しつつ,全体として言語における「規則」あるいは「不規則」とは何なのかという大きな議論を提示していただきました.水野さん,堀元さん,ありがとうございました! 「#5130. 「ゆる言語学ラジオ」周りの話題とリンク集」 ([2023-05-14-1]) もぜひご参照ください.

[ 固定リンク | 印刷用ページ ]

2022-05-01 Sun

#4752. which vs that --- 関係代名詞の選択の陰にひそむ使用域 [relative_pronoun][frequency][corpus][youtube][syntax][genre][ame_bre]

 4月27日(水)に公開された YouTube 番組「井上逸兵・堀田隆一英語学言語学チャンネル」では「受験生のみなさーん!関係代名詞の文法問題を間違えた時の対処法ですよー【井上逸兵・堀田隆一英語学言語学チャンネル # 18 】」と題して関係代名詞の話題を取り上げました.なかなか多く視聴されているようで,ありがたい限りですが,実際に2人でおもしろいことをしゃべっています(笑).ぜひご覧ください.



 標準英語で関係代名詞といえば which, who, whom, that, そしてゼロ(いわゆる関係代名詞の省略)辺りが挙げられますが,このいずれが用いられるかという選択には,複数のパラメータが複雑に関わってきます.関係代名詞節の内部での役割が主格なのか目的格なのかということはもちろん,制限/非制限用法の違い,先行詞が有性か無性かなどの統語意味論的パラメータが複雑に関与してきます.さらに,あまり注目されませんが,実は使用域 (register) という語用論的パラメータこそが,関係代名詞の選択にとても重要や役割を果たしているのです.
 Longman Grammar of Spoken and Written English (608--21) には,コーパスを用いた関係代名詞選択に関する調査結果が詳細に示されています.今回はそちらを参照しながら,全体として最も使用頻度の高いとされる whichthat に焦点を当て,両者の分布を比べてみましょう.
 whichthat は多くの場合入れ替え可能ですが,学校文法で教わるとおり,原則として which は先行詞が無性の場合に限られ,また制限用法のみならず非制限用法としても使えるという特徴がみられます.一方,that は先行詞を選びませんが,制限用法に限定されます.
 しかし,whichthat の分布の違いについておもしろいのは,そのような統語意味論的な要因と同じくらい使用域という要因も効いているということです.which は保守的で学術的な含みがあり,学術散文での非制限用法に限定すれば,70%を占め,that を圧倒しています.一方,that は口語的でくだけた含みがあり,例えばフィクションでの非制限用法に限定すると,75%を占めます.
 また,アメリカ英語かイギリス英語かという違いも,which vs that に絡んできます.ニュースでの非制限用法に注目すると,アメリカ英語のほうが明らかに that を好み,イギリス英語では which を好みます.会話で比べると,ますますアメリカ英語では that が好まれ,イギリス英語の2倍の頻度で用いられます.
 全体として,LGSWE (616) は which vs that 対決について次のように総括しています.

The AmE preference for that over which reflects a willingness to use a form with colloquial associations more widely in written contexts than BrE.


 関係代名詞の選択の陰には使用域というファクターがひそんでいたのです.
 ちなみに,今晩18:00に公開される YouTube #19 は関係代名詞の話題の続編となります.お楽しみに!

 ・ Biber, Douglas, Stig Johansson, Geoffrey Leech, Susan Conrad, and Edward Finegan, eds. Longman Grammar of Spoken and Written English. Harlow: Pearson Education, 1999.

[ 固定リンク | 印刷用ページ ]

2022-02-17 Thu

#4679. 言語における塊現象とゆらぎ [complex_system][computational_linguistics][statistics][frequency][1/f][terminology][keyword]

 昨日の記事「#4678. 言語における塊現象と長相関」 ([2022-02-16-1]) で,言語における塊現象を「長相関」の観点からみたが,今回はもう1つの観点である「ゆらぎ」に注目しよう.ゆらぎ解析について,田中 (112) は次のように説明している.

このような塊現象を捉える自然な方法の一つとして,ある一定の範囲内に出現する単語の頻度の分散を調べることが挙げられる.ある単語の出現にゆらぎがあるのであれば,ある一定の範囲内にその単語が出現しない場合があり,また一方でその単語が数多く出現する場合もあり,その頻度の分散は大きくなるはずである.


 解析原理としては分かりやすい.ある文章中に表われる語彙を念頭におく場合,ゆらぎ方は語によって異なるが,おもしろいことに,いわゆるキーワードはしばしばゆらぎが大きいという(田中,p. 118).これは,機械的なキーワードの同定などに貢献しそうな興味深い傾向である.
 また,人間言語による文章とランダム文字列の文章とでゆらぎを比べると,明らかに前者の方がゆらぎが大きく,このことは人間言語の特徴の一端を示唆する.さらに,文章のジャンルによってもゆらぎは異なるために(田中,p. 120),ゆらぎの度合いは文体論的な指標ともなり得る.
 様々な可能性を秘めた言語における「ゆらぎ」にアンテナを張っておきたい.関連して「1/f ゆらぎ」 (1/f) も要注目.

 ・ 田中 久美子 『言語とフラクタル --- 使用の集積の中にある偶然と必然』 東京大学出版会,2021年.

[ 固定リンク | 印刷用ページ ]

2022-02-16 Wed

#4678. 言語における塊現象と長相関 [complex_system][computational_linguistics][statistics][frequency][information_structure][article][terminology]

 言語には,他の多くの自然・社会現象にもみられる「塊現象」というものが観察される.田中 (98) の説明を引用する.

その傾向は一言で言えば「塊現象」,つまり単語が固まって現れること,ある単語が一旦現れるとしばらくの間は頻繁に出現する一方で,それを過ぎるとほとんど出現しなくなる傾向があることとして直感的に捉えることができる.塊現象が見られる系列では,短い間隔が続いた後には短い間隔が現れ,また逆に長い間隔が続いた後には長い間隔が現れる可能性が高い.このような言語の塊現象の要因の一つは,当然のことながら文脈の変化にある.
 塊現象は,自然,金融など,さまざまな複雑系においてはよく知られる〔中略〕.たとえば,大雨や地震が固まって現れることは経験を通して誰しも知っているだろう.社会的な対象においても,たとえば,株取引には,ある取引が引き金となって,関連する取引が行われるため,やはり塊現象が生じることが知られる.同様に,単語もある単語が引き金となり,その単語ならびに関連する単語の塊が出現する.


 説明されてみれば,もっともという現象ではある.この塊現象の一般的な研究には歴史があるが,言語に応用した研究は少ないようだ.解析法としては,大きく分けて「長相関」と「ゆらぎ」に着目する2種類があるという.ここでは前者を見ていこう.
 「長相関」による解析は,「ある系列中の,二つの部分列の相関が,その部分列の距離 s に依存してどのように変化するかを調べる解析」である(田中,p. 99).互いに離れた2つの部分列の内部構造が類似していれば長相関があるということになる(cf. 「#4675. 言語と複雑系」 ([2022-02-13-1]) で言及した「長期記憶」).
 英語における最頻語である定冠詞 the について,長い文章で長相関解析を試みると,どうやら弱い長相関があるようだ(田中,p. 105).しかし,あくまで弱い長相関があるにとどまり,細かくみれば the にすらある程度の塊現象がみられることが判明する.驚くことに,the も現われるときは固まって現われ,現われないときにはしばらく現われない,ということがある程度観察されるのである.田中 (109)は,先行研究に従い,この事実を次のように解釈している.

k 個の短い間隔があると,続く k + 1番目の間隔も短く,k 個の長い間隔があると,それに続く k + 1番目の間隔も長い傾向にある.短い間隔が続くことは,対象となる単語が固まって現れることを示している.〔中略〕このような塊現象の背景には文脈の変化がある.the については,まず不定冠詞を中心として一般的な概念を導入し,その後,導入された概念について議論が行われ,その際は the が多用される.


 これは,談話における情報構造 (information_structure) に着目した,the についての塊現象の読み解きといってよいだろう.

 ・ 田中 久美子 『言語とフラクタル --- 使用の集積の中にある偶然と必然』 東京大学出版会,2021年.

Referrer (Inside): [2022-02-17-1]

[ 固定リンク | 印刷用ページ ]

2021-08-01 Sun

#4479. 不規則動詞の過去形は直接記憶保存されている [frequency][suppletion][verb][inflection][be][preterite]

 形態的不規則性を示す語は高頻度語に集中している.その典型が不規則動詞である.規則的に -ed を付して過去形を作る圧倒的多数の動詞に対して,不規則動詞は数少ないが,たいてい相対的に頻度の高い動詞である.不規則中の不規則といえる gobe の過去形 went, was/were などは,補充法 (suppletion) によるものであり,暗記していないかぎり太刀打ちできない.これは,いずれも超高頻度語であることが関係している.この辺りの事情は以下の記事でも取り上げてきた.

 ・ 「なぜ高頻度語には不規則なことが多いのですか?」 (去る7月29日付の「英語の語源が身につくラジオ」にて音声解説)
 ・ 「#3859. なぜ言語には不規則な現象があるのですか?」 ([2019-11-20-1])
 ・ 「#43. なぜ go の過去形が went になるか」 ([2009-06-10-1])
 ・ 「#1482. なぜ go の過去形が went になるか (2)」 ([2013-05-18-1])
 ・ 「#3284. be 動詞の特殊性」 ([2018-04-24-1])

 では,なぜ頻度の高い動詞には不規則活用を示すものが多いのだろうか.記憶 (memory) や形態の心的表象 (mental representation) に訴える説明が一般的である.Smith (1535) の解説を引用する.

The relationship between high frequency and irregularity has to do with memory in so far as those verbs that are used frequently have strong mental representations such that the irregular past forms are stored autonomously and thus accessed independently of the present stem. Such items are said to have become "entrenched" in storage . . . . On the other hand, a low frequency form does not necessarily have its past form stored autonomously and does not allow for direct access to that past form. Thus, its use in the past involves access to the present stem and rule application . . . .


 頻度の高い動詞の過去形は,頻繁に使用するために,記憶のなかで直接アクセスできる引き出しにしまっておくのが便利である.go という現在形を足がかりにして went にたどり着くようでは,遅くて役に立たない.go を経由せずに,直接 went の引き出しにたどり着きたい.一方,頻度の低い動詞であれば,現在形を足がかりにして,それに -ed を付すという規則適用の計算も,たまのことにすぎないので耐えられる.つまり,引き出す頻度に応じて直接アクセスと間接アクセスの2種類に分けておくのが効率的である.
 では,-ed を付して過去形を作る規則動詞は常に計算を伴う間接アクセスなのかというと,必ずしもそうではないようだ.Smith (1535) で紹介されているある研究によると,同音語である kneadedneeded を被験者に発音してもらったところ,相対的に頻度の低い前者の -ed 語尾のほうが,頻度の高い後者の語尾よりも,平均して数ミリ秒長く発音されたという.これは,needed のほうがアクセスが容易であること,おそらくより直接に記憶保存されていることを示唆する.

 ・ Smith, K. Aaron. "New Perspectives, Theories and Methods: Frequency and Language Change." Chapter 97 of English Historical Linguistics: An International Handbook. 2 vols. Ed. Alexander Bergs and Laurel J. Brinton. Berlin: Mouton de Gruyter, 2012. 1531--46.

Referrer (Inside): [2022-12-02-1]

[ 固定リンク | 印刷用ページ ]

2021-07-31 Sat

#4478. 頻度でみる be 完了の衰退の歴史 [perfect][be][verb][aspect][tense][auxiliary_verb][frequency]

 英語史では,早くも古英語期より,完了を表わすのに have 完了と be 完了の2種類が行なわれてきた.ただし,be 完了は自動詞,およそ移動動詞に限定され,have 完了に比べればもとより目立たない存在ではあった.近代英語期にかけて have 完了がますます勢いを増すにおよび,移動動詞も have 完了へと乗り換えていった.
 上記は,be 完了の衰退の歴史の教科書的な概観である.関連する記事として「#1653. be 完了の歴史」 ([2013-11-05-1]),「#1814. 18--19世紀の be 完了の衰退を CLMET で確認」 ([2014-04-15-1]),「#3031. have 完了か be 完了か --- Auxiliary Selection Hierarchy」 ([2017-08-14-1]) も参照されたい.
 最近 be 完了と have 完了の比率の通時的推移を明らかにした Smith (2012: 1537) の調査をみつけたので,紹介しておこう.時代ごとに type 頻度と token 頻度の比率(および括弧内に頻度)が示されている(基となっているのは Smith の別の2001年の "Role" 論文).

TypeToken
BehaveBehave
OE16% (11)84% (57)21% (18)79% (85)
EME11% (12)89% (92)24% (69)76% (214)
LME11% (9)89% (70)11% (12)89% (96)
EModE8% (10)92% (115)4% (13)96% (319)
19th C3% (8)97% (311)4% (38)96% (839)


 have 完了をとる動詞の種類も生起頻度も,もとより圧倒的多数派だったことが分かるが,時代が下るにつれて徐々に増えてきたこともよく分かる.あくまで徐々に増えてきたという点が重要である.逆からみれば,もともと be 完了をとっていた少数の動詞が,have 完了化にそれだけ頑強に抵抗していたということになるからだ.
 現代までに be 完了は be gone のような定型句として用いられるにとどまり,事実上ほぼ完全に衰退してしまったといってよい.ちなみに,He is gone.He has gone. の違いについてだが,前者の be 完了では,行ってしまった現在の結果,すなわち「今はもういない」という側面に焦点が当てられるとされる.一方,後者の have 完了は,時間的に先行する行くという動作そのもの,およびその現在への関与という側面に焦点が当てられられ,およそ「行ったことがある」に近い意味となる.完了相のもともとの意味は「結果」であり,その点では形式的に古い be gone が意味的に古い「結果」を担っており,形式的に新しい have gone が意味的に新しい「先行性」を担っているという平行性はおもしろい (Smith, "New" 1537--38) .関連して「#3631. なぜ「?に行ったことがある」は have gone to . . . ではなく have been to . . . なのか?」 ([2019-04-06-1]) も参照.

 ・ Smith, K. Aaron. "New Perspectives, Theories and Methods: Frequency and Language Change." Chapter 97 of English Historical Linguistics: An International Handbook. 2 vols. Ed. Alexander Bergs and Laurel J. Brinton. Berlin: Mouton de Gruyter, 2012. 1531--46.
 ・ Smith, K. Aaron. "The Role of Frequency in the Specialization of the English Anterior." Frequency and the Emergence of Linguistic Structure. Ed. by Joan Bybee and Paul Hopper. Amsterdam/Philadelphia: Benjamins, 2001. 361--82.

[ 固定リンク | 印刷用ページ ]

2021-01-07 Thu

#4273. the --- 英語で最も重要な語 [article][frequency][hellog_entry_set][definiteness]

 英語で最も頻度の高い語は,定冠詞 the である.「#308. 現代英語の最頻英単語リスト」 ([2010-03-01-1]) のどの頻度表をみても,圧倒的な1位である.ところが,これほど重要な語でありながら「語彙的な意味」はない.あるのは「文法的な機能」のみである.the は,一般には特定のものや既知のものを指示する役割を担っているとされ,文法的であると同時に談話的・語用的な語でもある.
 一般に定冠詞に対置されるのは不定冠詞 a(n) や無冠詞の用法だが,これらの間の使い分けが難しいことはつとに知られている.規則でくくることができず,常に例外が存在する.また,同じ英語でも変種間で使い分けが異なる.「ギターを弾く」は play the guitar なのか play guitar なのか.「入院して」は in hospital なのか in the hospital なのか.
 変種間(そして話者個人間)で異なるのは,使い方にとどまらない.発音も [ðə], [ði], [ðiː] などと変異する.このような語がダントツの超高頻度語であるというのも,考えてみればたいへん困った話しである.
 歴史についてはどうか.古英語や,その祖先であるゲルマン祖語,そして究極の先祖に当たる印欧祖語でも,冠詞に相当するものはなかった.英語の歴史をみても,(定・不定)冠詞という語類は,古英語期には存在せず,中英語期以降に発達してきた新参者である.古英語には thisthat に相当する指示詞は存在しており,後に後者から派生する形で冠詞が生まれてきたという経緯がある.それが,近代英語以降には,なくてはならない中核的な語類へと登り詰めてきたわけだから,不思議な話だ.
 the について注目した30分弱のラジオ番組を紹介しよう.BBC Radio 4's Word of Mouth: The Most Powerful Word である.英語史の専門家たちが,the の不思議と魅力を余すところなく語っている.番組の内容をまとめた記事も一読をお勧めしたい.英語史の観点からは,とりわけ後半の "Origins" の節が有用.
 なお,本ブログでも the について様々に扱ってきた.是非##3831,154,156,2144,2855,2856,906,907,2236,4132の記事セットをどうぞ.

[ 固定リンク | 印刷用ページ ]

2020-12-10 Thu

#4245. 頻度と漸近双曲線 (A-curve) [lexical_diffusion][zipfs_law][frequency][statistics][language_change][uniformitarian_principle]

 variationist の立場を高度に押し進めた言語(変化)観を提案する,Kretzschmar and Tamasi の論考を読んだ."A-curve", "asymptotic hyperbolic distribution", "power law", "S-curve" などの用語が連発し思わず身構えてしまう論文だが,言わんとしていることは Zipf's Law (cf. zipfs_law) の発展版のように思われる.低頻度の言語項は多く,高頻度の言語項は少ないということだ.
 ある英語コーパスにおいて,1度しか現われない語は相当数ある.一方,the, of, have などは超高頻度で現われるが,主として機能語であり種類数でいえば相当に限定される.例えば,1回しか現われない語 ( x = 1 ) は1000個 ( y = 1000 ) あるが,1000回も現われる語 ( x = 1000 ) は the の1語しかない ( y = 1 ) とすると,これを座標上にプロットしてみれば第1象限の左上と右下に点が打たれることになる.この2点を両端として,その間の点を次々と埋めていくと,y = 1/x で表わせるような漸近双曲線 (asymptotic hyperbolic curve) の片割れに近づくだろう.これを Kretzschmar and Tamasi は "A-curve" と呼んでおり,背後にある法則を "power law" (べき乗則)と呼んでいる.後者は "few realizations that occur very frequently and many realizations that occur infrequently" (384) ということである.
 Kretzschmar and Tamasi は,アメリカ方言における訛語や調音の variants を調査し,各種の変異形について頻度の分布を取った.結果として,いずれのケースについても "A-curve" が観察されることを示した.
 また,Kretzschmar and Tamasi は,語彙拡散 (lexical_diffusion) との関連でしばしば言及される "S-curve" と,彼らの "A-curve" との関係についても議論している.同一の言語変化を異なる軸に着目してプロットすると "S-curve" にも "A-curve" にもなり,両者は矛盾しないどころか,親和性が高いという.
 私の拙い言葉使いでは上手く解説することができないのだが,言語体系や言語変化を徹底的に variationist に眺めようとすると,このような言語観あるいは言語理論になるのかと感心した.Kretzschmar and Tamasi (394) より,とりわけ重要と思われる箇所を引用する.

Our second observation, about the distribution of variants according to Zipf's Law, has the strongest set of implications for historical study of language. If we take the A-curve as the model for the frequency distribution of variants for any linguistic feature of interest to us at any moment in time, then we should expect that any particular variant of interest to us will have a particular rank along the A-curve. Therefore, one of the things that we should try to do for any given moment in time is to determine the place of our variant of interest on the curve; we need to know whether it is the most frequent variant in the set of possible realizations (at the top of the curve), or an infrequent variant (in the tail of the curve). Then, for any subsequent moment in time, we can again try to determine the location of our variant of interest along the curve, and so try to make a statement about whether the location of the variant has changed in the intervening time (see Figure 14). Since we hypothesize that an A-curve will exist for every feature at any moment in time (i.e., that language will not suddenly become invariant), we can define the notion "linguistic change" itself as the change in the location of the target variant at different heights along the curve. If a particular variant occurs at a higher place on the curve than it did before, it has become more frequent and so we can say that the direction of change for that variant is positive; if a variant occurs at a lower place on the curve than it did before, it has become less frequent and the direction of change is negative.


A-curves at different moments in time (Kretzschmar and Tamasi 395)

 ・ Kretzschmar, Jr.,William A and Susan Tamasi. "Distributional Foundations for a Theory of Language Change." World Englishes 22 (2003): 377--401.

[ 固定リンク | 印刷用ページ ]

2019-12-22 Sun

#3891. 現代英語の様々な句読記号の使用頻度 [punctuation][alphabet][diacritical_mark][net_speak][brown][corpus][frequency][statistics][exclamation_mark]

 英語は同じローマン・アルファベットを用いる文字圏のなかでも,句読法 (punctuation) に関しては比較的単純な部類に入る.現代的な句読記号が出そろったのは500年前くらいであり,その数も多くない (cf. 「#575. 現代的な punctuation の歴史は500年ほど」 ([2010-11-23-1])) .また,文字そのものが26文字しかない上に,フランス語やドイツ語などにみられる,文字の周辺に付す特殊な発音区別符(号) (diacritical mark; cf. 「#870. diacritical mark」 ([2011-09-14-1])) も原則として用いられない.さらに,現代の印刷文化では句読記号が控えめに使われるようになってきているとも言われる.一方,net_speak などでは,新たな句読記号の使用法が生み出されていることも確かであり,句読法の発展が止まってしまったわけではないようだ (cf. 「#808. smileys or emoticons」 ([2011-07-14-1])) .
 さて,約100万語のアメリカ英語の書き言葉コーパス Brown Corpus を用いた調査によると,英語の主要な句読記号の使用頻度 (%) は次の通りだという (Cook 92) .

Commas47
Full stops45
Dashes2
Parentheses2
Semi-colons2
Question marks1
Colons1
Exclamation marks1


 用いられている句読記号の9割以上が <,> か <.> であるというのは,英語の読み手・書き手の直感としてうなづける.英語の読み書き学習の観点からいえば,まずはこの2つの句読記号に習熟することに努めればよいことになる.
 ローマン・アルファベット文字圏の句読記号の変異について関心のある方は,Character design standards - Punctuation for Latin 1 などを参照されたい.

 ・ Cook, Vivian. The English Writing System. London: Hodder Education, 2004.

Referrer (Inside): [2023-08-26-1] [2022-12-21-1]

[ 固定リンク | 印刷用ページ ]

2019-12-15 Sun

#3884. 文字解読の「2経路」の対比 [spelling][grammatology][alphabet][reading][writing][psycholinguistics][kanji][frequency]

 「#3881. 文字読解の「2経路モデル」」 ([2019-12-12-1]) の記事でみたように,文字解読には「音韻ルート」 (phonological route) と「語ルート」 (lexical route) の2経路があると想定されている.典型的には各々アルファベットと漢字(訓読み)に結びつけるのが分かりやすいが,アルファベットで綴られた単語が語ルートで読解されることもあれば,形声文字の漢字が音韻ルートで読解されることもあり得るので,そう単純ではない.Cook (25) は,2つのルートを以下のように対比している.

 Phonological routeLexical route
Converts written unitsTo phonemesTo meanings
Also known asAssembled phonologyAddressed phonology
NeedsMental rulesMental lexicon of items
Works byCorrespondence rulesMatching
Can handleAny novel combinationOnly familiar symbols
Used withAny wordsHigh frequency words


 最後の2行の指摘が興味深い.語ルートは,すでに知っている語,とりわけ頻度の高い語と相性がよいという点だ.逆にいえば,未知の語や低頻度の語とは相性が悪いということだ.確かに漢字は先に学んでいない限り読むことはできないし,低頻度の漢字はなかなか定着しないので読み書きも忘れがちである.一方,アルファベットで書かれた語は,たとえ未知で意味不明であっても,およそ読むことはできる.また,アルファベットで書かれているとはいえ,thevery などの高頻度語は,おそらく語ルートで読解されているだろう.
 算術に喩えれば,音韻ルートは筆算して答えを得ることに,語ルートは暗記しているかけ算九九で直接解答にアクセスすることに相当するといったらよいだろうか.

 ・ Cook, Vivian. The English Writing System. London: Hodder Education, 2004.

Referrer (Inside): [2020-01-26-1] [2019-12-18-1]

[ 固定リンク | 印刷用ページ ]

2019-11-20 Wed

#3859. なぜ言語には不規則な現象があるのですか? [sobokunagimon][frequency][suppletion]

 英語史や英語学の講義でリアクション・ペーパーを書いてもらうと「なぜ英語には○○のような不規則な現象が多いのですか」という疑問が多く寄せられます.確かに英語学習においては,不規則な動詞活用,不規則な名詞の複数形,不規則なスペリングなどが立て続けに現われ,そのたびに暗記を強いられます.すべてが規則的であればいいのにと思うのも無理からぬことです.英語を第2言語として学ぶ際にそのような不満を感じることは,まったくもって普通の感覚でしょう.
 しかし,すでに第1言語として苦労なく習得してしまっている日本語を考えても,やはり不規則性に満ちています.日本語母語話者は,五段活用,上一段活用,下一段活用,ラ行変格活用,サ行変格活用を何の苦労もなく使いこなしていますが,外国語として日本語を学んでいる学習者にとっては,なぜすべての動詞が五段活用であってくれないのかと不満かもしれません.ラ変やサ変は「変格」すなわち「不規則」なわけですから,学習者にとっては迷惑でしょう.英語学習者にとっての thing -- thought -- thoughtgo -- went -- gone と大差ありません.
 言語には不規則は付きものです.不規則性は古今東西の諸言語に普遍的な現象なのです.さらに外国語学習者にとって気の滅入る事実を明言すれば,基本的,日常的,高頻度の項目であればあるほど不規則性が高いのです.つまり,あらゆる外国語学習において初級レベルほど暗記すべき不規則性が多く,中級・上級レベルに近づいてくると規則性が現われてきます.絶望的ともいえる事実ですが,これが言語というものです.
 問題は,なぜ不規則性があるかということです.ある程度の不規則性が古今東西の諸言語を通じて普遍的であるとすれば,言語においては,すべてが規則的だとむしろ都合の悪いことがあるのだと想定せざるをえません.ある程度の不規則性があったほうが,便利な何かがあるということです.では,それは何なのでしょうか.
 この問題について考えを巡らせながら「作業机と文房具」の比喩に思い至りました.今,この文章を書いている自宅の机付近には様々な文房具があります.すぐに手を伸ばしたところにある机上のペン立ての中には,各種のペンのほか,はさみ,カッター,定規,ホッチキスの芯外しがあります.同じく手近なところには,ポストイットとメモパッドがあります.一方,目の前には様々な文房具を収納できる引き出し棚があり,そこには糊,セロテープ,消しゴム,クリップ類,ホッチキス,画鋲などが入っています.机に備え付けの引き出しは,どうも使いにくいためにあまり利用していませんが,開けてみると万年筆用のインク,大型ホッチキス,穴あけパンチ,長い定規などが入っています.
 振り返ってみると,最初から上のような配置で文房具を整理したわけではありませんでした.長い時間をかけて,私にとって事務作業上都合のよい配置になってきたものと思われます.はさみやホッチキスの芯外しは,私にとって使用頻度が高いので手近にあったほうが便利だということで,常に至近のペン立てに定住するに至ったのでしょう.一方,穴あけパンチはほとんど使わないので,机に付属の引き出しの最も奥に眠っているのでしょう.使用頻度の高い文房具は,とにかくすぐに手に届く場所にないと役に立ちません.一方,ほとんど使用しない文房具は,むしろ引き出しの奥深くであってもきちんと整理・収納されているほうが精神衛生上気持ちよいですし,たまに使うくらいであればむしろ便利なのです.
 使用頻度の低い文房具であれば「あそこの引き出し」の「奥の方」という2段構えの検索方法でも十分用を足します.たまの使用ですから,探すのに少々の時間と工程数がかかっても我慢できます.しかし,使用頻度の高い文房具はそうもいきません.きれいに収納されていなくとも,ペンやポストイットは,やはりすぐ手元になければ役に立たないのです.無造作でかまわない,とにかくアクセスするのに時間と工程数が少ないほうがよいのです.
 言語使用における単語も,この文房具と同じことです.現代英語社会において一般に go (行く)と locomote (自力で動く)とでは頻度が明らかに異なります.たまにしか使わない動詞については,規則的に活用させる,すなわち locomote + ed のように計算させるという面倒にも耐えられますが,高頻度の動詞について,同じようにいちいち工程数をかけて計算させるのは,明らかに効率が悪いでしょう.go といえば went というように,かけ算九九のようにすぐに答えが出るほうが便利です.確かに最初に暗記するコストは高くつきますが,いったんそれをクリアしてしまえば,その後の毎回の使用に際して効率のよいパフォーマンスを得られます.また,語形が大きく異なることにより,言い間違いや聞き間違いの可能性が低くなるという利点もあります.不規則だからこそ便利ということもあるのです.
 すべての単語が同頻度で用いられるような言語はありませんし,そのような言語が用いられる人間社会も想像できません.よく使わない単語とほとんど使わない単語が同居しているのが言語というものです.もし上に述べた仮説の通り,単語による頻度の差と不規則性が関係しているのだとすれば,なぜ古今東西の言語において不規則な現象がみられるのかが理解できます.

[ 固定リンク | 印刷用ページ ]

Powered by WinChalow1.0rc4 based on chalow