hellog〜英語史ブログ     ChangeLog 最新    

brown - hellog〜英語史ブログ

最終更新時間: 2019-11-11 08:35

2015-04-22 Wed

#2186. 研究社Webマガジンの記事「コーパスで探る英語の英米差 ―― 基礎編 ――」 [link][corpus][brown][ame_bre]

 4月20日付けで,研究社WEBマガジン Lingua リンガリレー連載 実践で学ぶコーパス活用術に,私の執筆した「コーパスで探る英語の英米差 ―― 基礎編 ――」の記事が掲載されました.今日は,このリレー連載と私の記事について紹介します.  *
 連載「実践で学ぶコーパス活用術」はコーパス利用初心者向けのオムニバス記事で,毎月様々な言語学研究者が登場し,易しくかつ実践的にコーパス活用の方法を解説してゆくシリーズです.すでに20の記事が掲載されており,コーパスの基本から始まり,各種のコーパスの紹介,利用のコツ,事例研究,言語統計入門に至るまで,コーパスに関連する様々な視点が丁寧に解説されています.以下に,各記事へのリンクを張っておきます.

 1. なぜコーパスか? (赤須 薫)
 2. 英語コーパス体験ツアー ― BNCweb を検索してみる ―(前編) (石井 康毅)
 3. 英語コーパス体験ツアー ― BNCweb を検索してみる ―(後編) (石井 康毅)
 4. Google をコーパスに見立てる (仁科 恭徳)
 5. 言語統計の基礎(前編) ― 頻度差の検定 ― (小林 雄一郎 )
 6. 言語統計の基礎(後編) ― 共起尺度 ― (小林 雄一郎)
 7. コーパスを活用した古くて新しい学問領域:フレイジオロジー ― 理論編 ― (井上 亜依)
 8. コーパスを活用した古くて新しい学問領域:フレイジオロジー ― 実践編 ― (井上 亜依)
 9. 学習者コーパスとは何か? (鎌倉 義士)
 10. 学習者コーパスで何ができるのか? (鎌倉 義士)
 11. パラレルコーパスの可能性 (仁科 恭徳)
 12. 日本語コーパスに見られる慣用句の用法 (石田 プリシラ)
 13. 日本語コーパスに見られる慣用句の変化可能性 (石田 プリシラ)
 14. COCA を使ったコロケーションの検索 (内田 諭)
 15. COCA を使った類義語の検証 (内田 諭)
 16. コーパスで話し言葉を探る ― 基礎編 ― (青木 理香)
 17. コーパスで話し言葉を探る ― 実践編 ― (青木 理香)
 18. 学習者の話し言葉コーパスを使った語用論分析 (1)談話標識 well, I mean, kind of, like の使い方 (三浦 愛香)
 19. 学習者の話し言葉コーパスを使った語用論分析 (2)買い物での要求の表現 (三浦 愛香)
 20. 認知言語学を用いてコーパスから意味を探る― 入門編 ― (大谷 直輝)(←2015/05/18(Mon)にリンクを追加)
 21. 認知言語学を用いてコーパスから意味を探る― 前置詞・句動詞編 ― (大谷 直輝)(←2015/05/18(Mon)にリンクを追加)
 22. コーパスで探る英語の英米差 ―― 基礎編 ―― (堀田 隆一)
 23. コーパスで探る英語の英米差 ―― 実践編 ―― (堀田 隆一)(←2015/05/21(Thu)にリンクを追加)

 今回私の書いた記事は,コーパスを用いて英語の英米差について考えようという趣旨で,みかけは現代イギリス英語と現代アメリカ英語の共時的比較ですが,2変種を比較対照するに当たっては歴史的な背景や通時的な視点も欠かせないということを強調しています.今回は「基礎編」と銘打って,英語の英米差を論じるに当たっての準備事項を説明し,英米差の調査に利用できるコーパスを紹介しています.
 以下,今回のリレー連載の記事と合わせて読むと有用と思われる本ブログ内の記事にリンクを張ります.ほかにもコーパス利用については corpus の記事,英語の英米差については ame_bre の記事もご参照ください.

 ・ 「#1730. AmE-BrE 2006 Frequency Comparer」 ([2014-01-21-1])
 ・ 「#1739. AmE-BrE Diachronic Frequency Comparer」 ([2014-01-30-1])
 ・ 「#1743. ICE Frequency Comparer」 ([2014-02-03-1])

 ・ 「#428. The Brown family of corpora の利用上の注意」 ([2010-06-29-1])
 ・ 「#607. Google Books Ngram Viewer」 ([2010-12-25-1])
 ・ 「#517. ICE 提供の7種類の地域変種コーパス」 ([2010-09-26-1])

 ・ 「#1278. BNC を中心とするコーパス研究関連のリンク集」 ([2012-10-26-1])
 ・ 「#307. コーパス利用の注意点」 ([2010-02-28-1])
 ・ 「#367. コーパス利用の注意点 (2)」 ([2010-04-29-1])
 ・ 「#368. コーパスは研究の可能性を広げた」 ([2010-04-30-1])

 ・ 「#240. 綴字の英米差は大きいか小さいか?」 ([2009-12-23-1])
 ・ 「#244. 綴字の英米差のリスト」 ([2009-12-27-1])
 ・ 「#312. 文法の英米差」 ([2010-03-05-1])
 ・ 「#315. イギリス英語はアメリカ英語に比べて保守的か」 ([2010-03-08-1])
 ・ 「#357. American English or British English?」 ([2010-04-19-1])
 ・ 「#627. 2変種間の通時比較によって得られる言語的差異の類型論」 ([2011-01-14-1])
 ・ 「#628. 2変種間の通時比較によって得られる言語的差異の類型論 (2)」 ([2011-01-15-1])
 ・ 「#677. 現代英語における法助動詞の衰退」 ([2011-03-05-1])
 ・ 「#880. いかにもイギリス英語,いかにもアメリカ英語の単語」 ([2011-09-24-1])
 ・ 「#1010. 英語の英米差について Martinet からの一言」 ([2012-02-01-1])
 ・ 「#1221. 季節語の歴史」 ([2012-08-30-1])
 ・ 「#1304. アメリカ英語の「保守性」」 ([2012-11-21-1])
 ・ 「#1331. 語彙の英米差を整理するための術語」 ([2012-12-18-1])
 ・ 「#1343. 英語の英米差を整理(主として発音と語彙)」 ([2012-12-30-1])

 今回のリレー連載記事は「基礎編」でしたが,来月号は「実践編」を掲載する予定です.

[ | 固定リンク | 印刷用ページ ]

2011-03-05 Sat

#677. 現代英語における法助動詞の衰退 [auxiliary_verb][corpus][brown]

 現代英語の法助動詞 ( modal auxiliary ) の体系が複雑なことについては,[2010-07-22-1], [2010-01-20-1], [2009-07-01-1], [2009-06-25-1]の記事で触れた.法助動詞は一般動詞と比較して統語形態上の振る舞いが特異であり,意味も多様化してきたので英語史を通じて不安定な語類であった.現代英語でも体系的な安定は得られておらず,再編成が進行中と考えられるが,再編成の様相それ自体が複雑である.現代英語の法助動詞の研究は数多いが,体系の変化の傾向を記述した研究として,The Brown family of corpora ([2010-06-29-1]) を利用した Leech et al. (Chapters 3--5) の研究がある.特に4章 (pp. 71--90) では,主要な11の法助動詞の頻度の変化が詳述されている.以下は,1961年の米英書き言葉を代表する Brown と LOB,そして1991/92年の米英書き言葉を代表する Frown と F-LOB により,約30年間にわたる法助動詞の頻度の通時変化を表わしたグラフである(Leech et al., p. 283 の数値表をもとに作成).数値データはこのページのHTMLソースを参照.will には 'llwon't などの省略形・否定形も含む.need は肯定形と否定形を両方含む.

Frequencies of Modals in the Brown Family Corpora


 全体として30年の間に法助動詞の頻度が下がっていることが分かる.頻度の減少は,would, will, may, should, must, shall, ought (to) で p < 0.001 の非常に強い有意差を示し,might, need(n't) で p < 0.01 の強い有意差を示す.これは英米両変種をひっくるめた結果だが,変種で分けて調査すると,AmE のほうが BrE よりも減少の度合いが強く,BrE がその傾向を遅れて追いかけているかのような分布を示す (73) .
 興味深いのは,もともと頻度の低い法助動詞ほど減少率も大きい "bottom-weighting" (73) の傾向が観察されることだ.減少率の全体平均は18.9%だが,上位4助動詞でみると4.7%,下位7助動詞でみると22.7%である.特に,shall の43.5%,ought (to) の37.5%,need(n't) の31.6%という減少率は著しい.
 bottom-weighting の背景には,"paradigmatic atrophy" 「体系的な退化」(80--81) があるのではないかと指摘されている.上述のように,法助動詞は一般動詞と比べて多くの点で不完全であり変則的である.人称や数による屈折を欠いており,不定形が存在せず,時制変化もきわめて不規則である.shall は2人称代名詞を主語として現われることはほとんどなく,mayn't という否定形はきわめてまれである.法助動詞が全体的に "defective" な語類であることを考えれば,とりわけ頻度の低い法助動詞がいっそう機能不全に陥り,ますます低頻度になってゆくということは不思議ではない.法助動詞の再編成はグラフに見られるほど単純な現象ではないが,コーパスを用いた量的調査によって大きな潮流が明らかにされたと言えるだろう.

 ・ Leech, Geoffrey, Marianne Hundt, Christian Mair, and Nicholas Smith. Change in Contemporary English: A Grammatical Study. Cambridge: CUP, 2009.

Referrer (Inside): [2015-04-22-1] [2014-12-02-1]

[ | 固定リンク | 印刷用ページ ]

2011-01-14 Fri

#627. 2変種間の通時比較によって得られる言語的差異の類型論 [language_change][speed_of_change][corpus][brown][ame_bre]

 [2010-06-29-1]の記事でみたように,The Brown family of corpora を構成する4コーパス ( Brown, Frown, LOB, F-LOB ) を用いることによって英語の英米変種間の30年間ほどの通時変化を比べることができる.このように信頼するに足る比較可能性を示す複数のコーパスを用いた通時研究は "diachronic comparative corpus linguistics" (Leech et al. 24) と呼ばれており,相互に30年ほどの間隔をあけた英米変種のコーパス群が過去と未来の両方向へ向かって編纂されてゆくものと思われる.
 地域変種と年代という2つのパラメータによって得られる言語項目の頻度の差について,理論的な解釈は複数ありうる.Brown family の場合にはどのような解釈があり得るか,Mair (109--12) が論じている2変種間の通時比較によって得られる言語的差異(の有無)の類型論 ( "typology of contrasts" ) を改変した形で以下に示そう."=" は変化の出発点を,"+/-" は変化の生起とその方向を示す.

 (1) nothing happening
    BrE: = → =
    AmE: = → =

 (2) stable regional contrast
    BrE: = → =
    AmE: +/- → +/-

 (3) parallel diachronic development
    BrE: = → +/-
    AmE: = → +/-

 (4) convergence: Americanization
    BrE: +/- → =
    AmE: = → =

 (5) convergence: 'Britishization'
    BrE: = → =
    AmE: +/- → =

 (6) incipient divergence: British English innovating
    BrE: = → +/-
    AmE: = → =

 (7) incipient divergence: American English innovating
    BrE: = → =
    AmE: = → +/-

 (8) random fluctuation
    BrE: = → +/-
    AmE: +/- → +/-

 (1), (8) は最も多いが観察者の関心を引かない平凡なタイプの差異(の欠如)である.(2) は確立された不動の英米差,例えば <honour> vs. <honor> の綴字や got vs. gotten の使用が例となる.(3) の例は Mair では挙げられていないが何があるだろうか.(4) は Americanization の事例,例えば help が原型不定詞を取るようになってきている傾向を思い浮かべることができる(ただし BrE でのこの傾向はすべてが Americanization に帰せられるというわけではない).(5) は非常にまれだが 'Britishization' の例である.例えば AmE での準助動詞表現 have got to の広がりは BrE に牽引されている可能性があると疑われている.(6) は,BrE で prevent が "O + from + V-ing" ではなく "O + V-ing" を好んで選択するようになり出している傾向が例に挙げられる.(7) は,AmE で beginto 不定詞でなく V-ing を取る頻度が高まり出している傾向が例となる.
 理論的には,さらに変化の速度を考慮しなければならない.例えば (3) のように両変種で同方向の通時変化が生じている場合でも,変種間で変化の速度に差があれば結果として平行にはならないだろう.上記の類型論に速度という観点を持ち込むと,相当に細かい場合分けが必要になるはずである.このように複雑な課題は残っているが,2変種2時点を比較する "diachronic comparative corpus linguistics" の理論的原型として,上記の "typology of contrasts" は有用だろう.もちろん,このタイポロジーは,BrE と AmE において30年ほどという短期間に生じた通時変化だけでなく,近代以降の両変種の通時的発達を記述するモデルとしても有効である.広くは,[2010-10-09-1]の記事で扱った世界英語の convergence と divergence の問題にも適用できると思われる.

 ・ Leech, Geoffrey, Marianne Hundt, Christian Mair, and Nicholas Smith. Change in Contemporary English: A Grammatical Study. Cambridge: CUP, 2009.
 ・ Mair, Christian. Three Changing Patterns of Verb Complementation in Late Modern English: A Real-Time Study Based on Matching Text Corpora." English Language and Linguistics'' 6 (2002): 105--31.

[ | 固定リンク | 印刷用ページ ]

2010-09-18 Sat

#509. Dracula に現れる whilst (2) [corpus][lob][brown][bnc][oanc][coca][lmode][conjunction]

 昨日の記事[2010-09-17-1]の続編.Dracula に現れる同時性・対立を表す接続詞の3異形態 while, whilst, whiles の頻度を,20世紀後半以降の英米変種における頻度と比べることによって,この60〜110年くらいの間に起こった言語変化の一端を垣間見たい.用いたコーパスは以下の通り.

 (1) Dracula ( Gutenberg 版テキスト ): 1897年,イギリス英語.
 (2) LOB Corpus ( see also [2010-06-29-1] ): 1961年,イギリス英語.
 (3) BNC ( The British National Corpus ): late twentieth century,イギリス英語.
 (4) Brown Corpus ( see also [2010-06-29-1] ): 1961年,アメリカ英語.
 (5) OANC (Open American National Corpus): 1990年以降,アメリカ英語.
 (6) Corpus of Contemporary American English (BYU-COCA): 1990--2010年,アメリカ英語.

 各コーパスにおける接続詞としての while, whilst, whiles の度数と3者間の相対比率は以下の通り.

 whilewhilstwhiles
(1) Dracula14 (12.61%)95 (85.59%)2 (1.80%)
(2) LOB517 (88.68%)66 (11.32%)0 (0.00%)
(3) BNC48,761 (89.41%)5,773 (10.59%)0 (0.00%)
(4) Brown592 (100.00%)0 (0.00%)0 (0.00%)
(5) OANC7,893 (100.00%)0 (0.00%)0 (0.00%)
(6) COCA246,207 (99.82%)447 (0.18%)0 (0.00%)


 Draculawhilst の比率が異常に高い.はたして同時代のイギリス英語の文語の特徴なのだろうか.この表だけ眺めると,20世紀前半にイギリス英語で whilst が激減し,同世紀後半以降は10%程度で安定したと読める.アメリカ英語では20世紀後半では whilst はほぼ無に等しく,問題にならない.whiles に至っては,関心の発端であった Dracula での2例のみ(他に副詞としては1例あった)で,あとはどこを探しても見つからなかった.しかも,その Dracula の2例というのはいずれも訛りの強い英語を話すオランダ人医師 Van Helsing の口から発せられているもので,同時代イギリス英語でどの程度 spontaneous form であったかは分からない.
 今回の調査はもとより体系的な調査ではない.ジャンルの区別や作家の文体を意識していないし,比較する時代の間隔はたまたま入手可能なコーパスに依存したにすぎない.英米変種での比較というのも思いつきである.しかし,興味深い問いが新たに生まれたので,今後は追跡調査をしてみたい.

 ・ Dracula と同時代の他のイギリス文語では各異形の頻度はどうなのか
 ・ 20世紀前半に whilst が激減したように見えるのは本当なのか,本当だとしたらその背景に何があるのか
 ・ アメリカ英語のより古い段階では whilst はもっと頻度が高かったと考えてよいのか
 ・ whiles はいつ頃まで普通に見られたのか,あるいはそもそも普通に見られる形態ではなかったのか
 ・ the whilethe whilst などの複合形については頻度はどうだったのか

[ | 固定リンク | 印刷用ページ ]

Powered by WinChalow1.0rc4 based on chalow