hellog〜英語史ブログ     ChangeLog 最新     カテゴリ最新     前ページ 1 2 3 / page 3 (3)

lmode - hellog〜英語史ブログ

最終更新時間: 2020-04-01 05:11

2011-06-09 Thu

#773. PPCMBE と COHA の比較 [corpus][coha][ppcmbe][lmode][adjective][comparison][inflection][representativeness]

 本ブログでも何度か取り上げている2つの歴史英語コーパス PPCMBE ( Penn Parsed Corpus of Modern British English; see [2010-03-03-1]. ) と COHA ( Corpus of Historical American English; see [2010-09-19-1]. ) について,塚本氏が『英語コーパス研究』の最新号に研究ノートを発表している.両者とも2010年に公開された近代英語後期のコーパスだが,それぞれ英米変種であること,また編纂目的が異なることから細かな比較の対象には適さない.しかし,代表性をはじめとするコーパスの一般的な特徴を比べることは意味があるだろう.
 PPCMBE は1700--1914年のイギリス英語テキスト約949,000語で構成されており,Parsed Corpora of Historical English の1部をなす.同様に構文解析されたより古い時代の対応するコーパスとの接続を意識した作りである.有料でデータを入手する必要がある.一方,COHA は1810--2009年のアメリカ英語テキスト4億語を収録した巨大コーパスである.こちらは,構文解析はされていない.COHA は無料でオンラインアクセスできるため使いやすいが,インターフェースが固定されているので柔軟なデータ検索ができないという難点がある.
 コーパスの規模とも関係するが,PPCMBE は代表性 (representativeness) の点で難がある.PPCMBE のコーパステキストを18ジャンルへ細かく分類し,テキスト年代を10年刻みでとると,サイズがゼロとなるマス目が多く現われる.これは,区分を細かくしすぎると有意義な分析結果が出ないということであり,使用に際して注意を要する.
 一方,COHA のコーパステキストは Fiction, Popular Magazines, Newspapers, Non-Fiction Books の4ジャンルへ大雑把に区分されている.細かいジャンル分けの研究には利用できないが,10年刻みでも各マス目に適切なサイズのテキストが配されており,代表性はよく確保されている.ただし,Fiction の構成比率がどの時代も約50%を占めており,Fiction の言語の特徴(特に語彙)がコーパス全体の言語の特徴に影響を与えていると考えられ,分析の際にはこの点に注意を要する.
 塚本氏は,両コーパスの以上の特徴を,後期近代英語における形容詞の比較級・最上級の問題によって示している.CONCE (Corpus of Nineteenth-Century English) を用いた Kytö and Romaine の先行研究によれば,19世紀の間,比較級の迂言形に対する屈折形の割合は,30年刻みで世紀初頭の57.1%から世紀末の67.8%へと増加しているという.同様の調査を COHA と PPCMBE で10年刻みに施したところ,前者では1810年の64.7%から1910年の74.3%へ着実に増加していることが確かめられたが,後者では1810年の79.4%から1910年の78.0%まで増減の揺れが激しかったという(塚本,p. 56).しかし,CONCEと同様の30年刻みで分析し直すと,PPCMBE でも有意な変化をほぼ観察できるほどの結果がでるという.
 コーパスはそれぞれ独自の特徴をもっている.よく把握して利用する必要があることを確認した.関連して,[2010-06-04-1]の記事「流れに逆らっている比較級形成の歴史」を参照.

 ・ 塚本 聡 「2つの指摘コーパス---その代表性と類似性」『英語コーパス研究』第18号,英語コーパス学会,2011年,49--59頁.
 ・ Kytö, M. and S. Romaine. "Adjective Comparison in Nineteenth-Century English." Nineteenth-Century English: Stability and Change. Ed. M. Kytö, M. Rydén, and E. Smitterberg. Cambridge: CUP, 2006. 194--214.

Referrer (Inside): [2017-08-15-1] [2015-09-29-1]

[ | 固定リンク | 印刷用ページ ]

2010-09-18 Sat

#509. Dracula に現れる whilst (2) [corpus][lob][brown][bnc][oanc][coca][lmode][conjunction]

 昨日の記事[2010-09-17-1]の続編.Dracula に現れる同時性・対立を表す接続詞の3異形態 while, whilst, whiles の頻度を,20世紀後半以降の英米変種における頻度と比べることによって,この60〜110年くらいの間に起こった言語変化の一端を垣間見たい.用いたコーパスは以下の通り.

 (1) Dracula ( Gutenberg 版テキスト ): 1897年,イギリス英語.
 (2) LOB Corpus ( see also [2010-06-29-1] ): 1961年,イギリス英語.
 (3) BNC ( The British National Corpus ): late twentieth century,イギリス英語.
 (4) Brown Corpus ( see also [2010-06-29-1] ): 1961年,アメリカ英語.
 (5) OANC (Open American National Corpus): 1990年以降,アメリカ英語.
 (6) Corpus of Contemporary American English (BYU-COCA): 1990--2010年,アメリカ英語.

 各コーパスにおける接続詞としての while, whilst, whiles の度数と3者間の相対比率は以下の通り.

 whilewhilstwhiles
(1) Dracula14 (12.61%)95 (85.59%)2 (1.80%)
(2) LOB517 (88.68%)66 (11.32%)0 (0.00%)
(3) BNC48,761 (89.41%)5,773 (10.59%)0 (0.00%)
(4) Brown592 (100.00%)0 (0.00%)0 (0.00%)
(5) OANC7,893 (100.00%)0 (0.00%)0 (0.00%)
(6) COCA246,207 (99.82%)447 (0.18%)0 (0.00%)


 Draculawhilst の比率が異常に高い.はたして同時代のイギリス英語の文語の特徴なのだろうか.この表だけ眺めると,20世紀前半にイギリス英語で whilst が激減し,同世紀後半以降は10%程度で安定したと読める.アメリカ英語では20世紀後半では whilst はほぼ無に等しく,問題にならない.whiles に至っては,関心の発端であった Dracula での2例のみ(他に副詞としては1例あった)で,あとはどこを探しても見つからなかった.しかも,その Dracula の2例というのはいずれも訛りの強い英語を話すオランダ人医師 Van Helsing の口から発せられているもので,同時代イギリス英語でどの程度 spontaneous form であったかは分からない.
 今回の調査はもとより体系的な調査ではない.ジャンルの区別や作家の文体を意識していないし,比較する時代の間隔はたまたま入手可能なコーパスに依存したにすぎない.英米変種での比較というのも思いつきである.しかし,興味深い問いが新たに生まれたので,今後は追跡調査をしてみたい.

 ・ Dracula と同時代の他のイギリス文語では各異形の頻度はどうなのか
 ・ 20世紀前半に whilst が激減したように見えるのは本当なのか,本当だとしたらその背景に何があるのか
 ・ アメリカ英語のより古い段階では whilst はもっと頻度が高かったと考えてよいのか
 ・ whiles はいつ頃まで普通に見られたのか,あるいはそもそも普通に見られる形態ではなかったのか
 ・ the whilethe whilst などの複合形については頻度はどうだったのか

[ | 固定リンク | 印刷用ページ ]

2010-09-17 Fri

#508. Dracula に現れる whilst [conjunction][lmode]

 先日,ハンガリー旅行中に時間をもてあますことがあり,持参した本もすべて読み潰していたので困ったことがあった.飛び込んだ書店には英語の本があまりなかったのだが(ハンガリー語は読めないので),かろうじて Penguin Popular Classics の一部が置いてあった.物色した結果,アイルランド作家 Bram Stoker (1847-1912) による怪奇小説の名作 Dracula 『吸血鬼ドラキュラ』 (1897) を手に取った.主人公のドラキュラ伯爵はルーマニアの Transylvania 地方(ハンガリー東部から広がる地域)の城主という設定であり,この旅にそこそこふさわしいと思われたからだ.450ページ近くあるので時間潰しの目的にもかなう.帰りの飛行機で本格的に読み始め,帰国後も寝る前に少しずつ読み続けているが,いまだに読み終わらない.
 物語はおもしろいので引き込まれるが,趣味の読書とはいえ,気になる英語表現には目が留まる.気になることの1つに,接続詞 whilst が高頻度で現れることがある.接続詞 whilst は現在ではイギリス英語の文語に特徴的な形式張った語で,while に比べれば頻度の低い語である( Longman の辞書によれば while は最頻1000語レベル以内,whilst は最頻2000語レベル以内).もちろん作品には while も出るが whilst の頻度のほうが圧倒的に高く,この点で現在のイギリス文語の状況とは異なる.さらに whiles なる代替表現も稀ではあるが現れ,これは調べなければと思い立った.ほぼ1世紀の間に,接続詞としての while, whiles, whilst のそれぞれの頻度はどのように変化してきたのだろうか.
 頻度の問題を考察し始める前に,同時性や対立を表す従属接続詞として機能する3種類の形態の起源を見ておこう.現在もっとも一般的に用いられる while は,[2010-06-18-1]で話題にしたように古英語では「時間」を意味する名詞にすぎなかった.それが文法化 ( grammaticalisation ) を経て副詞や接続詞としての機能を発展させてきた.機能的発展という点では whileswhilstwhile と同様であり,名詞 while が起源と考えてよい.ただし前者2語は形態的には説明が必要である.
 whiles の語尾の -s[2009-07-18-1]で話題にした副詞的属格 ( adverbial genitive ) である.whiles は13世紀に初めて現れ,単独であるいは複合的に「〜のときに」を表す副詞や接続詞として普通に見られるようになった.現在ではスコットランド方言で「時々」の意味を表し,また古語としては while と同義に用いられるが,一般的には廃語となったと考えてよい.関連語としては,いずれもやはり古語としてだが otherwhile(s)somewhile(s) がある.
 whilst [waɪlst] は上記の whiles に -t 語尾がついたもので,副詞としては14世紀から,接続詞としては16世紀からおこなわれている.-t 語尾の付加については一種の音便とも考えられるが,意味や機能の点で関連づけられ得る against, amidst, amongst, betwixt などの語類の語尾が互いに影響しあった結果の挿入ではないかといわれる.これらの語類はいずれも副詞的属格の -s を取り,かつ最上級の -st との連想が働いたために,-st をもつようになったと考えられている(日本語でも「〜の最中に」などという).上述したように,whilst は現在ではイギリス英語の文語に限られ,形式張った語である.while と比較すると頻度は高くないが,文章でお目にかかる機会は結構ある.
 接続詞 while の variants として whileswhilst の形態の歴史をみたところで,次回は Dracula の英語と数世代下った英米変種での各形態の頻度を見てみることにしよう.

[ | 固定リンク | 印刷用ページ ]

Powered by WinChalow1.0rc4 based on chalow