hellog〜英語史ブログ     ChangeLog 最新    

glowbe - hellog〜英語史ブログ

最終更新時間: 2021-01-18 11:09

2020-10-19 Mon

#4193. インド系英語における discuss about [verb][indian_english][glowbe][corpus][accommodation]

 先月教えてもらったばかりの「#4169. GloWbE --- Corpus of Global Web-Based English」 ([2020-09-25-1]) を用いて,しかもつい数日前に院生の指摘からインスピレーションを受けた標題の話題について調べてみた.その意味では完全に人頼みの記事です(←ありがとうございます).
 標準英語では discuss は他動詞であり,前置詞を伴わずに直後に目的語を要求する.日本語母語話者としては,訳語がたいてい「〜について論じる」となるので,about 辺りの前置詞を介在させたくなり,discuss about としてしまうことがあるのだが,これは規範文法的には誤用とされる.しかし,実際には discuss about も耳にしたり目にする機会がある.インド英語などで広く行なわれる表現であるということは聞いたことがあった.
 そこで,現代の世界英語変種を比較できるコーパス GloWbE (= Corpus of Global Web-Based English) の出番である.難しいことはない,検索欄に "discuss about" を入力するだけである.この超簡単な検索だけで,超おもしろい結果を味わうことができる.自動的に出力されたチャートは次の通り.

Search of

 横方向のほぼ中央(ちょっとだけ左寄り)の一群で棒グラフが相対的に高い値を示している.この近辺はインド(亜大陸)系英語の数値である.統計学的な検定をかけるまでもなく,明らかに左右両端の英語変種とは異なる分布を示す.
 バングラデシュやインド等の南アジア圏を相手とする21世紀の商談においては,accommodation 理論に従い,われわれ極東アジア人も "Shall we discuss about our business?" と始めたほうがビジネスの成功率は高そうだ.
 コーパス利用はとかく苦手意識により敬遠されることが多いのだが,これくらいのところから始めてもよいのでは.

[ | 固定リンク | 印刷用ページ ]

2020-09-25 Fri

#4169. GloWbE --- Corpus of Global Web-Based English [glowbe][corpus][ice][englishes][world_englishes][variety][ame_bre][spelling]

 「#4166. 英語史の各時代のコーパスを比較すれば英語史がわかる(かも)」 ([2020-09-22-1]) で触れた World Englishes のコーパス GloWbE (= Corpus of Global Web-Based English) を少し試してみた.(先日の駒場英語史研究会にて本コーパスを導入していただきました菊地翔太先生(明海大学)には,改めて感謝します.)
 このコーパスは20カ国からの英語変種を総合した19億語からなる巨大コーパスで,変種間の比較が容易に行なえる仕様となっている.変種間比較についていえば,私はこれまで「#517. ICE 提供の7種類の地域変種コーパス」 ([2010-09-26-1]),「#1743. ICE Frequency Comparer」 ([2014-02-03-1]) などで取り上げたように ICE (International Corpus of English) しか知らなかったのだが,コーパスの世界は急速に進化しているようだ.GloWbE のインターフェースは,COCA (Corpus of Contemporary American English) や COHA (Corpus of Historical American English) などと共通なので,そちらに慣れたユーザーであれば,とっついやすいはずだ.
 きわめて単純な使い方ではあるが,GloWbE の最大の売りである変種間比較を colorcolour のスペリングに関して行なってみた.一般に color はアメリカ式,colour はイギリス式のスペリングといわれるが,この2変種間の比較に満足せず,20変種間で比べてみようという試みだ.インターフェースより単純に Chart 出力機能を選択し,各々のスペリングで検索し,返された図表を眺めるだけなのだが,それだけでも十分におもしろい.まずは,アメリカ式 color の図表から.



 次に,イギリス式 colour の図表を挙げよう.



 横方向の中央辺りに東南アジアの国々が集まっており,歴史的にはイギリス式が多いと予想される地域なわけだが,実はアメリカ式スペリングのほうが優勢のようだ.近年の英語のアメリカ化 (americanisation) の影響が疑われよう.一方,左側には(米国を除く)アングロサクソン系諸国が集まっており,そこでは予想通りにイギリス式が優勢である.右側に集まっているアフリカ諸国では,両スペリングの差はさほど大きくない.
 color vs colour の問題を米英間の問題として論じる時代は過ぎ去りつつある.凄いツールが出てきたものである.

Referrer (Inside): [2020-11-12-1] [2020-10-19-1]

[ | 固定リンク | 印刷用ページ ]

2020-09-22 Tue

#4166. 英語史の各時代のコーパスを比較すれば英語史がわかる(かも) [academic_conference][corpus][eebo][glowbe][laeme][lalme][historiography][standardisation]

 一昨日の9月20日(日),2020年度駒場英語史研究会にて,特別企画「電子コーパスやオンライン・リソースを使った英語史研究 ― その実践と可能性」に発表者として参加しました.Zoom でのオンライン大会でしたが,円滑に会が進行しました.(企画のご提案から会の主催までお世話になりました寺澤盾先生(東京大学),発表者の家入葉子先生(京都大学)と菊地翔太先生(明海大学),および参加者すべての方々には,貴重な機会とインスピレーションをいただきました.お礼申し上げます.)
 トップバッターの私自身の発表では「LAEME & LALME を用いた英語史研究入門」と題して,中英語を代表する2つの姉妹コーパス LAEMEeLALME を紹介しました.続いて,家入先生の「データベースの利用によるコーパス言語学 --- Early English Books Onlineを中心に」と題する発表では,初期近代英語期を代表するコーパス EEBO Online corpus が紹介されました.最後に,菊地先生による「Corpus of Global Web-Based English(GloWbE)を用いた World Englishes 研究の可能性」という発表により,21世紀の World Englishes 時代を象徴する GloWbE が導入されました(←私にとって未知だったので驚きの連続でした).
 各々の発表はコーパスの紹介とデモにとどまらず,その可能性や「利用上の注意」にまで触れた内容であり,発表後のディスカッションタイムでは,英語史研究においてコーパス利用はどのような意義をもつのかという方法論上の肝心な議論にまで踏み込めたように思います(時間が許せば,もっと議論したいところでした!).
 中英語,近代英語,21世紀英語という3つの異なる時代の英語を対象としたコーパスを並べてみたわけですが,研究会が終わってからいろいろと考えが浮かんできました.同じ英語のコーパスとはいえ,対象とする時代が異なるだけで,なぜ検索の仕方も検索の結果もインターフェースもここまで異なるのだろうかということです.その答えは「各々の時代における英語の(社会)言語学的事情が大きく異なっているから,それと連動して(現代の研究者が編纂する)コーパスのあり方も大きく異ならざるを得ない」ということではないかと思い至りました.
 逆からみれば,各時代のコーパスがどのように編纂され,どのように使用されているかを観察することにより,その時代の英語の(社会)言語学的事情が浮き彫りになってくるのではないか,ということです.そうして時代ごとの特徴がきれいに浮き彫りになってくるようであれば,それを並べてみれば,ある種の英語史記述となるにちがいない.換言すれば,各時代のコーパス検索に伴うクセや限界みたいなものを指摘していけば,その時代の背後にある言語事情が透けて見えてくるのではないかと.ここから「コーパスのあり方からみる英語史」のような試みが可能となってきそうです.
 時代順にみていきます.中英語期は標準形が不在なので,ある単語を検索しようとしても,そもそもどの綴字で検索すればよいのかという出発点からして問題となります (cf. 「#1450. 中英語の綴字の多様性はやはり不便である」 ([2013-04-16-1])).実際,中英語辞書 MED である単語を引くにしても,そこそこ苦労することがあります.LAEME や LALME でも検索インターフェースには様々な工夫はなされていますが,やはり事前の知識や見当づけが必要ですので,検索が簡単であるとは口が裂けても言えません.現実に標準形がないわけですから,致し方がありません.
 次に初期近代英語期ですが,EEBO は検索インターフェースが格段にとっつきやすく,一見すると検索そのものに問題があるようには見えません.しかし,英語史的にはあくまで標準化を模索している時代にとどまり,標準化が達成された現代とは事情が異なります.つまり,標準形とおぼしきものを検索欄に入れてクリックしたとしても,実は拾い漏れが多く生じてしまうのです.公式には実装されているとされる lemma 検索も,実際には思うほど精度は高くありません.落とし穴がいっぱいです.
 最後に,21世紀英語の諸変種を対象とする GloWbE については,(ポスト)現代英語が相手ですから,当然ながら標準形を入力して検索できます.しかし,BNC や COCA のような「普通の」コーパスと異なるのは,返される検索結果が諸変種に由来する多様な例だということです.
 大雑把にまとめると次のようになります.

 代表コーパス検索法などに反映される「コーパスのあり方」(社会)言語学的事情
中英語LAEME, LALME検索法が難しい標準形がない
初期近代英語EEBO検索法が一見すると易しい標準形が中途半端にしかない
21世紀英語GloWbE検索法が易しい標準形はあるが,その機能は変種によって多様


 異なる時代のコーパスを比べてみると,英語史がみえてくるということがよく分かりました.駒場英語史研究会での発表の機会をいただき,改めて感謝します.

Referrer (Inside): [2020-09-25-1]

[ | 固定リンク | 印刷用ページ ]

Powered by WinChalow1.0rc4 based on chalow