hellog〜英語史ブログ     ChangeLog 最新     カテゴリ最新     1 2 3 4 5 6 7 8 9 10 11 次ページ / page 1 (11)

corpus - hellog〜英語史ブログ

最終更新時間: 2021-04-15 17:41

2021-02-26 Fri

#4323. "subjunctive-friendly" なアメリカ英語 [subjunctive][ame_bre][brown][corpus][contact]

 仮定法現在の用法,いわゆる "mandative subjunctive" が現代アメリカ英語で安定的に用いられている事実について,本ブログでは通時的な観点から以下の記事で取り上げてきた.「#325. mandative subjunctive と should」 ([2010-03-18-1]),「#326. The subjunctive forms die hard.」 ([2010-03-19-1]),「#345. "mandative subjunctive" を取り得る語のリスト」 ([2010-04-07-1]),「#3042. 後期近代英語期に接続法の使用が増加した理由」 ([2017-08-25-1]),「#3351. アメリカ英語での "mandative subjunctive" の使用は "colonial lag" ではなく「復活」か?」 ([2018-06-30-1]) .
 この問題について Hundt (595--97) が Brown 系コーパスを用いて行なった調査の概要を読む機会があった (cf. 「#428. The Brown family of corpora の利用上の注意」 ([2010-06-29-1])) .1930年代から1991年までの英米両変種(書き言葉)の通時比較調査である.should 使用と比べての mandative subjunctive 使用の割合は,アメリカ英語ではすでに1930年代より8割に近づく高い値を示しており,1991年にはほぼ9割に達している.一方,イギリス英語では,1930年代で2割を超える程度の値であり,その後は増加したとはいえ1991年の時点で4割弱にとどまっている.mandative subjunctive の使用については,共時的にも通時的にもアメリカ英語のほうが著しいといってよい.
 Övergaard の先行研究によると,アメリカ英語での mandative subjunctive の増加は1900年から1920年にかけて起こっており,その背景としてドイツ語,フランス語,スペイン語,イタリア語など仮定法を保持している言語を母語とする中西部の移民たちの存在が指摘されている (Hundt 597) .
 おもしろいのは,上記の「仮定法現在」のみならず,If I were you のような「仮定法過去」の were の残存についても,英米変種間で似たような傾向がみられることだ.イギリス英語では,1930年代には were 使用が8割ほどあったが,199年代には5割強へと大きく減らしている.一方,アメリカ英語でも1930年代の83.4%から1990年代の74%へ落ちているとはいえ,減り幅は小さい.
 いずれの事例からも,20世紀のアメリカ英語(書き言葉)が "a relatively 'subjunctive-friendly' variety" (Hundt 597) であることがわかる.

 ・ Hundt, Marianne. "Change in Grammar." Chapter 27 of The Oxford Handbook of English Grammar. Ed. Bas Aarts, Jill Bowie and Gergana Popova. Oxford: OUP, 2020. 581--603.
 ・ Övergaard, Gerd. The Mandative Subjunctive in American and British English in the 20th Century. Uppsala: Almqvist and Wiksell, 1995.

[ | 固定リンク | 印刷用ページ ]

2021-02-25 Thu

#4322. EMEMT --- 初期近代英語期の医学テキストコーパス [corpus][emode][genre]

 本棚を整理していたら,Early Modern English Medical Texts: Corpus Description and Studies Including a CD-Rom . . . . なる本が出てきた.ハードカバーで厚さを測ってみたら3.4cm.購入してからほとんど開いたこともなかった本だが(実際いつ買ったのだろう?),コーパスの CD-ROM がついているというので開いてみた.確かに初期近代英語期の医学テキストコーパスがついている.本のほうは,そのコーパスについての解説とコーパスを用いたケース・スタディからなっている.
 今回は,まだ使ってもいないこのコーパスについて,本書の冒頭よりざっと概要を紹介する.

The Corpus of Early English Medical Texts (CEEM) is a three-part series of historical corpora of medical writing 1375--1800. The corpus was initiated about fifteen years ago at the University of Helsinki for the ongoing research project of Scientific Thought-styles: The Evolution of English Medical Writing by Irma Taavitsainen and Päivi Pahta. This project aims to gain new knowledge of the development of the language of science and medicine in a long diachronic perspective, and for this end an extensive electronic database was needed. The work has progressed in phases. The first corpus, Middle English Medical Texts (MEMT, 1375--1500), was published on CD-ROM in 2005 by John Benjamins. Early Modern English Medical Texts (EMEMT) is the second component of CEEM. The third, Late Modern English Medical Texts (LMEMT, 1700--1800), has already been initiated and will be released in due course. (Taavitsainen and Pahta, vii)


 なるほど,今回注目している EMEMT は,3つからなるシリーズの第2弾で初期近代英語期 (1500--1700) の医学テキストをカバーするジャンル限定のコーパスということのようだ.450ほどのテキスト,総語数200万語からなる堂々たる歴史コーパスである.一見狭いジャンルであるかのように「医学テキスト」のコーパスと謳ってはいるが,当時の科学思考を代表するジャンルとしてみれば,その応用範囲は案外広いかもしれない.シリーズのほかの2つのコーパスとそのプロジェクトについて,CoRD (Corpus Resource Database) に解説があるということで,そちらへのリンクも張っておく.

 ・ Corpus of Early English Medical Writing (CEEM)
   ・ Middle English Medical Texts (MEMT)
   ・ Early Modern English Medical Texts (EMEMT)
   ・ Late Modern English Medical Texts (LMEMT)

 目下使い途はないのだが,むりやり使い途を考えてみるというのもコーパス隆盛時代の頭の体操.考えてみたい.

 ・ Taavitsainen, Irma and Päivi Pahta, eds. Early Modern English Medical Texts: Corpus Description and Studies Including a CD-Rom Containing Early Modern English Medical Texts (EMEMT) Corpus Compiled by Irma Taavitsainen, Päivi Pahta, Turo Hiltunen, Martti Mäkinen, Ville Marttila, Maura Ratia, Carla Suhr and Jukka Tyrkkö.'' Amsterdam: Philadelphia: John Benjamins, 2010.

[ | 固定リンク | 印刷用ページ ]

2021-01-16 Sat

#4282. -ly が2つ続く副詞 -lily の事例を ICAMET で検索 [corpus][icamet][adverb][suffix][-ly]

 標記の -lily 副詞の話題について,最近の記事「#4268. -ly が2つ続く副詞 -lily は稀である」 ([2021-01-02-1]),「#4270. 後期近代英語には -ly が2つ続く副詞 -lily がもっとあった」 ([2021-01-04-1]),「#4271. -ly が2つ続く副詞 -lily の事例を Helsinki Corpus で検索」 ([2021-01-05-1]) で取り上げてきた.今回は,昨日の記事「#4281. ICAMET --- 中英語散文コーパス」 ([2021-01-15-1]) で紹介した ICAMET から例を集めてみる.
 Perl 対応の正規表現として "\b\S+(?<!s)l[iy]l[yi](ch?)?(e(r|st)?)?\b" を検索式として与え,結果を取り出してみると111の例が挙がってきた.異綴字としてまとめると,以下の41種類である.

folily, folyly, holily, holyly, holyliche, seliliche, holili, hallyly, semlyly, lawlyly, iolily, hoolily, holylye, holylyche, fullyly, worldlyly, worldlily, wilyly, willyly, wilili, vnwortlily, vnreulili, semelily, selyly, selily, selili, sclyly, reulily, reulili, priuelyliche, li3tlyliche, iolyly, hoolyly, holilie, holiliche, hallily, folyliche, folyli, foliliche, folilich, folili


 語彙項目としてまとめると,folily (40), fullyly (2), holily (41), iolily (3), lawlyly (2), li3tlyliche (1), priuelyliche (1), reulily (2), sclyly (1), seliliche (8), semlyly (3), vnreulili (1), vnwortlily (1), worldlily (2), wilili (3) となる.これまで集めてきたよりも多くの種類が出てきてくれたので,まずは今回の ICAMET の使用は成功としておきたい.
 コンコーダンスラインを眺めると,近くに別の -ly 副詞(-lily ではないもの)が現われるケースが散見された.散文テキストということもあり脚韻というほどではないにせよ,一種の統語的な語呂といった要因が作用している可能性がある.いくつか例を挙げておこう(括弧内は ICAMET のファイル名).

 ・ And with þis wurd þis knyght was confusid, & holilie and stronglie he tuke þe ordur and vttirly forsuke all þis werld. (Alpha2)
 ・ lyghtly and folyly to curse another. (Caxtdoc)
 ・ how after that they leued chastely, clenly, and holyly in thaire manere (Caxtkni)
 ・ pacyently and holyly without grudchyng (Caxtpro1)
 ・ Spoushod is a stat þet me ssel wel klenliche / and wel holylyche loki uor manie skeles (Danayen)
 ・ firste for to lyue holili, and after to preche trueli (Lollard)
 ・ Alle þat wolen lyue piteousli or holili in Crist schul suffre persecucyon. (Lollard)
 ・ Iff any man holily lyue & ri3twysly, Alsso warst synnars despise he nott. (Misfire)
 ・ whanne þei ben vnmesurably and vnreulili a3ens doom of resoun, (Pecdon1)
 ・ frely forgife vnto þe þinge þat þou has anese hym mysdone, folily & vnkyndely. (Rollebok)
 ・ þis wondyrful oned may nou3t be fulfilled parfitely, contynuelly, holyly in þis lyfe, (Rollhor1)
 ・ þat þay say to þame na wordes of myssawe ne vnhoneste ne of displesance vnauyssedly, / bot serue þame mekely and gladly and lawlyly; (Rollhor1)
 ・ and ther-for the preste muste go to that body holily and deuoutly with grete reuerence and drede, as mych as he may, (Specchri)
 ・ not to lyue worldlyly ne lustly ne proudely, but to lyue in bisy trauel to kepe þer sheep & wynne hem heuene; (Wyclif2)

[ | 固定リンク | 印刷用ページ ]

2021-01-15 Fri

#4281. ICAMET --- 中英語散文コーパス [icamet][corpus][me][link]

 ICAMET (= Innsbruck Computer Archive of Machine-Readable English Texts) は,約780万語(私の持っている古い Version 2.4 は約600万語ほど)からなる中英語散文コーパスである.2012年以来手元に置いていたもののほとんど活用する機会のなかったコーパスだが,同コーパスを用いた谷の論文によって思い出した次第.当時 CD-ROM で購入した有料コーパスだが,ICAMET 以外にも tagged Brown Corpus, Wall Street Journal, Switchboard tagged が含まれていた.ICAMET のファイル形式は doc と rtf で,テキストの annotation が COCOA 方式で与えられている.
 中英語テキストを含むコーパスといえば代表的なものとして以下が思い浮かぶが,このラインナップに ICAMET が加わるとなかなか強力な布陣だ.

 ・ Helsinki Corpus (HC) の中英語部分
 ・ The Penn-Helsinki Parsed Corpus of Middle English, second edition (PPCME2)
 ・ Corpus of Middle English Prose and Verse
 ・ The Middle English Grammar Corpus (MEG-C)
 ・ The Parsed Corpus of Middle English Poetry (PCMEP)

 上記コーパスにはそれぞれの特徴があるが,今回は ICAMET に注目する.まず,ジャンルとしては中英語散文のみが含まれているという点が特異である.規模については,Version 2.4 に基づいた谷 (63) によれば,次の通り.

世紀1212--131313--141414--1515Total
ファイル数38911413111159
語数110,45458,692344,2683,996704,137378,0804,349,8085,949,435
%1.91.05.80.111.96.473.1100


 全体で約600万語というコーパスサイズは,Helsinki Corpus の中英語部分の約10倍であり,PPCME2 の約5倍である.時代の分布としては14世紀と15世紀を合わせて91.4%となっており,相当に後期中英語に偏っている.この点は使用に際して注意すべき点だろう.
 中英語コーパスについては,「#3282. The Parsed Corpus of Middle English Poetry (PCMEP)」 ([2018-04-22-1]) も参照.

 ・ 谷 明信 「ICAMET 中英語散文コーパスを用いた認識動詞 wit の衰退の調査」『コーパスと英語史』堀 正広・赤野 一郎(監修),西村 秀男(編).ひつじ書房.2019年.59--95頁.
 ・ Markus, Manfred, ed. The Middle English Prose Corpus of the ICAMET. U of Innsbruck, 2003.

Referrer (Inside): [2021-01-16-1]

[ | 固定リンク | 印刷用ページ ]

2021-01-14 Thu

#4280. 19世紀イギリス文学のオンラインコーパス --- CLiC [corpus][lmode][literature]

 先日,大学院生より教わった19世紀を中心とするイギリス文学のオンラインコーパス The CLiC web app を紹介.英文学史上,とりわけ英語小説史上とても重要な同世紀からの小説群が多く登録されている.主要な著者を挙げてみると,Anne Brontë, Anthony Trollope, Arthur Conan Doyle, Beatrix Potter, Benjamin Disraeli, Bram Stoker, Charles Dickens, Charlotte Brontë, Emily Brontë, George Eliot, Henry James, Jane Austen, John Ruskin, Joseph Conrad, Lewis Carroll, Mary Shelley, Oscar Wilde, Robert Louis Stevenson, Rudyard Kipling, Thomas Hardy, William Makepeace Thackeray と華々しい.
 文体論研究を念頭においたコーパスで,作品や著者ごとにサブコーパスを選択できる.まだ本格的に使っていないが,上記インターフェースや説明書きから推察するに,例えば次のようなこともできそう.

 ・ Texts タブにより,テキストそのものを表示できる
 ・ 引用符内外のテキスト(地の文と台詞)を区別して検索対象として指定できる
 ・ Keywords タブにより,参照コーパスを別途設定しつつ,ある作品(群)の keywords を収集・一覧できる
 ・ Clusters タブにより,n-gram による共起表現の検索や計算ができる

 本来は,研究テーマが先にあり,その研究に役立つコーパスが存在するか,あるいは入手可能か,という問いが生じ,その答えが Yes であれば,それをどのように使えるか具体的に考え,そして実際に使ってみるというのが基本的な手順となるだろう.一方,ある新しいコーパスを見つけたら,それはどんなコーパスで,何ができる(できない)のかを問うてみて,その上で○○な研究をする際には使えそうだな,と当たりを付けておく逆の手順も,エクササイズとして有効.

[ | 固定リンク | 印刷用ページ ]

2021-01-08 Fri

#4274. 英語の学習・教育にも英語史・英語学の研究にもコーパスやオンラインツールを [corpus][coca][dictionary][methodology][elt]

 先月出版された今井著『英語独習法』が広く読まれているようだ.認知科学に基づく効果的な英語学習の指南書である.私も読了したところだが,目を引いたのは「第5章 コーパスによる英語スキーマ探索法 基本篇」と「第6章 コーパスによる英語スキーマ探索法 上級篇」である.そこでは,学習者に求められるのは受け身の学習ではなくコーパスを利用した能動的な学習であると説かれ,具体的なオンラインコーパスの利用法が伝授される.ターゲットとなる単語についてコーパスが与えてくれる頻度,共起,例文,関連語などの情報をもとに,その単語に関するスキーマを自ら習得していくことが大事である,という趣旨だ.そこで挙げられているコーパスを含めたオンラインツールのうち,無料で利用できるものを挙げておきたい(今井,259--60).

 ・ Weblio 英和・和英辞典
 ・ Cambridge English Dictionary
 ・ SkELL (= Sketch Engine for Language Learning)
 ・ COCA (= Corpus of Contemporary American English)
 ・ WordNet: A Lexical Database for English

 本書の5,6章のほか「探究実践篇」と題する50ページを超える部分では,英語学習のみならず英語学の研究テーマとなり得る種類の話題がいくつか取り上げられており,英語学・英語史を専攻する大学生にとっても有用である.コーパスを利用した研究のヒントとなるだろう.
 本書を貫くキーワード「スキーマ」は「氷山の水面下の知識」とも言い換えられている.英語の単語や表現を真に習得するためには,それを取り巻く百科辞典的な知識たる「スキーマ」を習得することが必要である.英語の単語や表現の習得のためには,確かに必要である.
 (ここからは我田引水にて失礼.)一方,英語という言語を理解するためには,英語のスキーマを理解しておく必要がある.英語を取り巻く社会言語学的な環境であるとか,英語を英語たらしめてきた歴史(=英語史)に関する知識である.これは氷山の水面下にある百科辞典的な知識であり,自然には身につけることができない.やはり能動的に学んでいく必要がある.
 本書を読み,英語史は「英語のスキーマ」「英語という氷山の表面化の知識」の一部を構成するものだったのだな,と気づいた次第.

 ・ 今井 むつみ 『英語独習法』 岩波書店〈岩波新書〉,2020年.

[ | 固定リンク | 印刷用ページ ]

2021-01-05 Tue

#4271. -ly が2つ続く副詞 -lily の事例を Helsinki Corpus で検索 [corpus][hc][adverb][suffix][-ly][haplology]

 「#4268. -ly が2つ続く副詞 -lily は稀である」 ([2021-01-02-1]),「#4270. 後期近代英語には -ly が2つ続く副詞 -lily がもっとあった」 ([2021-01-04-1]) で取り上げてきた話題の続き.今回は Helsinki Corpus を利用して,通時的に -lily 副詞の用例を集めた.
 問題の接尾辞は,古い英語では現代的な -ly のみならず,-li, -lic, -lich, -liche など様々な綴字で現われていた(cf. 「#1773. ich, everich, -lich から語尾の ch が消えた時期」 ([2014-03-05-1]),「#1810. 変異のエントロピー」 ([2014-04-11-1]),「#40. 接尾辞 -ly は副詞語尾か?」 ([2009-06-07-1])).そこで,歴史的な異綴字を広くカバーする Perl 対応の正規表現として "\B(?<!s)l[iy]l[yi](ch?)?(e(r|st)?)?\b" を設定した.これで Helsinki Corpus に検索をかけたところ,古英語からは該当例が1つも挙がってこなかったが,中英語以降からいくつかの用例が得られた.

[ M1 (1150--1250) ]

 ・ CMSAWLES(14658): ter hire; turne+d <P 178> ham treowliliche to wit hare lauerd. & to +teos fowr sus

[ M2 (1250--1350) ]

 ・ CMAYENBI(7376): te+t +tet we loki ine oure herte holylyche +tane holy gost +tet is oure wytnesse.

[ M3 (1350--1420) ]

 ・ CMBOETH(11516): , "see now how thou mayst proeven holily and withoute corrupcioun this that I ha
 ・ CMBOETH(49069): is, or elles thei scholden fleten folyly. "For whiche it es that alle thingis se
 ・ CMCLOUD(50919): peke +tus childly, & # as it were folily and lackyng kyndly discrecion; for I do
 ・ CMCTPROS(21119): surably, <P 234.C1> for they that folily wasten and despenden the goodes that th
 ・ CMCTVERS(35881): at moste I thynke. I have my body folily despended; Blessed be God that it shal
 ・ CMWYCSER(2866): eth herynne +tat God may not iuge folily ony man; and so, as oure wille ha+t ned
 ・ CMWYCSER(45437): kyng, he wolde not +tus reigne worldlily, ne # hym was owed no sych rewme, si+t

[ M4 (1420--1500) ]

 ・ CMGAYTRY(5492): +tat Haly Kirke, oure modire, es hallyly ane thorow-owte +te werlde, that es, #
 ・ CMGAYTRY(8961): +te thre +tat ere firste, awe vs hallyly to halde anence oure Godd, and +te Seue
 ・ CMROLLPS(48489): . bot be ware that +ge deme # not folily him that is goed, wenand that he be ill
 ・ CMROLLTR(3701): erue +tam mekely, and gladly and lawlyly, +tat +tay may wyn +tat Godde hyghte to

[ E1 (1500--1569) ]

 ・ CEFICT1A(24697): that some curatys that loke full holyly be but desemblers & ypocrytis. <S SAMPL

[ E2 (1570--1639) ]

 ・ CEBOETH2(7618): Looke how proonest thou that most holyly & without spot, that we say God is the

[ E3 (1640--1710) ]

   用例なし

 以上のように,Helsinki Corpus で確認する限り,歴史的にも -lily 副詞は低頻度だったようにみえるが,この段階で一般的なことを結論づけるのは控えておきたい.各時代に注目したもっと大規模なコーパスを利用し,頻度をとった上で結論づける必要があるだろう.
 これまで数回にわたって「-ly が2つ続く副詞 -lily」問題について考えてきたが,語源・語形成の観点から1つ留意しておくべき点がある.今回あるいはこれまでの記事で例示してきた副詞のうち follily, holily, jollily, melancholily, oilily, sillily 等については,外側の -ly を取り除いた後に基体形容詞の末尾に残る -ly は,実は形容詞を作る接尾辞 -ly そのものではなく,語幹の一部だったり,あるいはそれに別の接尾辞 -y が付随したものだったりする.このような語源的組成も -lily 副詞の許容可能性に影響してくるものと疑われるが,どうだろうか.今後も考え続けていきたい.

Referrer (Inside): [2021-01-16-1]

[ | 固定リンク | 印刷用ページ ]

2021-01-04 Mon

#4270. 後期近代英語には -ly が2つ続く副詞 -lily がもっとあった [corpus][clmet][lmode][adverb][suffix][-ly][haplology]

 「#4268. -ly が2つ続く副詞 -lily は稀である」 ([2021-01-02-1]) の記事で,接尾辞 -ly が2つついて -lily の形態を示す副詞が,現代英語においては稀であることを確認した.調音上の都合による haplology (重音脱落)の効果とみてよいだろう.
 しかし,古い英語においても同じ「調音上の都合」が効いていたかどうかは別途調べなければならない.というのは,中英語テキストを読んでいると,-lily のような副詞に出会うことがままあるからだ.歴史の過程で haplology を経た形態が一般的になってきたのではないかと,私は疑っている.
 まずは,現代の直近の時代である後期近代英語について調べてみたい.同時期のコーパス CLMET3.0 に登場してもらおう.このコーパスに対して,(いろいろ試行錯誤した挙げ句にたどりついた)"\B(?<!s)l[iy]l[yi](ch?)?(e(r|st)?)?\b" という Perl 対応の正規表現にて検索をかけてみた.その結果を,3つの時期ごとに整理したのが以下である.

 ・ 第1期(1710--1780年): surlily (11 times), livelily (3), sillily (2), immortalily (1), jollily (1) --- total 18 examples
 ・ 第2期(1780--1850年): surlily (13), holily (3), jollily (2), sillily (2), lovelily (1) --- total 21 examples
 ・ 第3期(1850--1920年): sillily (2), surlily (2), jollily (1), melancholily (1), lovelily (1), oilily (1), statelily (1) --- total 9 examples

 前回の記事 ([2021-01-02-1]) で示した現代英語の BNCweb から取り出した事例と比べてみると分かるように,後期近代英語期にも -lily として現われる副詞の種類には緩い傾向がありそうだ.jollily, sillily, surlily などは低頻度ながらも,どの時期にも現われている.
 約1億語からなる BNCweb から取り出せたのは実質的に15例,約3,400万語からなる CLMET から取り出せたのは48例.この単純な調査と比較だけで一般的に結論づけることはできないが,後期近代英語期では現代英語期よりも -lily 副詞が現われていた(許容されていた?)ようにみえる.

Referrer (Inside): [2021-01-16-1] [2021-01-05-1]

[ | 固定リンク | 印刷用ページ ]

2020-12-29 Tue

#4264. XXX Made Easy というタイトル (2) [syntax][clmet][eebo][corpus]

 昨日の記事 ([2020-12-28-1]) に引き続き続き,入門書などのタイトルに用いられる標記の表現について.昨今の本では定番文句となっているが,その走りがいつだったのか気になってきた.いくつかの歴史コーパスでざっと調べてみたが,そのうち2つを紹介.
 まず現代にほど近い時期から.後期近代英語のコーパス CLMET3.0 で検索してみると,第3期 (1850--1929) から "Atheism made easy" が挙がってきた.さらにさかのぼって第1期 (1710--1780) からも Farriery made Easy なる例が得られた.
 となれば,もっと早い時期の例を求めて初期近代英語期の EEBO Online corpus に当たってみたくなる.そこで探し出したのが,Thomas Edwards (1599--1647) なる著者が1644年に出した "Antapologia, or, A full answer to the Apologeticall narration of Mr. Goodwin, Mr. Nye, Mr. Sympson, Mr. Burroughs, Mr. Bridge, members of the Assembly of Divines wherein is handled many of the controversies of these times, viz. ... : humbly also submitted to the honourable Houses of Parliament" という本だ.(当時の本は,タイトルというよりは説明書きというべき,このように長いものが多い).その一部を引用する.

dialling made easy: or, tables calculated [.] # for the latitude of oxford, (but will serve without sensible difference for most parts of england:) by the help of which, and a line of chords, the hour-lines may quickly and exactly be described upon most sorts of useful dials: [.] # with some brief directions for making two sorts of spot-dials:


 EEBO から取り出したこの文脈は完全なものではなく,明確には分からないところもあるのだが,dialling は日時計・羅針盤による時間測量の技術のことのようだ.すでに当時より XXX Made Easy が現代のような定番文句になっていたかどうかは怪しいにせよ,その走りの1例とみることはできるのかもしれない.
 さらに中英語までさかのぼってみようと思ったが,ここで時間切れ.ここまででも十分にさかのぼった感あり.

[ | 固定リンク | 印刷用ページ ]

2020-12-17 Thu

#4252. COCA と BNCweb でみる color vs colour [coca][bnc][corpus][ame_bre][spelling]

 アメリカ式綴字 color とイギリス式綴字 colour をめぐる問題について,本ブログでは何度も取り上げてきた.綴字の米英差の代表例としてよく知られており,分かりやすい問題であるということもあるが,英語史的には意外と深掘りできる魅力的な問題だからでもある.
 しかし,最も基本的な事実確認 --- 現代のアメリカ英語とイギリス英語で colorcolour の各々の分布はどうなっているのかの調査 --- を行なわずいたことに気づいた.ということで,今回は現代アメリカ英語の代表的コーパス COCA と,イギリス英語の BNCweb で調べてみることにした.colo(u)r の屈折形,派生語,複合語を含めて網羅的に行なうのが理想だが,今回はレンマ検索を利用して,colo(u)r, colo(u)rs, colo(u)red (以上は屈折形として), colo(u)rful, colo(u)rless, discolo(u)r の6種類の語形の取り出しにとどめた.

COCA による <color> と <colour> の頻度
語形<or><our><or> 比率
COLOR124,7784,7920.9630
COLORS33,2251,8860.9463
COLORED5,5531790.9688
COLORFUL10,8714120.9635
COLORLESS1,000570.9461
DISCOLOR11001.0000

BNCweb による <color> と <colour> の頻度
語形<or><our><our> 比率
COLOR11511,3320.9900
COLORS244,3960.9946
COLORED142,4320.9943
COLORFUL61,0930.9945
COLORLESS41660.9765
DISCOLOR1190.9500


 COCA を用いたアメリカ英語の調査によれば,アメリカ式の <or> が,予想通りに圧倒的な95%前後の比率で用いられている.しかし,逆にいえば,5%ほどはイギリス式とされる <our> が用いられているというのも,とりわけ次のイギリス英語の状況と比較すると興味深い.
 BNCweb を用いたイギリス英語の調査結果をみてみると,99%ほどというほぼ完全な比率でイギリス式の <our> が用いられている.アメリカ綴字を用いている少数の例を確認してみると,引用符に囲まれた短いタイトルらしきもの(アメリカ系由来の可能性があるもの)のなかで用いられているのが散見され,それを差し引いて考えることが許されるのであれば,さらに <our> は100%に近づく.この点では,イギリス英語のほうが綴字慣習についてより一貫しており,アメリカ英語は若干の寛容さを示すといえるかもしれない.
 以上,標題の米英差の問題について事実確認した.

[ | 固定リンク | 印刷用ページ ]

2020-12-04 Fri

#4239. oddly enough, interestingly enough などの表現における enough (2) [clmet][corpus][adverb][eurhythmy]

 昨日の記事 ([2020-12-03-1]) に引き続き,文副詞となる oddly enough などの表現について.OED によると1704年に whimsically enough として初出したことが確認されるので,およそ後期近代英語期にかけて生まれ,育まれた表現である可能性が高い.とすれば,まず当たるべきコーパスは CLMET3.0 である.約3,400万語からなる,1710--1920年のイギリス英語のバランスコーパスだ.第1期 (1710--1780),第2期 (1780--1850),第3期 (1850--1929) と3期に分けて,関連する例を収集してみた.コンコーダンスラインはこちらからどうぞ(ただし,今回注目している用法ではなく「十分に〜に」を意味する通常の用法の例も多く混じっているので精査する必要がある).
 コンコーダンスラインをざっと眺めて気づくことは,18世紀の大半を含む第1期から,そこそこの数の例が挙がってくることだ.enough に前置される副詞として generously, gracefully, humorously などが散見される.いくつかランダムに例を示そう.

 ・ Generously enough, indeed, were I to be his; and had given him to believe that I would.--But that I have not done.
 ・ gracefully enough, I cannot but say; an advantage which travelled gentlemen have over other people.
 ・ These my father, humorously enough, called his beds of justice;
 ・ Footnote 82: Philelphus, absurdly enough, derives this Greek or Oriental jealousy from the manners of ancient Rome.
 ・ This was hastened by a temporary coalition between Fox and Pitt, which was occasioned, naturally enough, by the ill-treatment they had both received from the Duke of Newcastle.

 第2期,第3期からも続々と例が挙がってくるが,現代的な oddly, strangely, curiously といった副詞との共起が目立ってくる.

 ・ Oddly enough, it happened. Mine honest friend Hector came in before dinner to ask a copy of my seal of Arms, with a sly kindliness of intimation that it was for some agreeable purpose.
 ・ Ha, ha, ha! [Taking Roope's arm.] Oddly enough---oddly enough, the story deals with the very subject we've been discussing.
 ・ His name was Agostino Mosti; and, strangely enough, he was the person who had raised a monument to Ariosto, of whom he was an enthusiastic admirer.
 ・ Strangely enough, Rogers was at first dissatisfied with the offer, holding that the sum should be paid for the new volumes alone.
 ・ Curiously enough, although Adam Smith was immersed in abstract speculations, his "homely sagacity" led him to the most practical results;
 ・ Curiously enough, this novel consists of two perfectly distinct narratives;

 このようにコーパスによる調査結果を概観してみるだけでも,18世紀以降,共起する副詞の種類においても頻度においても,順調に分布を拡げ定着してきた表現といってよさそうである.enough を付加することでリズムがよくなるという効果 (eurhythmy) のほか,文副詞であることを明示する機能があるのかもしれない.

Referrer (Inside): [2020-12-05-1]

[ | 固定リンク | 印刷用ページ ]

2020-12-03 Thu

#4238. oddly enough, interestingly enough などの表現における enough (1) [adverb][semantics][bnc][corpus][collocation][eurhythmy]

 以前より不思議に思っていた表現がある.enough という卑近な副詞を用いた表現なのだが,典型的に -ly 副詞に enough が後置され,文頭位置あるいは挿入句として生起するものだ.例をみるのが早い.BNCweb より挙げてみよう(問題の句はイタリック体にしてある).なお,検索窓には "*ly_{ADV} enough" と入力した.

 ・ Oddly enough, many parliaments expect to modify government plans, which takes time.
 ・ Her large grin and knotted black curls were, strangely enough, more memorable.
 ・ I had a dream last night funnily enough about Leeds (I dont normally --- honest!).
 ・ Interestingly enough, even hens and rats have been found to consume more calories when they are offered a varied diet than when they are fed `the same old thing' all the time.
 ・ Naturally enough, those who commit crimes will tend to conceal their actions and protect themselves.

 それぞれ「妙なことに」「奇妙なことに」「滑稽なことに」「興味深いことに」「当然のことに」を意味する,いわゆる文修飾の副詞句である.文修飾であるから,統語的には文頭に現われたり,挿入的に用いられたりすることは不思議ではない.理解しかねるのは,enough の役割である.なぜ「十分に」が添えられているのだろうか.enough が省略されたところで,前置されている副詞単体でも文修飾として同じように機能するのだ.副詞単体ではやや寂しく感じられ,たいした強調ともならない enough を添えることでリズムを良くする程度の効果 (eurhythmy) はありそうだが.
 enough に前置されることの多い副詞の種類としては,ヒット数の多い順に20個を挙げると oddly, quickly, strangely, funnily, interestingly, early, easily, naturally, curiously, clearly, appropriately, only, seriously, barely, ironically, nearly, surprisingly, badly, reasonably, hardly となる.しかし,quickly, early, easily などは,今回注目する用法としてではない例(つまり「十分に素早く」などの通常の用法)によって頻度が高くなっているにすぎない.注目する用法で現われる最も典型的な10語を選べば,oddly, strangely, funnily, interestingly, naturally, curiously, appropriately, ironically, surprisingly, reasonably あたりとなる.
 この用法が生起する分布に注意すると,書き言葉にも話し言葉にも現われており,メディアによる違いはないといってよい(いずれも 18 wpm 程度).使用者の男女差や世代差でみても,特に目立った分布上の特徴ははない.テキストタイプとしては Fiction and verse で相対的に高い値 (27.01 wpm) を示すが,際立っているわけでもない.多くの異なるレジスターで用いられているのが実態である.
 改めて enough の意味の問題に立ち戻ろう.この enough は意味論的にはかなり薄いものと言わざるを得ない.実際『ジーニアス英和大辞典』によれば,この enough には「十分に」の意味はほどんどない旨,言及がある.また,OED の enough, adj., pron., and n., and adv.C. adv. 2 にも "With the idea of satisfying a requirement reduced or absent." とあり,何のために「十分な」のかについて「何」の前提が薄くなってしまった語義が立てられている.その下位区分 (b) として与えられているのが,まさに今問題にしている用法で,次のように説明がある.

(b) With a sentence adverb, as in aptly enough.

   See also funnily enough at FUNNILY adv. 2, oddly enough at ODDLY adv. 5b.

   1704 W. Nicolson Diary 22 Nov. in London Diaries (1985) 231 The Text of the Book (whimsically enough) in Vermilion-Letters, instead of an Italic Character.
   1783 Ld. Hailes Disquis. Antiq. Christian Church ii. 15 Which, aptly enough, might be denominated the journals of the senate.
   1912 E. V. Baxter & L. J. Rintoul Rep. Sc. Ornithol. 3 Curiously enough, both the Common Nightingale .. and the Northern Nightingale .. were added in spring to the Scottish list.
   2015 H. Scales Spirals in Time ix. 249 A mollusc named, appropriately enough, the Windowpane Oyster.


 この用法での初例が1704年となっているので,はるばる古英語 geōg にさかのぼる古参の副詞とはいえ,別の副詞に前置される問題の表現は,なかなかモダンらしい.

Referrer (Inside): [2020-12-05-1] [2020-12-04-1]

[ | 固定リンク | 印刷用ページ ]

2020-11-12 Thu

#4217. 後期近代英語期のイギリス英語における colour vs color [clmet][corpus][ame_bre][spelling]

 綴字の英米差の典型例の1つとされる colour vs color の問題については,本ブログで以下の記事などで取り上げてきた.

 ・ 「#3182. ARCHER で colourcolor の通時的英米差を調査」 ([2018-01-12-1])
 ・ 「#3247. 講座「スペリングでたどる英語の歴史」の第5回「color か colour か? --- アメリカのスペリング」」 ([2018-03-18-1])
 ・ 「#4152. アメリカ英語の -our から -or へのシフト --- Webster の影響は限定的?」 ([2020-09-08-1])
 ・ 「#4161. アメリカ式 color はラテン語的,イギリス式 colour はフランス語的」 ([2020-09-17-1])
 ・ 「#4169. GloWbE --- Corpus of Global Web-Based English」 ([2020-09-25-1])

 綴字に限らず英語における英米差の事例は多々あるが,歴史的にみると,これらの差異は,あるタイミングで突如として生じたというよりも,時間をかけて成立し,確立してきたというのが事実である.アメリカ英語的とされる color の綴字が定着するのにも,[2018-01-12-1], [2020-09-08-1] の記事でみたように,19世紀中の数十年という時間がかかっているし,イギリス英語的とされる colour にしても,後期近代英語期中にライバルの color を駆逐するには至っていない.後者の状況について,今回,1710--1920年のイギリス英語コーパスで,約3,400万語からなるジャンルを整理したバランスコーパス CLMET3.0 を用いて調査してみた.
 調査対象は,colo(u)r のみならず,これを語幹にもつ各種の接頭辞や接尾辞を付した語形で,bicolor, colorless, colouration, discoloured など様々な種類をも含む.以下,3区分した時代別の頻度数を示す.

Period (subcorpus size)colourcolor
1710--1780 (10,480,431 words)1,273 (88.28%)169
1780--1850 (11,285,587)1,650 (83.71%)321
1850--1920 (12,620,207)3,242 (94.11%)203


 3期を通じて colour 系が圧倒的であることは確認できるが,それでもライバルの color 系も完全に駆逐されてはおらず,なんとか持ちこたえていることが分かる.英語の英米差について,ともすれば A か B かというデジタルな問題のように思われがちだが,必ずしもそうではなく,程度のあるアナログの問題であることも多い.あるいは,たとえ共時的にはデジタル的な振る舞いを示しているようにみえたとしても,通時的にみればアナログ的に推移してきたことのほうが多いのである.

Referrer (Inside): [2020-11-13-1]

[ | 固定リンク | 印刷用ページ ]

2020-10-30 Fri

#4204. コーパス言語学の基本的な用語を解説 --- concordance [terminology][corpus][hel_education][collocation]

 昨日の記事 ([2020-10-29-1]) に引き続き,コーパス周りの用語を解説する.
 concordance とは,もともとは「用語索引」ほどを意味し,ある本に出てくる単語を1つ1つ取り出してアルファベット順にリスト化したものである.その本に例えば the という単語が何回出現したか,さらに具体的にどこに出現したがが分かるような作りになっていることもあり,文献学研究や言語研究では馴染みのツールだった.聖書のコンコーダンスやChaucer のコンコーダンスなどがよく知られている.
 しかし,電子コーパスが普及してからは,concordance という用語は別の意味でも用いられるようになった.昨今の電子コーパスで何らかの語なり表現なりを検索式の形にして検索すると,その条件にあった形式を含む例文がコーパス全体から収集され,ずらっと画面上に提示される.この全体が,その形式の concordance ということになる.そして,例文を含む個々の行のことを concordance line と呼ぶ.たとえていえば,ある単語を Google 検索して1万件ヒットしたという場合,その1万件全体が concordance ということになり,その1件1件が concordance line ということになる.
 たいていのコーパス検索では,注目している形式の前後にどのような語が共起しているかを知りたいことが多いので,注目する形式が各 concordance line の中央に位置するように表示されると都合がよい.前後の文脈 (context) も合わせてその形式の用例を確認できることから,この表示法はコーパス研究ではある種のデフォルトといってよく,KWIC (= Key Word in Context) という名前すらついている.
 昨日の記事で取り上げたが,BNCweb で "{love/V}" として検索してみると,14,195行もの concordance lines が得られる.その先頭の10行ほどを KWIC で表示すると,次のようになる.読みやすいし分析しやすい表示法であることがわかるだろう.

{love/V} in KWIC view, BNC

 このように電子コーパスでは,ある形式の concordance が容易に得られる.もちろん concordance を産出するプログラムが背後で動いてくれているおかげであり,そのようなプログラムやアプリケーションを concordancer と呼んでいる.

[ | 固定リンク | 印刷用ページ ]

2020-10-29 Thu

#4203. コーパス言語学の基本的な用語を解説 --- lemma [terminology][corpus][hel_education][lexicology][pos][verb][conjugation][inflection]

 先日,大学の授業でコーパスセミナーを開催した.BNCweb, COCA, COHA, EEBO Online corpus などの代表的な共時的・通時的英語コーパスに初めて触れる学部生に,使用経験者である大学院生が講師としてコーパス利用のいろはを指南するという Zoom によるオンライン企画である.
 一見,コーパス利用というのは初心者にはハードルが高いと思われがちが,適切な導入があれば,複雑な検索や応用的な利用法は別にしても,十分にその日から便利に使いこなすことができる.
 しかし,意外と落とし穴となり得るのは,コーパス周りの用語 (terminology) かもしれない.例えば「love を動詞で POS 指定して lemma 検索をし,その concordance line を KWIC で表示させ,前後数語のフレームで collocation を取ってから log-likelihood を出しておいてね.必要に応じて noise をマニュアルで除去しておいてよ.」などという指示を,初心者の誰が理解できようか! ということで,コーパス周りの術語(というよりもジャーゴン)を少しずつ解説してきたい.
 今回は lemma (レンマ,レマ)について.平たくいえば,辞書を念頭においた上でその「見出し語」だと思えばよい.動詞 love を例に取れば,実際の英文のなかでは,不定詞・現在形・命令形など love という裸の形態で生起することもあれば,3単現の loves として出現することもあるし,過去(分詞)形の loved や現在分詞・動名詞形の loving で現われることもあるだろう(「崩れた」lovin' 等として起こるかもしれない).love のこれらの諸形態は,確かに互いに少しずつ異なっているが,各々が異なる単語というわけではない.あくまで代表的・抽象的な love という動詞の,具体的な変化形にすぎないのである.このような代表的・抽象的な存在を lemma と呼んでいる.I love you. のように love という形態で出てきたとしても,これは love という lemma の,直説法1人称単数現在形の具体的な現われとしての love である.両者はたまたま形態的に一致しているけれども,あくまで前者は抽象的な love,後者は具体的な love として概念上は区別する必要がある.
 別の角度からみれば,私たちが英単語学習の際に習得する主たるものは,個々の見出し形ともいえる lemma と,その具体的な諸変化形ということになる.これらのワンセットが内部で適切にヒモづけられ,頭の中で整理されていれば,その単語に関して習得が完了していることになる.このワンセットとそれにつけられた名前こそが lemma なのである.
 「コーパスでlove を動詞で lemma 検索してね」というのは「動詞として用いられている love, loves, loved, loving などの例をすべて拾ってきてね」と言い換えられる.例えば BNCweb の場合には,検索式を "{love/V}" のように指定することで上記の lemma 検索が可能である.

Referrer (Inside): [2020-10-30-1]

[ | 固定リンク | 印刷用ページ ]

2020-10-19 Mon

#4193. インド系英語における discuss about [verb][indian_english][glowbe][corpus][accommodation]

 先月教えてもらったばかりの「#4169. GloWbE --- Corpus of Global Web-Based English」 ([2020-09-25-1]) を用いて,しかもつい数日前に院生の指摘からインスピレーションを受けた標題の話題について調べてみた.その意味では完全に人頼みの記事です(←ありがとうございます).
 標準英語では discuss は他動詞であり,前置詞を伴わずに直後に目的語を要求する.日本語母語話者としては,訳語がたいてい「〜について論じる」となるので,about 辺りの前置詞を介在させたくなり,discuss about としてしまうことがあるのだが,これは規範文法的には誤用とされる.しかし,実際には discuss about も耳にしたり目にする機会がある.インド英語などで広く行なわれる表現であるということは聞いたことがあった.
 そこで,現代の世界英語変種を比較できるコーパス GloWbE (= Corpus of Global Web-Based English) の出番である.難しいことはない,検索欄に "discuss about" を入力するだけである.この超簡単な検索だけで,超おもしろい結果を味わうことができる.自動的に出力されたチャートは次の通り.

Search of

 横方向のほぼ中央(ちょっとだけ左寄り)の一群で棒グラフが相対的に高い値を示している.この近辺はインド(亜大陸)系英語の数値である.統計学的な検定をかけるまでもなく,明らかに左右両端の英語変種とは異なる分布を示す.
 バングラデシュやインド等の南アジア圏を相手とする21世紀の商談においては,accommodation 理論に従い,われわれ極東アジア人も "Shall we discuss about our business?" と始めたほうがビジネスの成功率は高そうだ.
 コーパス利用はとかく苦手意識により敬遠されることが多いのだが,これくらいのところから始めてもよいのでは.

[ | 固定リンク | 印刷用ページ ]

2020-09-25 Fri

#4169. GloWbE --- Corpus of Global Web-Based English [glowbe][corpus][ice][englishes][world_englishes][variety][ame_bre][spelling]

 「#4166. 英語史の各時代のコーパスを比較すれば英語史がわかる(かも)」 ([2020-09-22-1]) で触れた World Englishes のコーパス GloWbE (= Corpus of Global Web-Based English) を少し試してみた.(先日の駒場英語史研究会にて本コーパスを導入していただきました菊地翔太先生(明海大学)には,改めて感謝します.)
 このコーパスは20カ国からの英語変種を総合した19億語からなる巨大コーパスで,変種間の比較が容易に行なえる仕様となっている.変種間比較についていえば,私はこれまで「#517. ICE 提供の7種類の地域変種コーパス」 ([2010-09-26-1]),「#1743. ICE Frequency Comparer」 ([2014-02-03-1]) などで取り上げたように ICE (International Corpus of English) しか知らなかったのだが,コーパスの世界は急速に進化しているようだ.GloWbE のインターフェースは,COCA (Corpus of Contemporary American English) や COHA (Corpus of Historical American English) などと共通なので,そちらに慣れたユーザーであれば,とっついやすいはずだ.
 きわめて単純な使い方ではあるが,GloWbE の最大の売りである変種間比較を colorcolour のスペリングに関して行なってみた.一般に color はアメリカ式,colour はイギリス式のスペリングといわれるが,この2変種間の比較に満足せず,20変種間で比べてみようという試みだ.インターフェースより単純に Chart 出力機能を選択し,各々のスペリングで検索し,返された図表を眺めるだけなのだが,それだけでも十分におもしろい.まずは,アメリカ式 color の図表から.



 次に,イギリス式 colour の図表を挙げよう.



 横方向の中央辺りに東南アジアの国々が集まっており,歴史的にはイギリス式が多いと予想される地域なわけだが,実はアメリカ式スペリングのほうが優勢のようだ.近年の英語のアメリカ化 (americanisation) の影響が疑われよう.一方,左側には(米国を除く)アングロサクソン系諸国が集まっており,そこでは予想通りにイギリス式が優勢である.右側に集まっているアフリカ諸国では,両スペリングの差はさほど大きくない.
 color vs colour の問題を米英間の問題として論じる時代は過ぎ去りつつある.凄いツールが出てきたものである.

Referrer (Inside): [2020-11-12-1] [2020-10-19-1]

[ | 固定リンク | 印刷用ページ ]

2020-09-22 Tue

#4166. 英語史の各時代のコーパスを比較すれば英語史がわかる(かも) [academic_conference][corpus][eebo][glowbe][laeme][lalme][historiography][standardisation]

 一昨日の9月20日(日),2020年度駒場英語史研究会にて,特別企画「電子コーパスやオンライン・リソースを使った英語史研究 ― その実践と可能性」に発表者として参加しました.Zoom でのオンライン大会でしたが,円滑に会が進行しました.(企画のご提案から会の主催までお世話になりました寺澤盾先生(東京大学),発表者の家入葉子先生(京都大学)と菊地翔太先生(明海大学),および参加者すべての方々には,貴重な機会とインスピレーションをいただきました.お礼申し上げます.)
 トップバッターの私自身の発表では「LAEME & LALME を用いた英語史研究入門」と題して,中英語を代表する2つの姉妹コーパス LAEMEeLALME を紹介しました.続いて,家入先生の「データベースの利用によるコーパス言語学 --- Early English Books Onlineを中心に」と題する発表では,初期近代英語期を代表するコーパス EEBO Online corpus が紹介されました.最後に,菊地先生による「Corpus of Global Web-Based English(GloWbE)を用いた World Englishes 研究の可能性」という発表により,21世紀の World Englishes 時代を象徴する GloWbE が導入されました(←私にとって未知だったので驚きの連続でした).
 各々の発表はコーパスの紹介とデモにとどまらず,その可能性や「利用上の注意」にまで触れた内容であり,発表後のディスカッションタイムでは,英語史研究においてコーパス利用はどのような意義をもつのかという方法論上の肝心な議論にまで踏み込めたように思います(時間が許せば,もっと議論したいところでした!).
 中英語,近代英語,21世紀英語という3つの異なる時代の英語を対象としたコーパスを並べてみたわけですが,研究会が終わってからいろいろと考えが浮かんできました.同じ英語のコーパスとはいえ,対象とする時代が異なるだけで,なぜ検索の仕方も検索の結果もインターフェースもここまで異なるのだろうかということです.その答えは「各々の時代における英語の(社会)言語学的事情が大きく異なっているから,それと連動して(現代の研究者が編纂する)コーパスのあり方も大きく異ならざるを得ない」ということではないかと思い至りました.
 逆からみれば,各時代のコーパスがどのように編纂され,どのように使用されているかを観察することにより,その時代の英語の(社会)言語学的事情が浮き彫りになってくるのではないか,ということです.そうして時代ごとの特徴がきれいに浮き彫りになってくるようであれば,それを並べてみれば,ある種の英語史記述となるにちがいない.換言すれば,各時代のコーパス検索に伴うクセや限界みたいなものを指摘していけば,その時代の背後にある言語事情が透けて見えてくるのではないかと.ここから「コーパスのあり方からみる英語史」のような試みが可能となってきそうです.
 時代順にみていきます.中英語期は標準形が不在なので,ある単語を検索しようとしても,そもそもどの綴字で検索すればよいのかという出発点からして問題となります (cf. 「#1450. 中英語の綴字の多様性はやはり不便である」 ([2013-04-16-1])).実際,中英語辞書 MED である単語を引くにしても,そこそこ苦労することがあります.LAEME や LALME でも検索インターフェースには様々な工夫はなされていますが,やはり事前の知識や見当づけが必要ですので,検索が簡単であるとは口が裂けても言えません.現実に標準形がないわけですから,致し方がありません.
 次に初期近代英語期ですが,EEBO は検索インターフェースが格段にとっつきやすく,一見すると検索そのものに問題があるようには見えません.しかし,英語史的にはあくまで標準化を模索している時代にとどまり,標準化が達成された現代とは事情が異なります.つまり,標準形とおぼしきものを検索欄に入れてクリックしたとしても,実は拾い漏れが多く生じてしまうのです.公式には実装されているとされる lemma 検索も,実際には思うほど精度は高くありません.落とし穴がいっぱいです.
 最後に,21世紀英語の諸変種を対象とする GloWbE については,(ポスト)現代英語が相手ですから,当然ながら標準形を入力して検索できます.しかし,BNC や COCA のような「普通の」コーパスと異なるのは,返される検索結果が諸変種に由来する多様な例だということです.
 大雑把にまとめると次のようになります.

 代表コーパス検索法などに反映される「コーパスのあり方」(社会)言語学的事情
中英語LAEME, LALME検索法が難しい標準形がない
初期近代英語EEBO検索法が一見すると易しい標準形が中途半端にしかない
21世紀英語GloWbE検索法が易しい標準形はあるが,その機能は変種によって多様


 異なる時代のコーパスを比べてみると,英語史がみえてくるということがよく分かりました.駒場英語史研究会での発表の機会をいただき,改めて感謝します.

Referrer (Inside): [2020-09-25-1]

[ | 固定リンク | 印刷用ページ ]

2020-06-25 Thu

#4077. MED の辞書としての特徴 [lexicography][dictionary][med][me][corpus][website][link][bibliography][onomastics]

 昨日の記事「#4076. Dictionary of Old EnglishDictionary of Old English Corpus」 ([2020-06-24-1]) に引き続き,英語史研究にはなくてはならないツールについて.中英語研究といえば,何をおいても MED を挙げなければならない (Kurath, Hans, Sherman M. Kuhn, John Reidy, and Robert E. Lewis. Middle English Dictionary. Ann Arbor: U of Michigan P, 1952--2001. Available online at http://quod.lib.umich.edu/m/med/) .昨日の DOE と DOEC の関係と同様に,MED にも関連する MEC というコーパスがあり,こちらもたいへん有用である (MEC = McSparran, Frances, ed. Middle English Compendium. Ann Arbor: U of Michigan P, 2006. Available online at http://quod.lib.umich.edu/m/mec/) .
 MED は1952年に最初の小冊が出版され,1991年に最後の小冊が出版されて完成した.その後,2000年にオンライン版の Middle English Compendium に組み込まれ,使い勝手が大幅に向上した.細かな検索ができることはもちろん,hyperbibliography の充実振りが嬉しい.56,000件ほどの見出し語を誇る中英語最大の辞書であることはいうにおよばず,中英語研究史上の最大の成果物といえる.2018年にはほぼ20年振りの改訂版が公開され,現在も中英語研究の第一線を走っている.
 MED には,使用に当たって知っておくべきいくつかの特徴がある.Durkin (1150--52) に拠って指摘しておこう.まず,MED は,語義に多くの注意を払う辞書だということだ.OED ではある語の語形を大きな基準として記述を仕分けているが,MED のエントリーの最大の構成原理は語義である.ある意味では語形の違いなどは方言差と割り切って,LALME や LAEME に委ねているといった風である.しかし,この語義優先という特徴により,語学的な研究のみならず,文化的,歴史的な研究にも資するツールとなっているという側面がある.
 語義の重視と関連して,MED は該当語の固有名詞としての使用にも意を払っている.たいてい最後の語義として言及されるが,これは固有名詞研究や歴史研究に有用である.多言語テキストに記されている英語の地名なども拾い上げられており,他言語文献や言語接触の研究にも資する情報である.
 MED で惜しむらく点は,語源記述が少ないことだ.直前の古英語形や借用語であればソース言語での形態などを挙げているにとどまり,深みがない.
 最後に指摘しておくべきは,例文に付されている年代について,(1) 写本(証拠)そのものの年代と,(2) テキストが作成されたとおぼしき年代とが,分けて記されている点である(後者はカッコでくくられている).両年代を念頭におけば,例えば異写本間での語形の比較に際して貴重な判断材料となるだろう.この重要な情報は,diplomatic な読みを追求する文献学的な関心に答えてくれる可能性を秘めている.
 関連して「#4016. 中英語研究のための基本的なオンライン・リソース」 ([2020-04-25-1]) も参照.

 ・ Durkin, Philip. "Resources: Lexicographic Resources." Chapter 73 of English Historical Linguistics: An International Handbook. 2 vols. Ed. Alexander Bergs and Laurel J. Brinton. Berlin: Mouton de Gruyter, 2012. 1149--63.

Referrer (Inside): [2020-06-26-1]

[ | 固定リンク | 印刷用ページ ]

2020-06-24 Wed

#4076. Dictionary of Old EnglishDictionary of Old English Corpus [lexicography][dictionary][doe][corpus][oe][website][link][bibliography]

 標題の辞書は,目下進行中の古英語辞書編纂プロジェクトの所産である(cf. 「#3006. 古英語の辞書」 ([2017-07-20-1])).進行中なので未完成ということになるが,現在 The Dictionary of Old English (DOE) のサイト より,Dictionary of Old English: A to I online, ed. Angus Cameron, Ashley Crandell Amos, Antonette diPaolo Healey et al. (Toronto: Dictionary of Old English Project, 2018). の項目をオンラインで閲覧・参照できる(限定利用できる無料版あり).
 この DOE と連動する形で古英語コーパス (DOEC) の編纂も同時に進行しており,Dictionary of Old English Web Corpus よりオンラインでアクセスできるようになっている(限定利用できる無料版あり).現存する古英語の文献資料は語数にして約300万語とされ,網羅的な目録を編纂し,網羅的な検索ツールを作ることは可能な範囲である.DOEC は,そのような目的の下,DOE 編纂プロジェクトの一環として,まず高頻度語を収録したマイクロフィッシュ版が1980年と1985年に公開された.その後,1997年にオンライン版が公開される一方,2005年には A--F までの項目を収録した CD-ROM 版も世に出た.その後も現在に至るまで,編纂者たちの地道な努力によって公開項目が増してきている.
 DOE の各語のエントリーでは,文証されるスペリング,語義や用例,(翻訳テキストの場合)対応するラテン単語などの情報が得られ,OED への参照を含めた参考資料へのアクセスも提供されている.
 この世に完璧なツールはないように,DOE(C) にも使用に際して注意すべき点はある.古英語テキストに複数のバージョンがある場合,文献学的には各々の単語の variants の情報が得られることが望ましいが,DOE(C) ではテキストによってその収録幅に揺れがある.また,語としての variants はおよそ拾い上げられているとしても,統語的,形態的,音韻的な意義をもつ variants にはさほど意が払われていない.さらに,書記上の省略が暗黙のうちに展開されているという点にも注意が必要である.語源情報が与えられていない点も,辞書として残念ではある.
 それでも,古英語研究における DOE の重要性と期待の大きさは計りしれない.OED にも古英語単語は収録されているが,あくまで部分的であり,1150年を超えて生き延びた古英語単語に限定されている.編纂プロジェクトのインスピレーション自体は,OED の初版が完成されつつあった100年ほど前の Craigie のアイディアに由来するというから,実に息の長いプロジェクトなのである.応援していきましょう.
 DOEC については,CoRD (Corpus Resource Database) よりこちらの情報もどうぞ.

 ・ Lowe, Kathryn A. "Resources: Early Textual Resources." Chapter 71 of English Historical Linguistics: An International Handbook. 2 vols. Ed. Alexander Bergs and Laurel J. Brinton. Berlin: Mouton de Gruyter, 2012. 1119--31.
 ・ Traxel, Oliver M. "Resources: Electronic/Online Resources." Chapter 72 of English Historical Linguistics: An International Handbook. 2 vols. Ed. Alexander Bergs and Laurel J. Brinton. Berlin: Mouton de Gruyter, 2012. 1131--48.
 ・ Durkin, Philip. "Resources: Lexicographic Resources." Chapter 73 of English Historical Linguistics: An International Handbook. 2 vols. Ed. Alexander Bergs and Laurel J. Brinton. Berlin: Mouton de Gruyter, 2012. 1149--63.

Referrer (Inside): [2020-06-26-1] [2020-06-25-1]

[ | 固定リンク | 印刷用ページ ]

Powered by WinChalow1.0rc4 based on chalow