hellog〜英語史ブログ     ChangeLog 最新     カテゴリ最新     前ページ 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 次ページ / page 18 (21)

link - hellog〜英語史ブログ

最終更新時間: 2024-11-21 08:03

2015-09-07 Mon

#2324. n-gram [corpus][information_theory][coca][bnc][google_books][statistics][n-gram][collocation][frequency][link]

 情報理論や自然言語処理の分野で用いられる n-gram という分析手法がある.コーパス言語学でもすでにお馴染みの概念であり,共起表現 (collocation) の研究などでは当たり前のように用いられるようになった.種々のコーパスのインターフェースにおいても採用されており,「#607. Google Books Ngram Viewer」 ([2010-12-25-1]) では名前に含まれているほどだし,本ブログでも COCA (Corpus of Contemporary American English) の N-gram データベースを用いて「#956. COCA N-Gram Search」 ([2011-12-09-1]) を実装してきた(その応用は,「#953. 頭韻を踏む2項イディオム」 ([2011-12-06-1]),「#954. 脚韻を踏む2項イディオム」 ([2011-12-07-1]),「#955. 完璧な語呂合わせの2項イディオム」 ([2011-12-08-1]) を参照).BNC では,Explore Words and Phrases from the BNC が利用できる.
 コンピュータを用いた分析手法というと難しそうに聞こえるが,n-gram の考え方は至って単純である.文字レベルの 2-gram (bigram) を考えてみよう.最長の英単語といわれる pneumonoultramicroscopicsilicovolcanoconiosis (「#63. 塵肺症は英語で最も重い病気?」 ([2009-06-30-1])) を例にとる.まず,先頭の2文字1組の pn を取り出す.次に,2文字目に進んで同じように ne を取り出す.3文字目に進んで eu を,4文字目に進んで um を得る.同じように,1文字ずつ右にずらしながら,最後の is まで2文字1組を次々と拾っていく.これで44組の2文字を得たことになる.この組のなかで,ic と co という組み合わせは各々3回起こり,os, si, no, on の組み合わせは各々2回現われ,それ以外の組み合わせはいずれも1度きりである.したがって,この単語において最高頻度の2文字1組は ic と co となる.
 n-gram の単位は,このように文字である必要はなく,音素でもよいし,より大きな単位である形態素や語でもよく,さらに大きな句などのより大きな単位でもよい.英語コーパス言語学では,語という単位で考えるのが普通だろう.Martin Luther King, Jr. の I Have a Dream の演説のテキストで語単位の 4-gram を取ると,最も多い4語の組み合わせは,予想通り "I have a dream" の8回だが,"will be able to" も同じく8回現われる."Let freedom ring from" も7回とよく現われる,等々の分析が可能となる.ここでは4語という「窓」を設定したので 4-gram と呼ばれるが,隣接するいくつの文字を考慮するかにより 1-gram (unigram), 2-gram (bigram), 3-gram (trigram),そして 5-gram 以上ももちろん考えることができる(1-gram の場合,得られるリストは,事実上各語の生起頻度表である).
 巨大コーパスから得られた 2-gram や 3-gram の一覧は,それ自体が共起表現の研究などでは基本データとなるため,ウェブ上でもいろいろと公開されている.日本語では「N-gram コーパス - 日本語ウェブコーパス 2010」があるし,現代英語では COCA の n-gram データベース がある.また,Bigram Plus では,歴史英語コーパスを含めた各種英語コーパスから N-Gram Search を行なえる機能を提供している.ほかにも任意のテキストやコーパスを対象に n-gram を取る各種のツールやソフトも,ウェブ上で入手可能だ.
 n-gram 分析の言語分野への応用範囲は広い.次に来る語(音,文字)は何か,という予測可能性とも関係が深いため,機械による音声認識,統語分析,言語判定,自動翻訳,スペルチェック,剽窃探知,全文検索用インデックスの作成などに活用される.もちろん,共起表現の研究では,基本にして不可欠の手段となっている.一方,n-gram はもっぱら言語として表面化されたテキストを対象とし,深層にある構造にまったく触れることがないため,生成文法のような言語理論の方面からは批判があるようだ.詳しくは,n-gram in Wikipedia を参照.
 n-gram は工夫次第で,まだまだ使い道がありそうだ.歴史英語テキストにも,応用していきたい.

(後記 2015/09/12(Sat): Sketch Engine より N-grams も参照.)

Referrer (Inside): [2016-09-07-1]

[ 固定リンク | 印刷用ページ ]

2015-08-30 Sun

#2316. "English 3.0" by Joe Gilbert [link][internet][medium][netspeak][speed_of_change][language_change]

 昨年11月のことになるが,Joe Gilbert による20分のドキュメンタリー番組 "English 3.0 on Vimeo" が公開された.オンラインで鑑賞できる.Tom Chatfield, David Crystal, Robert McCrum, Fiona McPherson, Simon Horobin といった名立たる出演陣により,インターネット時代の英語の現状が解説される.
 netspeak に代表される,インターネット上で用いられる種類の英語を巡って,世間には様々なとらえ方がある.英語の堕落だ,規範の崩壊だという否定的な見解が目立つが,上記の出演者たちは口を揃えて,そうではない,言語の歴史においていつの時代にも繰り返されてきた言語変化にすぎないと言い切る.インターネットの登場により言語変化が加速したということや,「#1664. CMC (computer-mediated communication)」 ([2013-11-16-1]) のような新たな媒体 (medium) が生じたことは確かだが,そのようなことは歴史上の他の技術革新の際にもおよそ生じてきたことであり,言語史という広い視点から見れば特別ではない,と.
 議論の主張点は,およそ次の4点だろう.

 (1) インターネットの登場により言語変化が加速している
 (2) インターネット英語に顕著な略式表現による英語の堕落が取りざたされているが,実際には英語の堕落を示す証拠はない
 (3) 大きな技術革新の時代には言語堕落論が生じやすいが,実際に生じていることは,言語に新たな次元が付け加わるということであり,積極的に評価すべきだ
 (4) 今後,伝統的な規範主義と,新しく生まれつつあるより自由な言語観とのあいだで戦いが生じるだろう

 私もこれらの主張点にはほぼ賛成する.ただ1つ気になるのは,(1) の言語変化の加速という点についてである.同時代の観察者として,歴史的にみても英語の変化の速度 (speed_of_change) が著しいという直感はあるが,変化の速度とはそもそもどのように客観的に計測できるものなのだろうか.速度とは単位時間辺りの変化量のことであるから,まず変化量を計測することができなければならない.では,変化量を計測するといったときに,計測する対象は何になるのか.英語の言語変化と一口にいっても,英語という言語単位がどこからどこまでなのか,標準変種に限るのか,ピジン語まで含むのか等々,社会言語学的に頭の痛い問題があるし,また変化の土俵が語彙なのか,音声なのか,文法なのかという部門の問題もある.さらに,現代は変化速度が早まっているなどと結論するためには,比較のために過去のいくつかの時点における変化速度も先に割り出しておかなければならない.
 同時代であるからこそ直感に頼ってはいけないという慎重論を取るのであれば,現代における言語変化の加速という命題は,たやすく前提として受け入れてはならないのかもしれない.同じドキュメンタリーに対する Wordorigins.org のレビューでも,別の角度から言語変化の速度について批判的に考察しているので,参照されたい.

[ 固定リンク | 印刷用ページ ]

2015-08-19 Wed

#2305. 英語を説明する25の地図 [map][link][hel_education]

 英語史を学ぶ上で有用な地図25枚を解説つきで掲載しているウェブページをみつけたので紹介したい.25 maps that explain the English language では,地図や図式で表わすことのできる英語史上の重要な話題が取り上げられており,それがおよそ時代順に並べられている.25項目の題名を抜き出してみよう.

 1. Where English comes from
 2. Where Indo-European languages are spoken in Europe today
 3. The Anglo-Saxon migration
 4. The Danelaw
 5. The Norman Conquest
 6. The Great Vowel Shift
 7. The colonization of America
 8. Early exploration of Australia
 9. Canada
 10. English in India
 11. Tristan da Cunha
 12. Countries with English as the official language
 13. Which countries in Europe can speak English
 14. Where people read English Wikipedia
 15. Where new English words come from
 16. How vocabulary changes based on what you're writing
 17. Vocabulary of Shakespeare vs. rappers
 18. Where English learners speak the language proficiently
 19. Scores on the Test of English as a Foreign Language
 20. Immigrants to the US are learning English more quickly than previous generations
 21. Where Cockneys come from
 22. Dialects and accents in Britain
 23. North American vowel shift
 24. American dialects
 25. You guys vs. y'all

 本ブログでもこれらの多くの話題を取り上げてきたので,関連する記事をキーワードで検索されたい.地図や図表のような視覚資料についても,本ブログでは積極的に掲載してきた.map の各記事,およびイメージ集もご覧ください.

Referrer (Inside): [2015-08-25-1]

[ 固定リンク | 印刷用ページ ]

2015-06-28 Sun

#2253. 意味変化の原因を論じるのがなぜ難しいか [causation][semantic_change][methodology][language_change][history_of_linguistics][language_change][link]

 この2日間の記事「#2251. Ullmann による意味変化の分類」 ([2015-06-26-1]),「#2252. Waldron による意味変化の分類」 ([2015-06-28-1]) で引用・参照した Waldron は,Stern と Ullmann などの主要な先行研究を踏まえながら,意味変化の原因についても論じている.原因についての何らかの新しい洞察を付け加えているわけではないが,原因論を巡ることがなぜ難しいのかというメタな問題について,非常に参考になる議論を展開している.

   We have now considered a number of factors which may contribute to change of meaning and it is not difficult to see why so many different schemes of semantic change have been proposed over the last 150 years and why there is so little agreement among scholars as to the correct classification of the phenomena. For behind every change of meaning there lies a chain of causation which can be analysed at a number of different levels --- e.g. material, social, psychological, logical --- and at each level we should get a different answer to the question 'Why did this word change its meaning?' The position of a statistician analysing (let us suppose) the causes of death in a certain community would be somewhat similar, unless he decided beforehand what sort of causes he was going to pay attention to. For at one level of analysis, every death might presumably be regarded as a case of heart stopped beating; at different levels of analysis such categories as drowning, overwork, carbon-monoxide poisoning, typhoid, and smoke-polluted atmosphere might all be acceptable as causes; but there would be no guarantee that each death would fit into one and only one aetiological category, unless the causes were all analysed at more or less the same level. The doctor who has to insert a cause of death on a death certificate uses one of a set of terms which classify the causes on a fairly consistent level of medical diagnosis; and in matters of such complexity no system of classification for causes is serviceable unless consistency of level is observed. This, of course, is a consequence of the indeterminateness of our concept of cause: every event has many different causes.
   It is quite futile, therefore, for us to attempt to distinguish which sense-changes are due to linguistic causes and which to non-linguistic causes, or which are due to material causes and which to social causes; while it would perhaps be an exaggeration to contend that any change of meaning could be regarded as the consequence, immediate or remote, of any of the recognized causes, the various causal schemes undoubtedly show a good deal of overlapping.


 意味変化の原因の研究を,人の死因の究明になぞらえた点が秀逸である.原因の分析のレベルが様々にありうる以上,そこから取り出される原因そのものも多種多様であり,またしばしば互いに重なり合っていることは当然である.必然的に multiple causation を想定せざるをえないことになる.
 このことは,意味変化の原因論にとどまらず,言語変化一般の原因論についてもいえるだろう.言語学史においても,言語変化の原因,理由,動機づけ(を探ること)については侃々諤々の議論がある.この問題については,本ブログから cat:language_change causation の各記事を参照されたい.その中でも,とりわけ関係するものとして以下を挙げておく (##442,1123,1173,1282,1549,1582,1584,1986,2123,2143,2151,2161) .

 ・ 「#442. 言語変化の原因」 ([2010-07-13-1])
 ・ 「#1123. 言語変化の原因と歴史言語学」 ([2012-05-24-1])
 ・ 「#1173. 言語変化の必然と偶然」 ([2012-07-13-1])
 ・ 「#1282. コセリウによる3種類の異なる言語変化の原因」 ([2012-10-30-1])
 ・ 「#1549. Why does language change? or Why do speakers change their language?」 ([2013-07-24-1])
 ・ 「#1582. 言語内的な要因と言語外的な要因はどちらが重要か? (2)」 ([2013-08-26-1])
 ・ 「#1584. 言語内的な要因と言語外的な要因はどちらが重要か? (3)」 ([2013-08-28-1])
 ・ 「#1986. 言語変化の multiple causation あるいは "synergy"」 ([2014-10-04-1])
 ・ 「#2123. 言語変化の切り口」 ([2015-02-18-1])
 ・ 「#2143. 言語変化に「原因」はない」 ([2015-03-10-1])
 ・ 「#2151. 言語変化の原因の3層」 ([2015-03-18-1])
 ・ 「#2161. 社会構造の変化は言語構造に直接は反映しない」 ([2015-03-28-1])

 ・ Waldron, R. A. Sense and Sense Development. New York: OUP, 1967.

Referrer (Inside): [2015-06-30-1] [2015-06-28-1]

[ 固定リンク | 印刷用ページ ]

2015-06-16 Tue

#2241. Dictionary of Canadianisms on Historical Principles [canadian_english][dictionary][lexicography][world_englishes][link][variety]

 先日,カナダの University of British Columbia で開催された SHEL-9/DSNA-20 Conference (The 9th Studies in the History of the English Language Conference) に参加してきた.発表の1つに,DCHP-2 プロジェクトに関する中間報告があった.DCHP-2 とは,歴史的原則によって編まれたカナダ語法の辞書 Dictionary of Canadianisms on Historical Principles の第2版である.初版は1967年に出版されており,2013年には電子化されたものが DCHP-1 としてウェブ上で公開されている.DCHP-2 は UBC が主体となって編纂を進めており,完成に近づいているようなので,遠からず公開されることになるだろう.発表では,編纂に関わる UBC の学生が,部分的に DCHP-2 のデモを見せてくれたが,なかなか充実した内容のようだ.
 その発表では,ある語(句),意味,語法が Canadianism であるというとき,何をもって Canadianism とみなすのかという定義の問題について,基本方針が示されていた.大雑把にいえば,カナダで使用される英語だけでなく,アメリカ英語,イギリス英語,その他の英語変種のコーパスを比較対象として用い,カナダで用いられる英語に統計的に使用が偏っているものを Canadianism とみなすという方針が貫かれている.それぞれの数値はグラフで可視化され,複数コーパス利用の長所が最大限に活かされているようだ.このようなグラフが容易に得られるようになれば,英語変種間の多角的な比較も促進されるだろう.
 伝統的,逸話的に Canadianism とみなされてきた語句については,上記の方針の下でとりわけ批判的な検討が加えられ,場合によっては Canadianism とみなすことはできないという結論が下されることもあるという.一方,Canadianism として認定されたものについては,コーパスからの用例や出典の掲載はもちろん,歴史的背景についても詳しい記述が施される.
 DCHP-2 が完成すれば,カナダ英語研究に弾みがつくことは間違いない.カナダ英語に限らず,○○英語の辞書やコーパスの編纂がますます活気づいてくれば,変種間の比較もしやすくなり,新たな英語研究の道が開けるはずである.21世紀的な英語学の形の1つだろう.
 また,このプロジェクトは,変種とは何かという本質的な問題を再検討するす機会を提供してくれているようにも思われる.一体 Canadianism とは何か.言語学的に定義できるのか,あるいはひとえに社会的,イデオロギー的にしか定義できないものか.Lilles のようにカナダ英語を「神話」とみる者もいれば,実在すると主張する者もいる.これは,Canadianism に限らず,Americanism, Britishism など「○○語法」を指す -ism のすべてに関わる問題である.変種 (variety) を巡る論考については,「#415. All linguistic varieties are fictions」 ([2010-06-16-1]),「#1373. variety とは何か」 ([2013-01-29-1]),「#2116. 「英語」の虚構性と曖昧性」 ([2015-02-11-1]) などを参照されたい.
 加えて,カナダ英語の歴史と概要については,「#313. Canadian English の二峰性」 ([2010-03-06-1]),「#1733. Canada における英語の歴史」 ([2014-01-24-1]) も参照.

 ・ Lilles, Jaan. "The Myth of Canadian English." English Today 62 (April 2000): 3--9, 17.

[ 固定リンク | 印刷用ページ ]

2015-05-22 Fri

#2216. 研究社Webマガジンの記事「コーパスで探る英語の英米差 ―― 実践編 ――」 [link][corpus][bnc][coca][ame_bre][sociolinguistics][language_change][gender_difference][link]

 一ヶ月前の「#2186. 研究社Webマガジンの記事「コーパスで探る英語の英米差 ―― 基礎編 ――」」 ([2015-04-22-1]) に引き続き,5月20日付で「実践編」が公開されました.研究社WEBマガジン Lingua リンガより,こちらをご覧ください.  *
 今回は,複数のコーパスを用いることの利点やおもしろさを押し出しました.また,英語の英米差という一見すると静的な話題にも,動的あるいは通時的に迫ることにより,新たな見方が得られる点も強調しました.
 記事のなかでも触れましたが,実際には今回の「実践編」で述べた結論に至るには,もっと詳しく調査しなければなりません.しかし,コーパスを用いて,例えばこのような言語変化の徴候をとらえることができるかもしれないという可能性を感じ取ってもらえれば,という気持ちで執筆しました.基礎編,実践編で私の執筆担当は完結ですが,来月以降も引き続き研究社WEBマガジン Lingua リンガの記事にご注目ください.バックナンバーも非常に有用です.以下,改めて研究社WEBマガジン Lingua リンガの各記事へのリンク(最新版)を張っておきます.

 1. なぜコーパスか? (赤須 薫)
 2. 英語コーパス体験ツアー ― BNCweb を検索してみる ―(前編) (石井 康毅)
 3. 英語コーパス体験ツアー ― BNCweb を検索してみる ―(後編) (石井 康毅)
 4. Google をコーパスに見立てる (仁科 恭徳)
 5. 言語統計の基礎(前編) ― 頻度差の検定 ― (小林 雄一郎 )
 6. 言語統計の基礎(後編) ― 共起尺度 ― (小林 雄一郎)
 7. コーパスを活用した古くて新しい学問領域:フレイジオロジー ― 理論編 ― (井上 亜依)
 8. コーパスを活用した古くて新しい学問領域:フレイジオロジー ― 実践編 ― (井上 亜依)
 9. 学習者コーパスとは何か? (鎌倉 義士)
 10. 学習者コーパスで何ができるのか? (鎌倉 義士)
 11. パラレルコーパスの可能性 (仁科 恭徳)
 12. 日本語コーパスに見られる慣用句の用法 (石田 プリシラ)
 13. 日本語コーパスに見られる慣用句の変化可能性 (石田 プリシラ)
 14. COCA を使ったコロケーションの検索 (内田 諭)
 15. COCA を使った類義語の検証 (内田 諭)
 16. コーパスで話し言葉を探る ― 基礎編 ― (青木 理香)
 17. コーパスで話し言葉を探る ― 実践編 ― (青木 理香)
 18. 学習者の話し言葉コーパスを使った語用論分析 (1)談話標識 well, I mean, kind of, like の使い方 (三浦 愛香)
 19. 学習者の話し言葉コーパスを使った語用論分析 (2)買い物での要求の表現 (三浦 愛香)
 20. 認知言語学を用いてコーパスから意味を探る― 入門編 ― (大谷 直輝)
 21. 認知言語学を用いてコーパスから意味を探る― 前置詞・句動詞編 ― (大谷 直輝)
 22. コーパスで探る英語の英米差 ―― 基礎編 ―― (堀田 隆一)
 23. コーパスで探る英語の英米差 ―― 実践編 ―― (堀田 隆一)

 なお,今回の実践編で注目した gorgeous に関しては,本ブログでも以下の記事で扱ってきましたのでご参照ください.
 
 ・ 「#476. That's gorgeous!」 ([2010-08-16-1])
 ・ 「#477. That's gorgeous! (2)」 ([2010-08-17-1])
 ・ 「#607. Google Books Ngram Viewer」 ([2010-12-25-1])

 また,英語(言語)の男女差についても gender_difference の各記事で扱ってきました.特に言語の男女差とコーパス利用を絡めた記事として,「#913. BNC による語彙の男女差の調査」 ([2011-10-27-1]) をご覧ください.

Referrer (Inside): [2019-05-21-1]

[ 固定リンク | 印刷用ページ ]

2015-05-22 Fri

#2216. 研究社Webマガジンの記事「コーパスで探る英語の英米差 ―― 実践編 ――」 [link][corpus][bnc][coca][ame_bre][sociolinguistics][language_change][gender_difference][link]

 一ヶ月前の「#2186. 研究社Webマガジンの記事「コーパスで探る英語の英米差 ―― 基礎編 ――」」 ([2015-04-22-1]) に引き続き,5月20日付で「実践編」が公開されました.研究社WEBマガジン Lingua リンガより,こちらをご覧ください.  *
 今回は,複数のコーパスを用いることの利点やおもしろさを押し出しました.また,英語の英米差という一見すると静的な話題にも,動的あるいは通時的に迫ることにより,新たな見方が得られる点も強調しました.
 記事のなかでも触れましたが,実際には今回の「実践編」で述べた結論に至るには,もっと詳しく調査しなければなりません.しかし,コーパスを用いて,例えばこのような言語変化の徴候をとらえることができるかもしれないという可能性を感じ取ってもらえれば,という気持ちで執筆しました.基礎編,実践編で私の執筆担当は完結ですが,来月以降も引き続き研究社WEBマガジン Lingua リンガの記事にご注目ください.バックナンバーも非常に有用です.以下,改めて研究社WEBマガジン Lingua リンガの各記事へのリンク(最新版)を張っておきます.

 1. なぜコーパスか? (赤須 薫)
 2. 英語コーパス体験ツアー ― BNCweb を検索してみる ―(前編) (石井 康毅)
 3. 英語コーパス体験ツアー ― BNCweb を検索してみる ―(後編) (石井 康毅)
 4. Google をコーパスに見立てる (仁科 恭徳)
 5. 言語統計の基礎(前編) ― 頻度差の検定 ― (小林 雄一郎 )
 6. 言語統計の基礎(後編) ― 共起尺度 ― (小林 雄一郎)
 7. コーパスを活用した古くて新しい学問領域:フレイジオロジー ― 理論編 ― (井上 亜依)
 8. コーパスを活用した古くて新しい学問領域:フレイジオロジー ― 実践編 ― (井上 亜依)
 9. 学習者コーパスとは何か? (鎌倉 義士)
 10. 学習者コーパスで何ができるのか? (鎌倉 義士)
 11. パラレルコーパスの可能性 (仁科 恭徳)
 12. 日本語コーパスに見られる慣用句の用法 (石田 プリシラ)
 13. 日本語コーパスに見られる慣用句の変化可能性 (石田 プリシラ)
 14. COCA を使ったコロケーションの検索 (内田 諭)
 15. COCA を使った類義語の検証 (内田 諭)
 16. コーパスで話し言葉を探る ― 基礎編 ― (青木 理香)
 17. コーパスで話し言葉を探る ― 実践編 ― (青木 理香)
 18. 学習者の話し言葉コーパスを使った語用論分析 (1)談話標識 well, I mean, kind of, like の使い方 (三浦 愛香)
 19. 学習者の話し言葉コーパスを使った語用論分析 (2)買い物での要求の表現 (三浦 愛香)
 20. 認知言語学を用いてコーパスから意味を探る― 入門編 ― (大谷 直輝)
 21. 認知言語学を用いてコーパスから意味を探る― 前置詞・句動詞編 ― (大谷 直輝)
 22. コーパスで探る英語の英米差 ―― 基礎編 ―― (堀田 隆一)
 23. コーパスで探る英語の英米差 ―― 実践編 ―― (堀田 隆一)

 なお,今回の実践編で注目した gorgeous に関しては,本ブログでも以下の記事で扱ってきましたのでご参照ください.
 
 ・ 「#476. That's gorgeous!」 ([2010-08-16-1])
 ・ 「#477. That's gorgeous! (2)」 ([2010-08-17-1])
 ・ 「#607. Google Books Ngram Viewer」 ([2010-12-25-1])

 また,英語(言語)の男女差についても gender_difference の各記事で扱ってきました.特に言語の男女差とコーパス利用を絡めた記事として,「#913. BNC による語彙の男女差の調査」 ([2011-10-27-1]) をご覧ください.

Referrer (Inside): [2019-05-21-1]

[ 固定リンク | 印刷用ページ ]

2015-04-22 Wed

#2186. 研究社Webマガジンの記事「コーパスで探る英語の英米差 ―― 基礎編 ――」 [link][corpus][brown][ame_bre]

 4月20日付けで,研究社WEBマガジン Lingua リンガリレー連載 実践で学ぶコーパス活用術に,私の執筆した「コーパスで探る英語の英米差 ―― 基礎編 ――」の記事が掲載されました.今日は,このリレー連載と私の記事について紹介します.  *
 連載「実践で学ぶコーパス活用術」はコーパス利用初心者向けのオムニバス記事で,毎月様々な言語学研究者が登場し,易しくかつ実践的にコーパス活用の方法を解説してゆくシリーズです.すでに20の記事が掲載されており,コーパスの基本から始まり,各種のコーパスの紹介,利用のコツ,事例研究,言語統計入門に至るまで,コーパスに関連する様々な視点が丁寧に解説されています.以下に,各記事へのリンクを張っておきます.

 1. なぜコーパスか? (赤須 薫)
 2. 英語コーパス体験ツアー ― BNCweb を検索してみる ―(前編) (石井 康毅)
 3. 英語コーパス体験ツアー ― BNCweb を検索してみる ―(後編) (石井 康毅)
 4. Google をコーパスに見立てる (仁科 恭徳)
 5. 言語統計の基礎(前編) ― 頻度差の検定 ― (小林 雄一郎 )
 6. 言語統計の基礎(後編) ― 共起尺度 ― (小林 雄一郎)
 7. コーパスを活用した古くて新しい学問領域:フレイジオロジー ― 理論編 ― (井上 亜依)
 8. コーパスを活用した古くて新しい学問領域:フレイジオロジー ― 実践編 ― (井上 亜依)
 9. 学習者コーパスとは何か? (鎌倉 義士)
 10. 学習者コーパスで何ができるのか? (鎌倉 義士)
 11. パラレルコーパスの可能性 (仁科 恭徳)
 12. 日本語コーパスに見られる慣用句の用法 (石田 プリシラ)
 13. 日本語コーパスに見られる慣用句の変化可能性 (石田 プリシラ)
 14. COCA を使ったコロケーションの検索 (内田 諭)
 15. COCA を使った類義語の検証 (内田 諭)
 16. コーパスで話し言葉を探る ― 基礎編 ― (青木 理香)
 17. コーパスで話し言葉を探る ― 実践編 ― (青木 理香)
 18. 学習者の話し言葉コーパスを使った語用論分析 (1)談話標識 well, I mean, kind of, like の使い方 (三浦 愛香)
 19. 学習者の話し言葉コーパスを使った語用論分析 (2)買い物での要求の表現 (三浦 愛香)
 20. 認知言語学を用いてコーパスから意味を探る― 入門編 ― (大谷 直輝)(←2015/05/18(Mon)にリンクを追加)
 21. 認知言語学を用いてコーパスから意味を探る― 前置詞・句動詞編 ― (大谷 直輝)(←2015/05/18(Mon)にリンクを追加)
 22. コーパスで探る英語の英米差 ―― 基礎編 ―― (堀田 隆一)
 23. コーパスで探る英語の英米差 ―― 実践編 ―― (堀田 隆一)(←2015/05/21(Thu)にリンクを追加)

 今回私の書いた記事は,コーパスを用いて英語の英米差について考えようという趣旨で,みかけは現代イギリス英語と現代アメリカ英語の共時的比較ですが,2変種を比較対照するに当たっては歴史的な背景や通時的な視点も欠かせないということを強調しています.今回は「基礎編」と銘打って,英語の英米差を論じるに当たっての準備事項を説明し,英米差の調査に利用できるコーパスを紹介しています.
 以下,今回のリレー連載の記事と合わせて読むと有用と思われる本ブログ内の記事にリンクを張ります.ほかにもコーパス利用については corpus の記事,英語の英米差については ame_bre の記事もご参照ください.

 ・ 「#1730. AmE-BrE 2006 Frequency Comparer」 ([2014-01-21-1])
 ・ 「#1739. AmE-BrE Diachronic Frequency Comparer」 ([2014-01-30-1])
 ・ 「#1743. ICE Frequency Comparer」 ([2014-02-03-1])

 ・ 「#428. The Brown family of corpora の利用上の注意」 ([2010-06-29-1])
 ・ 「#607. Google Books Ngram Viewer」 ([2010-12-25-1])
 ・ 「#517. ICE 提供の7種類の地域変種コーパス」 ([2010-09-26-1])

 ・ 「#1278. BNC を中心とするコーパス研究関連のリンク集」 ([2012-10-26-1])
 ・ 「#307. コーパス利用の注意点」 ([2010-02-28-1])
 ・ 「#367. コーパス利用の注意点 (2)」 ([2010-04-29-1])
 ・ 「#368. コーパスは研究の可能性を広げた」 ([2010-04-30-1])

 ・ 「#240. 綴字の英米差は大きいか小さいか?」 ([2009-12-23-1])
 ・ 「#244. 綴字の英米差のリスト」 ([2009-12-27-1])
 ・ 「#312. 文法の英米差」 ([2010-03-05-1])
 ・ 「#315. イギリス英語はアメリカ英語に比べて保守的か」 ([2010-03-08-1])
 ・ 「#357. American English or British English?」 ([2010-04-19-1])
 ・ 「#627. 2変種間の通時比較によって得られる言語的差異の類型論」 ([2011-01-14-1])
 ・ 「#628. 2変種間の通時比較によって得られる言語的差異の類型論 (2)」 ([2011-01-15-1])
 ・ 「#677. 現代英語における法助動詞の衰退」 ([2011-03-05-1])
 ・ 「#880. いかにもイギリス英語,いかにもアメリカ英語の単語」 ([2011-09-24-1])
 ・ 「#1010. 英語の英米差について Martinet からの一言」 ([2012-02-01-1])
 ・ 「#1221. 季節語の歴史」 ([2012-08-30-1])
 ・ 「#1304. アメリカ英語の「保守性」」 ([2012-11-21-1])
 ・ 「#1331. 語彙の英米差を整理するための術語」 ([2012-12-18-1])
 ・ 「#1343. 英語の英米差を整理(主として発音と語彙)」 ([2012-12-30-1])

 今回のリレー連載記事は「基礎編」でしたが,来月号は「実践編」を掲載する予定です.

[ 固定リンク | 印刷用ページ ]

2014-10-17 Fri

#1999. Chuo Online の記事「カタカナ語の氾濫問題を立体的に視る」 [japanese][katakana][kanji][lexicology][lexicography][inkhorn_term][loan_word][waseieigo][link]

 ヨミウリ・オンライン(読売新聞)内に,中央大学が発信するニュースサイト Chuo Online がある.そのなかの 教育×Chuo Online へ寄稿した「カタカナ語の氾濫問題を立体的に視る」と題する私の記事が,昨日(2014年10月16日)付で公開されたので,関心のある方はご参照ください.ちょうど今期の英語史概説の授業で,この問題の英語版ともいえる初期近代英語期のインク壺語 (inkhorn_term) を巡る論争について取り上げる矢先だったので,とてもタイムリー.数週間後に記事の英語版も公開される予定.  *
 上の投稿記事に関連する内容は本ブログでも何度か取り上げてきたものなので,関係する外部リンクと合わせて,この機会にリンクを張っておきたい.

 ・ 文化庁による平成25年度「国語に関する世論調査」
 ・ 「#32. 古英語期に借用されたラテン語」 ([2009-05-30-1])
 ・ 「#296. 外来宗教が英語と日本語に与えた言語的影響」 ([2010-02-17-1])
 ・ 「#478. 初期近代英語期に湯水のように借りられては捨てられたラテン語」 ([2010-08-18-1])
 ・ 「#576. inkhorn term と英語辞書」 ([2010-11-24-1])
 ・ 「#609. 難語辞書の17世紀」 ([2010-12-27-1])
 ・ 「#845. 現代英語の語彙の起源と割合」 ([2011-08-20-1])
 ・ 「#1067. 初期近代英語と現代日本語の語彙借用」 ([2012-03-29-1])
 ・ 「#1202. 現代英語の語彙の起源と割合 (2)」 ([2012-08-11-1])
 ・ 「#1408. インク壺語論争」 ([2013-03-05-1])
 ・ 「#1410. インク壺語批判と本来語回帰」 ([2013-03-07-1])
 ・ 「#1411. 初期近代英語に入った "oversea language"」 ([2013-03-08-1])
 ・ 「#1493. 和製英語ならぬ英製羅語」 ([2013-05-29-1])
 ・ 「#1526. 英語と日本語の語彙史対照表」 ([2013-07-01-1])
 ・ 「#1606. 英語言語帝国主義,言語差別,英語覇権」 ([2013-09-19-1])
 ・ 「#1615. インク壺語を統合する試み,2種」 ([2013-09-28-1])
 ・ 「#1616. カタカナ語を統合する試み,2種」 ([2013-09-29-1])
 ・ 「#1617. 日本語における外来語の氾濫」 ([2013-09-30-1])
 ・ 「#1624. 和製英語の一覧」 ([2013-10-07-1])
 ・ 「#1629. 和製漢語」 ([2013-10-12-1])
 ・ 「#1630. インク壺語,カタカナ語,チンプン漢語」 ([2013-10-13-1])
 ・ 「#1645. 現代日本語の語種分布」 ([2013-10-28-1]) とそこに張ったリンク集
 ・ 「#1869. 日本語における仏教語彙」 ([2014-06-09-1])
 ・ 「#1896. 日本語に入った西洋語」 ([2014-07-06-1])
 ・ 「#1927. 英製仏語」 ([2014-08-06-1])

(後記 2014/10/30(Thu):英語版の記事はこちら.  *

[ 固定リンク | 印刷用ページ ]

2014-05-19 Mon

#1848. 英訳聖書のウェブ・リソース [bible][link]

 寺澤盾先生の『聖書でたどる英語の歴史』の付録 (195--96) に,英訳聖書関係のウェブサイトへのリンク集が載っているので,以下にコメントとともに張りつけておきたい.

 ・ Anglo-Saxon Bible: 古英語期に翻訳された英訳聖書のテクストを集めたもの(ただし開発途上).
 ・ StudyLight.org: 『ウィクリフ派聖書』以降の40を超える英訳聖書のテクストを所収.
 ・ Bible Study Tools.com: 英訳聖書のほかに仏訳,独訳などの聖書テクスト所収.さまざまな検索もできる.
 ・ oremus Bible Browser: 『ジェームズ王聖書』,『新改訂標準約聖書』などのテクスト所収.
 ・ BibleGateway.com: 40を超える英訳聖書のテクストを所収.また,英語以外の聖書やハワイ・ピジン英語訳も収められている.
 ・ Schoenberg Center for electronic Text & Image: 米国のペンシルヴェニア大学図書館の Schoenberg Center for Electronic Text & Image のサイト.1611年に刊行された『ジェームズ王聖書』の画像を見ることができる.
 ・ Bible: King James Version: 『ジェームズ王聖書』についてさまざまな検索ができる.
 ・ Bible Search: アメリカ聖書協会のサイト.米国系の聖書テクスト所収.
 ・ The Holy Bible --- Bible in Basic English: 『ベーシック・イングリッシュ訳聖書』のテクスト所収.

 ほかに「#1429. 英語史に関連する BL の写本等画像と説明」 ([2013-03-26-1]) 及び「#1847. BL サイトで閲覧できる中世英語写本の画像」 ([2014-05-18-1]) のリンク集も参照されたい.聖書関係のものを再掲しておこう.

 ・ Cotton MS Nero D IV, Lindisfarne Gospels
 ・ Cotton MS Claudius B IV, Old English Hexateuch (imperfect)
 ・ The Lindisfarne Gospels: 写本画像と説明.こちらに写本をめくって読めるサービスもあり.
 ・ William Tyndale's New Testament: 写本画像と説明.
 ・ King James Bible: 刊本画像と説明.こちらに写本をめくって読めるサービスもあり.
 ・ Bible in Basic English: 「#1705. Basic English で書かれたお話し」 ([2013-12-27-1]) も参照.

 ・ 寺澤 盾 『聖書でたどる英語の歴史』 大修館書店,2013年.

Referrer (Inside): [2023-01-07-1]

[ 固定リンク | 印刷用ページ ]

2014-05-18 Sun

#1847. BL サイトで閲覧できる中世英語写本の画像 [bl][link][manuscript]

 昨日の記事「#1846. Pearl のウェブ・リソース」 ([2014-05-17-1]) を書くために中世写本に関するオンライン・リソースを探している過程で,British Library の Digitised ManuscriptsSearch our Catalogue Archives and Manuscripts に行き当たった.関心のある中世英語の写本画像を検索してみると,あれもこれも画像化されていたのかと発見がある.
 BL によるもう1つの最新の写本画像へのリンク集としては,BL Medieval and Earlier Digitised Manuscripts Master List 10.04.13. (XLS) も有用.このリンク集から,とりわけ中世英語の写本として重要と思われるものへのリンクを抜き出したので,以下にまとめておく.

 ・ Add MS 40165 A, Cyprian epistles and Old English Martyrology fragments
 ・ Add MS 59678, Sir Thomas Malory, Le Morte Darthur
 ・ Add MS 60577, Miscellany of verse and prose (the 'Winchester Anthology')
 ・ Add MS 61823, The Book of Margery Kempe
 ・ Arundel MS 57, Michael of Northgate, Ayenbite of Inwyt
 ・ Cotton MS Claudius B IV, Old English Hexateuch (imperfect)
 ・ Cotton MS Cleopatra C VI, Ancrene Riwle; songs and prayers; a leaf from a Book of Hours
 ・ Cotton MS Nero D IV, Lindisfarne Gospels
 ・ Cotton MS Vespasian A I, The Vespasian Psalter
 ・ Cotton MS Vitellius A XV, Augustine of Hippo, Soliloquia; Marvels of the East; Beowulf; Judith, etc.
 ・ Harley MS 2253, Miscellany of English, French, and Latin works ('The Harley Lyrics')
 ・ Harley MS 4866, Thomas Hoccleve, The Regiment of Princes
 ・ Harley MS 7334, Geoffrey Chaucer, The Canterbury Tales
 ・ Royal MS 14 C IX, Ranulph Higden's Polychronicon
 ・ Royal MS 7 D X, The Prayerbook of Princess Elizabeth

 類似するリンク集は「#1429. 英語史に関連する BL の写本等画像と説明」 ([2013-03-26-1]),「#1431. Gelderen の英語史概説書のリンク集」 ([2013-03-28-1]),「#1293. Sir Orfeo の関連サイト」 ([2012-11-10-1]),「#744. Auchinleck MS の重要性」 ([2011-05-11-1]) にも張っておいたので,合わせて参照されたい.

Referrer (Inside): [2014-05-19-1]

[ 固定リンク | 印刷用ページ ]

2014-05-17 Sat

#1846. Pearl のウェブ・リソース [pearl][bl][link][manuscript][sggk]

 今,中世英文学 Pearl を Andrew and Waldron 版で読んでいる.Cleanness, patience, Sir Gawain and the Green Knight とともに無名の詩人によって14世紀後半の北西イングランド方言で書かれた作品である.いずれも British Library MS Cotton Nero A.x にのみ現存する名品だ.
 校訂本や注釈書など関連書誌は多く挙げることができるが,以下では主としてウェブ上のリソースへリンクを張っておきたい.

[ 電子テキスト ]

 ・ Corpus of Middle English Prose and Verse より,1953年版 (Pearl. Ed. E. V. Gordon. Oxford: Clarendon Press, 1953) に基づいた Digitised Text of Pearl が閲覧可能.
 ・ TEAMS: Middle English Texts 提供のテキスト Pearl by Robbins Library Digital Projects では,本文とともに語注・脚注が付されている.Pearl: Introduction のページでは,イントロと関連書誌も得られる.
 ・ Pearl by Bill Stanton では,イントロのほか,原文と現代英語訳の電子テキストが閲覧できる.

[ 写本画像 ]

 ・ The Cotton Nero A.x Project のサイトの Browse the Manuscript Images より,Pearl Manuscript の画像をフルで閲覧することができる.

[ 関連情報・書誌 ]

 ・ Entry for "Pearl" in Middle English Compendium HyperBibliography
 ・ 上にも挙げた Cotton Nero A.x. Project より,Web Resources for Pearl-poet Study: A Vetted Selection がリンク集として有用.
 ・ Pearl (poem) by Wikipedia では,書誌が役立つ.

 最後に,オンラインの MED を利用して,Pearl からの引用を含む全エントリーへのリンクを整理した.行番号順に並べてあるので,テキストを読みながら一種の語注として使える.A Pearl Glossary Derived from MED Entries よりアクセスを.

 ・ Andrew, Malcolm and Ronald Waldron, eds. The Poems of the Pearl Manuscript. 3rd ed. Exeter: U of Exeter P, 2002.

Referrer (Inside): [2014-05-18-1]

[ 固定リンク | 印刷用ページ ]

2014-04-14 Mon

#1813. IPA の肺気流による子音の分類 [phonetics][consonant][ipa][chart][link]

 標題の内容に入る前に,関連する過去の記事へリンクを張っておく.
 
 ・ 「#251. IPAのチャート」 ([2010-01-03-1])
 ・ 「#669. 発音表記と英語史」 ([2011-02-25-1])
 ・ 「#822. IPA の略史」 ([2011-07-28-1])
 ・ 「#1376. 音声器官の図」 ([2013-02-01-1])
 ・ 「#31. 現代英語の子音の音素」 ([2009-05-29-1])

 では,本題へ.以下の IPA の2005年度版 (PDF; 58KB) の肺気流(「#1672. 気流機構」 ([2013-11-24-1]) を参照)による子音表で,行と列はそれぞれ何を表わしているだろうか.

 IPA Pulmonic Consonants

 まず,列は調音点 (place of articulation) を表わし,左端の唇から右端の声門まで,声道内の各器官に対応する.左を向いた顔の横顔ととらえればよい.
 一方,行は調音様式 (manner of articulation) を表わし,上から下へ,およそ呼気に対する妨害の程度の高いものから順に並んでいる.ここで妨害の種類は8つに区分されているが,この配列にも実は一定の論理がある.その論理は,斉藤 (21) による図をみれば一目瞭然だ.分節音の種類に英語訳をつけつつ,その図を再現しよう.

                                                ┌─ 破裂[口]音 (plosive)
                                ┌─ 破 裂 ─┤
                                │              └─ [破裂]鼻音 (nasal)
                                │
口腔内に閉鎖がつくられるもの ─┼─ ふるえ ─── ふるえ音 (trill)
                                │
                                └─ はじき ─── はじき音 (tap or flap)


                                                ┌─ [中線的]摩擦音 (fricative)
                                ┌─ 摩 擦 ─┤
                                │              └─ 側面[的]摩擦音 (lateral fricative)
口腔内に隙間が残されるもの ──┤                          
                                │              ┌─ [中線的」接近音 (approximant)
                                └─ 接 近 ─┤
                                                └─ 側面[的]接近音 (lateral approximant)

 大きく2系列に分かれる.口腔内に完全な閉鎖が作られて,気流が一時止められるものと,閉鎖が不完全で隙間が残り,気流がせき止められないものとである.前者は広い意味での破裂を表わし,閉鎖の形成,持続,開放の3段階からなる.しっかりした持続が1回はあるもの,と言い換えてもよい.気流の開放が口のみで生じれば破裂[口]音 (plosive) ,鼻でも生じれば[破裂]鼻音 (nasal) となる.一方,持続の極めて短い閉鎖と破裂が複数回繰り返されると,例えば巻き舌音のような,ふるえ音 (trill) となる.また,極めて短い閉鎖と破裂が一度だけ生じる場合には,日本語のラ行の子音に現れるような,はじき音 (tap or flap) となる.厳密に言えば,tap と flap は異なり,「tap は舌(動的調音器官)がそれ自体の運動の目的として上歯茎など(静的調音器官)に接触してもどるもの,flap は舌がもとの位置にもどる運動の途中で上歯茎などに1回触れるものをさす」(斉藤,p. 40).
 もう1つの系列,すなわち口腔内に隙間が残される音には,調音器官のあいだを通る気流の摩擦の強いものと,そのような摩擦がほとんどなく,調音器官間がある程度接近しているにすぎないものとが区別される.また,それぞれについて,気流が口腔内の真ん中を通るか脇を通るかに応じて,中線的と側面的な音が区別される.結果として,[中線的]摩擦音 (fricative) ,側面[的]摩擦音 (lateral fricative) ,[中線的」接近音 (approximant) ,側面[的]接近音 (lateral approximant) の4種類が分けられることになる.
 IPA の子音分類は,したがって,調音音声学の観点からきわめて論理的になされていることになる.全体として,肺気流による子音の分類は,以下の5つの観点からなされているといえる(斉藤,p. 25).
 
 (1) 声門の状態(声帯の振動の有無)
 (2) 調音の場所(どの部分で空気の流れを妨害するか)
 (3) 気流の通路(気流は口腔内の真ん中を通るか脇を通るか)
 (4) 接近の度合いなど(気流に対してどのように妨害を作るか)
 (5) 口蓋帆の位置(気流は鼻腔に抜けるか抜けないか)

 IPA や音声学の学習には,音声を聴くこともできる以下のページをどうぞ.

 ・ 東京外国語大学による IPA モジュール
 ・ Department of Language and Communication Studies, Norges Teknisk-Naturvitenskapelige Universitet による A Sound Reference to the IPA: active, sound-enabled version of the International Phonetic Alphabet
 ・ Department of Phonetics and Linguistics, University College London による IPA: Alphabet
 ・ The UCLA Phonetics Lab
 ・ Institute of Phonetic Sciences, University of Amsterdam による Phonetic Sciences, Amsterdam
 ・ 東北大学の後藤斉教授による 音声学音響音声学のリンク集

 ・ 斉藤 純男 『日本語音声学入門』改訂版 三省堂,2013年.

[ 固定リンク | 印刷用ページ ]

2014-04-10 Thu

#1809. American Heritage Dictionary の Notes [dictionary][etymology][link][synonym][thesaurus]

 「#485. 語源を知るためのオンライン辞書」 ([2010-08-25-1]) で触れたが,American Heritage Dictionary of the English Language, 4th ed. (AHD) とその他の辞書に基づいた The Free Dictionary というオンライン辞書がある.AHD は,アメリカの辞書らしく百科事典的な情報や視覚資料が豊富で,私もよく使うお気に入りの辞書だ.紙版は大型だが,読む辞書としてお薦めである.(なお,The Free Dictionary EncyclopediaArticle of the Day というフィードもお気に入り.)
 特に注目したいのが,Notes と呼ばれるコラム的な記事が充実していることだ.Usage Notes, Synonym Notes, Word Histories, Our Living Language, Regional Notes といった5種類の Notes が,延べ1,700以上,辞書中にちりばめられている.以下では,取りこぼれもあるとは思われるが,その大多数へのリンクを拾い出した.長いリストなので,ジャンプのための目次を挙げておく.

 ・ Usage Notes 一覧
 ・ Synonym Notes 一覧
 ・ Word Histories 一覧
 ・ Our Living Language 一覧
 ・ Regional Notes 一覧

 ほかにも,リンク先の Notes 部分のみを抜き出した Notes 集そのものもブラウザ上で閲覧できるように作ってみたが,1.6MBと重めなので,必要に応じてどうぞ.

[ Usage Notes ]

!Kung, -ee, -ess, -wise, .gov, a, A.M., aberrant, able, about, absolute, absolutely, accessory, acquiesce, act, acumen, ad hominem, admission, adopt, advance, advise, affect, affinity, agenda, aggravate, ain't, alibi, all, all right, alleged, allude, alongside, also, alternative, although, altogether, alumnus, Amerasian, Amerindian, and, and/or, Anglo, anticipate, antidote, anxious, any, anyone, apparent, archetype, as, as far as, Asian, Asiatic, assure, author, awhile, backward, bad, bait, baleful, banal, barbarism, barbiturate, be, bear, because, behalf, berdache, besides, best, between, bi-, black, Black English, blatant, boast, both, bring, but, callous, can, cannot, capital, careen, celebrant, celibate, center, certain, challenged, Chicano, child-directed speech, claustrophobic, cohort, collective noun, color, colored, compact disk, compare, complected, complement, complete, comprise, conflicted, contact, contemporary, continuance, contrast, controller, convince, council, couple, craft, credential, credible, crescendo, criterion, critique, culture, czar, dare, data, deaf, debut, deceptively, decimate, definite, demagogue, denote, depend, deprecate, dialogue, different, dilemma, disabled, discomfit, disingenuous, disinterested, disinvent, distinct, dive, domestic partner, double negative, doubt, dour, drunk, due to, each, each other, either, elder, else, empower, enervate, enormity, enthuse, envelope, epicenter, epithet, equal, err, escape, Eskimo, Eurasian, every, everyplace, except, exceptionable, fact, factoid, farther, February, few, finalize, First Nation, firstly, flammable, flaunt, flotsam, follow, foot, foregone, former, formidable, forte, fortuitous, founder, fulsome, fun, gambit, gay, gender, General American, get, glamour, good, gourmet, government, graduate, graffito, grieve, group, grow, handicapped, hang, harass, hardly, harebrained, have, he, headquarter, headquarters, healthy, hegemony, height, help, herb, hero, Hispanic, historic, hoi polloi, holocaust, homosexual, hopefully, host, however, hyphenated, I, identical, identify, if, impact, impeach, important, impracticable, include, Indian, individual, infer, infinite, infrastructure, input, insignia, intense, interface, intrigue, intuit, Inuit, ironic, irregardless, its, Jew, Jewess, kabbalah, Kanaka, kilometer, knot, kudos, lack, lady, late, Latina, lay, leave, legend, liable, lifestyle, light, like, likely, literally, literate, loan, look, majority, man, master, masterful, materialize, mean, medium, men, methodology, mid-, migrate, minimal, mistress, momentarily, month, moot, Ms., mute, mutual, myriad, myself, native, Native American, nauseous, need, neither, Net, none, nonstandard, nonwhite, nor, not, nothing, nuclear, number, oblivious, octoroon, of, off, officiate, often, old, on, one, only, or, oriental, ought, over-, pair, paradigm, parameter, participle, party, pass, people, percent, percentage, perfect, periodic, permit, person, peruse, phenomenon, pill bug, plead, plus, politics, poor, possessed, practicable, practically, precipitate, premiere, preposition, presently, principal, prioritize, process, protagonist, prove, quarter, queer, quick, quote, race, rarely, rather, redundancy, regard, replete, repulse, responsible, restive, sacrilegious, safe sex, said, salutation, same, saving, scarcely, schism, Scottish, seasonal, series, service, set, shall, she, short-lived, should, slow, sneak, so, so-called, someday, sometime, sonorous, soon, split infinitive, Standard English, status, staunch, stomp, stratum, strength, such, suffer, than, that, themed, there, they, this, Three Age system, thusly, tight, till, together, too, tortuous, toward, transpire, try, un-, unaware, unexceptionable, unique, utilize, various, verbal, very, victual, virtual, wake, want, way, we, wean, web, website, well, what, whatever, when, whence, where, which, who, whose, why, wish, with, wreak, Xmas, ye, yet, zoology

[ Synonym Notes ]

ability, abolish, abstinence, abuse, accidental, accompany, acknowledge, active, adapt, admonish, adulterate, advance, adventurous, advice, advise, affair, affect, affectation, afflict, afraid, ageless, agitate, agree, aim, airy, allocate, alone, amateur, ambiguous, ambush, amenity, amiss, amuse, analyze, ancestor, anger, angry, announce, annoy, answer, anxiety, apology, apparent, appear, appendage, applaud, appoint, appreciate, apprehend, appropriate, approve, arbitrary, argue, argument, argumentative, arrange, art, artificial, ask, assent, assistant, attack, attribute, authentic, authorize, average, aware, band, banish, banter, bargain, barrage, base, baseless, batter, bear, beat, beautiful, beg, begin, beginning, behavior, belief, belligerent, bend, beneficial, benefit, benevolent, besiege, bet, bias, binge, bite, bitter, blackball, blackout, blame, blameworthy, blast, blemish, blink, block, bloom, blunder, boast, bodily, boil, book, boor, border, boring, botch, branch, brave, brawl, breach, break, breeze, bright, broach, broad-minded, brood, brush, bulge, bulwark, burden, burdensome, burn, business, busy, cadge, calculate, call, calm, campaign, care, careful, careless, caress, caricature, catch, cause, celebrity, center, certain, certainty, chafe, chance, charge, charm, chief, choice, chronic, circumference, citizen, claim, clean, clear, clever, cliché, clothe, coagulate, cold, collision, comfort, comfortable, comment, commit, common, complete, complex, conceit, condemn, conduct, confidence, confirm, conflict, confuse, consider, contain, contaminate, contemporary, continual, convert, convey, cool, correct, corrupt, count, crisis, criticize, crowd, crude, cruel, crush, cry, cure, curious, dark, daze, dead, decay, deceive, decide, decision, decisive, decrease, decry, defeat, defend, defer, defy, degrade, delicate, delicious, demand, demote, deny, dependent, deplete, depressed, describe, desire, despise, despondent, development, deviation, devote, dexterous, dialect, dictate, dictatorial, differ, difference, difficulty, dip, dirty, disadvantage, disappear, discord, discourage, discover, discuss, disguise, disgust, dishonest, dismay, dismiss, display, disposition, dissuade, distinct, distort, distribute, doctrine, dominant, dry, dull, earn, easy, eat, echo, effect, effective, eject, elaborate, element, elevation, eliminate, embarrass, emphasis, empty, enclose, encourage, endanger, enemy, engagement, enmity, enormous, enrapture, envy, equipment, erase, escape, estimate, estrange, evoke, exaggerate, example, excel, excessive, existence, expect, explain, explicit, expressive, extemporaneous, extricate, fair, faithful, faithless, fantastic, fashion, fashionable, fast, fasten, fat, fatal, favorable, fawn, fear, feat, feeling, female, fertile, fidelity, field, figure, flagrant, flash, flexible, flirt, flock, flourish, flow, follow, foolish, forbid, force, foreign, foretell, forgive, form, forte, found, fragile, fragrance, frank, freedom, frighten, frown, function, furnish, futile, gather, gaudy, gaze, general, gesture, ghastly, giddy, glad, glib, gossip, gracious, grand, graphic, grieve, gruff, guide, habit, hamper, handle, happen, happy, harass, hard, harden, haste, hateful, healthy, heap, heavy, help, heritage, hesitate, hide, hinder, honor, humane, idea, ideal, imagination, imitate, immaterial, impetuous, importance, impression, improper, improve, inactive, incalculable, incisive, incline, include, increase, indicate, indispensable, infinite, inflexible, injustice, innate, inquiry, insanity, instinctive, insubordinate, intelligent, intense, intention, interfere, intimidate, introduce, irrelevant, isolate, item, jealous, jerk, join, joke, judge, justify, keep, kind, knowledge, lack, large, last, latent, lazy, lean, learned, lethargy, letter, level, liberal, lie, lift, likeness, limit, limp, living, logical, loose, loud, love, lure, luxury, makeshift, male, malign, malleable, manipulate, mark, mature, living, logical, mercy, method, meticulous, mind, miscellaneous, mix, mixture, moderate, moment, monopolize, mood, moral, morale, moving, multitude, muscular, mysterious, naive, native, nautical, neat, negligent, new, news, noise, noted, noticeable, nuance, nurture, object, oblige, observe, obstacle, obstinate, occurrence, offend, offensive, offer, old, opinion, opportunity, oppose, opposite, orderly, origin, outline, overthrow, pacify, pain, palliate, pamper, partner, passion, pathetic, patience, pause, pedantic, penitence, pensive, perceptible, perfect, perform, period, periodic, permission, persuade, phase, pity, plain, plan, plausible, please, plentiful, poisonous, polite, poor, possible, posture, practice, praise, predicament, predict, predilection, preliminary, presume, prevailing, prevent, produce, proficient, profuse, promise, proportion, propose, proud, provoke, prudence, pull, punish, pure, push, puzzle, quality, qualm, quibble, range, reach, real, reap, reason, recede, reciprocate, reckless, recover, refer, refrain, refuse, regard, regret, relevant, reliable, relieve, religious, relinquish, rely, remember, reparation, repeat, replace, represent, resort, responsible, restrain, revere, reverse, revive, rich, ridicule, right, rise, rival, room, rough, rude, ruin, rural, sad, sarcastic, satisfy, save, saying, scatter, scold, secret, see, seem, send, sensuous, sentimental, separate, series, serious, severe, shade, shake, shameless, shapeless, sharp, shelter, shorten, shout, show, showy, shrewd, shy, sign, silent, sinister, slant, sleek, slide, sloppy, slow, small, smell, social, solitude, solve, sour, spacious, sparing, speak, speed, spend, spontaneous, stain, standard, state, stay, steal, steep, stem, stench, stiff, still, stoop, stop, strange, streak, strength, subject, substance, sufficient, suggest, summit, superfluous, supervise, support, supposed, sure, surprise, surrender, surround, swerve, swing, tact, tardy, task, taste, teach, tear, teem, temporary, tend, tendency, theoretical, think, think, tight, tire, tireless, tool, touch, treat, trial, trivial, trouble, trust, truth, turn, ugly, uncertainty, unctuous, unfortunate, unruly, unspeakable, urgent, use, usual, vain, valid, vent, versatile, vertical, victory, vigor, vociferous, voluntary, voracious, wander, waste, way, weak, weird, wet, whole, wile, wit, wonder, wordy, work, yield, young, zest

[ Word Histories ]

abacus, abracadabra, accolade, acorn, adder, adolescent, agnostic, alcohol, Allegheny River, alligator, amateur, Amazon, an, anesthesia, appendicitis, arena, arrowroot, artery, artichoke, Aryan, asparagus, assassin, automatic, avocado, baby-sit, badger, ballyhoo, banquet, barnacle, bayonet, beef, belfry, berserk, Betelgeuse, bigot, bless, Bolshevik, book, boomerang, boycott, Brazil, brickbat, broker, buccaneer, buffalo, bumpkin, bury, butterfly, bylaw, Canada, canter, cappuccino, caricature, carouse, casino, caterpillar, caviar, chagrin, chameleon, chaperon, check, Chicago, china, chivalry, chortle, churl, ciao, circus, cleric, cockroach, codex, cologne, comet, comrade, coroner, cot, coupon, coward, crayfish, croissant, crucial, cuckold, cushy, cute, cynic, dandelion, debunk, deer, delta, dervish, desert, diabetes, diatribe, digitalis, dinner, dirge, ditto, do-gooding, Don River, drench, dress, dungeon, dynamite, easel, economy, edit, eleven, empty, encyclopedia, English, ennui, enthusiasm, erudite, ethnic, eunuch, exorcise, fascism, fear, fee, fellow, fey, fiction, film, fire, fizzle, flunky, fool, fornication, fraction, freeze, friend, fuck, funky, garage, gauntlet, geezer, gerrymander, giddy, glitch, goatee, goodbye, gorilla, Gothic, grass widow, Greenland, gremlin, gringo, guillotine, hall, hamburger, harlot, hassle, haywire, hectic, helicopter, hell, helpmate, hex, high muckamuck, hobnob, holocaust, hooker, Hoosier, hubbub, husband, iconoclast, ilk, impeach, industry, inkling, interloper, internecine, island, item, janitor, Japan, jaunty, junk, kangaroo, ketchup, kidnap, kiosk, kith and kin, laconic, landscape, larva, lava, lemon, leprechaun, lieutenant, limbo, lingo, lion, loaf, lobster, long-lived, lucre, macabre, maharajah, malaprop, mannequin, mantis, marshal, mascot, mattress, mealy-mouthed, Melba toast, menu, mesmerism, metal, midwife, milquetoast, Minnesota, misericord, Mississippi, modern, mortgage, mosquito, Muse, mutt, namby-pamby, nap, naughty, neighbor, nerd, nest, New Jersey, noise, nonchalant, numb, OK, ombudsman, one, opossum, orange, orgy, oscillate, otorhinolaryngology, Ouse River, outlaw, oyez, Pakistan, pal, pant, paradise, pariah, pay, peeping Tom, penthouse, period, petard, Philistine, pickle, pilot, plane, Platonic, plumber, Plymouth, poison, pollster, Pomerania, posh, posthumous, powwow, premise, pretzel, prison, prude, Pueblo, Punjab, Quaalude, quark, queen, queue, quiz, raid, rajah, rankle, rapt, read, reindeer, resent, rhinestone, Riot Act, robot, role, rose, roster, rune, sack, salad, sanction, sanguine, Sanskrit, sarcophagus, scan, scarce, scold, scuba, séance, seersucker, senile, serendipity, shadow, shambles, sherbet, short shrift, shyster, Singapore, slave, sleuth, slivovitz, soldier, soothsayer, Sophocles, south, speak, speed, spill, spoof, spree, stampede, stove, sunbeam, superman, surly, syphilis, taboo, tangerine, tattoo, tea, telephone, temple, testis, testy, Thames, theater, they, third, ticket, tin, tithe, toady, Tokyo, tomato, tooth, trek, trivial, true, tulip, tweed, tycoon, typhoon, umpire, underling, uranium, valentine, vegetable, vixen, vogue, vulgar, Wales, wallflower, war, water, Wednesday, went, werewolf, whiskey, whore, wigwam, window, winsome, worry, write, xylophone, Yankee, Zeus, zipper, zloty

[ Our Living Language ]

a-, agreement, all, as far as, ax, bad, basket case, be, breathe, call, cent, chill, comparative, cool, dig, downsize, dude, dumb, foot, geek, go, gung ho, hisself, historical present, hornswoggle, I'm, igg, it, izzard, knockout, like, me, might, mine, Ocracoke Island, of, plural, rap, redundancy, rent, right, schlock, sleigh, Smith Island, strike, trashed, were, za, zero copula

[ Regional Notes ]

absquatulate, agin, andiron, anymore, as, bare-naked, beignet, birth, bodacious, boughten, cayuse, chaw, chesterfield, chirren, clever, critter, damned, dogie, dope, dornick, dragonfly, drudge, everwhere, fair, faubourg, favor, feist, ferninst, fix, frosting, frying pan, gallery, goober, greasy, gum band, gunnysack, gutter, hey, highfalutin, holler, hosey, intervale, johnnycake, juke, kindling, krewe, krumkake, lagniappe, light bread, lightning bug, loblolly, luminaria, milk shake, mill, mozo, mud dauber, muffuletta, need, neutral ground, Old Scratch, old-field colt, olla, parking, pocosin, poke, pone, possum, powerful, preacher, purty, quoit, ramada, redd, reeling, run, scoot, shivaree, slatch, smart, so, spa, stateside, stob, stoop, submarine, summercater, tarnation, ted, teeter-totter, thataway, tit, tonic, tule, tumbleset, ugly, ukulele, vaquero, vum, wake, wanigan, whiffletree, woodchuck, yonder, you-all, you-uns

Referrer (Inside): [2022-07-31-1] [2014-04-20-1]

[ 固定リンク | 印刷用ページ ]

2014-02-23 Sun

#1763. Shakespeare の作品と言語に関する雑多な情報 [shakespeare][statistics][link][timeline]

 Shakespeare とその作品については,周知の通り,膨大な研究の蓄積がある.年表や統計の類いも多々あるが,Crystal and Crystal から適当に抜粋したものをいくつか載せておきたい.なお,Crystal and Crystal の種々の統計の元になっているデータベースは,Shakespeare's Words よりアクセスできる.その他の Shakespeare 関連のリンクについては,「#195. Shakespeare に関する Web resources」 ([2009-11-08-1]) を参照.

(1) Chronology of works (Crystal and Crystal 6)

1590--91The Two Gentlemen of Verona; The Taming of the Shrew
1591Henry VI Part II; Henry VI Part III
1592Henry VI Part I (perhaps with Thomas Nashe); Titus Andronicus (perhaps with George Peele)
1592--3Richard III; Venus and Adonis
1593--4The Rape of Lucrece
1594The Comedy of Errors
1594--5Love's Labour's Lost
by 1595King Edward III
1595Richard II; Romeo and Juliet; A Midsummer Night's Dream
1596King John
1596--7The merchant of Venice; Henry IV Part I
1597--8The Merry Wives of Windsor; Henry IV Part II
1598Much Ado About Nothing
1598--9Henry V
1599Julius Caesar
1599--1600As You Like It
1600--1601Hamlet; Twelfth Night
by 1601The Phoenix and Turtle
1602Troilus and Cressida
1593--1603The Sonnets
1603--4A Lover's Complaint; Sir Thomas More; Othello
1603Measure for Measure
1604--5All's Well that Ends Well
1605Timon of Athens (with Thomas Middleton)
1605--6King Lear
1606Macbeth (revised by Middleton); Antony and Cleopatra
1607Pericles (with George Wilkins)
1608Coriolanus
1609The Winter's Tale
1610Cymbeline
1611The Tempest
1613Henry VIII (with John Fletcher); Cardenio (with John Fletcher)
1613--14The Two Noble Kinsmen (with John Fletcher)


(2) Top ten content words (Crystal and Crystal 153)

good3995
lord3164
man3091
love3047
sir2548
know2252
give2114
think/thought1911
king1680
speak1626


(3) Poetry or prose (Crystal and Crystal 165)

Poetry (%)No. of linesProse (%)No. of linesPlay
100275200Richard II
100256900King John
100249300King Edward III
99.728920.38Henry VI Part III
99.526640.514Henry VI Part I
98.624791.435Titus Andronicus
97.635172.485Richard III
97.427352.674Henry VIII
94.526415.5154The Two Noble Kinsmen
93.519486.5135Macbeth
90.122089.9244Julius Caesar
89.8271810.2308Antony and Cleopatra
86.9261013.1393Romeo and Juliet
86.6154313.4239The Comedy of Errors
85.2280814.5487Cymbeline
83.7258016.3503Henry VI Part II
81.2190318.8441Pericles
80.6207619.4498The Taming of the Shrew
80.6171319.4413A Midsummer Night's Dream
80.4259919.6633Othello
78.6202521.4551The Merchant of Venice
77.2257122.8760Coriolanus
76.5156923.5481The Tempest
73.2218126.8800The Winter's Tale
73.1234526.9865King Lear
73.1170726.9627Timon of Athens
73.1161326.9595The Two Gentlemen of Verona
71.5274228.51092Hamlet
66.4225033.61137Troilus and Cressida
64.2171635.8955Love's Labour's Lost
60.6163439.41062Measure for Measure
60.5194339.51269Henry V
55.6166644.41332Henry IV Part I
51.6144748.41356All's Well that Ends Well
47.6154752.41700Henry IV Part II
47.4127652.61415As You Like It
38.294961.81532Twelfth Night
28.373971.71871Much Ado About Nothing
12.533887.52370The Merry Wives of Windsor


(4) How long are the plays? (Crystal and Crystal 139)

Total linesTotal wordsPlayFirst FolioRiverside
383429,844Hamlet39064042
360228,439Richard III38873667
338725,730Troilus and Cressida35923531
333126,479Coriolanus38383752
329526,876Cymbeline38193707
324725,737Henry IV Part II33503326
323226,003Othello36853551
321225,623Henry V33813297
321025,341King Lear33023487
308324,490Henry VI Part II33553130
302623,726Antony and Cleopatra36363522
300324,023Romeo and Juliet31853099
299824,126Henry IV Part I31803081
298124,597The Winter's Tale33693348
290023,318Henry VI Part III32172915
280923,333Henry VIII34633221
280322,537All's Well that Ends Well30783013
279523,388The Two Noble Kinsmennot in3261
275221,884Richard II28492796
270821,290The Merry Wives of Windsor27292891
269621,269Measure for Measure29382891
269121,477As You Like It27962810
267820,541Henry VI Part I29312695
267120,881Love's Labour's Lost29002829
261020,767Much Ado About Nothing26842787
257620,911The Merchant of Venice27372701
257420,552The Taming of the Shrew27502676
256920,472King John27292638
251419,888Titus Andronicus27082538
249319,406King Edward IIInot innot in
248119,592Twelfth Night25792591
245219,149Julius Caesar27302591
234417,728Periclesnot in2459
233417,796Timon of Athens26072488
220816,936The Two Gentlemen of Verona22982288
212616,305A Midsummer Night's Dream22222192
208316,372Macbeth25292349
205016,047The Tempest23412283
178214,415The Comedy of Errors19181787


(5) Using you and thou (Crystal and Crystal 126)

You-formsThou-forms
you14,244thou5,942
ye352thee3,444
your6,912thy4,429
yours260thine510
yourself289thyself251
yourselves74  
Total22,131 14,576


 ・ Crystal, David and Ben Crystal. The Shakespeare Miscellany. Woodstock & New York: Overlook, 2005.

[ 固定リンク | 印刷用ページ ]

2013-12-19 Thu

#1697. Liberia の国旗 [vexillology][link][map][geography]

 旗を研究対象とする旗章学 (vexillology) と呼ばれる分野がある.国旗のデザイン,由来,変遷の歴史なども研究対象となるが,世界の地理や歴史を学ぶ上で,よい教材を提供してくれる.英語史でも,近代以降の英語の世界展開をたどるのに時に有益である.例えば,英国の歴史をたどる上で,Union Jack (Union Flag) 成立の経緯は重要である(詳しくはこちらのサイトを参照).国旗に関する出版物は多いが,ウェブ上のリソースも便利なものが多いので,いくつかを紹介しておこう.
 
 ・ Flags of the World (FOTWO): 由来や変遷の歴史など詳細な情報を含み,非常に有用.
 ・ World Flag Database: アルファベット順で,大きくデザインを表示する.国の地図へも飛べる.
 ・ All Flags in Alphabetical Sequence: アルファベット順にサムネイルで一覧.各種のサイズをフリーで利用できる.
 ・ 外務省 世界の国旗: 地域ごとにサムネイルで一覧するのに便利

 さて,今日は リベリア共和国 (Republic of Liberia) とその国旗を取り上げる.西アフリカ南西部,大西洋に面したこの土地には,古来多数の土着民族が住んでいた.建国につながる近現代史に限れば,1822年にアメリカ植民協会 (American Colonization Society) が米国の黒人解放奴隷の入植地として買収したことに始まる.首都となる Monrovia (アメリカ第5代大統領 James Monroe にちなむ)へ移住したアメリカの解放奴隷が支配層となり,1847年に独立した.アフリカで最も古い共和国である.国名には,ラテン語で「自由な」を意味する liber が含まれている.

Map of Liberia

 350万人ほどの国民のうち,解放奴隷の子孫は数パーセントを占めるにすぎないが,早くから欧米式の教育を受け,社会的には影響力のある集団となっている.英語が国語として採用されているのもそのためである.使用されている英語変種としては,アメリカ英語の影響を受けた標準的な変種のほか,Liberian English と呼ばれるピジン英語もある.アフリカにおける標準英語変種は,英植民地の歴史によりイギリス英語のそれに大きく偏っているが,リベリアはアメリカ英語に基づいており,特異な存在である.「#376. 世界における英語の広がりを地図でみる」 ([2010-05-08-1]) で,アフリカ大陸のなかで唯一リベリアがピンクで示されていることを確認されたい.ほかに Ethnologue: Liberia も参照.
 アメリカとの関連の深さは,国旗にもよく現れている.アメリカの星条旗 (Stars and Stripes) を基にしたデザインであることが明らかである.赤白11本の縞は憲法の起草者の数を,白い1つの星 (Lone Star) はアフリカにおいて模範となるべき欧米風独立国家の象徴を表わす.

National Flag of Liberia

[ 固定リンク | 印刷用ページ ]

2013-12-10 Tue

#1688. Tok Pisin [pidgin][creole][lingua_franca][tok_pisin][link]

 英語ベースのピジン語 (pidgin) としておそらく最も知られているのは Tok Pisin だろう.多言語国家 Papua New Guinea の事実上の国家語として用いられており,lingua_franca として機能している.新聞,ラジオ,テレビ,辞書,文法,聖書などの言語として採用されており,話者により積極的な社会言語学的評価を付されている.第2言語として400万人により話されており,第1言語としても5万人の話者がいる.後者の母語話者の存在は,Tok Pisin がクレオール語化 (creolisation) を始めていることの現れでもある.
 New Guinea は,Greenland に次いで世界で2番目に大きな島である.政治的には西半分のインドネシア領 Irian Jaya と東半分の Papua New Guinea (PNG) に分かれる.島全体としてみれば使用されている言語は1,000に及び,PNG だけに限っても,「#401. 言語多様性の最も高い地域」 ([2010-06-02-1]) で見たとおり,830言語を数える.言語多様性指数としては,世界最高値を示す国である.この超多言語地域が lingua franca を持ち始める契機となったのは,19世紀にヨーロッパの植民地主義列が介入したときである.Samoa, Vanuatu, Queensland など,オセアニア地域のプランテーション契約労働者が各地を往来したこと,孤立していた言語共同体が孤立を維持できなくなったことが,lingua franca の発生を促した.結果として,PNG の土着語から発生したピジン語 Hiri Motu や,英語ベースのピジン語 Tok Pisin が広がっていった.
 オセアニア地域のピジン語の発達については不明の点も多いが,Australia 経由で広がった系列 (ex. Australian Pidgin English, Roper river Creole, Cape York Creole) と,Vanuatu (the New Hebrides), the Solomon Islands, Queensland, Fiji を経て Papua や New Guinea へ広がった系列が区別される.19世紀,この地域では,New England の捕鯨,メラネシアのビャクダン交易,中国の食材としてのナマコ採取,Queensland や Fiji での綿花やサトウキビのプランテーション,Samoa でのコプラのプランテーション,トレス海峡 (the Torres Strait) での真珠採取などが,経済と労働の推進力となっていた.初期の Tok Pisin は,これらの経済活動を通じて Bislama (「#1536. 国語でありながら学校での使用が禁止されている Bislama」 ([2013-07-11-1]) を参照), Solomon Islands Pidgin, Torres Straits Creole などと接した帰国労働者によって PNG に広まっていったとされる.
 上述のように,Tok Pisin は英語ベースの(すわなち英語を lexifier とする)ピジン語である.標準英語と比べれば,音韻,文法,語彙などあらゆる部門において確かに簡略化されているが,一方で独特な規則をもつ.言語体系としては,英語とは異なる言語といって差し支えないだろう.Gramley (239--40) に掲載されている Tok Pisin で書かれた文章のサンプルについて,標準英語の対訳つきで見やすく作り直したものをこちらのPDFで用意した.その他,Tok Pisin については以下のサイトも参照.

 ・ 「#463. 英語ベースのピジン語とクレオール語の一覧」 ([2010-08-03-1])
 ・ Ethnologue: Tok Pisin
 ・ Tok Pisin -- Pidgin / English Dictionary
 ・ Tok Pisin Translation, Resources, and Discussion

 ・ Gramley, Stephan. The History of English: An Introduction. Abingdon: Routledge, 2012.

[ 固定リンク | 印刷用ページ ]

2013-10-09 Wed

#1626. 現代日本語書き言葉均衡コーパス BCCWJ の各種インターフェース [web_service][corpus][link][japanese]

「#1567. 英語と日本語のオンラインコーパスをいくつか紹介」 ([2013-08-11-1]) で,現代日本語のコーパスとしてKOTONOHA 「現代日本語書き言葉均衡コーパス」に言及した.この『現代日本語書き言葉均衡コーパス』 (BCCWJ: Balanced Corpus of Contemporary Written Japanese) は,大学共同利用機関法人人間文化研究機構国立国語研究所と文部科学省科学研究費特定領域研究「日本語コーパス」プロジェクトが共同で開発した本格的なコーパスである.
 コーパスの内容については,同サイトに「2012年3月現在,検索対象となっているのは,以下の11種のデータ,合計約1億500万語です」とある.サンプルは,1976--2008年にかけての文書で,その11のジャンルは書籍,雑誌,新聞,白書,教科書,広報紙,Yahoo!知恵袋,Yahoo!ブログ,韻文,法律,国会会議録にわたる.各テキストからは2種類のサンプルが取られており,「ひとつは長さを1000字に固定したサンプル (固定長サンプル),もうひとつは,節や章など文章の意味上のまとまりに対応した単位の全体です (可変長サンプル).これまでの調査によれば,可変長サンプルの平均長は新聞で約1000字,書籍で4000字弱です.」とある.
 BCCWJ を利用する方法やインターフェースはいくつかあるが,もっとも簡便なものが,上にもリンクを張った少納言である.登録不要で,表層の文字列によるコーパスの全文検索ができる.出力は無作為の500件と制限があるが,お手軽に試すことができる.
 一方,利用申請が必要な中納言では,同コーパスに対して,短単位・長単位・文字列の3つの方法により,形態論的な複雑な検索をかけることができる.
 また別のインターフェーとして,NINJAL-LWP for BCCWJ (NLB) がある.現行の1.20版では,BBCWJ のほとんどのデータを対象として,検索をかけることができる.検索ページはこちら
 関連して,NLB と同じインターフェースで利用できるもう1つの日本語コーパスを紹介する.筑波大学がウェブサイトからテキストを収集して編纂した11億語からなる筑波ウェブコーパス (Tsukuba Web Corpus: TWC) へのインターフェース,NINJAL-LWP for TWC (NLT)である.検索ページはこちら

[ 固定リンク | 印刷用ページ ]

2013-08-11 Sun

#1567. 英語と日本語のオンラインコーパスをいくつか紹介 [web_service][corpus][efl][link][japanese]

 ウェブ上で用いることのできるコーパスをいくつか紹介したい.
 まず,「#1441. JACET 8000 等のベース辞書による語彙レベル分析ツール」 ([2013-04-07-1]) で取り上げた染谷泰正氏は,Business Letter Corpus のオンライン・コンコーダンサーをこちらで公開している.27種のコーパスからの検索が選択可能となっているが,メインは100万語超からなる Business Letter Corpus (BLC2000) とそれにタグ付けした POS-tagged BLC の2つだ.これは1970年代以降の英米その他の出版物から収集したデータである.
 Instructions for the First-Time User でまとめられているように,種々のコーパスのなかには,167万語を超える State of the Union Address (1790--2006) などデータをダウンロードできるものもあり,有用である.英作文の学習・教育や,独自データベースのコンコーダンサー作成のために参考になる.
 なお,同サイトでは,上述の各種コーパスから N-Gram Search を行なえる Bigram Plus の機能も提供している.N-Gram の検索には,本ブログより「#956. COCA N-Gram Search」 ([2011-12-09-1]) も参照.
 次は,英国のリーズ大学 (University of Leeds) が作成した大規模な Leeds collection of Internet corpora.英語を始め,フランス語,日本語などの様々な言語のコーパスをオンラインで検索できる.
 日本語のコーパスの情報については詳しくないが,KOTONOHA 「現代日本語書き言葉均衡コーパス」は充実しているようだ.ほかの日本語コーパスの情報源としては,コーパス日本語学のための情報館 --- コーパス紹介が有用.

Referrer (Inside): [2013-10-09-1]

[ 固定リンク | 印刷用ページ ]

2013-07-29 Mon

#1554. against の -st 語尾 [preposition][adverb][genitive][phonetics][link]

 語源的には againstagain から派生した形態だが,いったいこの -st 語尾は何なのだろうか.
 古英語で,again は ongēan などの形態で副詞,前置詞(与格あるいは対格を支配する),接頭辞として広く機能していた.平行して,副詞を示す属格語尾語尾を伴った ongēanes などの形態も行なわれていた([2009-07-18-1]の記事「#81. oncetwice の -ce とは何か」を参照).中英語になると,前置詞としての again は,異形 agains および後続の against とともに競合し始め,近代英語の標準語確立の過程で副詞としての機能に限定されてゆくこととなった.近代英語で前置詞としての標準的な地位を確立したのは,最も後発の against だった.
 さて,again の直後の -(e)s の添加は,上述の通り,副詞化する属格語尾とされているが,さらなる t の添加はどのように説明されるだろうか.OED の against, prep., conj., adv., and n. の語源欄によると次のようにある.

The development of excrescent final -t . . . was probably reinforced by the fact that the word was frequently followed by te, variant of THE adj., and perhaps also by association with superlatives in -st; compare similarly AMONGST prep. 1a, AMIDST adv., BETWIXT prep.


 『英語語源辞典』の記述も,OED に沿っているが,補足説明がある.

-t はおそらく最上級の -st と混同されたための添え字 (cf. AMIDST, AMONGST, BETWIXT), または agains þeagains teagainst(e) þe (cf. hwīls þatwhilst þat) となる異分析によるものか.この -st に終わる語形の最初の例は Layamon Brut の Otho 写本 (c1300) に aȝenest として見いだされる(Caligula 写本 (?a1200) では toȝines). Trevisa や1400年以降 London の英語では広く使用され,16C半には文語として確立した.again, against とも ModE -g- の綴りと発音は ON の影響を受けた北部方言による.


 Brut からの初例は,MED ayēn(e)s (prep.) 1(b) より,"c1300 Lay. Brut (Otho C.13) 22476: He dude ase a wisman and wende a3enest [Clg: to3eines] him anon." である.
 上記より,against の -st 添加については,(1) 最上級語尾 -st との類推,(2) 直後の定冠詞の語頭子音に関わる異分析,という説明が提案されてきたということである.同じ語尾添加の例として amidst, amongst, betwixt, whilst などがあるが,これらの初出時期,互いの機能的類似性,-st の有無による意味の相違,語末3子音連続の音韻論的意義などを考察して,総合的に迫るべき問題だろう.関連して,古英語 ongēan の類義語 tōgēan(es) に基づいて,-t の添加された形態が15世紀に toȝenes として初出していることも付け加えておく.
 ほかに against における語尾音添加 (paragoge) については,「#739. glide, prosthesis, epenthesis, paragoge」 ([2011-05-06-1]) を参照.また,whilst については「#508. Dracula に現れる whilst」 ([2010-09-17-1]),「#509. Dracula に現れる whilst (2)」 ([2010-09-18-1]),「#510. アメリカ英語における whilst の消失」 ([2010-09-19-1]) を,betwixt については「#1389. between の語源」 ([2013-02-14-1]),「#1393. between の歴史的異形態の豊富さ」([2013-02-18-1]),「#1394. between の異形態の分布の通時的変化」 ([2013-02-19-1]),「#1399. 初期中英語における between の異形態の分布」 ([2013-02-24-1]) を参照.

 ・ 寺澤 芳雄 (編集主幹) 『英語語源辞典』 研究社,1997年.

[ 固定リンク | 印刷用ページ ]

Powered by WinChalow1.0rc4 based on chalow