現代英語における綴字と発音の乖離の問題については,spelling_pronunciation_gap の多くの記事で取り上げてきた.とりわけその歴史的要因については,「#62. なぜ綴りと発音は乖離してゆくのか」 ([2009-06-28-2]) でまとめた.今回は英語綴字について言われる不規則性の種類と,それが生じた歴史的要因に注目し,改めて関連する事情を箇条書きで整理したい.各項の説明は,関連する記事のリンクにて代える.
[ 不規則性の不満の背後にある前提 ]
(1) アルファベットは表音文字体系を標榜している以上「1文字=1音」を守るべし (see #1024)
(2) 綴字規則に例外あるべからず (see #503)
(3) 1つの単語に対して1つの決まった綴字があるべし,という正書法 (orthography)の発想 (see ##53,54,194)
[ 不規則性の種類 ]
(1) 1つの文字(列)に対して複数の音: <o> で表わされる音は? <gh> で表わされる音は? (see ##210,1195)
(2) 1つの音に対して複数の文字(列): /iː/ を表わす文字(列)は? /k/ を表わす文字(列)は? (see #2205)
(3) 黙字 (silent_letter): climb, indict, doubt, imbroglio, high, hour, marijuana, know, half, autumn, receipt, island, listen, isthmus, liquor, answer, plateaux, randezvous
(4) 形態音韻上の交替: city/cities, swim/swimming, die/dying (see #1284)
(5) 綴字のヴァリエーション: color/colour, center/centre, realize/realise, jail/gaol (see #94)
[ 不規則性の歴史的要因 ]
(1) 英語は,音素体系の異なるラテン語を表記するのに最適化されたローマン・アルファベットという文字体系を借りた (see ##423,1329,2092)
(2) 英語は,諸言語から語彙とともに綴字体系まで借用した (see #2162)
(3) 綴字の標準を欠く中英語期の綴字習慣の余波 (see ##562,1341,1812)
(4) 各時代の書写の習慣,美意識,文字配列法 (graphotactics) (see ##91,223,446,1094,2227,2235)
(5) 語源的綴字 (see etymological_respelling)
(6) 表音主義から表語主義への流れ (see ##1332,1386,1760,2043,2058,2059,2097,2312,2344)
(7) 音はひたすら変化するが,文字は保守的 (see ##15,2292)
(8) 綴字標準化の間の悪さ (see ##1902,297,871,312)
(9) 変種間,位相間の綴字ヴァリエーション (see #ame_bre spelling)
(10) 綴字改革の難しさ (see spelling_reform)
[ 前提を疑う必要 ]
(1) アルファベットは表音文字体系だが,単語を表記するためにそれを組み合わせた単位である綴字は表語的である
(2) 1つの単語に対して1つの決まった綴字があるべしという正書法の発想は,多くの言語において近代以降に特徴的な考え方である (see #2392)
(3) 綴字規則には例外が多いが,個々の例外の多くは歴史的に説明される
・ 大名 力 『英語の文字・綴り・発音のしくみ』 研究社,2014年.
・ Horobin, Simon. Does Spelling Matter? Oxford: OUP, 2013.
象形文字 (hieroglyph) は,前段階の絵文字 (pictogram) から発達したと考えられる,真の文字の名に値する原初の文字である.絵文字は特定の言語単位に対応しておらず,厳密にいえば真の文字とはいえない.したがって,「絵文字」という呼称そのものがある種の自己矛盾を含んでいる.一方,象形文字は特定の言語単位(最初期の文字においては典型的に語)に対応している,換言すれば特定の音声上の「読み」をもっている,とみられるものである.象形文字も,(多少なりとも簡略化されているとはいえ)事物をかたどった絵であるという点で,見栄えこそ絵文字と共通するが,その記号論上の機能は絵文字と決定的に異なることに注意したい.
典型的な象形文字として,ヒエログリフ (hieroglyph) と称されるエジプト聖刻文字がよく知られている.その詳細で繊細な字形はまさに絵というにふさわしく,その形態も3000年の長きにわたってほとんど変化していないことから,一般に「絵文字」と称されるが,上記の定義からすると絵文字ではなく正真正銘の文字,象形文字と称するべきである.聖刻文字はこのように典型的な象形文字であることから,英語で hieroglyph はエジプト聖刻文字に限らず,シュメール楔形文字や甲骨文字なども含めて,広義に象形文字を意味する語ともなっている.
以下,加藤 (250--51) の年表をもとに,象形文字 (hieroglyph) の盛衰を示そう.
エジプト・エーゲ海 | 西アジア | インド・東アジア | 新大陸 | |
---|---|---|---|---|
都市国家の成立(前3300頃) | ||||
エジプト統一王朝の始まり,ヒエログリフの始まり(前3100頃) | シュメール象形文字の始まり(前3100頃) | |||
前3000 | ||||
エジプト古王国(前2700頃--前2200頃) | ||||
楔形文字の始まり(前2600頃) | ||||
インダス文明,インダス文字の使用(前2500頃--前1500頃) | ||||
アッカド王国(前2350頃--前2150頃) | ||||
前2000 | エジプト中王国(前2000頃--前1800頃),クレタ文字(前2000頃--前1450頃) | |||
殷王朝(前18世紀頃--前1050頃) | ||||
エーゲ線状文字A型(前1700頃--前1450頃),ファイストス円盤(前17世紀) | バビロニア王国(前1830頃--前1530頃) | |||
エジプト新王国(前1570頃--前1090頃) | 原シナイ文字(前16世紀頃) | |||
ヒッタイト象形文字(前1500頃--前700頃),ヒッタイト帝国(前1460頃--前1200頃) | ||||
アクエンアテンの宗教改革(前1370頃),エーゲ線状文字B型(前14世紀頃--前12世紀) | 甲骨文字(前14世紀--前11世紀) | |||
アヒラム王碑文(前13世紀頃) | ||||
周王朝(西周・東周時代,前1120頃--前256)のもとに金文の使用 | ||||
前1000 | アッシリア帝国(前1000頃--前612) | |||
デモティックの始まり(前700頃),エジプト・サイス王朝時代(前663--前525) | ||||
ペルシア帝国(前6世紀中頃--前330) | ||||
エジプト・プトレマイオス王朝時代(前323--前30) | ||||
秦時代(前221--前206)に小篆(ふつうにいう篆書)と隷書の始まり | ||||
前1 | 楔形文字の終わり(前1世紀末) | |||
紀元後 | ||||
コプト文字の始まり(200頃) | 楷書(今日の漢字)の始まり(後漢末,200頃),中国文字が日本につたわる(200頃) | |||
ヒエログリフの最後の例(394) | ||||
デモティックの最後の例(452) | ||||
マヤ文化,マヤ文字の使用(6世紀頃--10世紀頃) | ||||
1000 | ||||
アステカ文化,アステカ文字の使用(1220頃--1521) | ||||
インカ帝国の盛時(1400頃--1533) | ||||
シャンポリオンがヒエログリフを解読(1822) | グローテフェントが楔形文字を解読(1802),ローリンソンが楔形文字を解読(1835) | 甲骨文字の発見(1899) | ||
原シナイ文字の発見(1904--05),ヴェントリスがエーゲ線状文字B型を解読 | ||||
2000 |
情報理論や自然言語処理の分野で用いられる n-gram という分析手法がある.コーパス言語学でもすでにお馴染みの概念であり,共起表現 (collocation) の研究などでは当たり前のように用いられるようになった.種々のコーパスのインターフェースにおいても採用されており,「#607. Google Books Ngram Viewer」 ([2010-12-25-1]) では名前に含まれているほどだし,本ブログでも COCA (Corpus of Contemporary American English) の N-gram データベースを用いて「#956. COCA N-Gram Search」 ([2011-12-09-1]) を実装してきた(その応用は,「#953. 頭韻を踏む2項イディオム」 ([2011-12-06-1]),「#954. 脚韻を踏む2項イディオム」 ([2011-12-07-1]),「#955. 完璧な語呂合わせの2項イディオム」 ([2011-12-08-1]) を参照).BNC では,Explore Words and Phrases from the BNC が利用できる.
コンピュータを用いた分析手法というと難しそうに聞こえるが,n-gram の考え方は至って単純である.文字レベルの 2-gram (bigram) を考えてみよう.最長の英単語といわれる pneumonoultramicroscopicsilicovolcanoconiosis (「#63. 塵肺症は英語で最も重い病気?」 ([2009-06-30-1])) を例にとる.まず,先頭の2文字1組の pn を取り出す.次に,2文字目に進んで同じように ne を取り出す.3文字目に進んで eu を,4文字目に進んで um を得る.同じように,1文字ずつ右にずらしながら,最後の is まで2文字1組を次々と拾っていく.これで44組の2文字を得たことになる.この組のなかで,ic と co という組み合わせは各々3回起こり,os, si, no, on の組み合わせは各々2回現われ,それ以外の組み合わせはいずれも1度きりである.したがって,この単語において最高頻度の2文字1組は ic と co となる.
n-gram の単位は,このように文字である必要はなく,音素でもよいし,より大きな単位である形態素や語でもよく,さらに大きな句などのより大きな単位でもよい.英語コーパス言語学では,語という単位で考えるのが普通だろう.Martin Luther King, Jr. の I Have a Dream の演説のテキストで語単位の 4-gram を取ると,最も多い4語の組み合わせは,予想通り "I have a dream" の8回だが,"will be able to" も同じく8回現われる."Let freedom ring from" も7回とよく現われる,等々の分析が可能となる.ここでは4語という「窓」を設定したので 4-gram と呼ばれるが,隣接するいくつの文字を考慮するかにより 1-gram (unigram), 2-gram (bigram), 3-gram (trigram),そして 5-gram 以上ももちろん考えることができる(1-gram の場合,得られるリストは,事実上各語の生起頻度表である).
巨大コーパスから得られた 2-gram や 3-gram の一覧は,それ自体が共起表現の研究などでは基本データとなるため,ウェブ上でもいろいろと公開されている.日本語では「N-gram コーパス - 日本語ウェブコーパス 2010」があるし,現代英語では COCA の n-gram データベース がある.また,Bigram Plus では,歴史英語コーパスを含めた各種英語コーパスから N-Gram Search を行なえる機能を提供している.ほかにも任意のテキストやコーパスを対象に n-gram を取る各種のツールやソフトも,ウェブ上で入手可能だ.
n-gram 分析の言語分野への応用範囲は広い.次に来る語(音,文字)は何か,という予測可能性とも関係が深いため,機械による音声認識,統語分析,言語判定,自動翻訳,スペルチェック,剽窃探知,全文検索用インデックスの作成などに活用される.もちろん,共起表現の研究では,基本にして不可欠の手段となっている.一方,n-gram はもっぱら言語として表面化されたテキストを対象とし,深層にある構造にまったく触れることがないため,生成文法のような言語理論の方面からは批判があるようだ.詳しくは,n-gram in Wikipedia を参照.
n-gram は工夫次第で,まだまだ使い道がありそうだ.歴史英語テキストにも,応用していきたい.
(後記 2015/09/12(Sat): Sketch Engine より N-grams も参照.)
昨年11月のことになるが,Joe Gilbert による20分のドキュメンタリー番組 "English 3.0 on Vimeo" が公開された.オンラインで鑑賞できる.Tom Chatfield, David Crystal, Robert McCrum, Fiona McPherson, Simon Horobin といった名立たる出演陣により,インターネット時代の英語の現状が解説される.
netspeak に代表される,インターネット上で用いられる種類の英語を巡って,世間には様々なとらえ方がある.英語の堕落だ,規範の崩壊だという否定的な見解が目立つが,上記の出演者たちは口を揃えて,そうではない,言語の歴史においていつの時代にも繰り返されてきた言語変化にすぎないと言い切る.インターネットの登場により言語変化が加速したということや,「#1664. CMC (computer-mediated communication)」 ([2013-11-16-1]) のような新たな媒体 (medium) が生じたことは確かだが,そのようなことは歴史上の他の技術革新の際にもおよそ生じてきたことであり,言語史という広い視点から見れば特別ではない,と.
議論の主張点は,およそ次の4点だろう.
(1) インターネットの登場により言語変化が加速している
(2) インターネット英語に顕著な略式表現による英語の堕落が取りざたされているが,実際には英語の堕落を示す証拠はない
(3) 大きな技術革新の時代には言語堕落論が生じやすいが,実際に生じていることは,言語に新たな次元が付け加わるということであり,積極的に評価すべきだ
(4) 今後,伝統的な規範主義と,新しく生まれつつあるより自由な言語観とのあいだで戦いが生じるだろう
私もこれらの主張点にはほぼ賛成する.ただ1つ気になるのは,(1) の言語変化の加速という点についてである.同時代の観察者として,歴史的にみても英語の変化の速度 (speed_of_change) が著しいという直感はあるが,変化の速度とはそもそもどのように客観的に計測できるものなのだろうか.速度とは単位時間辺りの変化量のことであるから,まず変化量を計測することができなければならない.では,変化量を計測するといったときに,計測する対象は何になるのか.英語の言語変化と一口にいっても,英語という言語単位がどこからどこまでなのか,標準変種に限るのか,ピジン語まで含むのか等々,社会言語学的に頭の痛い問題があるし,また変化の土俵が語彙なのか,音声なのか,文法なのかという部門の問題もある.さらに,現代は変化速度が早まっているなどと結論するためには,比較のために過去のいくつかの時点における変化速度も先に割り出しておかなければならない.
同時代であるからこそ直感に頼ってはいけないという慎重論を取るのであれば,現代における言語変化の加速という命題は,たやすく前提として受け入れてはならないのかもしれない.同じドキュメンタリーに対する Wordorigins.org のレビューでも,別の角度から言語変化の速度について批判的に考察しているので,参照されたい.
英語史を学ぶ上で有用な地図25枚を解説つきで掲載しているウェブページをみつけたので紹介したい.25 maps that explain the English language では,地図や図式で表わすことのできる英語史上の重要な話題が取り上げられており,それがおよそ時代順に並べられている.25項目の題名を抜き出してみよう.
1. Where English comes from
2. Where Indo-European languages are spoken in Europe today
3. The Anglo-Saxon migration
4. The Danelaw
5. The Norman Conquest
6. The Great Vowel Shift
7. The colonization of America
8. Early exploration of Australia
9. Canada
10. English in India
11. Tristan da Cunha
12. Countries with English as the official language
13. Which countries in Europe can speak English
14. Where people read English Wikipedia
15. Where new English words come from
16. How vocabulary changes based on what you're writing
17. Vocabulary of Shakespeare vs. rappers
18. Where English learners speak the language proficiently
19. Scores on the Test of English as a Foreign Language
20. Immigrants to the US are learning English more quickly than previous generations
21. Where Cockneys come from
22. Dialects and accents in Britain
23. North American vowel shift
24. American dialects
25. You guys vs. y'all
本ブログでもこれらの多くの話題を取り上げてきたので,関連する記事をキーワードで検索されたい.地図や図表のような視覚資料についても,本ブログでは積極的に掲載してきた.map の各記事,およびイメージ集もご覧ください.
この2日間の記事「#2251. Ullmann による意味変化の分類」 ([2015-06-26-1]),「#2252. Waldron による意味変化の分類」 ([2015-06-28-1]) で引用・参照した Waldron は,Stern と Ullmann などの主要な先行研究を踏まえながら,意味変化の原因についても論じている.原因についての何らかの新しい洞察を付け加えているわけではないが,原因論を巡ることがなぜ難しいのかというメタな問題について,非常に参考になる議論を展開している.
We have now considered a number of factors which may contribute to change of meaning and it is not difficult to see why so many different schemes of semantic change have been proposed over the last 150 years and why there is so little agreement among scholars as to the correct classification of the phenomena. For behind every change of meaning there lies a chain of causation which can be analysed at a number of different levels --- e.g. material, social, psychological, logical --- and at each level we should get a different answer to the question 'Why did this word change its meaning?' The position of a statistician analysing (let us suppose) the causes of death in a certain community would be somewhat similar, unless he decided beforehand what sort of causes he was going to pay attention to. For at one level of analysis, every death might presumably be regarded as a case of heart stopped beating; at different levels of analysis such categories as drowning, overwork, carbon-monoxide poisoning, typhoid, and smoke-polluted atmosphere might all be acceptable as causes; but there would be no guarantee that each death would fit into one and only one aetiological category, unless the causes were all analysed at more or less the same level. The doctor who has to insert a cause of death on a death certificate uses one of a set of terms which classify the causes on a fairly consistent level of medical diagnosis; and in matters of such complexity no system of classification for causes is serviceable unless consistency of level is observed. This, of course, is a consequence of the indeterminateness of our concept of cause: every event has many different causes.
It is quite futile, therefore, for us to attempt to distinguish which sense-changes are due to linguistic causes and which to non-linguistic causes, or which are due to material causes and which to social causes; while it would perhaps be an exaggeration to contend that any change of meaning could be regarded as the consequence, immediate or remote, of any of the recognized causes, the various causal schemes undoubtedly show a good deal of overlapping.
意味変化の原因の研究を,人の死因の究明になぞらえた点が秀逸である.原因の分析のレベルが様々にありうる以上,そこから取り出される原因そのものも多種多様であり,またしばしば互いに重なり合っていることは当然である.必然的に multiple causation を想定せざるをえないことになる.
このことは,意味変化の原因論にとどまらず,言語変化一般の原因論についてもいえるだろう.言語学史においても,言語変化の原因,理由,動機づけ(を探ること)については侃々諤々の議論がある.この問題については,本ブログから cat:language_change causation の各記事を参照されたい.その中でも,とりわけ関係するものとして以下を挙げておく (##442,1123,1173,1282,1549,1582,1584,1986,2123,2143,2151,2161) .
・ 「#442. 言語変化の原因」 ([2010-07-13-1])
・ 「#1123. 言語変化の原因と歴史言語学」 ([2012-05-24-1])
・ 「#1173. 言語変化の必然と偶然」 ([2012-07-13-1])
・ 「#1282. コセリウによる3種類の異なる言語変化の原因」 ([2012-10-30-1])
・ 「#1549. Why does language change? or Why do speakers change their language?」 ([2013-07-24-1])
・ 「#1582. 言語内的な要因と言語外的な要因はどちらが重要か? (2)」 ([2013-08-26-1])
・ 「#1584. 言語内的な要因と言語外的な要因はどちらが重要か? (3)」 ([2013-08-28-1])
・ 「#1986. 言語変化の multiple causation あるいは "synergy"」 ([2014-10-04-1])
・ 「#2123. 言語変化の切り口」 ([2015-02-18-1])
・ 「#2143. 言語変化に「原因」はない」 ([2015-03-10-1])
・ 「#2151. 言語変化の原因の3層」 ([2015-03-18-1])
・ 「#2161. 社会構造の変化は言語構造に直接は反映しない」 ([2015-03-28-1])
・ Waldron, R. A. Sense and Sense Development. New York: OUP, 1967.
先日,カナダの University of British Columbia で開催された SHEL-9/DSNA-20 Conference (The 9th Studies in the History of the English Language Conference) に参加してきた.発表の1つに,DCHP-2 プロジェクトに関する中間報告があった.DCHP-2 とは,歴史的原則によって編まれたカナダ語法の辞書 Dictionary of Canadianisms on Historical Principles の第2版である.初版は1967年に出版されており,2013年には電子化されたものが DCHP-1 としてウェブ上で公開されている.DCHP-2 は UBC が主体となって編纂を進めており,完成に近づいているようなので,遠からず公開されることになるだろう.発表では,編纂に関わる UBC の学生が,部分的に DCHP-2 のデモを見せてくれたが,なかなか充実した内容のようだ.
その発表では,ある語(句),意味,語法が Canadianism であるというとき,何をもって Canadianism とみなすのかという定義の問題について,基本方針が示されていた.大雑把にいえば,カナダで使用される英語だけでなく,アメリカ英語,イギリス英語,その他の英語変種のコーパスを比較対象として用い,カナダで用いられる英語に統計的に使用が偏っているものを Canadianism とみなすという方針が貫かれている.それぞれの数値はグラフで可視化され,複数コーパス利用の長所が最大限に活かされているようだ.このようなグラフが容易に得られるようになれば,英語変種間の多角的な比較も促進されるだろう.
伝統的,逸話的に Canadianism とみなされてきた語句については,上記の方針の下でとりわけ批判的な検討が加えられ,場合によっては Canadianism とみなすことはできないという結論が下されることもあるという.一方,Canadianism として認定されたものについては,コーパスからの用例や出典の掲載はもちろん,歴史的背景についても詳しい記述が施される.
DCHP-2 が完成すれば,カナダ英語研究に弾みがつくことは間違いない.カナダ英語に限らず,○○英語の辞書やコーパスの編纂がますます活気づいてくれば,変種間の比較もしやすくなり,新たな英語研究の道が開けるはずである.21世紀的な英語学の形の1つだろう.
また,このプロジェクトは,変種とは何かという本質的な問題を再検討するす機会を提供してくれているようにも思われる.一体 Canadianism とは何か.言語学的に定義できるのか,あるいはひとえに社会的,イデオロギー的にしか定義できないものか.Lilles のようにカナダ英語を「神話」とみる者もいれば,実在すると主張する者もいる.これは,Canadianism に限らず,Americanism, Britishism など「○○語法」を指す -ism のすべてに関わる問題である.変種 (variety) を巡る論考については,「#415. All linguistic varieties are fictions」 ([2010-06-16-1]),「#1373. variety とは何か」 ([2013-01-29-1]),「#2116. 「英語」の虚構性と曖昧性」 ([2015-02-11-1]) などを参照されたい.
加えて,カナダ英語の歴史と概要については,「#313. Canadian English の二峰性」 ([2010-03-06-1]),「#1733. Canada における英語の歴史」 ([2014-01-24-1]) も参照.
・ Lilles, Jaan. "The Myth of Canadian English." English Today 62 (April 2000): 3--9, 17.
一ヶ月前の「#2186. 研究社Webマガジンの記事「コーパスで探る英語の英米差 ―― 基礎編 ――」」 ([2015-04-22-1]) に引き続き,5月20日付で「実践編」が公開されました.研究社WEBマガジン Lingua リンガより,こちらをご覧ください. *
今回は,複数のコーパスを用いることの利点やおもしろさを押し出しました.また,英語の英米差という一見すると静的な話題にも,動的あるいは通時的に迫ることにより,新たな見方が得られる点も強調しました.
記事のなかでも触れましたが,実際には今回の「実践編」で述べた結論に至るには,もっと詳しく調査しなければなりません.しかし,コーパスを用いて,例えばこのような言語変化の徴候をとらえることができるかもしれないという可能性を感じ取ってもらえれば,という気持ちで執筆しました.基礎編,実践編で私の執筆担当は完結ですが,来月以降も引き続き研究社WEBマガジン Lingua リンガの記事にご注目ください.バックナンバーも非常に有用です.以下,改めて研究社WEBマガジン Lingua リンガの各記事へのリンク(最新版)を張っておきます.
1. なぜコーパスか? (赤須 薫)
2. 英語コーパス体験ツアー ― BNCweb を検索してみる ―(前編) (石井 康毅)
3. 英語コーパス体験ツアー ― BNCweb を検索してみる ―(後編) (石井 康毅)
4. Google をコーパスに見立てる (仁科 恭徳)
5. 言語統計の基礎(前編) ― 頻度差の検定 ― (小林 雄一郎 )
6. 言語統計の基礎(後編) ― 共起尺度 ― (小林 雄一郎)
7. コーパスを活用した古くて新しい学問領域:フレイジオロジー ― 理論編 ― (井上 亜依)
8. コーパスを活用した古くて新しい学問領域:フレイジオロジー ― 実践編 ― (井上 亜依)
9. 学習者コーパスとは何か? (鎌倉 義士)
10. 学習者コーパスで何ができるのか? (鎌倉 義士)
11. パラレルコーパスの可能性 (仁科 恭徳)
12. 日本語コーパスに見られる慣用句の用法 (石田 プリシラ)
13. 日本語コーパスに見られる慣用句の変化可能性 (石田 プリシラ)
14. COCA を使ったコロケーションの検索 (内田 諭)
15. COCA を使った類義語の検証 (内田 諭)
16. コーパスで話し言葉を探る ― 基礎編 ― (青木 理香)
17. コーパスで話し言葉を探る ― 実践編 ― (青木 理香)
18. 学習者の話し言葉コーパスを使った語用論分析 (1)談話標識 well, I mean, kind of, like の使い方 (三浦 愛香)
19. 学習者の話し言葉コーパスを使った語用論分析 (2)買い物での要求の表現 (三浦 愛香)
20. 認知言語学を用いてコーパスから意味を探る― 入門編 ― (大谷 直輝)
21. 認知言語学を用いてコーパスから意味を探る― 前置詞・句動詞編 ― (大谷 直輝)
22. コーパスで探る英語の英米差 ―― 基礎編 ―― (堀田 隆一)
23. コーパスで探る英語の英米差 ―― 実践編 ―― (堀田 隆一)
なお,今回の実践編で注目した gorgeous に関しては,本ブログでも以下の記事で扱ってきましたのでご参照ください.
・ 「#476. That's gorgeous!」 ([2010-08-16-1])
・ 「#477. That's gorgeous! (2)」 ([2010-08-17-1])
・ 「#607. Google Books Ngram Viewer」 ([2010-12-25-1])
また,英語(言語)の男女差についても gender_difference の各記事で扱ってきました.特に言語の男女差とコーパス利用を絡めた記事として,「#913. BNC による語彙の男女差の調査」 ([2011-10-27-1]) をご覧ください.
一ヶ月前の「#2186. 研究社Webマガジンの記事「コーパスで探る英語の英米差 ―― 基礎編 ――」」 ([2015-04-22-1]) に引き続き,5月20日付で「実践編」が公開されました.研究社WEBマガジン Lingua リンガより,こちらをご覧ください. *
今回は,複数のコーパスを用いることの利点やおもしろさを押し出しました.また,英語の英米差という一見すると静的な話題にも,動的あるいは通時的に迫ることにより,新たな見方が得られる点も強調しました.
記事のなかでも触れましたが,実際には今回の「実践編」で述べた結論に至るには,もっと詳しく調査しなければなりません.しかし,コーパスを用いて,例えばこのような言語変化の徴候をとらえることができるかもしれないという可能性を感じ取ってもらえれば,という気持ちで執筆しました.基礎編,実践編で私の執筆担当は完結ですが,来月以降も引き続き研究社WEBマガジン Lingua リンガの記事にご注目ください.バックナンバーも非常に有用です.以下,改めて研究社WEBマガジン Lingua リンガの各記事へのリンク(最新版)を張っておきます.
1. なぜコーパスか? (赤須 薫)
2. 英語コーパス体験ツアー ― BNCweb を検索してみる ―(前編) (石井 康毅)
3. 英語コーパス体験ツアー ― BNCweb を検索してみる ―(後編) (石井 康毅)
4. Google をコーパスに見立てる (仁科 恭徳)
5. 言語統計の基礎(前編) ― 頻度差の検定 ― (小林 雄一郎 )
6. 言語統計の基礎(後編) ― 共起尺度 ― (小林 雄一郎)
7. コーパスを活用した古くて新しい学問領域:フレイジオロジー ― 理論編 ― (井上 亜依)
8. コーパスを活用した古くて新しい学問領域:フレイジオロジー ― 実践編 ― (井上 亜依)
9. 学習者コーパスとは何か? (鎌倉 義士)
10. 学習者コーパスで何ができるのか? (鎌倉 義士)
11. パラレルコーパスの可能性 (仁科 恭徳)
12. 日本語コーパスに見られる慣用句の用法 (石田 プリシラ)
13. 日本語コーパスに見られる慣用句の変化可能性 (石田 プリシラ)
14. COCA を使ったコロケーションの検索 (内田 諭)
15. COCA を使った類義語の検証 (内田 諭)
16. コーパスで話し言葉を探る ― 基礎編 ― (青木 理香)
17. コーパスで話し言葉を探る ― 実践編 ― (青木 理香)
18. 学習者の話し言葉コーパスを使った語用論分析 (1)談話標識 well, I mean, kind of, like の使い方 (三浦 愛香)
19. 学習者の話し言葉コーパスを使った語用論分析 (2)買い物での要求の表現 (三浦 愛香)
20. 認知言語学を用いてコーパスから意味を探る― 入門編 ― (大谷 直輝)
21. 認知言語学を用いてコーパスから意味を探る― 前置詞・句動詞編 ― (大谷 直輝)
22. コーパスで探る英語の英米差 ―― 基礎編 ―― (堀田 隆一)
23. コーパスで探る英語の英米差 ―― 実践編 ―― (堀田 隆一)
なお,今回の実践編で注目した gorgeous に関しては,本ブログでも以下の記事で扱ってきましたのでご参照ください.
・ 「#476. That's gorgeous!」 ([2010-08-16-1])
・ 「#477. That's gorgeous! (2)」 ([2010-08-17-1])
・ 「#607. Google Books Ngram Viewer」 ([2010-12-25-1])
また,英語(言語)の男女差についても gender_difference の各記事で扱ってきました.特に言語の男女差とコーパス利用を絡めた記事として,「#913. BNC による語彙の男女差の調査」 ([2011-10-27-1]) をご覧ください.
4月20日付けで,研究社WEBマガジン Lingua リンガのリレー連載 実践で学ぶコーパス活用術に,私の執筆した「コーパスで探る英語の英米差 ―― 基礎編 ――」の記事が掲載されました.今日は,このリレー連載と私の記事について紹介します. *
連載「実践で学ぶコーパス活用術」はコーパス利用初心者向けのオムニバス記事で,毎月様々な言語学研究者が登場し,易しくかつ実践的にコーパス活用の方法を解説してゆくシリーズです.すでに20の記事が掲載されており,コーパスの基本から始まり,各種のコーパスの紹介,利用のコツ,事例研究,言語統計入門に至るまで,コーパスに関連する様々な視点が丁寧に解説されています.以下に,各記事へのリンクを張っておきます.
1. なぜコーパスか? (赤須 薫)
2. 英語コーパス体験ツアー ― BNCweb を検索してみる ―(前編) (石井 康毅)
3. 英語コーパス体験ツアー ― BNCweb を検索してみる ―(後編) (石井 康毅)
4. Google をコーパスに見立てる (仁科 恭徳)
5. 言語統計の基礎(前編) ― 頻度差の検定 ― (小林 雄一郎 )
6. 言語統計の基礎(後編) ― 共起尺度 ― (小林 雄一郎)
7. コーパスを活用した古くて新しい学問領域:フレイジオロジー ― 理論編 ― (井上 亜依)
8. コーパスを活用した古くて新しい学問領域:フレイジオロジー ― 実践編 ― (井上 亜依)
9. 学習者コーパスとは何か? (鎌倉 義士)
10. 学習者コーパスで何ができるのか? (鎌倉 義士)
11. パラレルコーパスの可能性 (仁科 恭徳)
12. 日本語コーパスに見られる慣用句の用法 (石田 プリシラ)
13. 日本語コーパスに見られる慣用句の変化可能性 (石田 プリシラ)
14. COCA を使ったコロケーションの検索 (内田 諭)
15. COCA を使った類義語の検証 (内田 諭)
16. コーパスで話し言葉を探る ― 基礎編 ― (青木 理香)
17. コーパスで話し言葉を探る ― 実践編 ― (青木 理香)
18. 学習者の話し言葉コーパスを使った語用論分析 (1)談話標識 well, I mean, kind of, like の使い方 (三浦 愛香)
19. 学習者の話し言葉コーパスを使った語用論分析 (2)買い物での要求の表現 (三浦 愛香)
20. 認知言語学を用いてコーパスから意味を探る― 入門編 ― (大谷 直輝)(←2015/05/18(Mon)にリンクを追加)
21. 認知言語学を用いてコーパスから意味を探る― 前置詞・句動詞編 ― (大谷 直輝)(←2015/05/18(Mon)にリンクを追加)
22. コーパスで探る英語の英米差 ―― 基礎編 ―― (堀田 隆一)
23. コーパスで探る英語の英米差 ―― 実践編 ―― (堀田 隆一)(←2015/05/21(Thu)にリンクを追加)
今回私の書いた記事は,コーパスを用いて英語の英米差について考えようという趣旨で,みかけは現代イギリス英語と現代アメリカ英語の共時的比較ですが,2変種を比較対照するに当たっては歴史的な背景や通時的な視点も欠かせないということを強調しています.今回は「基礎編」と銘打って,英語の英米差を論じるに当たっての準備事項を説明し,英米差の調査に利用できるコーパスを紹介しています.
以下,今回のリレー連載の記事と合わせて読むと有用と思われる本ブログ内の記事にリンクを張ります.ほかにもコーパス利用については corpus の記事,英語の英米差については ame_bre の記事もご参照ください.
・ 「#1730. AmE-BrE 2006 Frequency Comparer」 ([2014-01-21-1])
・ 「#1739. AmE-BrE Diachronic Frequency Comparer」 ([2014-01-30-1])
・ 「#1743. ICE Frequency Comparer」 ([2014-02-03-1])
・ 「#428. The Brown family of corpora の利用上の注意」 ([2010-06-29-1])
・ 「#607. Google Books Ngram Viewer」 ([2010-12-25-1])
・ 「#517. ICE 提供の7種類の地域変種コーパス」 ([2010-09-26-1])
・ 「#1278. BNC を中心とするコーパス研究関連のリンク集」 ([2012-10-26-1])
・ 「#307. コーパス利用の注意点」 ([2010-02-28-1])
・ 「#367. コーパス利用の注意点 (2)」 ([2010-04-29-1])
・ 「#368. コーパスは研究の可能性を広げた」 ([2010-04-30-1])
・ 「#240. 綴字の英米差は大きいか小さいか?」 ([2009-12-23-1])
・ 「#244. 綴字の英米差のリスト」 ([2009-12-27-1])
・ 「#312. 文法の英米差」 ([2010-03-05-1])
・ 「#315. イギリス英語はアメリカ英語に比べて保守的か」 ([2010-03-08-1])
・ 「#357. American English or British English?」 ([2010-04-19-1])
・ 「#627. 2変種間の通時比較によって得られる言語的差異の類型論」 ([2011-01-14-1])
・ 「#628. 2変種間の通時比較によって得られる言語的差異の類型論 (2)」 ([2011-01-15-1])
・ 「#677. 現代英語における法助動詞の衰退」 ([2011-03-05-1])
・ 「#880. いかにもイギリス英語,いかにもアメリカ英語の単語」 ([2011-09-24-1])
・ 「#1010. 英語の英米差について Martinet からの一言」 ([2012-02-01-1])
・ 「#1221. 季節語の歴史」 ([2012-08-30-1])
・ 「#1304. アメリカ英語の「保守性」」 ([2012-11-21-1])
・ 「#1331. 語彙の英米差を整理するための術語」 ([2012-12-18-1])
・ 「#1343. 英語の英米差を整理(主として発音と語彙)」 ([2012-12-30-1])
今回のリレー連載記事は「基礎編」でしたが,来月号は「実践編」を掲載する予定です.
ヨミウリ・オンライン(読売新聞)内に,中央大学が発信するニュースサイト Chuo Online がある.そのなかの 教育×Chuo Online へ寄稿した「カタカナ語の氾濫問題を立体的に視る」と題する私の記事が,昨日(2014年10月16日)付で公開されたので,関心のある方はご参照ください.ちょうど今期の英語史概説の授業で,この問題の英語版ともいえる初期近代英語期のインク壺語 (inkhorn_term) を巡る論争について取り上げる矢先だったので,とてもタイムリー.数週間後に記事の英語版も公開される予定. *
上の投稿記事に関連する内容は本ブログでも何度か取り上げてきたものなので,関係する外部リンクと合わせて,この機会にリンクを張っておきたい.
・ 文化庁による平成25年度「国語に関する世論調査」
・ 「#32. 古英語期に借用されたラテン語」 ([2009-05-30-1])
・ 「#296. 外来宗教が英語と日本語に与えた言語的影響」 ([2010-02-17-1])
・ 「#478. 初期近代英語期に湯水のように借りられては捨てられたラテン語」 ([2010-08-18-1])
・ 「#576. inkhorn term と英語辞書」 ([2010-11-24-1])
・ 「#609. 難語辞書の17世紀」 ([2010-12-27-1])
・ 「#845. 現代英語の語彙の起源と割合」 ([2011-08-20-1])
・ 「#1067. 初期近代英語と現代日本語の語彙借用」 ([2012-03-29-1])
・ 「#1202. 現代英語の語彙の起源と割合 (2)」 ([2012-08-11-1])
・ 「#1408. インク壺語論争」 ([2013-03-05-1])
・ 「#1410. インク壺語批判と本来語回帰」 ([2013-03-07-1])
・ 「#1411. 初期近代英語に入った "oversea language"」 ([2013-03-08-1])
・ 「#1493. 和製英語ならぬ英製羅語」 ([2013-05-29-1])
・ 「#1526. 英語と日本語の語彙史対照表」 ([2013-07-01-1])
・ 「#1606. 英語言語帝国主義,言語差別,英語覇権」 ([2013-09-19-1])
・ 「#1615. インク壺語を統合する試み,2種」 ([2013-09-28-1])
・ 「#1616. カタカナ語を統合する試み,2種」 ([2013-09-29-1])
・ 「#1617. 日本語における外来語の氾濫」 ([2013-09-30-1])
・ 「#1624. 和製英語の一覧」 ([2013-10-07-1])
・ 「#1629. 和製漢語」 ([2013-10-12-1])
・ 「#1630. インク壺語,カタカナ語,チンプン漢語」 ([2013-10-13-1])
・ 「#1645. 現代日本語の語種分布」 ([2013-10-28-1]) とそこに張ったリンク集
・ 「#1869. 日本語における仏教語彙」 ([2014-06-09-1])
・ 「#1896. 日本語に入った西洋語」 ([2014-07-06-1])
・ 「#1927. 英製仏語」 ([2014-08-06-1])
(後記 2014/10/30(Thu):英語版の記事はこちら. *)
寺澤盾先生の『聖書でたどる英語の歴史』の付録 (195--96) に,英訳聖書関係のウェブサイトへのリンク集が載っているので,以下にコメントとともに張りつけておきたい.
・ Anglo-Saxon Bible: 古英語期に翻訳された英訳聖書のテクストを集めたもの(ただし開発途上).
・ StudyLight.org: 『ウィクリフ派聖書』以降の40を超える英訳聖書のテクストを所収.
・ Bible Study Tools.com: 英訳聖書のほかに仏訳,独訳などの聖書テクスト所収.さまざまな検索もできる.
・ oremus Bible Browser: 『ジェームズ王聖書』,『新改訂標準約聖書』などのテクスト所収.
・ BibleGateway.com: 40を超える英訳聖書のテクストを所収.また,英語以外の聖書やハワイ・ピジン英語訳も収められている.
・ Schoenberg Center for electronic Text & Image: 米国のペンシルヴェニア大学図書館の Schoenberg Center for Electronic Text & Image のサイト.1611年に刊行された『ジェームズ王聖書』の画像を見ることができる.
・ Bible: King James Version: 『ジェームズ王聖書』についてさまざまな検索ができる.
・ Bible Search: アメリカ聖書協会のサイト.米国系の聖書テクスト所収.
・ The Holy Bible --- Bible in Basic English: 『ベーシック・イングリッシュ訳聖書』のテクスト所収.
ほかに「#1429. 英語史に関連する BL の写本等画像と説明」 ([2013-03-26-1]) 及び「#1847. BL サイトで閲覧できる中世英語写本の画像」 ([2014-05-18-1]) のリンク集も参照されたい.聖書関係のものを再掲しておこう.
・ Cotton MS Nero D IV, Lindisfarne Gospels
・ Cotton MS Claudius B IV, Old English Hexateuch (imperfect)
・ The Lindisfarne Gospels: 写本画像と説明.こちらに写本をめくって読めるサービスもあり.
・ William Tyndale's New Testament: 写本画像と説明.
・ King James Bible: 刊本画像と説明.こちらに写本をめくって読めるサービスもあり.
・ Bible in Basic English: 「#1705. Basic English で書かれたお話し」 ([2013-12-27-1]) も参照.
・ 寺澤 盾 『聖書でたどる英語の歴史』 大修館書店,2013年.
昨日の記事「#1846. Pearl のウェブ・リソース」 ([2014-05-17-1]) を書くために中世写本に関するオンライン・リソースを探している過程で,British Library の Digitised Manuscripts と Search our Catalogue Archives and Manuscripts に行き当たった.関心のある中世英語の写本画像を検索してみると,あれもこれも画像化されていたのかと発見がある.
BL によるもう1つの最新の写本画像へのリンク集としては,BL Medieval and Earlier Digitised Manuscripts Master List 10.04.13. (XLS) も有用.このリンク集から,とりわけ中世英語の写本として重要と思われるものへのリンクを抜き出したので,以下にまとめておく.
・ Add MS 40165 A, Cyprian epistles and Old English Martyrology fragments
・ Add MS 59678, Sir Thomas Malory, Le Morte Darthur
・ Add MS 60577, Miscellany of verse and prose (the 'Winchester Anthology')
・ Add MS 61823, The Book of Margery Kempe
・ Arundel MS 57, Michael of Northgate, Ayenbite of Inwyt
・ Cotton MS Claudius B IV, Old English Hexateuch (imperfect)
・ Cotton MS Cleopatra C VI, Ancrene Riwle; songs and prayers; a leaf from a Book of Hours
・ Cotton MS Nero D IV, Lindisfarne Gospels
・ Cotton MS Vespasian A I, The Vespasian Psalter
・ Cotton MS Vitellius A XV, Augustine of Hippo, Soliloquia; Marvels of the East; Beowulf; Judith, etc.
・ Harley MS 2253, Miscellany of English, French, and Latin works ('The Harley Lyrics')
・ Harley MS 4866, Thomas Hoccleve, The Regiment of Princes
・ Harley MS 7334, Geoffrey Chaucer, The Canterbury Tales
・ Royal MS 14 C IX, Ranulph Higden's Polychronicon
・ Royal MS 7 D X, The Prayerbook of Princess Elizabeth
類似するリンク集は「#1429. 英語史に関連する BL の写本等画像と説明」 ([2013-03-26-1]),「#1431. Gelderen の英語史概説書のリンク集」 ([2013-03-28-1]),「#1293. Sir Orfeo の関連サイト」 ([2012-11-10-1]),「#744. Auchinleck MS の重要性」 ([2011-05-11-1]) にも張っておいたので,合わせて参照されたい.
今,中世英文学 Pearl を Andrew and Waldron 版で読んでいる.Cleanness, patience, Sir Gawain and the Green Knight とともに無名の詩人によって14世紀後半の北西イングランド方言で書かれた作品である.いずれも British Library MS Cotton Nero A.x にのみ現存する名品だ.
校訂本や注釈書など関連書誌は多く挙げることができるが,以下では主としてウェブ上のリソースへリンクを張っておきたい.
[ 電子テキスト ]
・ Corpus of Middle English Prose and Verse より,1953年版 (Pearl. Ed. E. V. Gordon. Oxford: Clarendon Press, 1953) に基づいた Digitised Text of Pearl が閲覧可能.
・ TEAMS: Middle English Texts 提供のテキスト Pearl by Robbins Library Digital Projects では,本文とともに語注・脚注が付されている.Pearl: Introduction のページでは,イントロと関連書誌も得られる.
・ Pearl by Bill Stanton では,イントロのほか,原文と現代英語訳の電子テキストが閲覧できる.
[ 写本画像 ]
・ The Cotton Nero A.x Project のサイトの Browse the Manuscript Images より,Pearl Manuscript の画像をフルで閲覧することができる.
[ 関連情報・書誌 ]
・ Entry for "Pearl" in Middle English Compendium HyperBibliography
・ 上にも挙げた Cotton Nero A.x. Project より,Web Resources for Pearl-poet Study: A Vetted Selection がリンク集として有用.
・ Pearl (poem) by Wikipedia では,書誌が役立つ.
最後に,オンラインの MED を利用して,Pearl からの引用を含む全エントリーへのリンクを整理した.行番号順に並べてあるので,テキストを読みながら一種の語注として使える.A Pearl Glossary Derived from MED Entries よりアクセスを.
・ Andrew, Malcolm and Ronald Waldron, eds. The Poems of the Pearl Manuscript. 3rd ed. Exeter: U of Exeter P, 2002.
標題の内容に入る前に,関連する過去の記事へリンクを張っておく.
・ 「#251. IPAのチャート」 ([2010-01-03-1])
・ 「#669. 発音表記と英語史」 ([2011-02-25-1])
・ 「#822. IPA の略史」 ([2011-07-28-1])
・ 「#1376. 音声器官の図」 ([2013-02-01-1])
・ 「#31. 現代英語の子音の音素」 ([2009-05-29-1])
では,本題へ.以下の IPA の2005年度版 (PDF; 58KB) の肺気流(「#1672. 気流機構」 ([2013-11-24-1]) を参照)による子音表で,行と列はそれぞれ何を表わしているだろうか.
まず,列は調音点 (place of articulation) を表わし,左端の唇から右端の声門まで,声道内の各器官に対応する.左を向いた顔の横顔ととらえればよい.
一方,行は調音様式 (manner of articulation) を表わし,上から下へ,およそ呼気に対する妨害の程度の高いものから順に並んでいる.ここで妨害の種類は8つに区分されているが,この配列にも実は一定の論理がある.その論理は,斉藤 (21) による図をみれば一目瞭然だ.分節音の種類に英語訳をつけつつ,その図を再現しよう.
┌─ 破裂[口]音 (plosive) ┌─ 破 裂 ─┤ │ └─ [破裂]鼻音 (nasal) │ 口腔内に閉鎖がつくられるもの ─┼─ ふるえ ─── ふるえ音 (trill) │ └─ はじき ─── はじき音 (tap or flap) ┌─ [中線的]摩擦音 (fricative) ┌─ 摩 擦 ─┤ │ └─ 側面[的]摩擦音 (lateral fricative) 口腔内に隙間が残されるもの ──┤ │ ┌─ [中線的」接近音 (approximant) └─ 接 近 ─┤ └─ 側面[的]接近音 (lateral approximant)
「#485. 語源を知るためのオンライン辞書」 ([2010-08-25-1]) で触れたが,American Heritage Dictionary of the English Language, 4th ed. (AHD) とその他の辞書に基づいた The Free Dictionary というオンライン辞書がある.AHD は,アメリカの辞書らしく百科事典的な情報や視覚資料が豊富で,私もよく使うお気に入りの辞書だ.紙版は大型だが,読む辞書としてお薦めである.(なお,The Free Dictionary Encyclopedia の Article of the Day というフィードもお気に入り.)
特に注目したいのが,Notes と呼ばれるコラム的な記事が充実していることだ.Usage Notes, Synonym Notes, Word Histories, Our Living Language, Regional Notes といった5種類の Notes が,延べ1,700以上,辞書中にちりばめられている.以下では,取りこぼれもあるとは思われるが,その大多数へのリンクを拾い出した.長いリストなので,ジャンプのための目次を挙げておく.
・ Usage Notes 一覧
・ Synonym Notes 一覧
・ Word Histories 一覧
・ Our Living Language 一覧
・ Regional Notes 一覧
ほかにも,リンク先の Notes 部分のみを抜き出した Notes 集そのものもブラウザ上で閲覧できるように作ってみたが,1.6MBと重めなので,必要に応じてどうぞ.
[ Usage Notes ]
!Kung, -ee, -ess, -wise, .gov, a, A.M., aberrant, able, about, absolute, absolutely, accessory, acquiesce, act, acumen, ad hominem, admission, adopt, advance, advise, affect, affinity, agenda, aggravate, ain't, alibi, all, all right, alleged, allude, alongside, also, alternative, although, altogether, alumnus, Amerasian, Amerindian, and, and/or, Anglo, anticipate, antidote, anxious, any, anyone, apparent, archetype, as, as far as, Asian, Asiatic, assure, author, awhile, backward, bad, bait, baleful, banal, barbarism, barbiturate, be, bear, because, behalf, berdache, besides, best, between, bi-, black, Black English, blatant, boast, both, bring, but, callous, can, cannot, capital, careen, celebrant, celibate, center, certain, challenged, Chicano, child-directed speech, claustrophobic, cohort, collective noun, color, colored, compact disk, compare, complected, complement, complete, comprise, conflicted, contact, contemporary, continuance, contrast, controller, convince, council, couple, craft, credential, credible, crescendo, criterion, critique, culture, czar, dare, data, deaf, debut, deceptively, decimate, definite, demagogue, denote, depend, deprecate, dialogue, different, dilemma, disabled, discomfit, disingenuous, disinterested, disinvent, distinct, dive, domestic partner, double negative, doubt, dour, drunk, due to, each, each other, either, elder, else, empower, enervate, enormity, enthuse, envelope, epicenter, epithet, equal, err, escape, Eskimo, Eurasian, every, everyplace, except, exceptionable, fact, factoid, farther, February, few, finalize, First Nation, firstly, flammable, flaunt, flotsam, follow, foot, foregone, former, formidable, forte, fortuitous, founder, fulsome, fun, gambit, gay, gender, General American, get, glamour, good, gourmet, government, graduate, graffito, grieve, group, grow, handicapped, hang, harass, hardly, harebrained, have, he, headquarter, headquarters, healthy, hegemony, height, help, herb, hero, Hispanic, historic, hoi polloi, holocaust, homosexual, hopefully, host, however, hyphenated, I, identical, identify, if, impact, impeach, important, impracticable, include, Indian, individual, infer, infinite, infrastructure, input, insignia, intense, interface, intrigue, intuit, Inuit, ironic, irregardless, its, Jew, Jewess, kabbalah, Kanaka, kilometer, knot, kudos, lack, lady, late, Latina, lay, leave, legend, liable, lifestyle, light, like, likely, literally, literate, loan, look, majority, man, master, masterful, materialize, mean, medium, men, methodology, mid-, migrate, minimal, mistress, momentarily, month, moot, Ms., mute, mutual, myriad, myself, native, Native American, nauseous, need, neither, Net, none, nonstandard, nonwhite, nor, not, nothing, nuclear, number, oblivious, octoroon, of, off, officiate, often, old, on, one, only, or, oriental, ought, over-, pair, paradigm, parameter, participle, party, pass, people, percent, percentage, perfect, periodic, permit, person, peruse, phenomenon, pill bug, plead, plus, politics, poor, possessed, practicable, practically, precipitate, premiere, preposition, presently, principal, prioritize, process, protagonist, prove, quarter, queer, quick, quote, race, rarely, rather, redundancy, regard, replete, repulse, responsible, restive, sacrilegious, safe sex, said, salutation, same, saving, scarcely, schism, Scottish, seasonal, series, service, set, shall, she, short-lived, should, slow, sneak, so, so-called, someday, sometime, sonorous, soon, split infinitive, Standard English, status, staunch, stomp, stratum, strength, such, suffer, than, that, themed, there, they, this, Three Age system, thusly, tight, till, together, too, tortuous, toward, transpire, try, un-, unaware, unexceptionable, unique, utilize, various, verbal, very, victual, virtual, wake, want, way, we, wean, web, website, well, what, whatever, when, whence, where, which, who, whose, why, wish, with, wreak, Xmas, ye, yet, zoology
[ Synonym Notes ]
ability, abolish, abstinence, abuse, accidental, accompany, acknowledge, active, adapt, admonish, adulterate, advance, adventurous, advice, advise, affair, affect, affectation, afflict, afraid, ageless, agitate, agree, aim, airy, allocate, alone, amateur, ambiguous, ambush, amenity, amiss, amuse, analyze, ancestor, anger, angry, announce, annoy, answer, anxiety, apology, apparent, appear, appendage, applaud, appoint, appreciate, apprehend, appropriate, approve, arbitrary, argue, argument, argumentative, arrange, art, artificial, ask, assent, assistant, attack, attribute, authentic, authorize, average, aware, band, banish, banter, bargain, barrage, base, baseless, batter, bear, beat, beautiful, beg, begin, beginning, behavior, belief, belligerent, bend, beneficial, benefit, benevolent, besiege, bet, bias, binge, bite, bitter, blackball, blackout, blame, blameworthy, blast, blemish, blink, block, bloom, blunder, boast, bodily, boil, book, boor, border, boring, botch, branch, brave, brawl, breach, break, breeze, bright, broach, broad-minded, brood, brush, bulge, bulwark, burden, burdensome, burn, business, busy, cadge, calculate, call, calm, campaign, care, careful, careless, caress, caricature, catch, cause, celebrity, center, certain, certainty, chafe, chance, charge, charm, chief, choice, chronic, circumference, citizen, claim, clean, clear, clever, cliché, clothe, coagulate, cold, collision, comfort, comfortable, comment, commit, common, complete, complex, conceit, condemn, conduct, confidence, confirm, conflict, confuse, consider, contain, contaminate, contemporary, continual, convert, convey, cool, correct, corrupt, count, crisis, criticize, crowd, crude, cruel, crush, cry, cure, curious, dark, daze, dead, decay, deceive, decide, decision, decisive, decrease, decry, defeat, defend, defer, defy, degrade, delicate, delicious, demand, demote, deny, dependent, deplete, depressed, describe, desire, despise, despondent, development, deviation, devote, dexterous, dialect, dictate, dictatorial, differ, difference, difficulty, dip, dirty, disadvantage, disappear, discord, discourage, discover, discuss, disguise, disgust, dishonest, dismay, dismiss, display, disposition, dissuade, distinct, distort, distribute, doctrine, dominant, dry, dull, earn, easy, eat, echo, effect, effective, eject, elaborate, element, elevation, eliminate, embarrass, emphasis, empty, enclose, encourage, endanger, enemy, engagement, enmity, enormous, enrapture, envy, equipment, erase, escape, estimate, estrange, evoke, exaggerate, example, excel, excessive, existence, expect, explain, explicit, expressive, extemporaneous, extricate, fair, faithful, faithless, fantastic, fashion, fashionable, fast, fasten, fat, fatal, favorable, fawn, fear, feat, feeling, female, fertile, fidelity, field, figure, flagrant, flash, flexible, flirt, flock, flourish, flow, follow, foolish, forbid, force, foreign, foretell, forgive, form, forte, found, fragile, fragrance, frank, freedom, frighten, frown, function, furnish, futile, gather, gaudy, gaze, general, gesture, ghastly, giddy, glad, glib, gossip, gracious, grand, graphic, grieve, gruff, guide, habit, hamper, handle, happen, happy, harass, hard, harden, haste, hateful, healthy, heap, heavy, help, heritage, hesitate, hide, hinder, honor, humane, idea, ideal, imagination, imitate, immaterial, impetuous, importance, impression, improper, improve, inactive, incalculable, incisive, incline, include, increase, indicate, indispensable, infinite, inflexible, injustice, innate, inquiry, insanity, instinctive, insubordinate, intelligent, intense, intention, interfere, intimidate, introduce, irrelevant, isolate, item, jealous, jerk, join, joke, judge, justify, keep, kind, knowledge, lack, large, last, latent, lazy, lean, learned, lethargy, letter, level, liberal, lie, lift, likeness, limit, limp, living, logical, loose, loud, love, lure, luxury, makeshift, male, malign, malleable, manipulate, mark, mature, living, logical, mercy, method, meticulous, mind, miscellaneous, mix, mixture, moderate, moment, monopolize, mood, moral, morale, moving, multitude, muscular, mysterious, naive, native, nautical, neat, negligent, new, news, noise, noted, noticeable, nuance, nurture, object, oblige, observe, obstacle, obstinate, occurrence, offend, offensive, offer, old, opinion, opportunity, oppose, opposite, orderly, origin, outline, overthrow, pacify, pain, palliate, pamper, partner, passion, pathetic, patience, pause, pedantic, penitence, pensive, perceptible, perfect, perform, period, periodic, permission, persuade, phase, pity, plain, plan, plausible, please, plentiful, poisonous, polite, poor, possible, posture, practice, praise, predicament, predict, predilection, preliminary, presume, prevailing, prevent, produce, proficient, profuse, promise, proportion, propose, proud, provoke, prudence, pull, punish, pure, push, puzzle, quality, qualm, quibble, range, reach, real, reap, reason, recede, reciprocate, reckless, recover, refer, refrain, refuse, regard, regret, relevant, reliable, relieve, religious, relinquish, rely, remember, reparation, repeat, replace, represent, resort, responsible, restrain, revere, reverse, revive, rich, ridicule, right, rise, rival, room, rough, rude, ruin, rural, sad, sarcastic, satisfy, save, saying, scatter, scold, secret, see, seem, send, sensuous, sentimental, separate, series, serious, severe, shade, shake, shameless, shapeless, sharp, shelter, shorten, shout, show, showy, shrewd, shy, sign, silent, sinister, slant, sleek, slide, sloppy, slow, small, smell, social, solitude, solve, sour, spacious, sparing, speak, speed, spend, spontaneous, stain, standard, state, stay, steal, steep, stem, stench, stiff, still, stoop, stop, strange, streak, strength, subject, substance, sufficient, suggest, summit, superfluous, supervise, support, supposed, sure, surprise, surrender, surround, swerve, swing, tact, tardy, task, taste, teach, tear, teem, temporary, tend, tendency, theoretical, think, think, tight, tire, tireless, tool, touch, treat, trial, trivial, trouble, trust, truth, turn, ugly, uncertainty, unctuous, unfortunate, unruly, unspeakable, urgent, use, usual, vain, valid, vent, versatile, vertical, victory, vigor, vociferous, voluntary, voracious, wander, waste, way, weak, weird, wet, whole, wile, wit, wonder, wordy, work, yield, young, zest
[ Word Histories ]
abacus, abracadabra, accolade, acorn, adder, adolescent, agnostic, alcohol, Allegheny River, alligator, amateur, Amazon, an, anesthesia, appendicitis, arena, arrowroot, artery, artichoke, Aryan, asparagus, assassin, automatic, avocado, baby-sit, badger, ballyhoo, banquet, barnacle, bayonet, beef, belfry, berserk, Betelgeuse, bigot, bless, Bolshevik, book, boomerang, boycott, Brazil, brickbat, broker, buccaneer, buffalo, bumpkin, bury, butterfly, bylaw, Canada, canter, cappuccino, caricature, carouse, casino, caterpillar, caviar, chagrin, chameleon, chaperon, check, Chicago, china, chivalry, chortle, churl, ciao, circus, cleric, cockroach, codex, cologne, comet, comrade, coroner, cot, coupon, coward, crayfish, croissant, crucial, cuckold, cushy, cute, cynic, dandelion, debunk, deer, delta, dervish, desert, diabetes, diatribe, digitalis, dinner, dirge, ditto, do-gooding, Don River, drench, dress, dungeon, dynamite, easel, economy, edit, eleven, empty, encyclopedia, English, ennui, enthusiasm, erudite, ethnic, eunuch, exorcise, fascism, fear, fee, fellow, fey, fiction, film, fire, fizzle, flunky, fool, fornication, fraction, freeze, friend, fuck, funky, garage, gauntlet, geezer, gerrymander, giddy, glitch, goatee, goodbye, gorilla, Gothic, grass widow, Greenland, gremlin, gringo, guillotine, hall, hamburger, harlot, hassle, haywire, hectic, helicopter, hell, helpmate, hex, high muckamuck, hobnob, holocaust, hooker, Hoosier, hubbub, husband, iconoclast, ilk, impeach, industry, inkling, interloper, internecine, island, item, janitor, Japan, jaunty, junk, kangaroo, ketchup, kidnap, kiosk, kith and kin, laconic, landscape, larva, lava, lemon, leprechaun, lieutenant, limbo, lingo, lion, loaf, lobster, long-lived, lucre, macabre, maharajah, malaprop, mannequin, mantis, marshal, mascot, mattress, mealy-mouthed, Melba toast, menu, mesmerism, metal, midwife, milquetoast, Minnesota, misericord, Mississippi, modern, mortgage, mosquito, Muse, mutt, namby-pamby, nap, naughty, neighbor, nerd, nest, New Jersey, noise, nonchalant, numb, OK, ombudsman, one, opossum, orange, orgy, oscillate, otorhinolaryngology, Ouse River, outlaw, oyez, Pakistan, pal, pant, paradise, pariah, pay, peeping Tom, penthouse, period, petard, Philistine, pickle, pilot, plane, Platonic, plumber, Plymouth, poison, pollster, Pomerania, posh, posthumous, powwow, premise, pretzel, prison, prude, Pueblo, Punjab, Quaalude, quark, queen, queue, quiz, raid, rajah, rankle, rapt, read, reindeer, resent, rhinestone, Riot Act, robot, role, rose, roster, rune, sack, salad, sanction, sanguine, Sanskrit, sarcophagus, scan, scarce, scold, scuba, séance, seersucker, senile, serendipity, shadow, shambles, sherbet, short shrift, shyster, Singapore, slave, sleuth, slivovitz, soldier, soothsayer, Sophocles, south, speak, speed, spill, spoof, spree, stampede, stove, sunbeam, superman, surly, syphilis, taboo, tangerine, tattoo, tea, telephone, temple, testis, testy, Thames, theater, they, third, ticket, tin, tithe, toady, Tokyo, tomato, tooth, trek, trivial, true, tulip, tweed, tycoon, typhoon, umpire, underling, uranium, valentine, vegetable, vixen, vogue, vulgar, Wales, wallflower, war, water, Wednesday, went, werewolf, whiskey, whore, wigwam, window, winsome, worry, write, xylophone, Yankee, Zeus, zipper, zloty
[ Our Living Language ]
a-, agreement, all, as far as, ax, bad, basket case, be, breathe, call, cent, chill, comparative, cool, dig, downsize, dude, dumb, foot, geek, go, gung ho, hisself, historical present, hornswoggle, I'm, igg, it, izzard, knockout, like, me, might, mine, Ocracoke Island, of, plural, rap, redundancy, rent, right, schlock, sleigh, Smith Island, strike, trashed, were, za, zero copula
[ Regional Notes ]
absquatulate, agin, andiron, anymore, as, bare-naked, beignet, birth, bodacious, boughten, cayuse, chaw, chesterfield, chirren, clever, critter, damned, dogie, dope, dornick, dragonfly, drudge, everwhere, fair, faubourg, favor, feist, ferninst, fix, frosting, frying pan, gallery, goober, greasy, gum band, gunnysack, gutter, hey, highfalutin, holler, hosey, intervale, johnnycake, juke, kindling, krewe, krumkake, lagniappe, light bread, lightning bug, loblolly, luminaria, milk shake, mill, mozo, mud dauber, muffuletta, need, neutral ground, Old Scratch, old-field colt, olla, parking, pocosin, poke, pone, possum, powerful, preacher, purty, quoit, ramada, redd, reeling, run, scoot, shivaree, slatch, smart, so, spa, stateside, stob, stoop, submarine, summercater, tarnation, ted, teeter-totter, thataway, tit, tonic, tule, tumbleset, ugly, ukulele, vaquero, vum, wake, wanigan, whiffletree, woodchuck, yonder, you-all, you-uns
Shakespeare とその作品については,周知の通り,膨大な研究の蓄積がある.年表や統計の類いも多々あるが,Crystal and Crystal から適当に抜粋したものをいくつか載せておきたい.なお,Crystal and Crystal の種々の統計の元になっているデータベースは,Shakespeare's Words よりアクセスできる.その他の Shakespeare 関連のリンクについては,「#195. Shakespeare に関する Web resources」 ([2009-11-08-1]) を参照.
(1) Chronology of works (Crystal and Crystal 6)
1590--91 | The Two Gentlemen of Verona; The Taming of the Shrew |
1591 | Henry VI Part II; Henry VI Part III |
1592 | Henry VI Part I (perhaps with Thomas Nashe); Titus Andronicus (perhaps with George Peele) |
1592--3 | Richard III; Venus and Adonis |
1593--4 | The Rape of Lucrece |
1594 | The Comedy of Errors |
1594--5 | Love's Labour's Lost |
by 1595 | King Edward III |
1595 | Richard II; Romeo and Juliet; A Midsummer Night's Dream |
1596 | King John |
1596--7 | The merchant of Venice; Henry IV Part I |
1597--8 | The Merry Wives of Windsor; Henry IV Part II |
1598 | Much Ado About Nothing |
1598--9 | Henry V |
1599 | Julius Caesar |
1599--1600 | As You Like It |
1600--1601 | Hamlet; Twelfth Night |
by 1601 | The Phoenix and Turtle |
1602 | Troilus and Cressida |
1593--1603 | The Sonnets |
1603--4 | A Lover's Complaint; Sir Thomas More; Othello |
1603 | Measure for Measure |
1604--5 | All's Well that Ends Well |
1605 | Timon of Athens (with Thomas Middleton) |
1605--6 | King Lear |
1606 | Macbeth (revised by Middleton); Antony and Cleopatra |
1607 | Pericles (with George Wilkins) |
1608 | Coriolanus |
1609 | The Winter's Tale |
1610 | Cymbeline |
1611 | The Tempest |
1613 | Henry VIII (with John Fletcher); Cardenio (with John Fletcher) |
1613--14 | The Two Noble Kinsmen (with John Fletcher) |
good | 3995 |
lord | 3164 |
man | 3091 |
love | 3047 |
sir | 2548 |
know | 2252 |
give | 2114 |
think/thought | 1911 |
king | 1680 |
speak | 1626 |
Poetry (%) | No. of lines | Prose (%) | No. of lines | Play |
---|---|---|---|---|
100 | 2752 | 0 | 0 | Richard II |
100 | 2569 | 0 | 0 | King John |
100 | 2493 | 0 | 0 | King Edward III |
99.7 | 2892 | 0.3 | 8 | Henry VI Part III |
99.5 | 2664 | 0.5 | 14 | Henry VI Part I |
98.6 | 2479 | 1.4 | 35 | Titus Andronicus |
97.6 | 3517 | 2.4 | 85 | Richard III |
97.4 | 2735 | 2.6 | 74 | Henry VIII |
94.5 | 2641 | 5.5 | 154 | The Two Noble Kinsmen |
93.5 | 1948 | 6.5 | 135 | Macbeth |
90.1 | 2208 | 9.9 | 244 | Julius Caesar |
89.8 | 2718 | 10.2 | 308 | Antony and Cleopatra |
86.9 | 2610 | 13.1 | 393 | Romeo and Juliet |
86.6 | 1543 | 13.4 | 239 | The Comedy of Errors |
85.2 | 2808 | 14.5 | 487 | Cymbeline |
83.7 | 2580 | 16.3 | 503 | Henry VI Part II |
81.2 | 1903 | 18.8 | 441 | Pericles |
80.6 | 2076 | 19.4 | 498 | The Taming of the Shrew |
80.6 | 1713 | 19.4 | 413 | A Midsummer Night's Dream |
80.4 | 2599 | 19.6 | 633 | Othello |
78.6 | 2025 | 21.4 | 551 | The Merchant of Venice |
77.2 | 2571 | 22.8 | 760 | Coriolanus |
76.5 | 1569 | 23.5 | 481 | The Tempest |
73.2 | 2181 | 26.8 | 800 | The Winter's Tale |
73.1 | 2345 | 26.9 | 865 | King Lear |
73.1 | 1707 | 26.9 | 627 | Timon of Athens |
73.1 | 1613 | 26.9 | 595 | The Two Gentlemen of Verona |
71.5 | 2742 | 28.5 | 1092 | Hamlet |
66.4 | 2250 | 33.6 | 1137 | Troilus and Cressida |
64.2 | 1716 | 35.8 | 955 | Love's Labour's Lost |
60.6 | 1634 | 39.4 | 1062 | Measure for Measure |
60.5 | 1943 | 39.5 | 1269 | Henry V |
55.6 | 1666 | 44.4 | 1332 | Henry IV Part I |
51.6 | 1447 | 48.4 | 1356 | All's Well that Ends Well |
47.6 | 1547 | 52.4 | 1700 | Henry IV Part II |
47.4 | 1276 | 52.6 | 1415 | As You Like It |
38.2 | 949 | 61.8 | 1532 | Twelfth Night |
28.3 | 739 | 71.7 | 1871 | Much Ado About Nothing |
12.5 | 338 | 87.5 | 2370 | The Merry Wives of Windsor |
Total lines | Total words | Play | First Folio | Riverside |
---|---|---|---|---|
3834 | 29,844 | Hamlet | 3906 | 4042 |
3602 | 28,439 | Richard III | 3887 | 3667 |
3387 | 25,730 | Troilus and Cressida | 3592 | 3531 |
3331 | 26,479 | Coriolanus | 3838 | 3752 |
3295 | 26,876 | Cymbeline | 3819 | 3707 |
3247 | 25,737 | Henry IV Part II | 3350 | 3326 |
3232 | 26,003 | Othello | 3685 | 3551 |
3212 | 25,623 | Henry V | 3381 | 3297 |
3210 | 25,341 | King Lear | 3302 | 3487 |
3083 | 24,490 | Henry VI Part II | 3355 | 3130 |
3026 | 23,726 | Antony and Cleopatra | 3636 | 3522 |
3003 | 24,023 | Romeo and Juliet | 3185 | 3099 |
2998 | 24,126 | Henry IV Part I | 3180 | 3081 |
2981 | 24,597 | The Winter's Tale | 3369 | 3348 |
2900 | 23,318 | Henry VI Part III | 3217 | 2915 |
2809 | 23,333 | Henry VIII | 3463 | 3221 |
2803 | 22,537 | All's Well that Ends Well | 3078 | 3013 |
2795 | 23,388 | The Two Noble Kinsmen | not in | 3261 |
2752 | 21,884 | Richard II | 2849 | 2796 |
2708 | 21,290 | The Merry Wives of Windsor | 2729 | 2891 |
2696 | 21,269 | Measure for Measure | 2938 | 2891 |
2691 | 21,477 | As You Like It | 2796 | 2810 |
2678 | 20,541 | Henry VI Part I | 2931 | 2695 |
2671 | 20,881 | Love's Labour's Lost | 2900 | 2829 |
2610 | 20,767 | Much Ado About Nothing | 2684 | 2787 |
2576 | 20,911 | The Merchant of Venice | 2737 | 2701 |
2574 | 20,552 | The Taming of the Shrew | 2750 | 2676 |
2569 | 20,472 | King John | 2729 | 2638 |
2514 | 19,888 | Titus Andronicus | 2708 | 2538 |
2493 | 19,406 | King Edward III | not in | not in |
2481 | 19,592 | Twelfth Night | 2579 | 2591 |
2452 | 19,149 | Julius Caesar | 2730 | 2591 |
2344 | 17,728 | Pericles | not in | 2459 |
2334 | 17,796 | Timon of Athens | 2607 | 2488 |
2208 | 16,936 | The Two Gentlemen of Verona | 2298 | 2288 |
2126 | 16,305 | A Midsummer Night's Dream | 2222 | 2192 |
2083 | 16,372 | Macbeth | 2529 | 2349 |
2050 | 16,047 | The Tempest | 2341 | 2283 |
1782 | 14,415 | The Comedy of Errors | 1918 | 1787 |
You-forms | Thou-forms | ||
you | 14,244 | thou | 5,942 |
ye | 352 | thee | 3,444 |
your | 6,912 | thy | 4,429 |
yours | 260 | thine | 510 |
yourself | 289 | thyself | 251 |
yourselves | 74 | ||
Total | 22,131 | 14,576 |
---|
旗を研究対象とする旗章学 (vexillology) と呼ばれる分野がある.国旗のデザイン,由来,変遷の歴史なども研究対象となるが,世界の地理や歴史を学ぶ上で,よい教材を提供してくれる.英語史でも,近代以降の英語の世界展開をたどるのに時に有益である.例えば,英国の歴史をたどる上で,Union Jack (Union Flag) 成立の経緯は重要である(詳しくはこちらのサイトを参照).国旗に関する出版物は多いが,ウェブ上のリソースも便利なものが多いので,いくつかを紹介しておこう.
・ Flags of the World (FOTWO): 由来や変遷の歴史など詳細な情報を含み,非常に有用.
・ World Flag Database: アルファベット順で,大きくデザインを表示する.国の地図へも飛べる.
・ All Flags in Alphabetical Sequence: アルファベット順にサムネイルで一覧.各種のサイズをフリーで利用できる.
・ 外務省 世界の国旗: 地域ごとにサムネイルで一覧するのに便利
さて,今日は リベリア共和国 (Republic of Liberia) とその国旗を取り上げる.西アフリカ南西部,大西洋に面したこの土地には,古来多数の土着民族が住んでいた.建国につながる近現代史に限れば,1822年にアメリカ植民協会 (American Colonization Society) が米国の黒人解放奴隷の入植地として買収したことに始まる.首都となる Monrovia (アメリカ第5代大統領 James Monroe にちなむ)へ移住したアメリカの解放奴隷が支配層となり,1847年に独立した.アフリカで最も古い共和国である.国名には,ラテン語で「自由な」を意味する liber が含まれている.
350万人ほどの国民のうち,解放奴隷の子孫は数パーセントを占めるにすぎないが,早くから欧米式の教育を受け,社会的には影響力のある集団となっている.英語が国語として採用されているのもそのためである.使用されている英語変種としては,アメリカ英語の影響を受けた標準的な変種のほか,Liberian English と呼ばれるピジン英語もある.アフリカにおける標準英語変種は,英植民地の歴史によりイギリス英語のそれに大きく偏っているが,リベリアはアメリカ英語に基づいており,特異な存在である.「#376. 世界における英語の広がりを地図でみる」 ([2010-05-08-1]) で,アフリカ大陸のなかで唯一リベリアがピンクで示されていることを確認されたい.ほかに Ethnologue: Liberia も参照.
アメリカとの関連の深さは,国旗にもよく現れている.アメリカの星条旗 (Stars and Stripes) を基にしたデザインであることが明らかである.赤白11本の縞は憲法の起草者の数を,白い1つの星 (Lone Star) はアフリカにおいて模範となるべき欧米風独立国家の象徴を表わす.
英語ベースのピジン語 (pidgin) としておそらく最も知られているのは Tok Pisin だろう.多言語国家 Papua New Guinea の事実上の国家語として用いられており,lingua_franca として機能している.新聞,ラジオ,テレビ,辞書,文法,聖書などの言語として採用されており,話者により積極的な社会言語学的評価を付されている.第2言語として400万人により話されており,第1言語としても5万人の話者がいる.後者の母語話者の存在は,Tok Pisin がクレオール語化 (creolisation) を始めていることの現れでもある.
New Guinea は,Greenland に次いで世界で2番目に大きな島である.政治的には西半分のインドネシア領 Irian Jaya と東半分の Papua New Guinea (PNG) に分かれる.島全体としてみれば使用されている言語は1,000に及び,PNG だけに限っても,「#401. 言語多様性の最も高い地域」 ([2010-06-02-1]) で見たとおり,830言語を数える.言語多様性指数としては,世界最高値を示す国である.この超多言語地域が lingua franca を持ち始める契機となったのは,19世紀にヨーロッパの植民地主義列が介入したときである.Samoa, Vanuatu, Queensland など,オセアニア地域のプランテーション契約労働者が各地を往来したこと,孤立していた言語共同体が孤立を維持できなくなったことが,lingua franca の発生を促した.結果として,PNG の土着語から発生したピジン語 Hiri Motu や,英語ベースのピジン語 Tok Pisin が広がっていった.
オセアニア地域のピジン語の発達については不明の点も多いが,Australia 経由で広がった系列 (ex. Australian Pidgin English, Roper river Creole, Cape York Creole) と,Vanuatu (the New Hebrides), the Solomon Islands, Queensland, Fiji を経て Papua や New Guinea へ広がった系列が区別される.19世紀,この地域では,New England の捕鯨,メラネシアのビャクダン交易,中国の食材としてのナマコ採取,Queensland や Fiji での綿花やサトウキビのプランテーション,Samoa でのコプラのプランテーション,トレス海峡 (the Torres Strait) での真珠採取などが,経済と労働の推進力となっていた.初期の Tok Pisin は,これらの経済活動を通じて Bislama (「#1536. 国語でありながら学校での使用が禁止されている Bislama」 ([2013-07-11-1]) を参照), Solomon Islands Pidgin, Torres Straits Creole などと接した帰国労働者によって PNG に広まっていったとされる.
上述のように,Tok Pisin は英語ベースの(すわなち英語を lexifier とする)ピジン語である.標準英語と比べれば,音韻,文法,語彙などあらゆる部門において確かに簡略化されているが,一方で独特な規則をもつ.言語体系としては,英語とは異なる言語といって差し支えないだろう.Gramley (239--40) に掲載されている Tok Pisin で書かれた文章のサンプルについて,標準英語の対訳つきで見やすく作り直したものをこちらのPDFで用意した.その他,Tok Pisin については以下のサイトも参照.
・ 「#463. 英語ベースのピジン語とクレオール語の一覧」 ([2010-08-03-1])
・ Ethnologue: Tok Pisin
・ Tok Pisin -- Pidgin / English Dictionary
・ Tok Pisin Translation, Resources, and Discussion
・ Gramley, Stephan. The History of English: An Introduction. Abingdon: Routledge, 2012.
「#1567. 英語と日本語のオンラインコーパスをいくつか紹介」 ([2013-08-11-1]) で,現代日本語のコーパスとしてKOTONOHA 「現代日本語書き言葉均衡コーパス」に言及した.この『現代日本語書き言葉均衡コーパス』 (BCCWJ: Balanced Corpus of Contemporary Written Japanese) は,大学共同利用機関法人人間文化研究機構国立国語研究所と文部科学省科学研究費特定領域研究「日本語コーパス」プロジェクトが共同で開発した本格的なコーパスである.
コーパスの内容については,同サイトに「2012年3月現在,検索対象となっているのは,以下の11種のデータ,合計約1億500万語です」とある.サンプルは,1976--2008年にかけての文書で,その11のジャンルは書籍,雑誌,新聞,白書,教科書,広報紙,Yahoo!知恵袋,Yahoo!ブログ,韻文,法律,国会会議録にわたる.各テキストからは2種類のサンプルが取られており,「ひとつは長さを1000字に固定したサンプル (固定長サンプル),もうひとつは,節や章など文章の意味上のまとまりに対応した単位の全体です (可変長サンプル).これまでの調査によれば,可変長サンプルの平均長は新聞で約1000字,書籍で4000字弱です.」とある.
BCCWJ を利用する方法やインターフェースはいくつかあるが,もっとも簡便なものが,上にもリンクを張った少納言である.登録不要で,表層の文字列によるコーパスの全文検索ができる.出力は無作為の500件と制限があるが,お手軽に試すことができる.
一方,利用申請が必要な中納言では,同コーパスに対して,短単位・長単位・文字列の3つの方法により,形態論的な複雑な検索をかけることができる.
また別のインターフェーとして,NINJAL-LWP for BCCWJ (NLB) がある.現行の1.20版では,BBCWJ のほとんどのデータを対象として,検索をかけることができる.検索ページはこちら.
関連して,NLB と同じインターフェースで利用できるもう1つの日本語コーパスを紹介する.筑波大学がウェブサイトからテキストを収集して編纂した11億語からなる筑波ウェブコーパス (Tsukuba Web Corpus: TWC) へのインターフェース,NINJAL-LWP for TWC (NLT)である.検索ページはこちら.
Powered by WinChalow1.0rc4 based on chalow