言語研究における corpus 「コーパス」は様々に定義されているが,McEnery et al. の定義が簡潔である.
. . . a corpus is a collection of (1) machine-readable (2) authentic texts (including transcripts of spoken data) which is (3) sampled to be (4) representative of a particular language or language variety.
(1) と (2) についてはおよそ研究者間にコンセンサスがあるが,(3) と (4) については何をもって "sampled" あるいは "representative" とみなすかについて様々な意見がある.しかし,大筋においてこの定義を受け入れることができるだろう.
手軽に英語コーパスを試すには,オンラインのものが便利である.以下は,(登録の必要なものもあるが)オンラインで簡便に利用できる英語コーパス.
・ British National Corpus (いくつかのインターフェースが提供されている)
* BNC ( The British National Corpus )
* BNCweb (要無料登録)
* BYU-BNC (要無料登録)
・ BYU Corpora ( Brigham Young University, Mark Davies 提供のその他のオンラインコーパス群)
* COCA ( Corpus of Contemporary American English ) (要無料登録)
* COHA ( Corpus of Historical American English ) (要無料登録)
* TIME Magazine Corpus of American English (要無料登録)
・ Cobuild Concordance and Collocations Sampler
その他,本ブログではコーパス関係の記事をいろいろと掲載しているので,参考にされたい.
・ hellog 内のコーパス情報の集約記事: [2010-09-15-1]
・ hellog 内のコーパス関連記事: corpus
・ hellog 内の BNC 関連記事: bnc
・ McEnery, Tony, Richard Xiao, and Yukio Tono. Corpus-Based Language Studies: An Advanced Resource Book. London: Routledge, 2006.
Helsinki 大学の VARIENG ( Research Unit for Variation, Contacts and Change in English ) プロジェクトに関わる電子サービスの一環として,英語歴史コーパス(と英語変種コーパス)の情報をとりまとめる CoRD ( Corpus Resource Database ) なるサービスがある.すでに51件のコーパス情報が登録されており,今後も増え続けるだろう.種々のコーパスが様々な形態で公開され,そろそろ本格的な整理の必要が感じられるようになってきたので,CoRD のようなハブが出てくると重宝する.今後の登録コーパスの増加に期待したい.
・ List of Corpora: まずはこちらの一覧を.
・ Corpus Finder: 登録されている全コーパスの情報が表形式のデータベースになっている."Corpus", "Start", "End", "Periods", "Word Count", "Text Samples", "Spoken/Written", "Annotation", "Format", "Availability" の各列でソートやフィルターが可能.(こういうデータベースがあると便利だろうなと思っていた!)
各コーパスのリンク先には,概要説明から入手情報までの情報がよくまとまっている.特に "Basic structure of the corpus" は図表付きのものが多く有用."Reference lines and copyright" なども,ちょっとしたことなのだが論文を書くときなどにコピーできて便利.覚えておいて損はない HP だろう.
CoRD の他にも,英語コーパス言語学に関連する重要な HP をいくつか掲載しておきたい.個々のコーパスの関連ページはしばしばリンク切れになっているので,複数のハブを押さえておく必要がある.
・ コーパス言語学関係のリンク集: 家入葉子先生のサイトより.
・ 英語史関係のコーパス・電子テキスト: 同上.
・ 英語史関係のコーパス: 三浦あゆみさんの A Gateway to Studying HEL より.
・ JAECS 英語コーパス学会のリンク集: 『英語コーパス言語学:第二版』(東京:研究社, 2005)に掲載されているものをまとめたリンク集.
・ コーパス関連サイト: 『実践コーパス言語学』の著者の一人,須賀廣氏のリンク集.
・ ICAME Corpus Manuals: ICAME コーパスのマニュアルがまとまっている.
こんな英語学習サイトを見つけた.English Language: All about the English language.この手のサイトは多数あるが,トップに英語史と英語の統計情報が簡単にまとまっているので目を引いた.
・ English language History
・ English language Statistics
前者の英語史の解説文の "Middle English" の節で,中英語期の英語の復権 ( see reestablishment_of_english ) がノルマン・コンクェスト後の50年くらいで早々と始まっていたという記述があった.
Various contemporary sources suggest that within fifty years most of the Normans outside the royal court had switched to English, with French remaining the prestige language largely out of social inertia. For example, Orderic Vitalis, a historian born in 1075 and the son of a Norman knight, said that he only learned French as a second language.
英語の復権を話題にするときには話し言葉か書き言葉か,庶民レベルか貴族レベルか,言語使用の状況が私的か公的かなど,視点によって復権の時期や程度が変わってくるのだが,従来の英語史ではフランス語のくびきの時代が中世のあいだに比較的長く続いたと記述されることが多かったように思う.しかし,事実としては上の解説文にあるとおり,中世イングランドでは庶民の実用上,英語は圧倒的な言語だったのであり,この事実を強調しておくことは重要だと思う.
英語の統計については本ブログでも statistics の各記事で取り上げてきたが,以下のものは驚きこそしないが,私にとって初耳だった.
・ English is the language of navigation, aviation and of Christianity; it is the ecumenical language of the World Council of Churches
・ Five of the largest broadcasting companies in the world (CBS, NBC, ABC, BBC and CBC) transmit in English, reaching millions and millions of people all over the world
・ Of the 163 member nations of the U.N., more use English as their official language than any other. . . . After English, 26 nations in the U.N. cite French as their official tongue, 21 Spanish and 17 Arabic.
・ People who count English as their mother tongue make up less than 10% of the world's population, but possess over 30% of the world's economic power
ただし,全体的に典拠は示されていない.また,2010年現在の国連加盟国は192カ国であり,上記の3点目の163カ国に基づく統計は1990年くらいの時点での数値かもしれない( see United Nations member States - Growth in United Nations membership, 1945-present ) .
このサイトには他にも English Dictionaries や English Literature などのページがある.
今日は語源情報を与えてくれるオンライン辞書を紹介したい.専門的なオンラインの英語語源辞書は Online Etymology Dictionary だけだが,一般のオンライン辞書の語源欄にも便利なものがある.英語語源情報ぬきだしCGI(一括版)もどうぞ.
(1) 唯一の本格派オンライン語源辞書
・ Online Etymology Dictionary: Douglas Harper 氏による本格的な語源辞書.初出年あり.英語語源情報ぬきだしCGI(一括版)でもお世話になっています.お薦め.
(2) 語源の勉強になるお薦めの辞書
・ Dictionary.com: 初出年あり.The Random House dictionary や Collins English Dictionary などの複数の辞書の記述を比べられるので便利.お薦め.
・ The Free Dictionary: American Heritage Dictionary of the English Dictionary と Collins English Dictionary に基づいた簡潔な語源説明.比べられて便利.また,thesaurus の情報も一緒に入ってきて有用.単なる類義語だけでなく関連語が一覧されるので,語彙増強にも役立つ.お薦め.
・ Merriam-Webster's Online Dictionary: 老舗辞書の語源欄として有用.初出年あり.
・ スペースアルクの語源辞典: 日本語で分かりやすい.関連語の一覧が出るので,語彙増強に利用できる.
(3) 意味や類義語などを知るついでに語源を軽く知りたいときに
・ Oxford Dictionaries Online - English Dictionary and Thesaurus: 老舗の辞書に簡潔な語源説明あり.Origin 欄で読みやすい説明.
・ Webster's Revised Unabridged Dictionary (1913 + 1828): 本格派辞書(旧版)の語源欄.
・ HyperDictionary.com: 同じく Webster (1913) の語源欄.ただ,thesaurus の情報も一緒に入ってくるので便利なときも.
・ Wiktionary: 簡潔な語源説明.先頭に語源欄が来る.
・ MSN Encarta Dictionary: 簡潔な語源説明.
(4) 語源に関する読み物
・ Etymologically Speaking: 語源豆辞典.228語しかないが各々に丁寧な説明があり,辞書としてよりも読み物として面白い.
・ hellog の語源の話題: 本ブログでも何かと語源は断片的に扱っているので.検索ボックスに "etymology ○○" (○○は英単語)などとすると引っかかるものがあるかもしれない.
たまに表面的に利用することがあったが,ちゃんとサイト内を巡ったことはなかった.アメリカの老舗辞書出版社 Merriam-Webster の Merriam-Webster Online の充実振りに驚いた.Unabridged Dictionary こそ有料サービスだが,以下のものはフリーで利用できる.
・ Merriam-Webster Collegiate Dictionary
・ Thesaurus
・ Medical Dictionary
・ Learner's Dictionary: 2008年出版のアメリカ発・初のアメリカ英語 EFL 辞書 Merriam-Webster's Advanced Learner's English Dictionary ( MWALED ) に対応するオンライン版.以下の検索ボックスから検索可能.最近,老舗のイギリス系 EFL 辞書( LDOCE5 や OALD7 ) は語源に力を入れているが,MWALED は語源は重視していないようだ.
昨日の記事[2010-08-10-1]で,toilet の婉曲表現が豊富であることを見た.複数の辞書を引き比べていて感じたが,最近の(特に学習者用)英英辞書は類義語間の使い分けや語法の解説が詳しく,類義語辞典 ( thesaurus ) ならずともそれに準ずる実用的な類義語リストが得られて有用である.それでも,類義語リストの提示に特化した thesaurus にはかなわない.
最近はWeb上にも thesaurus が豊富に転がっており,例えば the Free Online Dictionary, Thesaurus and Encyclopedia や Thesaurus.com などが手軽に利用できる.昨日はWeb辞書は調べていなかったが,追加すべき「トイレ」代替表現がいくつかあるようである.
Web上の本格的な thesaurus として有名なのは,Princeton University の George A. Miller の指揮によって編纂されている WordNet である.自然言語処理の世界では WordNet と連係しながら様々な応用が図られているようだ.現時点では Version 3.0 のデータベースがこちらから検索可能となっており,例えば toilet の検索結果はこの通り である.上位語 ( hypernym ) や下位語 ( hyponym ) へも一瞬のうちにアクセスでき,英語の意味の世界が手軽に扱えるようになったことを実感できる.また,WordNet 3.0 database statistics には英語の名詞の平均語義数が1.24なのに対して動詞の平均語義数は2.17であるなど,有用な情報がある.
語の意味の世界を視覚化したネットワーク図が手軽に得られるようなWeb上のサービスも出てきた.Visual Thesaurus がその1つだが有料.フリーでも以下のような簡便なネットワーク図が得られる.
Visual Thesaurus は有料なので,代わりに私がたまに使っているフリーのものが Visuwords.上記の WordNet のデータベースと連係している.出力されるネットワーク図は以下の通り.以下のイメージをクリックして現われる拡大画像,あるいは Visuwords で直接 toilet を検索した出力で,詳細を確かめてみてほしい.
世界には英語ベースのピジン語やクレオール語が30以上存在するといわれている.[2010-07-15-1], [2010-07-16-1]で見たように,ピジン語やクレオール語の定義や起源に曖昧な点があるので正確に数えることは難しいが,名前がついているものを挙げると30以上になるという.McArthur (177) よりその一覧を再現しよう.
(1) Africa
Gambian Creole or Aku; Krio and pidginized Krio in Sierra Leone; Liberian Creole; Ghanaian Pidgin; Togolese Pidgin; Nigerian Pidgin (creolized in urban areas); Kamtok in Cameroon (creolized in urban areas; see [2010-06-13-1], [2010-06-14-1]); Bioku Pidgin on Fernando Po.
(2) North America (All in the United States)
Afro-Seminole Creole; Amerindian Pidgin (most varieties now extinct); Black English Vernacular (status controversial); Sea Island Creole, or Gullah; Hawaii Pidgin and Creole.
(3) Central America, the Caribbean, and the neighbouring South America
Bahamian Creole; Barbadian Creole; Belizean Creole; Costa Rican Creole; Guyanese Creolese (sic) (see [2010-05-17-1]); Jamaican Creole or Nation Language or Patwa; Leeward Island Creole(s); Nicaraguan Creole; Surinamese Djuka or Aukan, Saramaccan, and Sranan (see [2010-06-05-1]); Trinidad and Tobago Creole(s) or Trinibagianese or Trinbagonian; Virgin Islands Creole; Windward Island Creole(s).
(4) Australasia-Pacific Ocean
Bislama (Vanuatu), Hawaii Pidgin and Creole, Pijin (the Solomon Islands), Kriol or Roper River Pidgin/Creole (northern Australia), Pitcairnese and Norfolkese (Pitcairn Island and Norfolk Island), Tok Pisin/Neo-Melanesian (Papua-New Guinea), Torres Straits Broken/Creole.
世界中にむらなく分布しているというよりは,英米の植民地史を反映して局地的に分布していることがよくわかる.これらの遠心性をもつ「英語」が,求心性をもつ世界標準英語 (World Standard English)や標準英米変種などの主要な標準変種に対して今後どのように位置づけられてゆくかが注目される.というのは,これらの「英語話者」は今後続々と教育の普及などによって post-creole continuum の階段を上り,標準変種を獲得し,かっこ付きでない英語話者となることが見込まれるからだ.しかも,束になれば相当な人口である.
これらのピジン語やクレオール語が話される地域のみを選んで旅したら,英語観が変わってくるかもしれないな・・・.
ピジン語やクレオール語に関するリンクをいくつか張っておく.
・ Society for Pidgin and Creole Linguistics: 学会のサイト
・ Pidgin and Creole Languages: ピジン語・クレオール語入門
・ Tok Pisin Translation, Resources, and Discussion: Tok Pisin/English 辞書あり
・ Jamaican Creole Texts: クレオール語とピジン語関係のリンクもあり
・ McArthur, Tom. The English Languages. Cambridge: CUP, 1998.
[2010-04-03-1]の語源情報抜きだしCGIの改良版.情報源は同じ Online Etymology Dictionary.今回の「一括版」は複数の語の語源を一覧したいときに便利.1行1語で入力された単語リストを用意し,それを以下のテキストエリアに入れて Go するだけ.1語だけでも使えるので,事実上,前回の版の上位互換.語数が多いと時間がかかるし,サーバに負担がかかるので注意.
こうしてますます面倒くさがりになってゆく.
電子辞書はもちろんのこと,今ではWeb上で利用できる英語辞書も数え切れないほど出ており,紙の辞書を引く時代に育ったものとしては驚きの世の中になった.あまたあるWeb辞書のなかでも,個人的に使う機会の多い英英辞書が Dictionary.com である.複数の辞書を横断しての「串刺し検索」が可能である.また,簡便な語源情報が "Word Origin & History" という項で得られるので,これだけのために参照することもある.語源と例文が特に有用なので,私は毎日ランダムに単語情報を自動配信してくれるサービス "Word of the Day" にも登録している.
もっとも,語源情報だけを参照したいのであれば,"Word Origin & History" の提供元である Online Etymology Dictionary を直接検索するのがはやい.(c) 2001-2010 Douglas Harper による英語語源のサイトで,簡単便利.これだけでも十分に簡単便利なのだが「辞書の雑多な情報はいらない,とりあえず語源情報だけを今すぐ欲しい,早く早く!」という(私だけの?)喫緊のニーズに対応し,一発スクリプトを作って使っている.特に初出年やどの言語から来ているかを即座に知りたいときに重宝している.
そのスクリプトのCGI版を以下に作ってみた.単に Online Etymology Dictionary の検索結果から語源記述の部分をぬきだすだけのもの.電子検索が可能になると,どんどん面倒くさがりになってゆく・・・.
現代英語の最頻英単語は何か.この話題についてはコーパス言語学,辞書学,計算機の発展により,様々な頻度表が作られてきた.ウェブ上でも簡単に手に入るので,いくつか代表的なリストや情報源へのリンクを掲げておく.語彙研究に活用したい.
[主要な頻度表]
・ GSL ( General Service List ): 最頻2000語を掲げたリスト.出版が1953年と古いが,現在でも広く参照されているリスト.
・ AWL ( Academic Word List ): 学術テキストに限定した最頻語リスト.2000年に出版され,GSLに含まれる語と重複しないように選ばれた570語を掲載.10のサブリストに分かれている.AWL の前身となる,1984年に出版された808語のリスト UWL ( University Word List ) も参照.
・ BNC Word Frequency Lists: BNC ( The British National Corpus ) による最頻6318語のリスト.頻度表の直接ダウンロードはこちらから.
・ Top 1000 words in UK English: 18人の著者,29作品,460万語のコーパスから抽出したイギリス英語の最頻1000語リスト.
・ Brown Corpus List: Brown Corpus によるアルファベット順リスト.
・ The Longman Defining Vocabulary: LDOCE の1988年版の定義語彙リスト.2000語以上.
[他のリストへのリンク集]
・ Work/Frequency List: 様々な頻度表へのリンク集.(2010/09/10(Fri)現在リンク切れ)
・ Famous Frequency Lists: 様々な頻度表へのリンク集.
・ Basic English and Common Words: ML上の最頻語頻度表についての議論.
[アルファベットの文字の頻度表]
・ Letter Frequencies (rankings for various languages): いくつかのランキング表がある.BNCでは "etaoinsrhldcumfpgwybvkxjqz" の順とある.
(後記 2010/03/07(Sun):American National Corpus に基づいた頻度表を見つけた.Written と Spoken で分別した頻度表もあり.)
(後記 2010/04/12(Mon):COLT: The Bergen Corpus Of London Teenage Language に基づいた最頻1000語のリストを見つけた.)
(後記 2011/02/14(Mon):Corpus of Contemporary American English (COCA) に基づいた Corpus-based word frequency lists, collocates, and n-grams を見つけた.Top 5,000 lemma, Top 500,000 word forms など.)
英語研究を始め言語研究にコーパスが利用されるようになって,すでに久しい.英語史の分野でも,革新的な The Diachronic Part of the Helsinki Corpus of English Texts の出版以来,様々な種類の歴史・通時コーパスが出ている.
研究には大いにコーパスを利用したいが,コーパス利用研究の注意点を(コメントつきで)挙げておきたい (McEnery et at. 121).
(1) コーパスは negative evidence を提供してくれない.○○がどれだけ生起するかは教えてくれるが,××が生起しないことは教えてくれない.(だが,一般的にいって存在しないかもしれないことを研究することは難しいので,これはコーパス言語学に限った問題点ではない.)
(2) コーパスは事実を提供してくれるが,その事実の説明はしてくれない.(確かに.説明それ自身は研究者の仕事である.)
(3) コーパスは,研究の範囲を限定する.(コーパスではできない研究もたくさんある.コーパス研究は,問題を適切に設定すればその目的のためには常に有効である.しかし,最初の問題設定の外にも問題が広がっていることは忘れてはいけない.)
(4) コーパス研究で導かれた結論を一般化する際には細心の注意を要する.(いくら膨大なコーパスでも,あくまで対象とする言語事実の部分集合である.)
以上4点を書き留めてみてふと立ち止まった.考えてみれば,この4点はコーパス利用ならずとも常に気をつけなければならない点である.英語史を含め歴史言語学の研究は,話者の直感に頼ることができない以上,残された事実(=コーパス)を分析するところから始まらざるをえないのだから,それを電子的に扱うか否かにかかわらず,やっていることはコーパス言語学にほかならない.ただ,電子的な統計に注目する傾向のある近年の(コンピュータ)コーパス言語学では,上記4点について余計に注意すべきだということは言えるだろう.
(3) に関連して,望遠鏡(コーパス言語学に代表される量的研究)と顕微鏡(文献学や談話分析に代表される質的研究)の比喩が興味深い.コーパスを利用するか否かにかかわらず,研究の目的が最重要ということだろう.
If it is ridiculous to criticize a telescope for not being a microsope, it is equally pointless to criticize the corpus-based approach for not doing what it is not intended to do (McEnery et al. 121)
英語コーパス研究の入り口として,以下の非常に良質なリンクを参照.
・ コーパス言語学の入門: 家入葉子先生のサイトより.英語史研究に有用.
・ 英語史関係のコーパス・電子テキスト: 家入葉子先生のサイトより.
・ 英語史関係のコーパス: 三浦あゆみさんの A Gateway to Studying HEL より.
・ コーパス研究に有用なWebサイト一覧
・ JAECS 英語コーパス学会
(後記 2010/03/21(Sun))
・ おすすめコーパスサイト: 『実践コーパス言語学』の著者の一人,須賀廣氏のリンク集.
・ McEnery, Tony, Richard Xiao, and Yukio Tono. Corpus-Based Language Studies: An Advanced Resource Book. London: Routledge, 2006.
このブログでもたまに EIL ( English as an International Language ) を話題に取り上げるが ( see elf ),○○英語の発音を聞いてみたいというときにすぐにサンプル音源を手に入れられると便利だと思い,Web上のリソースを探してみた.もっと探せば良質のものがもっとあると思うが,とりあえず数点のみを.
・ The International Dialects of English Archive: IDEA 提供.右メニューの「Dialects & Accent」から世界中の英語のサンプル音源へ.transcript つきで便利.
・ the speech accent archive: 英米内の地域変種が中心だが,それ以外も多少あり.同じテキストが読み上げられており,比較に便利.
・ Listen to English around the World: 世界の英語ラジオ放送網へのリンク.ENL と ESL の国がメイン.
・ Sample Sound Files from International Corpus of English: ICE 提供のサンプル.Australia, East Africa (Kenya & Tanzania), Great Britain, Hong Kong, India, Jamaica, The Philippines で話される英語のサンプル音源があるが,いずれも短い.
[2009-11-08-1]で Shakespeare に関する Web resources を紹介したが,今回は Chaucer の研究に役立つリンクを集めてみた.Chaucer についてもウェブ上には膨大な情報が存在するので,リンクをチェックしたり選定するだけで一仕事である.
[Portals to Chaucer]
・ Chaucer MetaPage: とてつもなく膨大な情報源への入口.
・ The Geoffrey Chaucer Website: もう一つの膨大な入り口.
・ geoffreychaucer.org: Web resources への注解つきリンク集というべきページ.
・ Baragona's Chaucer Page: 学生用ページということで,リンクも豊富.
・ Duncan's Chaucer Course: こちらも学生用ページ.入りやすい入口.
・ The Chaucer Scriptorium by Michael Hanly
・ Jane Zatta's Chaucer: 各作品の背景を知るのに.
・ Luminarium Chaucer Page: 中英語文学の広い視点からの Chaucer.
・ The New Chaucer Society: 学会サイト.リンク集も.
[Texts and Translations]
・ Librarius's The Canterbury Tales and Other Works: 現代英語対訳.下部フレームを利用したグロッサリーも完備.Canterbury Tales はこちら
・ Interlinear Translations of Chaucer's Canterbury Tales: 行間で現代英語訳が読める.
・ The Electronic Canterbury Tales: Tale ごとに情報が満載.Canterbury Tales のテキストはこちらから簡単アクセス.
・ Chaucer Texts: テキストファイルで入手可能.現代英語訳はこちらから,HTMLやPDFでも入手可能.
・ The General Prologue - An Electronic Edition: General Prologue に特化したページ.メニューから各話へジャンプ.現代英語対訳も.
・ The Canterbury Tales: Corpus of Middle English Prose and Verse による提供.
・ The Canterbury Tales and Other Poems of Geoffrey Chaucer, Edited for Popular Perusal from Project Gutenberg: Gutenberg からテキストファイルで落とせる.
・ General Prologue and the Miller's Tale: University of Glasgow 提供の Miller's Tale.グロッサリーとコメントつき.
・ The Canterbury Tales - Reader-Friendly edition in PDF: PDFで落とし,現代英語綴字でじっくり読みたい人に.
・ The Canterbury Tales: オンラインで読める現代英語訳.
・ Canterbury Tales and Other Poems -- Hypertext and eBooks: Literature Project による提供の現代英語訳.
[Glossaries, Concordancers, and Other Research Tools]
・ A Basic Chaucer Glossary: 超簡易グロッサリー.
・ A Glossarial DataBase of Middle English: Canterbury Tales の本格派検索系グロッサリー.
・ A Glossary for the Works of Geoffrey Chaucer (in the Riverside Edition): 1ページの有用なグロッサリー.
・ Chaucer Concordance: 作品毎のコンコーダンサー.
・ Chaucer Bibliography Online: 強力な Chaucer 関連の論文検索ツール.
[Others]
・ Canterbury Tales Project の写本イメージのサンプル.Hengwrt Chaucer Digital Facsimile, Miller's Tale, Nun's Priest's Tale など.
・ Audio Files of Chaucer's Works: 原文の朗読が吹き込まれた音源集.
・ The Chaucer Studio: テキスト朗読 CD を購入できるページ.
(後記 2013/03/10(Sat) Ellesmere Chaucer: 写本画像.)
ここ数日の記事で取り上げてきた "endangered languages" の話題に関連して,Web上では複数の機関が情報を提供している.以下は,主だったサイトへのリンク集.
・ Committee on Endangered Languages and Their Preservation (CELP)
・ Endangered Language Fund
・ Ethnologue
・ European Bureau for Lesser-Used Languages (EBLUL)
・ Foundation For Endangered Languages
・ Gesellschaft für bedrohte Sprachen (GBS)
・ The Society for the Study of the Indigenous Languages of the Americas
・ Terralingua: Unity in Biocultural Diversity
・ The International Clearing House for Endangered Languages (←東京大学内の機関.日本語版はこちら)(2010/09/10(Fri)現在,両ページともリンク切れ)
・ UNESCO Culture Sector - Intangible Heritage - 2003 Convention: Safeguarding endangered languages
・ Universal Declaration of linguistic rights
危機に瀕した言語を復興させるための知識と知恵を蓄積するこの分野はいまだ定着した名称は与えられていないが,この20年足らずのあいだに世界中で少しずつ関心が高まってきたことは事実のようである.ちなみに,Crystal は "preventive linguistics",Matisoff は "perilinguistics" と呼んでいる (Crystal 93).
上記,東京大学の The International Clearing House for Endangered Languages は,世界のなかでも比較的早い1995年に立ち上がった危機言語に関連する機関である.(2010/09/10(Fri)現在,リンク切れ)
・ Crystal, David. Language Death. Cambridge: CUP, 2000.
昨日の記事[2010-01-02-1]に引き続き,正月でますますお酒が回ってきたので軽い話題をもう一つ.
IPA 「国際音標文字」の図が,The International Phonetic Association のサイトからPDFでダウンロードできる(直接にはこちら).A4用紙1枚に印刷できるので,昨日のOE Inflection Magic Sheetの裏面に印刷してみた.
ちなみに,[2009-05-17-1]でも紹介したが,PC上でIPAの発音記号を打ち込むにはこちらのサイトが便利である.
正月でお酒が回ってきたので軽い話題を一つ.
OE Inflection Magic Sheetから,非常にコンパクトにまとまった古英語の屈折表をPDFで落とすことができる(直接にはこちら).A4用紙1枚にカラーで印刷できるので,試験前のアンチョコとして申し分ない.名詞,形容詞,代名詞,動詞の主要な屈折が掲げられている. *
私は中英語の形態論を主な研究領域としているので古英語の屈折は熟知していなければならないはずなのだが,かなりの部分が記憶から抜け落ちてしまっている.新年でもあるし,改めて覚えなおすか・・・.せめて手帳に挟み込んでおくことにする.
「レディース」と答える人が圧倒的ではないだろうか.英語でも,men's wear に対して ladies' wear というのが一般的である.ところが,先日,ユニクロの日替わりセールの広告で「ウィメンズ 3Dスキニージーンズ 1,490円」なる文言を見つけた.
確かに,英語でも women's wear という表現はないではないし,むしろ mens' wear との対比が綴字上の eye rhyme として効果的に示されるという利点はあるかもしれない.ただ,[2009-12-06-1], [2009-12-07-1]で見たように,発音上は /mɛnz/ と /wɪmɪnz/ とでは韻を踏まない.
一方,日本語では,綴字上も発音上も見事に韻を踏む.「メンズ」に対して,「ウィメンズ」と発音が日本語化するからである.無標の ( unmarked ) 「レディース」ではなく,あえて有標の ( marked ) 「ウィメンズ」を使うというのは,ユニクロの差別化戦略だろうか?
英語の話しに戻るが,ladies' wear と women's wear のように二つ(以上)の variants があり,どちらの使用頻度がより高いかの見当をつけたい場合に便利なウェブツールがある.英文校正サイト [NativeChecker]は「Web上に蓄積されている膨大な英文テキストを基盤とした,英語のネイティブチェックシステム」で,自然な英語表現のチェックに威力を発揮する.入力された英語表現のヒット数によって,その頻度や自然度も計れるので,今回のような問題に活用できる.
これによると,ladies' wear のヒットは2,780,000件,women's wear のヒットは1,520,000件だった.前者のほうが,およそ倍近くの頻度を誇るようだ.およその見当付けとして活用したい.
Wovreはオーストラリア発の大学生コミュニティサイト.大学の授業の講義ノートのまとめサイトというか,試験直前のアンチョコ集というか,そのようなコンテンツを収集している.オーストラリアやニュージーランドの大学生が加盟(?)しているようで,英語史に関するものも二つ見つかった.
・Language Acquisition and Change --- History of English: 英語史を5分で総復習といった風.
・Language Change --- Timeline: 表の形式で英語史をざっくりと一望.
時代区分(periodisation)の観点からは,偶然にも上記二つの「英語史」はともに8区分である.ただし,英語がブリテン島に持ち込まれた5世紀以降だけを考えると,前者が7区分,後者が6区分である.前者では,16世紀以降はおよそ1世紀刻みの区分となっている.多かれ少なかれ時代区分は恣意的である以上,1世紀刻みというのは,むしろわかりやすい区分かもしれない.
いずれも試験前の大学生のために要点をまとめたという感じがよく出ている.授業を受けた学生なら「へぇ,便利」と思うに違いない.だが,当然ながらまとめアンチョコなので情報は断片的であり,決して体系的ではない.
良質なアンチョコを作るには,通史を記述するのと同じくらいのセンスが必要ではないだろうか.「英語史のアンチョコ」にはいつかトライしてみたい.
私は Shakespeare を専門とする者ではないが,英語史を研究していると Shakespeare にはいろいろなところでお世話になる.Shakespeare ともなればウェブ上の情報源はそれこそ無限に等しいものと思われるので,参照に便利なようにコメント付きで少数のリンクにまとめてみた.
・Open Source Shakespeare: http://www.opensourceshakespeare.org/
テキスト参照と検索に便利.advanced search も可能.検索結果の出力も見やすい.全体的に使いやすいインターフェース.
・The Complete Works of William Shakespeare: http://shakespeare.mit.edu/
HTML版の標準的 Shakespeare 全集.Title, Act, Scene がわかっている場合に参照しやすい.
・The Collected Works of Shakespeare: http://www.it.usyd.edu.au/~matty/Shakespeare/
HTML版の標準的 Shakespeare 全集.特にこちらの検索機能が有用.
・Mr. William Shakespeare and the Internet: http://shakespeare.palomar.edu/sitemap.htm
ハブサイト.ここを中心として,Shakespeare の世界へ飛べる.膨大なサイトなのであえてサイトマップへのリンク.
・Links to HTML Complete Works Sites: http://shakespeare.palomar.edu/works.htm#Collected
その他の HTML 化されたテキストへのリンク集.
・Shakespeare Search Tools: http://shakespeare.palomar.edu/searching.htm#Shsearch
その他の検索ツールへのリンク集.glossary へのリンクもあり.
試みに,上記の Open Source Shakespeare の検索により,worse と worser の使用頻度を調べてみた.worser はいわゆる二重比較級 ( double comparative ) の形態で,16?17世紀に特によく用いられたとされている.
検索の結果,worse が178例,worser が21例.例文をみてみると,worser は Our worser thoughts や the worser part of it などのように限定的用法の形容詞として用いられる傾向が強い一方で,worse は単独で用いられる傾向があるとわかる.これは,現代英語に標準用法として存在する二重比較級である lesser がもっぱら限定的用法で用いられるのに対応している.
などなど,ちょっとした発見が得られる.
(後記 2014/02/08(Sat):追加的に有用なサイトを以下に挙げておく.)
・ Shakespeare's Words: David Crystal による Shakespeare の言語への導入的サイト
・ Shakespeare Authorship
・ Stratford-upon-Avon - Shakespeare Birthplace Trust
・ Royal Shakespeare Company (RSC)
グラスゴー大学の英語学科のサイトには,英語史学習に最適な教材が置かれている.以下に,コメントをつけつつリンクを張る.
・Essentials of Old English: オンラインで古英語を勉強するならここ.古英語の歴史的背景や文法などが学べる.特に,A short grammar of Old Englishは手軽で必見.
・Readings in Early English: 古英語,中英語,初期近代英語のテキストとそれを読み上げたオーディオファイルが入手できる.
・ Essentials of Early English のリソース集: 古英語の屈折表などがPDFで手に入る.中世の写本へのリンクも張られている.本書はこちら
・The Basics of English Metre: 英語の韻律について学べる.英語史の理解にも,韻律や音節の学習は必要.
Powered by WinChalow1.0rc4 based on chalow