電子辞書はもちろんのこと,今ではWeb上で利用できる英語辞書も数え切れないほど出ており,紙の辞書を引く時代に育ったものとしては驚きの世の中になった.あまたあるWeb辞書のなかでも,個人的に使う機会の多い英英辞書が Dictionary.com である.複数の辞書を横断しての「串刺し検索」が可能である.また,簡便な語源情報が "Word Origin & History" という項で得られるので,これだけのために参照することもある.語源と例文が特に有用なので,私は毎日ランダムに単語情報を自動配信してくれるサービス "Word of the Day" にも登録している.
もっとも,語源情報だけを参照したいのであれば,"Word Origin & History" の提供元である Online Etymology Dictionary を直接検索するのがはやい.(c) 2001-2010 Douglas Harper による英語語源のサイトで,簡単便利.これだけでも十分に簡単便利なのだが「辞書の雑多な情報はいらない,とりあえず語源情報だけを今すぐ欲しい,早く早く!」という(私だけの?)喫緊のニーズに対応し,一発スクリプトを作って使っている.特に初出年やどの言語から来ているかを即座に知りたいときに重宝している.
そのスクリプトのCGI版を以下に作ってみた.単に Online Etymology Dictionary の検索結果から語源記述の部分をぬきだすだけのもの.電子検索が可能になると,どんどん面倒くさがりになってゆく・・・.
現代英語の最頻英単語は何か.この話題についてはコーパス言語学,辞書学,計算機の発展により,様々な頻度表が作られてきた.ウェブ上でも簡単に手に入るので,いくつか代表的なリストや情報源へのリンクを掲げておく.語彙研究に活用したい.
[主要な頻度表]
・ GSL ( General Service List ): 最頻2000語を掲げたリスト.出版が1953年と古いが,現在でも広く参照されているリスト.
・ AWL ( Academic Word List ): 学術テキストに限定した最頻語リスト.2000年に出版され,GSLに含まれる語と重複しないように選ばれた570語を掲載.10のサブリストに分かれている.AWL の前身となる,1984年に出版された808語のリスト UWL ( University Word List ) も参照.
・ BNC Word Frequency Lists: BNC ( The British National Corpus ) による最頻6318語のリスト.頻度表の直接ダウンロードはこちらから.
・ Top 1000 words in UK English: 18人の著者,29作品,460万語のコーパスから抽出したイギリス英語の最頻1000語リスト.
・ Brown Corpus List: Brown Corpus によるアルファベット順リスト.
・ The Longman Defining Vocabulary: LDOCE の1988年版の定義語彙リスト.2000語以上.
[他のリストへのリンク集]
・ Work/Frequency List: 様々な頻度表へのリンク集.(2010/09/10(Fri)現在リンク切れ)
・ Famous Frequency Lists: 様々な頻度表へのリンク集.
・ Basic English and Common Words: ML上の最頻語頻度表についての議論.
[アルファベットの文字の頻度表]
・ Letter Frequencies (rankings for various languages): いくつかのランキング表がある.BNCでは "etaoinsrhldcumfpgwybvkxjqz" の順とある.
(後記 2010/03/07(Sun):American National Corpus に基づいた頻度表を見つけた.Written と Spoken で分別した頻度表もあり.)
(後記 2010/04/12(Mon):COLT: The Bergen Corpus Of London Teenage Language に基づいた最頻1000語のリストを見つけた.)
(後記 2011/02/14(Mon):Corpus of Contemporary American English (COCA) に基づいた Corpus-based word frequency lists, collocates, and n-grams を見つけた.Top 5,000 lemma, Top 500,000 word forms など.)
英語研究を始め言語研究にコーパスが利用されるようになって,すでに久しい.英語史の分野でも,革新的な The Diachronic Part of the Helsinki Corpus of English Texts の出版以来,様々な種類の歴史・通時コーパスが出ている.
研究には大いにコーパスを利用したいが,コーパス利用研究の注意点を(コメントつきで)挙げておきたい (McEnery et at. 121).
(1) コーパスは negative evidence を提供してくれない.○○がどれだけ生起するかは教えてくれるが,××が生起しないことは教えてくれない.(だが,一般的にいって存在しないかもしれないことを研究することは難しいので,これはコーパス言語学に限った問題点ではない.)
(2) コーパスは事実を提供してくれるが,その事実の説明はしてくれない.(確かに.説明それ自身は研究者の仕事である.)
(3) コーパスは,研究の範囲を限定する.(コーパスではできない研究もたくさんある.コーパス研究は,問題を適切に設定すればその目的のためには常に有効である.しかし,最初の問題設定の外にも問題が広がっていることは忘れてはいけない.)
(4) コーパス研究で導かれた結論を一般化する際には細心の注意を要する.(いくら膨大なコーパスでも,あくまで対象とする言語事実の部分集合である.)
以上4点を書き留めてみてふと立ち止まった.考えてみれば,この4点はコーパス利用ならずとも常に気をつけなければならない点である.英語史を含め歴史言語学の研究は,話者の直感に頼ることができない以上,残された事実(=コーパス)を分析するところから始まらざるをえないのだから,それを電子的に扱うか否かにかかわらず,やっていることはコーパス言語学にほかならない.ただ,電子的な統計に注目する傾向のある近年の(コンピュータ)コーパス言語学では,上記4点について余計に注意すべきだということは言えるだろう.
(3) に関連して,望遠鏡(コーパス言語学に代表される量的研究)と顕微鏡(文献学や談話分析に代表される質的研究)の比喩が興味深い.コーパスを利用するか否かにかかわらず,研究の目的が最重要ということだろう.
If it is ridiculous to criticize a telescope for not being a microsope, it is equally pointless to criticize the corpus-based approach for not doing what it is not intended to do (McEnery et al. 121)
英語コーパス研究の入り口として,以下の非常に良質なリンクを参照.
・ コーパス言語学の入門: 家入葉子先生のサイトより.英語史研究に有用.
・ 英語史関係のコーパス・電子テキスト: 家入葉子先生のサイトより.
・ 英語史関係のコーパス: 三浦あゆみさんの A Gateway to Studying HEL より.
・ コーパス研究に有用なWebサイト一覧
・ JAECS 英語コーパス学会
(後記 2010/03/21(Sun))
・ おすすめコーパスサイト: 『実践コーパス言語学』の著者の一人,須賀廣氏のリンク集.
・ McEnery, Tony, Richard Xiao, and Yukio Tono. Corpus-Based Language Studies: An Advanced Resource Book. London: Routledge, 2006.
このブログでもたまに EIL ( English as an International Language ) を話題に取り上げるが ( see elf ),○○英語の発音を聞いてみたいというときにすぐにサンプル音源を手に入れられると便利だと思い,Web上のリソースを探してみた.もっと探せば良質のものがもっとあると思うが,とりあえず数点のみを.
・ The International Dialects of English Archive: IDEA 提供.右メニューの「Dialects & Accent」から世界中の英語のサンプル音源へ.transcript つきで便利.
・ the speech accent archive: 英米内の地域変種が中心だが,それ以外も多少あり.同じテキストが読み上げられており,比較に便利.
・ Listen to English around the World: 世界の英語ラジオ放送網へのリンク.ENL と ESL の国がメイン.
・ Sample Sound Files from International Corpus of English: ICE 提供のサンプル.Australia, East Africa (Kenya & Tanzania), Great Britain, Hong Kong, India, Jamaica, The Philippines で話される英語のサンプル音源があるが,いずれも短い.
[2009-11-08-1]で Shakespeare に関する Web resources を紹介したが,今回は Chaucer の研究に役立つリンクを集めてみた.Chaucer についてもウェブ上には膨大な情報が存在するので,リンクをチェックしたり選定するだけで一仕事である.
[Portals to Chaucer]
・ Chaucer MetaPage: とてつもなく膨大な情報源への入口.
・ The Geoffrey Chaucer Website: もう一つの膨大な入り口.
・ geoffreychaucer.org: Web resources への注解つきリンク集というべきページ.
・ Baragona's Chaucer Page: 学生用ページということで,リンクも豊富.
・ Duncan's Chaucer Course: こちらも学生用ページ.入りやすい入口.
・ The Chaucer Scriptorium by Michael Hanly
・ Jane Zatta's Chaucer: 各作品の背景を知るのに.
・ Luminarium Chaucer Page: 中英語文学の広い視点からの Chaucer.
・ The New Chaucer Society: 学会サイト.リンク集も.
[Texts and Translations]
・ Librarius's The Canterbury Tales and Other Works: 現代英語対訳.下部フレームを利用したグロッサリーも完備.Canterbury Tales はこちら
・ Interlinear Translations of Chaucer's Canterbury Tales: 行間で現代英語訳が読める.
・ The Electronic Canterbury Tales: Tale ごとに情報が満載.Canterbury Tales のテキストはこちらから簡単アクセス.
・ Chaucer Texts: テキストファイルで入手可能.現代英語訳はこちらから,HTMLやPDFでも入手可能.
・ The General Prologue - An Electronic Edition: General Prologue に特化したページ.メニューから各話へジャンプ.現代英語対訳も.
・ The Canterbury Tales: Corpus of Middle English Prose and Verse による提供.
・ The Canterbury Tales and Other Poems of Geoffrey Chaucer, Edited for Popular Perusal from Project Gutenberg: Gutenberg からテキストファイルで落とせる.
・ General Prologue and the Miller's Tale: University of Glasgow 提供の Miller's Tale.グロッサリーとコメントつき.
・ The Canterbury Tales - Reader-Friendly edition in PDF: PDFで落とし,現代英語綴字でじっくり読みたい人に.
・ The Canterbury Tales: オンラインで読める現代英語訳.
・ Canterbury Tales and Other Poems -- Hypertext and eBooks: Literature Project による提供の現代英語訳.
[Glossaries, Concordancers, and Other Research Tools]
・ A Basic Chaucer Glossary: 超簡易グロッサリー.
・ A Glossarial DataBase of Middle English: Canterbury Tales の本格派検索系グロッサリー.
・ A Glossary for the Works of Geoffrey Chaucer (in the Riverside Edition): 1ページの有用なグロッサリー.
・ Chaucer Concordance: 作品毎のコンコーダンサー.
・ Chaucer Bibliography Online: 強力な Chaucer 関連の論文検索ツール.
[Others]
・ Canterbury Tales Project の写本イメージのサンプル.Hengwrt Chaucer Digital Facsimile, Miller's Tale, Nun's Priest's Tale など.
・ Audio Files of Chaucer's Works: 原文の朗読が吹き込まれた音源集.
・ The Chaucer Studio: テキスト朗読 CD を購入できるページ.
(後記 2013/03/10(Sat) Ellesmere Chaucer: 写本画像.)
ここ数日の記事で取り上げてきた "endangered languages" の話題に関連して,Web上では複数の機関が情報を提供している.以下は,主だったサイトへのリンク集.
・ Committee on Endangered Languages and Their Preservation (CELP)
・ Endangered Language Fund
・ Ethnologue
・ European Bureau for Lesser-Used Languages (EBLUL)
・ Foundation For Endangered Languages
・ Gesellschaft für bedrohte Sprachen (GBS)
・ The Society for the Study of the Indigenous Languages of the Americas
・ Terralingua: Unity in Biocultural Diversity
・ The International Clearing House for Endangered Languages (←東京大学内の機関.日本語版はこちら)(2010/09/10(Fri)現在,両ページともリンク切れ)
・ UNESCO Culture Sector - Intangible Heritage - 2003 Convention: Safeguarding endangered languages
・ Universal Declaration of linguistic rights
危機に瀕した言語を復興させるための知識と知恵を蓄積するこの分野はいまだ定着した名称は与えられていないが,この20年足らずのあいだに世界中で少しずつ関心が高まってきたことは事実のようである.ちなみに,Crystal は "preventive linguistics",Matisoff は "perilinguistics" と呼んでいる (Crystal 93).
上記,東京大学の The International Clearing House for Endangered Languages は,世界のなかでも比較的早い1995年に立ち上がった危機言語に関連する機関である.(2010/09/10(Fri)現在,リンク切れ)
・ Crystal, David. Language Death. Cambridge: CUP, 2000.
昨日の記事[2010-01-02-1]に引き続き,正月でますますお酒が回ってきたので軽い話題をもう一つ.
IPA 「国際音標文字」の図が,The International Phonetic Association のサイトからPDFでダウンロードできる(直接にはこちら).A4用紙1枚に印刷できるので,昨日のOE Inflection Magic Sheetの裏面に印刷してみた.
ちなみに,[2009-05-17-1]でも紹介したが,PC上でIPAの発音記号を打ち込むにはこちらのサイトが便利である.
正月でお酒が回ってきたので軽い話題を一つ.
OE Inflection Magic Sheetから,非常にコンパクトにまとまった古英語の屈折表をPDFで落とすことができる(直接にはこちら).A4用紙1枚にカラーで印刷できるので,試験前のアンチョコとして申し分ない.名詞,形容詞,代名詞,動詞の主要な屈折が掲げられている. *
私は中英語の形態論を主な研究領域としているので古英語の屈折は熟知していなければならないはずなのだが,かなりの部分が記憶から抜け落ちてしまっている.新年でもあるし,改めて覚えなおすか・・・.せめて手帳に挟み込んでおくことにする.
「レディース」と答える人が圧倒的ではないだろうか.英語でも,men's wear に対して ladies' wear というのが一般的である.ところが,先日,ユニクロの日替わりセールの広告で「ウィメンズ 3Dスキニージーンズ 1,490円」なる文言を見つけた.
確かに,英語でも women's wear という表現はないではないし,むしろ mens' wear との対比が綴字上の eye rhyme として効果的に示されるという利点はあるかもしれない.ただ,[2009-12-06-1], [2009-12-07-1]で見たように,発音上は /mɛnz/ と /wɪmɪnz/ とでは韻を踏まない.
一方,日本語では,綴字上も発音上も見事に韻を踏む.「メンズ」に対して,「ウィメンズ」と発音が日本語化するからである.無標の ( unmarked ) 「レディース」ではなく,あえて有標の ( marked ) 「ウィメンズ」を使うというのは,ユニクロの差別化戦略だろうか?
英語の話しに戻るが,ladies' wear と women's wear のように二つ(以上)の variants があり,どちらの使用頻度がより高いかの見当をつけたい場合に便利なウェブツールがある.英文校正サイト [NativeChecker]は「Web上に蓄積されている膨大な英文テキストを基盤とした,英語のネイティブチェックシステム」で,自然な英語表現のチェックに威力を発揮する.入力された英語表現のヒット数によって,その頻度や自然度も計れるので,今回のような問題に活用できる.
これによると,ladies' wear のヒットは2,780,000件,women's wear のヒットは1,520,000件だった.前者のほうが,およそ倍近くの頻度を誇るようだ.およその見当付けとして活用したい.
Wovreはオーストラリア発の大学生コミュニティサイト.大学の授業の講義ノートのまとめサイトというか,試験直前のアンチョコ集というか,そのようなコンテンツを収集している.オーストラリアやニュージーランドの大学生が加盟(?)しているようで,英語史に関するものも二つ見つかった.
・Language Acquisition and Change --- History of English: 英語史を5分で総復習といった風.
・Language Change --- Timeline: 表の形式で英語史をざっくりと一望.
時代区分(periodisation)の観点からは,偶然にも上記二つの「英語史」はともに8区分である.ただし,英語がブリテン島に持ち込まれた5世紀以降だけを考えると,前者が7区分,後者が6区分である.前者では,16世紀以降はおよそ1世紀刻みの区分となっている.多かれ少なかれ時代区分は恣意的である以上,1世紀刻みというのは,むしろわかりやすい区分かもしれない.
いずれも試験前の大学生のために要点をまとめたという感じがよく出ている.授業を受けた学生なら「へぇ,便利」と思うに違いない.だが,当然ながらまとめアンチョコなので情報は断片的であり,決して体系的ではない.
良質なアンチョコを作るには,通史を記述するのと同じくらいのセンスが必要ではないだろうか.「英語史のアンチョコ」にはいつかトライしてみたい.
私は Shakespeare を専門とする者ではないが,英語史を研究していると Shakespeare にはいろいろなところでお世話になる.Shakespeare ともなればウェブ上の情報源はそれこそ無限に等しいものと思われるので,参照に便利なようにコメント付きで少数のリンクにまとめてみた.
・Open Source Shakespeare: http://www.opensourceshakespeare.org/
テキスト参照と検索に便利.advanced search も可能.検索結果の出力も見やすい.全体的に使いやすいインターフェース.
・The Complete Works of William Shakespeare: http://shakespeare.mit.edu/
HTML版の標準的 Shakespeare 全集.Title, Act, Scene がわかっている場合に参照しやすい.
・The Collected Works of Shakespeare: http://www.it.usyd.edu.au/~matty/Shakespeare/
HTML版の標準的 Shakespeare 全集.特にこちらの検索機能が有用.
・Mr. William Shakespeare and the Internet: http://shakespeare.palomar.edu/sitemap.htm
ハブサイト.ここを中心として,Shakespeare の世界へ飛べる.膨大なサイトなのであえてサイトマップへのリンク.
・Links to HTML Complete Works Sites: http://shakespeare.palomar.edu/works.htm#Collected
その他の HTML 化されたテキストへのリンク集.
・Shakespeare Search Tools: http://shakespeare.palomar.edu/searching.htm#Shsearch
その他の検索ツールへのリンク集.glossary へのリンクもあり.
試みに,上記の Open Source Shakespeare の検索により,worse と worser の使用頻度を調べてみた.worser はいわゆる二重比較級 ( double comparative ) の形態で,16?17世紀に特によく用いられたとされている.
検索の結果,worse が178例,worser が21例.例文をみてみると,worser は Our worser thoughts や the worser part of it などのように限定的用法の形容詞として用いられる傾向が強い一方で,worse は単独で用いられる傾向があるとわかる.これは,現代英語に標準用法として存在する二重比較級である lesser がもっぱら限定的用法で用いられるのに対応している.
などなど,ちょっとした発見が得られる.
(後記 2014/02/08(Sat):追加的に有用なサイトを以下に挙げておく.)
・ Shakespeare's Words: David Crystal による Shakespeare の言語への導入的サイト
・ Shakespeare Authorship
・ Stratford-upon-Avon - Shakespeare Birthplace Trust
・ Royal Shakespeare Company (RSC)
グラスゴー大学の英語学科のサイトには,英語史学習に最適な教材が置かれている.以下に,コメントをつけつつリンクを張る.
・Essentials of Old English: オンラインで古英語を勉強するならここ.古英語の歴史的背景や文法などが学べる.特に,A short grammar of Old Englishは手軽で必見.
・Readings in Early English: 古英語,中英語,初期近代英語のテキストとそれを読み上げたオーディオファイルが入手できる.
・ Essentials of Early English のリソース集: 古英語の屈折表などがPDFで手に入る.中世の写本へのリンクも張られている.本書はこちら
・The Basics of English Metre: 英語の韻律について学べる.英語史の理解にも,韻律や音節の学習は必要.
今回はちょっとしたサイトの紹介だけ.BBC の Ages of English Timeline は,FLASH により遊び感覚で英語史の要点を学べる.
Powered by WinChalow1.0rc4 based on chalow