Joseph Wright による English Dialect Dictionary のオンライン版である EDD Online について,Manfred Markus が率いる Innsbruck 大学のチームがオンライン化プロジェクトの最終段階の成果として Version 4.0 を公表した,との情報を得ました.Innsbruck EDD Online 4.0 Based on Joseph Wright's English Dialect Dictionary (1898--1905) です.
私はまだ EDD Online の豊富な機能を使いこなせていないのですが,辞書の画像イメージを確認できたり,地図上に示してくれたり等,視覚化の機能が充実している印象です.
Markus 教授による使い方のイントロ動画(5分)もありますので視聴をお勧めします(辞書とは関係ありませんが,動画の最後のインスブルックの景色に心奪われて今すぐオーストリアに行きたい,などと妄想).
EDD については,hellog では以下の記事で取り上げてきましたので,そちらもご参照下さい.
・ 「#869. Wright's English Dialect Dictionary」 ([2011-09-13-1])
・ 「#868. EDD Online」 ([2011-09-12-1])
・ 「#2694. EDD Online (2)」 ([2016-09-11-1]) を参照.
昨日の記事「#4130. 英語語彙の多様化と拡大の歴史を視覚化した "The OED in two minutes"」 ([2020-08-17-1]) で紹介した同じコンテンツを,異なる角度から改めて眺めてみたい.The OED in two minutes で公開されている英語語彙史地図のコンテンツである.
中英語の始まりとなる1150年から再生して1年ごとに時間を進めていくと,しばらくは動きがヨーロッパ内部に限られており,さしておもしろくもないのだが,15世紀後半になってくると中東や北アフリカなどに散発的に点が現われてくる.そして,16世紀後半になると新大陸やインド方面にも点がポツポツしてきて,日本も舞台に登場してくる.この状況は17,18世紀にかけて稀ではなくなってくる.次に注目すべき動きが出てくるのは,18世紀後半のオセアニア,太平洋,南アフリカといった南半球を中心とした海洋地域である.19世紀に入るとアフリカや東南アジアを含めた世界の広域に点が打たれるようになり,同世紀後半には南アメリカも加わる.20世紀はまさにグローバルである.
実におもしろい.同時に,実に恐ろしい.16世紀後半から19世紀終わりまでの時間枠に関するかぎり,そのままイギリスの世界帝国化の足跡を語彙史の観点からパラフレーズしたコンテンツに見えてきたからだ.直接・間接にイギリスの支配権の及ぶ領土を塗りつぶした世界史の地図は「軍事的な」地図として見慣れているし,ある意味で分かりやすい.しかし,今回のような「語彙史的な」地図がそれと多かれ少なかれ一致するというのは,何とも薄気味悪い.そして,後者の地図が,OED という英語文献学の粋というべき学術的な成果物を利用して作成されていること,またその辞書それ自身が大英帝国の最盛期である19世紀半ばの企画の産物であることを思い出すとき,薄気味悪さ以上に,得体のしれない恐ろしさを感じる.
OED は学術的(文献学的)偉業を体現するツールであり,その点で私も賞賛を抑えることができない.しかし,その事実を認めつつ,それ自体が,毀誉褒貶相半ばする近代世界史の産物であることは肝に銘じておきたい.関連して以下の記事も参照.
・ 「#3020. 帝国主義の申し子としての比較言語学 (1)」 ([2017-08-03-1])
・ 「#3021. 帝国主義の申し子としての比較言語学 (2)」 ([2017-08-04-1])
・ 「#3376. 帝国主義の申し子としての英語文献学」 ([2018-07-25-1])
・ 「#3603. 帝国主義,水族館,辞書」 ([2019-03-09-1])
・ 「#3767. 日本の帝国主義,アイヌ,拓殖博覧会」 ([2019-08-20-1])
The OED in two minutes に,中英語の始まる1150年から2010年までの英語(借用)語彙史を地図上で視覚化してダイジェストで示すコンテンツが公表されている.これは凄いコンテンツ.実にみごとに英語語彙の多様化と拡大の歴史が表現されており,しかもいろいろな意味で考えさせられる.こちらからどうぞ.
地図の下にある色付きの帯は,現代英語における語種ごとの総トークン頻度を表わしている(背後で利用されているデータベースは Google Ngrams の1970--2008年の部分だという).試しに2010年現在の地図に示される統計をみてみると,総トークン頻度にして,ゲルマン系の語彙(青帯)が49%,英語要素に基づく複合語など(白帯)が26%なので,ここまでで全体の3/4である.ロマンス系の語彙(赤帯)が18%,ラテン語が7%,そしてその他が0.2%だ.英語史では語彙の歴史は借用の歴史であるというのが定番だが,トークン頻度で考える限り,現在でも英語の語彙は圧倒的にアングロサクソン(あるいはゲルマン)的であるといってよいことになる.この事実については「#3400. 英語の中核語彙に借用語がどれだけ入り込んでいるか?」 ([2018-08-18-1]) と,そこに張ったリンク先の記事を参照.
地図左下の年号に重なって描かれている灰色のバブルは,高頻度かつ多数の単語が加わった年ほど大きくなり,低頻度かつ少数の単語が加わったにすぎない年には小さくなる.17世紀を通じて相対的に大きかったバブルが,18世紀にかけてしぼんでいく様子も興味深い (cf. 「#2995. Augustan Age の語彙的保守性」 ([2017-07-09-1]),「#203. 1500--1900年における英語語彙の増加」 ([2009-11-16-1]),「#4070. 18世紀の語彙的低迷のなぞ」 ([2020-06-18-1])) .
英語(語彙)史を大づかみするには,このようなダイジェストの視覚コンテンツが威力を発揮する.
OED が OED Text Visualizer という物凄いツールを作っている.入力欄に英文テキストを放り投げると,OED の情報に基づいて背後で各単語にタグが付され,初出年代と語源をタイムラインで視覚的に表現してくれるというものだ.いつかこのようなツールが作れたら(あるいは誰かが作ってくれたら)いいなと私が夢見ていたような語源表示ツールである.これまでも技術的には十分に可能だったろうが,本格的に取り組む者が現われなかった.それを OED が実装してくれたというのは,さすがである.開発中のベータ版ということで,入力する英文は500語まで,また1750年以後の英文でないと精度が下がるなどの制限はあるようだが,十分に楽しめる.
百聞は一見に如かず.「#3276. Churchill の We Shall Fight on the Beaches 演説」 ([2018-04-16-1]) より,308語からなる英文の1節を放り込んでみた.1940年の演説なので,その年代も添えつつ Vizualize ボタンをクリックすると,次のような図が返される(画像クリックで拡大).
テキストに現われる各単語(レンマ)がバブルで表現されている.バブルの左右の位置はその語の初出年代に対応し,色は語源に,大きさは同テキスト内の頻度に対応する.バブルにマウスを乗せれば,その語の詳しい情報が得られる.スゴい.
画面のさらに下には,各単語が token ベース,および lexeme ベースでタグ付けされた情報が一覧され,CSV や JSON でダウンロードできるので,後からプログラムを用いて詳しく分析することも可能である.
いや,驚いた.英語史の研究方法もどんどん変わっていきそうだ.
Powered by WinChalow1.0rc4 based on chalow