hellog〜英語史ブログ

#1294. 英語語源分析ツールの夢[etymology][lexicology][statistics][web_service]

2012-11-11

 英文を投げ込むと,各単語(あるいは形態素)が語源別に色づけされて返ってくるような語源分析ツールがあるとよいなと思っている.しかも,各単語に語源辞書のエントリーへのリンクが張られているような.語彙研究や英語教育にも活かせるだろうし,出力を眺めているだけでもおもしろそうだ.このようなツールを作成するには精度の高い形態素分析プログラムと語源データベースの完備が欠かせないが,完璧を求めてしまうと実現は不可能だろう.
 同じことを考える人はいるようだ.例えば,Visualizing English Word Origins はツールを公開こそしていないが,Douglas Harper による Online Etymology Dictionary に基づく自作のツールで,いくつかの短い英文一節を色づけ語源分析している.テキストの分野別に本来語やラテン語の割合が何パーセントであるかなどを示しており,およそ予想通りの結果が出されたとはいえ,実におもしろい.この分析に関して,The Economist に記事があった.
 また,今は残念ながらリンク切れとなっているが,かつて http://huco.artsrn.ualberta.ca/~mburden/project/message.php?thread=Shakspere&id=174 に簡易的な語源分析ツールが公開されていた.こちらの紹介記事 にあるとおりで,なかなか有望なツールだった.私も少し利用した記憶があるのだが,どこへ消えてしまったのだろうか.
 英語語源関連のオンライン・コンテンツも増えてきた.以下にいくつかをまとめておく.

 ・ 「#485. 語源を知るためのオンライン辞書」: [2010-08-25-1]
 ・ Etymology 関連の外部リンク集

 ・ 「#361. 英語語源情報ぬきだしCGI(一括版)」: [2010-04-23-1]
 ・ Behind the Name: The Etymology and History of First Names
 ・ Behind the Name: The Etymology and History of Surnames

 ・ 語源別語彙統計に関する本ブログ内の記事: lexicology loan_word statistics
 ・ Etymologic! The Toughest Word Game on the Web: 英語語源クイズ.

[ | 固定リンク | 印刷用ページ ]

Powered by WinChalow1.0rc4 based on chalow