web_service / hellog～英語史ブログ

最終更新時間: 2026-07-15 01:27

2012-11-11 Sun

■ #1294. 英語語源分析ツールの夢 [etymology][lexicology][statistics][web_service]

　英文を投げ込むと，各単語（あるいは形態素）が語源別に色づけされて返ってくるような語源分析ツールがあるとよいなと思っている．しかも，各単語に語源辞書のエントリーへのリンクが張られているような．語彙研究や英語教育にも活かせるだろうし，出力を眺めているだけでもおもしろそうだ．このようなツールを作成するには精度の高い形態素分析プログラムと語源データベースの完備が欠かせないが，完璧を求めてしまうと実現は不可能だろう．
　同じことを考える人はいるようだ．例えば，Visualizing English Word Origins はツールを公開こそしていないが，Douglas Harper による Online Etymology Dictionary に基づく自作のツールで，いくつかの短い英文一節を色づけ語源分析している．テキストの分野別に本来語やラテン語の割合が何パーセントであるかなどを示しており，およそ予想通りの結果が出されたとはいえ，実におもしろい．この分析に関して，The Economist に記事があった．
　また，今は残念ながらリンク切れとなっているが，かつて http://huco.artsrn.ualberta.ca/~mburden/project/message.php?thread=Shakspere&id=174 に簡易的な語源分析ツールが公開されていた．こちらの紹介記事にあるとおりで，なかなか有望なツールだった．私も少し利用した記憶があるのだが，どこへ消えてしまったのだろうか．
　英語語源関連のオンライン・コンテンツも増えてきた．以下にいくつかをまとめておく．

　・「#485. 語源を知るためのオンライン辞書」: [2010-08-25-1]
　・ Etymology 関連の外部リンク集

　・「#361. 英語語源情報ぬきだしCGI（一括版）」: [2010-04-23-1]
　・ Behind the Name: The Etymology and History of First Names
　・ Behind the Name: The Etymology and History of Surnames

　・語源別語彙統計に関する本ブログ内の記事: lexicology loan_word statistics
　・ Etymologic! The Toughest Word Game on the Web: 英語語源クイズ．

Phoneme	Example	Translation
AA	odd	AA D
AE	at	AE T
AH	hut	HH AH T
AO	ought	AO T
AW	cow	K AW
AY	hide	HH AY D
B	be	B IY
CH	cheese	CH IY Z
D	dee	D IY
DH	thee	DH IY
EH	Ed	EH D
ER	hurt	HH ER T
EY	ate	EY T
F	fee	F IY
G	green	G R IY N
HH	he	HH IY
IH	it	IH T
IY	eat	IY T
JH	gee	JH IY
K	key	K IY
L	lee	L IY
M	me	M IY
N	knee	N IY
NG	ping	P IY NG
OW	oat	OW T
OY	toy	T OY
P	pee	P IY
R	read	R IY D
S	sea	S IY
SH	she	SH IY
T	tea	T IY
TH	theta	TH EY T AH
UH	hood	HH UH D
UW	two	T UW
V	vee	V IY
W	we	W IY
Y	yield	Y IY L D
Z	zee	Z IY
ZH	seizure	S IY ZH ER

	though	although
Natural and pure sciences	56.3	80.13
Applied science	37.36	68.31
World affairs	45.81	68.2
Social science	48.98	63.38
Commerce and finance	46.18	57.21
Arts	74.07	52.93
Leisure	45.85	49.46
Belief and thought	70.78	46.75
Imaginative prose	80.2	26.37

web_service - hellog～英語史ブログ

■ #1294. 英語語源分析ツールの夢 [etymology][lexicology][statistics][web_service]

■ #1285. FLASHで英語史略年表 [timeline][history][flash][web_service][world_languages][loan_word][link]

■ #1278. BNC を中心とするコーパス研究関連のリンク集 [corpus][bnc][link][web_service][lltest]

■ #1270. 類義語ネットワークの可視化ツールと類義語辞書 [web_service][thesaurus][link][synonym][dictionary][polysemy]

■ #1210. 中英語のフランス借用語の一覧 [french][loan_word][lexicology][me][web_service][cgi]

■ #1191. Pronunciation Search [pronunciation][web_service][cgi][ame][dictionary]

■ #1178. MED Spelling Search [dictionary][cgi][web_service]

■ #1163. オンライン語彙データベース DICT.ORG [web_service][dictionary][lexicology][link]

■ #1159. MRC Psycholinguistic Database Search [cgi][web_service][lexicology][frequency][statistics]

■ #1158. MRC Psycholinguistic Database [web_service][lexicology][frequency][statistics]

■ #1057. LAEME Index of Sources の検索ツール Ver. 2 [laeme][web_service][cgi][dialect]

■ #1041. COCA の "ANALYZE TEXT" [coca][corpus][web_service][academic_word_list][text_tool]

■ #986. COCA の "WORD AND PHRASE . INFO" [coca][corpus][dictionary][synonym][collocation][semantic_prosody][intensifier][web_service]

■ #956. COCA N-Gram Search [cgi][web_service][coca][corpus][collocation][n-gram]

■ #952. Etymology Search [etymology][dictionary][cgi][web_service][metathesis][blend][dissimilation]

■ #942. LAEME Index of Sources の検索ツール [laeme][web_service][cgi]

■ #868. EDD Online [dialect][web_service][corpus][lmode][lexicography][edd][dictionary]

■ #846. HelMapperUK --- hellog 仕様の英国地図作成 CGI [cgi][web_service][map][lalme][laeme][bre]

■ #749. hel typist --- hellog 仕様の文字列変換 CGI [cgi][web_service][ipa]

■ #711. Log-Likelihood Tester CGI, Ver. 2 [corpus][bnc][statistics][web_service][cgi][lltest]