cgi / hellog～英語史ブログ

最終更新時間: 2025-10-27 12:12

2013-03-29 Fri

■ #1432. もう1つの類義語ネットワーク「instaGrok」と連想語列挙ツール [web_service][thesaurus][synonym][cgi]

　「#471. toilet の豊富な婉曲表現を WordNet と Visuwords でみる」 ([2010-08-11-1]) や「#1270. 類義語ネットワークの可視化ツールと類義語辞書」 ([2012-10-18-1]) で，オンラインで利用できるヴィジュアル類義語ツールを紹介した（特に後者[2012-10-18-1]にリンク集を作ってあるので参照）．今回，新たに instaGrok なるウェブサービスを発見した．grok とは米俗語で "to understand sth completely using your feelings rather than considering the facts" を意味するが，instaGrok ではヴィジュアルで直感的に語のネットワークを把握することができる．
　出力されるネットワーク図は，Graph Words, Visuwords, Visual Thesaurus などとおよそ同じだが，右欄に定義らしき例文，キーワードと結びつけられるウェブページや画像・動画へのリンク，関連する選択クイズなどが現われるのが革新的だ．さらに，右下の Glossary 欄には，指定したキーワードと連辞的 (syntagmatic) および範列的 (paradigmatic) に緩いつながりを示す類義語群（むしろ連想語群と呼ぶべきか）が簡単な説明とともに列挙されるが，これは指定キーワードを出発点とする発想支援を促すツールともなり得る．例えば，キーワードに "tsunami" を指定すると，以下のような画面が得られる（画像をクリックすると拡大版）．

　データソースはウェブ上のデータのようだが，内部でどのようなエンジンを使っているのかは不明である．
　Glossary 欄の連想語群だけでも簡単に抜き出せると便利かもしれないと思い，次のツールを作った．並一通りの類義語辞書的な語群とは異なった連想語が得られておもしろい．ウェブベースなので，"Japan", "Pacific ocean" などの固有名詞などを入れると時事的な連想語が現われたりする．100語までのリストが出力される．

Phoneme	Example	Translation
AA	odd	AA D
AE	at	AE T
AH	hut	HH AH T
AO	ought	AO T
AW	cow	K AW
AY	hide	HH AY D
B	be	B IY
CH	cheese	CH IY Z
D	dee	D IY
DH	thee	DH IY
EH	Ed	EH D
ER	hurt	HH ER T
EY	ate	EY T
F	fee	F IY
G	green	G R IY N
HH	he	HH IY
IH	it	IH T
IY	eat	IY T
JH	gee	JH IY
K	key	K IY
L	lee	L IY
M	me	M IY
N	knee	N IY
NG	ping	P IY NG
OW	oat	OW T
OY	toy	T OY
P	pee	P IY
R	read	R IY D
S	sea	S IY
SH	she	SH IY
T	tea	T IY
TH	theta	TH EY T AH
UH	hood	HH UH D
UW	two	T UW
V	vee	V IY
W	we	W IY
Y	yield	Y IY L D
Z	zee	Z IY
ZH	seizure	S IY ZH ER

	though	although
Natural and pure sciences	56.3	80.13
Applied science	37.36	68.31
World affairs	45.81	68.2
Social science	48.98	63.38
Commerce and finance	46.18	57.21
Arts	74.07	52.93
Leisure	45.85	49.46
Belief and thought	70.78	46.75
Imaginative prose	80.2	26.37

	BNC_Male_Speakers	BNC_Female_Speakers
new	149	91
good	408	310
free	173	75
fresh	84	118
delicious	12	34
full	210	107
sure	532	328
clean	197	223
wonderful	270	258
special	177	82
crisp	10	16
fine	347	215
big	470	415
great	203	96
real	163	80
easy	326	157
bright	113	110
extra	347	203
safe	182	92
rich	120	45
#--------
corpus_size	4949938	3290569

cgi - hellog～英語史ブログ

■ #1432. もう1つの類義語ネットワーク「instaGrok」と連想語列挙ツール [web_service][thesaurus][synonym][cgi]

■ #1425. 最新のアクセスランキング [notice][cgi]

■ #1323. Helsinki Corpus の COCOA 検索 [cgi][web_service][hc][corpus]

■ #1322. ANC Frequency Extractor [cgi][web_service][frequency][corpus][anc]

■ #1321. BNC Frequency Extractor [cgi][web_service][frequency][corpus][bnc]

■ #1210. 中英語のフランス借用語の一覧 [french][loan_word][lexicology][me][web_service][cgi]

■ #1191. Pronunciation Search [pronunciation][web_service][cgi][ame][dictionary]

■ #1178. MED Spelling Search [dictionary][cgi][web_service]

■ #1159. MRC Psycholinguistic Database Search [cgi][web_service][lexicology][frequency][statistics]

■ #1057. LAEME Index of Sources の検索ツール Ver. 2 [laeme][web_service][cgi][dialect]

■ #956. COCA N-Gram Search [cgi][web_service][coca][corpus][collocation][n-gram]

■ #952. Etymology Search [etymology][dictionary][cgi][web_service][metathesis][blend][dissimilation]

■ #942. LAEME Index of Sources の検索ツール [laeme][web_service][cgi]

■ #846. HelMapperUK --- hellog 仕様の英国地図作成 CGI [cgi][web_service][map][lalme][laeme][bre]

■ #749. hel typist --- hellog 仕様の文字列変換 CGI [cgi][web_service][ipa]

■ #711. Log-Likelihood Tester CGI, Ver. 2 [corpus][bnc][statistics][web_service][cgi][lltest]

■ #708. Frequency Sorter CGI [corpus][bnc][statistics][web_service][cgi][lexicology][plural]

■ #697. Log-Likelihood Tester CGI [corpus][bnc][statistics][web_service][cgi][lltest][sociolinguistics]

■ #618. OED の検索結果から語彙を初出世紀ごとに分類する CGI [lexicology][oed][cgi][web_service]

■ #361. 英語語源情報ぬきだしCGI（一括版） [etymology][dictionary][link][cgi][web_service]