The DICT Development Group による DICT.ORG は,ウェブ上の様々な語彙データベースや辞書を利用するための統一的な仕様を提供するサービスである.登録されている語彙データベースを利用するインターフェースはこちら.
辞書というよりは語彙データベースと呼ぶ方が適切なのは,ある語の定義や発音などを与えてくれるというよりは,ある条件(主として綴字上の条件)を満たす語の一覧を作成するのが得意だからだ.ある特定の目的で行なわれる語彙研究のために,単語リストを準備するのに役立つ.
DICT.ORG で利用できる辞書はオンライン上で公開されている無料のものが多いが,語彙データベースとしての使用を前提とすれば,機能的には十分である.条件指定の方法("strategy" と呼ばれる;以下参照)は,電子辞書などでお馴染みの,綴字の完全一致,前方一致,後方一致,部分一致のほか,正規表現も完全にサポートしており,近似した綴字の語を取り出す Levenshtein distance 検索や Soundex algorithm 検索も実装されている.
Strategy Description
--------- -----------
first : Match the first word within headwords
exact : Match headwords exactly
re : POSIX 1003.2 (modern) regular expressions
last : Match the last word within headwords
nprefix : Match prefixes (skip, count)
soundex : Match using SOUNDEX algorithm
lev : Match headwords within Levenshtein distance one
word : Match separate words within headwords
suffix : Match suffixes
regexp : Old (basic) regular expressions
substring : Match substring occurring anywhere in a headword
prefix : Match prefixes
Powered by WinChalow1.0rc4 based on chalow