International Corpus of English @ ICE-corpora.net からは,7種類の英語地域変種コーパスがダウンロードできる.ダウンロードした圧縮ファイルにパスワードがかかっており,別途パスワードを申請(郵送かFAXにより無料)しなければならない.
・ Canada (ICE-CAN): http://ice-corpora.net/ice/icecan.htm
・ East Africa (Kenya & Tanzania) (ICE-EA): http://ice-corpora.net/ice/iceea.htm
・ Hong Kong (ICE-HK): http://ice-corpora.net/ice/icehk.htm
・ India (ICE-IND): http://ice-corpora.net/ice/iceind.htm
・ Jamaica (ICE-JA): http://ice-corpora.net/ice/icejam.htm
・ Philippines (ICE-PHI): http://ice-corpora.net/ice/icephi.htm
・ Singapore (ICE-SIN): http://ice-corpora.net/ice/icesin.htm
ICEでは,他にも相互比較可能な地域変種コーパスが編纂されている最中であり,中にはすでに有料で手に入るものもある.いずれも1990年以降の書き言葉と話し言葉が納められた100万語規模のコーパスである.編纂方式や構成は[2010-06-29-1]の記事で紹介した The Brown family of corpora に準じており,500テキスト×2000語となっている.corpus design や annotation scheme の詳細については,ICEトップページの上部メニューから参照できる.いくつかの地域変種には話し言葉のサンプル音源もあり有用.
この手の英語地域変種コーパスでかつ相互比較可能なものは今のところ他に出ていないだろうから,その目的の研究には重宝するだろう.
ゼミ研究で地域変種を扱っている学生は特に見ておいてください.
Powered by WinChalow1.0rc4 based on chalow