hellog〜英語史ブログ

#4280. 19世紀イギリス文学のオンラインコーパス --- CLiC[corpus][lmode][literature]

2021-01-14

 先日,大学院生より教わった19世紀を中心とするイギリス文学のオンラインコーパス The CLiC web app を紹介.英文学史上,とりわけ英語小説史上とても重要な同世紀からの小説群が多く登録されている.主要な著者を挙げてみると,Anne Brontë, Anthony Trollope, Arthur Conan Doyle, Beatrix Potter, Benjamin Disraeli, Bram Stoker, Charles Dickens, Charlotte Brontë, Emily Brontë, George Eliot, Henry James, Jane Austen, John Ruskin, Joseph Conrad, Lewis Carroll, Mary Shelley, Oscar Wilde, Robert Louis Stevenson, Rudyard Kipling, Thomas Hardy, William Makepeace Thackeray と華々しい.
 文体論研究を念頭においたコーパスで,作品や著者ごとにサブコーパスを選択できる.まだ本格的に使っていないが,上記インターフェースや説明書きから推察するに,例えば次のようなこともできそう.

 ・ Texts タブにより,テキストそのものを表示できる
 ・ 引用符内外のテキスト(地の文と台詞)を区別して検索対象として指定できる
 ・ Keywords タブにより,参照コーパスを別途設定しつつ,ある作品(群)の keywords を収集・一覧できる
 ・ Clusters タブにより,n-gram による共起表現の検索や計算ができる

 本来は,研究テーマが先にあり,その研究に役立つコーパスが存在するか,あるいは入手可能か,という問いが生じ,その答えが Yes であれば,それをどのように使えるか具体的に考え,そして実際に使ってみるというのが基本的な手順となるだろう.一方,ある新しいコーパスを見つけたら,それはどんなコーパスで,何ができる(できない)のかを問うてみて,その上で○○な研究をする際には使えそうだな,と当たりを付けておく逆の手順も,エクササイズとして有効.

[ | 固定リンク | 印刷用ページ ]

Powered by WinChalow1.0rc4 based on chalow