自分で書いた文章をいろいろと分析することを自分マイニングというが,今回は僭越ながら拙著 The Development of the Nominal Plural Forms in Early Middle English の英文を材料にして,自分の英作文の傾向(と対策)を調べてみたい.今回使用したツールは,コーパス研究用に開発された WordSmith Version 3 である.
まず準備として,手元にある拙稿を収めた LaTeX ファイルから図表部や Bibliography 部などをそぎ落とし,おおかた本文だけが含まれるような平テキストを得る.それを WordSmith にかけて,文体に関わる統計値を出してみた.
Tokens | 58,535 |
Types | 4,805 |
Type/Token Ratio | 8.21 |
Standardised Type/Token | 37.81 |
Ave. Word Length | 4.88 |
Sentences | 1,745 |
Sent.length | 22.49 |
sd. Sent. Length | 12.36 |
Paragraphs | 865 |
Para. length | 67.67 |
sd. Para. length | 48.26 |
1-letter words | 3,239 |
2-letter words | 9,619 |
3-letter words | 10,771 |
4-letter words | 7,996 |
5-letter words | 5,657 |
6-letter words | 4,938 |
7-letter words | 5,220 |
8-letter words | 3,747 |
9-letter words | 2,594 |
10-letter words | 2,043 |
11-letter words | 1,224 |
12-letter words | 857 |
13-letter words | 304 |
14(+)-letter words | 203 |
the, of, in, to, and, a, is, plural, as, english, that, s, for, old, was, n, it, be, from, i, this, are, with, by, on, middle, language, but, or, nouns, not, early, dialect, norse, west, midland, were, forms, text, south, texts, more, have, we, system, than, which, an, may, v
大部分は機能語だが,内容語としては plural, english, middle, nouns, early, forms がちゃんと出てきてくれた.ちゃんとというのは,タイトルを構成する単語が上位に出てきてくれないとタイトルの付けかたが悪かったということになりかねないからだ.development は56位,nominal は189位だったが・・・.
Powered by WinChalow1.0rc4 based on chalow