「#3419. 英語ことわざのキーワード」 ([2018-09-06-1]) と「#3420. キーワードを含む英語ことわざ」 ([2018-09-07-1]) に引き続き,英語ことわざの話題.安藤邦男(著)『ことわざから探る 英米人の知恵と考え方』の紹介ページより取り出した866件の英語ことわざについて,その文体的・語彙的な特徴を数字で示してみたい.特徴を浮き彫りにするには,英語ことわざコーパスを,より大きな一般的なコーパスと比較する必要があるので,昨日と同様に100万語規模の British English 06 (BE06) を使用した.結果として,次のような基本的な統計値が得られた.  *  *
| Corpus | Proverbs | BE06 | 
|---|---|---|
| tokens (running words) in text | 6,276 | 1,011,020 | 
| types (distinct words) | 1,616 | 45,298 | 
| type/token ratio (TTR) | 25.75 | 4.48 | 
| standardised TTR | 45.25 | 43.90 | 
| STTR std.dev. | 46.42 | 54.62 | 
| STTR basis | 1,000 | 1,000 | 
| mean word length (in characters) | 4.09 | 4.69 | 
| word length std.dev. | 1.92 | 2.58 | 
| sentences | 869 | 53,466 | 
| mean (in words) | 7.22 | 18.91 | 
| std.dev. | 2.86 | 14.38 | 
| 1-letter words | 292 | 38,775 | 
| 2-letter words | 1,020 | 168,273 | 
| 3-letter words | 1,345 | 205,211 | 
| 4-letter words | 1,370 | 166,961 | 
| 5-letter words | 996 | 110,856 | 
| 6-letter words | 553 | 88,195 | 
| 7-letter words | 359 | 79,174 | 
| 8-letter words | 163 | 56,645 | 
| 9-letter words | 96 | 39,767 | 
| 10-letter words | 53 | 26,170 | 
| 11-letter words | 17 | 15,493 | 
| 12-letter words | 6 | 8,208 | 
| 13-letter words | 4 | 4,557 | 
| 14-letter words | 1 | 1,687 | 
| 15-letter words | 1 | 623 | 
Powered by WinChalow1.0rc4 based on chalow