bnc / hellog～英語史ブログ

最終更新時間: 2026-07-15 01:27

2025-01-18 Sat

■ #5745. アルファベットの文字頻度 [corpus][link][alphabet][frequency][statistics][letter_frequency][bnc][morse_code]

　AからZまでのアルファベット文字のなかで，最も頻度の高い文字，低い文字は何か．この文字頻度 (letter_frequency) の話題については，「#308. 現代英語の最頻英単語リスト」 ([2010-03-01-1]) の下部に Letter Frequencies (rankings for various languages) へのリンクを挙げたとおり，様々な言語やコーパスでの順位表が作り出されている．例えば，BNC に依拠すると "etaoinsrhldcumfpgwybvkxjqz" の順位表が得られる．
　Crystal (277) には，The Cambridge Encyclopedia (1st ed.) の全テキスト，150万語をコーパスとした文字頻度表が掲げられている．累積頻度順位 (Cumulative) のみならず，文学，宗教，政治，物理学，化学の各々のテーマごとの頻度や Morse code (morse_code) の頻度も合わせて示されている．以下のグラフは，X軸に沿って累積頻度順 (= "eatinorslhdcmufpgbywvkxjq") に文字を並べ，Y軸を各テーマ内での頻度割合（百分率）としたものである（頻度表はソース HTML を参照）．

　累積頻度順に照らしてテーマごとの特徴を見てみるとと，政治が最も標準的である．文学と政治がそれに続く．標準から遠ざかっていくのが，化学，物理学，そして Morse code となる．
　個々の文字をみると興味深い点が多々ある．相対的に宗教では <h> が多く (holy?) <l> が少ないこと，文学では <w> が多いことは何を意味するのだろうか？　物理学や化学はラテン・ギリシア語系の単語が多く含まれているために，その他一般とは若干異なる文字頻度を示しているのかもしれない．人工的な Morse code は，他のテーマとは目に見えて異なる線を描いていることがわかる．

　・ Crystal, D. The Cambridge Encyclopedia of the English Language. 3rd ed. CUP, 2018.

Referrer (Inside): [2026-01-01-1]

No.	Lexical items	No. of occurrences
1	long silence	145
2	stunned silence	53
3	complete silence	44
4	total silence	43
5	tense silence	37
6	awkward silence	31
7	brief silence	28
8	short silence	27
9	sudden silence	23
10	absolute silence	22
11	deafening silence	22
12	embarrassed silence	22
13	uncomfortable silence	22
14	shocked silence	16
15	stony silence	15
16	dead silence	14
17	deep silence	13
18	Eerie silence	13
19	heavy silence	13
20	small silence	12
21	thoughtful silence	12
22	uneasy silence	12
23	utter silence	12
24	ensuing silence	11
25	sullen silence	11
26	momentary silence	10
27	fraught silence	9
28	ominous silence	9
29	terrible silence	9
30	brooding silence	8
31	companionable silence	8
32	sponsored silence	8
33	virtual silence	8
34	dignified silence	7
35	horrified silence	7
36	Hushed Silence	7
37	lengthy silence	7
38	long silences	7
39	longer silence	7
40	strained silence	7
41	uncanny silence	7
42	awful silence	6
43	cold silence	6
44	comparative silence	6
45	continuing silence	6
46	embarrassing silence	6
47	gloomy silence	6
48	great silence	6
49	strange silence	6
50	angry silence	5

COCA による <color> と <colour> の頻度
語形	<or>	<our>	<or> 比率
COLOR	124,778	4,792	0.9630
COLORS	33,225	1,886	0.9463
COLORED	5,553	179	0.9688
COLORFUL	10,871	412	0.9635
COLORLESS	1,000	57	0.9461
DISCOLOR	110	0	1.0000

BNCweb による <color> と <colour> の頻度
語形	<or>	<our>	<our> 比率
COLOR	115	11,332	0.9900
COLORS	24	4,396	0.9946
COLORED	14	2,432	0.9943
COLORFUL	6	1,093	0.9945
COLORLESS	4	166	0.9765
DISCOLOR	1	19	0.9500

bnc - hellog～英語史ブログ

■ #5745. アルファベットの文字頻度 [corpus][link][alphabet][frequency][statistics][letter_frequency][bnc][morse_code]

■ #5046. silence と共起する形容詞 [adjective][collocation][bnc][corpus]

■ #5016. 中英語の動名詞構文 there was ---ing 「---が行なわれた」 [gerund][construction][be][syntax][existential_sentence][bnc]

■ #4496. two laps to go 「残り2週」の to go [sobokunagimon][infinitive][bnc]

■ #4409. 色白で美しく公正な白雪姫 --- fair の語感 [khelf_hel_intro_2021][adjective][synonym][semantics][semantic_change][lexical_stratification][bnc][collocation][etymology]

■ #4400. 「犬猫」と cats and dogs の順序問題 [sound_symbolism][phonaesthesia][onomatopoeia][idiom][binomial][prosody][alliteration][phonetics][vowel][khelf_hel_intro_2021][clmet][coca][coha][bnc][sobokunagimon]

■ #4268. -ly が2つ続く副詞 -lily は稀である [bnc][adverb][suffix][adjective][productivity][-ly][haplology]

■ #4252. COCA と BNCweb でみる color vs colour [coca][bnc][corpus][ame_bre][spelling]

■ #4238. oddly enough, interestingly enough などの表現における enough (1) [adverb][semantics][bnc][corpus][collocation][eurhythmy]

■ #4036. stay at home か stay home か --- コーパス調査 [sobokunagimon][phraseology][preposition][bnc][coca][coha][clmet][ame_bre]

■ #3726. Just The Word --- 英作文の強力なお供 [collocation][bnc][webservice]

■ #3725. 語彙力診断テストや語彙関連ツールなど [lexicology][bnc][coca][corpus][webservice][link]

■ #3562. may 祈願文の生産性 [optative][productivity][frequency][bnc][auxiliary_verb][may]

■ #3180. 徐々に高頻度語の仲間入りを果たしてきたフランス・ラテン借用語 [french][latin][loan_word][borrowing][frequency][statistics][lexicology][hc][bnc]

■ #2324. n-gram [corpus][information_theory][coca][bnc][google_books][statistics][n-gram][collocation][frequency][link]

■ #2216. 研究社Webマガジンの記事「コーパスで探る英語の英米差 ―― 実践編 ――」 [link][corpus][bnc][coca][ame_bre][sociolinguistics][language_change][gender_difference][link]

■ #2044. なぜ mayn't が使われないのか？ (1) [auxiliary_verb][negative][tag_question][bnc][corpus][sobokunagimon]

■ #1963. 構文文法 [bnc][construction_grammar][syntax][cognitive_linguistics][prototype][web_service][speech_act][generative_grammar]

■ #1321. BNC Frequency Extractor [cgi][web_service][frequency][corpus][bnc]

■ #1283. 共起性の計算法 [corpus][statistics][bnc][collocation][lltest]

■ #2216. 研究社Webマガジンの記事「コーパスで探る英語の英米差　――　実践編　――」 [link][corpus][bnc][coca][ame_bre][sociolinguistics][language_change][gender_difference][link]