2016-09-11 Sun

#2694. EDD Online (2)

 「#868. EDD Online」 ([2011-09-12-1]) で紹介したように,Joseph Wright による The English Dialect Dictionary の電子化プロジェクトが Innsbruck 大学で進められていたが,つい最近完成したとの知らせを受けた.これまでウェブ上のサービスではアカウント取得が必要だったが,これで直接自由にアクセスできるようになった.こちらの EDD Online からどうぞ.

 EDD Online Screenshot

 機能も充実しており,例えば上のスクリーンショットのように,検索語と関連して辞書内に言及されている方言地域を地図上で確認できる機能がある.ちょうど語源的綴字 (etymological_respelling) に関する調査の関係で,言及されている方言地域が地図上で確認できれば便利だろうと思っていた矢先だったので,嬉しい.
 また,紙媒体の元祖 The English Dialect Dictionary のページをイメージとして確認することもできる.検索については,dialect area, part of speech, phonetic, etymology, usage label, source, morphemic, time span など各種カテゴリーによるサーチが可能.

 ・ Wright, Joseph, ed. The English Dialect Dictionary. 6 vols. Henry Frowde, 1898--1905.

2015-06-16 Tue

#2241. Dictionary of Canadianisms on Historical Principles

 先日,カナダの University of British Columbia で開催された SHEL-9/DSNA-20 Conference (The 9th Studies in the History of the English Language Conference) に参加してきた.発表の1つに,DCHP-2 プロジェクトに関する中間報告があった.DCHP-2 とは,歴史的原則によって編まれたカナダ語法の辞書 Dictionary of Canadianisms on Historical Principles の第2版である.初版は1967年に出版されており,2013年には電子化されたものが DCHP-1 としてウェブ上で公開されている.DCHP-2 は UBC が主体となって編纂を進めており,完成に近づいているようなので,遠からず公開されることになるだろう.発表では,編纂に関わる UBC の学生が,部分的に DCHP-2 のデモを見せてくれたが,なかなか充実した内容のようだ.
 その発表では,ある語(句),意味,語法が Canadianism であるというとき,何をもって Canadianism とみなすのかという定義の問題について,基本方針が示されていた.大雑把にいえば,カナダで使用される英語だけでなく,アメリカ英語,イギリス英語,その他の英語変種のコーパスを比較対象として用い,カナダで用いられる英語に統計的に使用が偏っているものを Canadianism とみなすという方針が貫かれている.それぞれの数値はグラフで可視化され,複数コーパス利用の長所が最大限に活かされているようだ.このようなグラフが容易に得られるようになれば,英語変種間の多角的な比較も促進されるだろう.
 伝統的,逸話的に Canadianism とみなされてきた語句については,上記の方針の下でとりわけ批判的な検討が加えられ,場合によっては Canadianism とみなすことはできないという結論が下されることもあるという.一方,Canadianism として認定されたものについては,コーパスからの用例や出典の掲載はもちろん,歴史的背景についても詳しい記述が施される.
 DCHP-2 が完成すれば,カナダ英語研究に弾みがつくことは間違いない.カナダ英語に限らず,○○英語の辞書やコーパスの編纂がますます活気づいてくれば,変種間の比較もしやすくなり,新たな英語研究の道が開けるはずである.21世紀的な英語学の形の1つだろう.
 また,このプロジェクトは,変種とは何かという本質的な問題を再検討するす機会を提供してくれているようにも思われる.一体 Canadianism とは何か.言語学的に定義できるのか,あるいはひとえに社会的,イデオロギー的にしか定義できないものか.Lilles のようにカナダ英語を「神話」とみる者もいれば,実在すると主張する者もいる.これは,Canadianism に限らず,Americanism, Britishism など「○○語法」を指す -ism のすべてに関わる問題である.変種 (variety) を巡る論考については,「#415. All linguistic varieties are fictions」 ([2010-06-16-1]),「#1373. variety とは何か」 ([2013-01-29-1]),「#2116. 「英語」の虚構性と曖昧性」 ([2015-02-11-1]) などを参照されたい.
 加えて,カナダ英語の歴史と概要については,「#313. Canadian English の二峰性」 ([2010-03-06-1]),「#1733. Canada における英語の歴史」 ([2014-01-24-1]) も参照.

 ・ Lilles, Jaan. "The Myth of Canadian English." English Today 62 (April 2000): 3--9, 17.

2014-10-13 Mon

#1995. Mulcaster の語彙リスト "generall table" における語源的綴字

 昨日の記事「#1994. John Hart による語源的綴字への批判」 ([2014-10-12-1]) や「#1939. 16世紀の正書法をめぐる議論」 ([2014-08-18-1]),「#1940. 16世紀の綴字論者の系譜」 ([2014-08-19-1]),「#1943. Holofernes --- 語源的綴字の礼賛者」 ([2014-08-22-1]) で Richard Mulcaster の名前を挙げた.「#441. Richard Mulcaster」 ([2010-07-12-1]) ほか mulcaster の各記事でも話題にしてきたこの初期近代英語期の重要人物は,辞書編纂史の観点からも,特筆に値する.
 英語史上最初の英英辞書は,「#603. 最初の英英辞書 A Table Alphabeticall (1)」 ([2010-12-21-1]),「#604. 最初の英英辞書 A Table Alphabeticall (2)」 ([2010-12-22-1]),「#726. 現代でも使えるかもしれない教育的な Cawdrey の辞書」 ([2011-04-23-1]),「#1609. Cawdrey の辞書をデータベース化」 ([2013-09-22-1]) で取り上げたように,Robert Cawdrey (1537/38--1604) の A Table Alphabeticall (1604) と言われている.しかし,それに先だって Mulcaster が The First Part of the Elementarie (1582) において約8000語の語彙リスト "generall table" を掲げていたことは銘記しておく必要がある.Mulcaster は,教育的な見地から英語辞書の編纂の必要性を訴え,いわば試作としてとしてこの "generall table" を世に出した.Cawdrey は Mulcaster に刺激を受けたものと思われ,その多くの語彙を自らの辞書に採録している.Mulcaster の英英辞書の出版を希求する切実な思いは,次の一節に示されている.

It were a thing verie praiseworthie in my opinion, and no lesse profitable then praise worthie, if som one well learned and as laborious a man, wold gather all the words which we vse in our English tung, whether naturall or incorporate, out of all professions, as well learned as not, into one dictionarie, and besides the right writing, which is incident to the Alphabete, wold open vnto vs therein, both their naturall force, and their proper vse . . . .

 上の引用の最後の方にあるように,辞書編纂史上重要なこの "generall table" は,語彙リストである以上に,「正しい」綴字の指南書となることも目指していた.当時の綴字改革ブームのなかにあって Mulcaster は伝統主義の穏健派を代表していたが,穏健派ながらも final e 等のいくつかの規則は提示しており,その効果を具体的な単語の綴字の列挙によって示そうとしたのである.

For the words, which concern the substance thereof: I haue gathered togither so manie of them both enfranchised and naturall, as maie easilie direct our generall writing, either bycause theie be the verie most of those words which we commonlie vse, or bycause all other, whether not here expressed or not yet inuented, will conform themselues, to the presidencie of these.

 「#1387. 語源的綴字の採用は17世紀」 ([2013-02-12-1]) で,Mulcaster は <doubt> のような語源的綴字には否定的だったと述べたが,それを "generall table" を参照して確認してみよう.EEBO (Early English Books Online) のデジタル版 The first part of the elementarie により,いくつかの典型的な語源的綴字を表わす語を参照したところ,auance., auantage., auentur., autentik., autor., autoritie., colerak., delite, det, dout, imprenable, indite, perfit, receit, rime, soueranitie, verdit, vitail など多数の語において,「余分な」文字は挿入されていない.確かに Mulcaster は語源的綴字を受け入れていないように見える.しかし,他の語例を参照すると,「余分な」文字の挿入されている aduise., language, psalm, realm, salmon, saluation, scholer, school, soldyer, throne なども確認される.
 語によって扱いが異なるというのはある意味で折衷派の Mulcaster らしい振る舞いともいえるが,Mulcaster の扱い方の問題というよりも,当時の各語各綴字の定着度に依存する問題である可能性がある.つまり,すでに語源的綴字がある程度定着していればそれがそのまま採用となったということかもしれないし,まだ定着していなければ採用されなかったということかもしれない.Mulcaster の選択を正確に評価するためには,各語における語源的綴字の挿入の時期や,その拡散と定着の時期を調査する必要があるだろう.
 "generall table" のサンプル画像が British Library の Mulcaster's Elementarie より閲覧できるので,要参照.  *

2014-04-20 Sun

#1819. AHD Word History Note Search

 「#1809. American Heritage Dictionary の Notes」 ([2014-04-10-1]) で,The Free Dictionary 上でアクセスできる Notes へのリンク集を作った(Notes 集そのものは,1.6MBあるこちらのページへ).今回は,そのなかから Word Histories に関する Notes を集めたものをデータベース化し,「#952. Etymology Search」 ([2011-12-05-1]) の要領で,検索ツール "AHD Word History Note Search" を作ってみた.
 語源記事が登録されている見出し語を検索するだけであれば,上のリンク集で単語を検索すればよく,このツールの有用性はあまりない.このツールの特徴は,Notes の中身を正規表現で検索できる仕様(デフォルト)にある.例えば,日本に何らかの言及のある英単語の語源コラムを得たいのであれば,下の検索ボックスに Japan と入れればよいし,アイルランド関係であれば (Irish|Ireland) などだ.ほかには,search range を "Search for entry words" に入れ替えて,^[A-Z] と検索ボックスに入れると,固有名詞の語源コラムを集められる,等々.

search mode: non-regex regex
search range: Search for entry words Search notes (in one-line regex only)

2014-04-10 Thu

#1809. American Heritage Dictionary の Notes

 「#485. 語源を知るためのオンライン辞書」 ([2010-08-25-1]) で触れたが,American Heritage Dictionary of the English Language, 4th ed. (AHD) とその他の辞書に基づいた The Free Dictionary というオンライン辞書がある.AHD は,アメリカの辞書らしく百科事典的な情報や視覚資料が豊富で,私もよく使うお気に入りの辞書だ.紙版は大型だが,読む辞書としてお薦めである.(なお,The Free Dictionary EncyclopediaArticle of the Day というフィードもお気に入り.)
 特に注目したいのが,Notes と呼ばれるコラム的な記事が充実していることだ.Usage Notes, Synonym Notes, Word Histories, Our Living Language, Regional Notes といった5種類の Notes が,延べ1,700以上,辞書中にちりばめられている.以下では,取りこぼれもあるとは思われるが,その大多数へのリンクを拾い出した.長いリストなので,ジャンプのための目次を挙げておく.

 ・ Usage Notes 一覧
 ・ Synonym Notes 一覧
 ・ Word Histories 一覧
 ・ Our Living Language 一覧
 ・ Regional Notes 一覧

 ほかにも,リンク先の Notes 部分のみを抜き出した Notes 集そのものもブラウザ上で閲覧できるように作ってみたが,1.6MBと重めなので,必要に応じてどうぞ.

[ Usage Notes ]

!Kung, -ee, -ess, -wise, .gov, a, A.M., aberrant, able, about, absolute, absolutely, accessory, acquiesce, act, acumen, ad hominem, admission, adopt, advance, advise, affect, affinity, agenda, aggravate, ain't, alibi, all, all right, alleged, allude, alongside, also, alternative, although, altogether, alumnus, Amerasian, Amerindian, and, and/or, Anglo, anticipate, antidote, anxious, any, anyone, apparent, archetype, as, as far as, Asian, Asiatic, assure, author, awhile, backward, bad, bait, baleful, banal, barbarism, barbiturate, be, bear, because, behalf, berdache, besides, best, between, bi-, black, Black English, blatant, boast, both, bring, but, callous, can, cannot, capital, careen, celebrant, celibate, center, certain, challenged, Chicano, child-directed speech, claustrophobic, cohort, collective noun, color, colored, compact disk, compare, complected, complement, complete, comprise, conflicted, contact, contemporary, continuance, contrast, controller, convince, council, couple, craft, credential, credible, crescendo, criterion, critique, culture, czar, dare, data, deaf, debut, deceptively, decimate, definite, demagogue, denote, depend, deprecate, dialogue, different, dilemma, disabled, discomfit, disingenuous, disinterested, disinvent, distinct, dive, domestic partner, double negative, doubt, dour, drunk, due to, each, each other, either, elder, else, empower, enervate, enormity, enthuse, envelope, epicenter, epithet, equal, err, escape, Eskimo, Eurasian, every, everyplace, except, exceptionable, fact, factoid, farther, February, few, finalize, First Nation, firstly, flammable, flaunt, flotsam, follow, foot, foregone, former, formidable, forte, fortuitous, founder, fulsome, fun, gambit, gay, gender, General American, get, glamour, good, gourmet, government, graduate, graffito, grieve, group, grow, handicapped, hang, harass, hardly, harebrained, have, he, headquarter, headquarters, healthy, hegemony, height, help, herb, hero, Hispanic, historic, hoi polloi, holocaust, homosexual, hopefully, host, however, hyphenated, I, identical, identify, if, impact, impeach, important, impracticable, include, Indian, individual, infer, infinite, infrastructure, input, insignia, intense, interface, intrigue, intuit, Inuit, ironic, irregardless, its, Jew, Jewess, kabbalah, Kanaka, kilometer, knot, kudos, lack, lady, late, Latina, lay, leave, legend, liable, lifestyle, light, like, likely, literally, literate, loan, look, majority, man, master, masterful, materialize, mean, medium, men, methodology, mid-, migrate, minimal, mistress, momentarily, month, moot, Ms., mute, mutual, myriad, myself, native, Native American, nauseous, need, neither, Net, none, nonstandard, nonwhite, nor, not, nothing, nuclear, number, oblivious, octoroon, of, off, officiate, often, old, on, one, only, or, oriental, ought, over-, pair, paradigm, parameter, participle, party, pass, people, percent, percentage, perfect, periodic, permit, person, peruse, phenomenon, pill bug, plead, plus, politics, poor, possessed, practicable, practically, precipitate, premiere, preposition, presently, principal, prioritize, process, protagonist, prove, quarter, queer, quick, quote, race, rarely, rather, redundancy, regard, replete, repulse, responsible, restive, sacrilegious, safe sex, said, salutation, same, saving, scarcely, schism, Scottish, seasonal, series, service, set, shall, she, short-lived, should, slow, sneak, so, so-called, someday, sometime, sonorous, soon, split infinitive, Standard English, status, staunch, stomp, stratum, strength, such, suffer, than, that, themed, there, they, this, Three Age system, thusly, tight, till, together, too, tortuous, toward, transpire, try, un-, unaware, unexceptionable, unique, utilize, various, verbal, very, victual, virtual, wake, want, way, we, wean, web, website, well, what, whatever, when, whence, where, which, who, whose, why, wish, with, wreak, Xmas, ye, yet, zoology

[ Synonym Notes ]

ability, abolish, abstinence, abuse, accidental, accompany, acknowledge, active, adapt, admonish, adulterate, advance, adventurous, advice, advise, affair, affect, affectation, afflict, afraid, ageless, agitate, agree, aim, airy, allocate, alone, amateur, ambiguous, ambush, amenity, amiss, amuse, analyze, ancestor, anger, angry, announce, annoy, answer, anxiety, apology, apparent, appear, appendage, applaud, appoint, appreciate, apprehend, appropriate, approve, arbitrary, argue, argument, argumentative, arrange, art, artificial, ask, assent, assistant, attack, attribute, authentic, authorize, average, aware, band, banish, banter, bargain, barrage, base, baseless, batter, bear, beat, beautiful, beg, begin, beginning, behavior, belief, belligerent, bend, beneficial, benefit, benevolent, besiege, bet, bias, binge, bite, bitter, blackball, blackout, blame, blameworthy, blast, blemish, blink, block, bloom, blunder, boast, bodily, boil, book, boor, border, boring, botch, branch, brave, brawl, breach, break, breeze, bright, broach, broad-minded, brood, brush, bulge, bulwark, burden, burdensome, burn, business, busy, cadge, calculate, call, calm, campaign, care, careful, careless, caress, caricature, catch, cause, celebrity, center, certain, certainty, chafe, chance, charge, charm, chief, choice, chronic, circumference, citizen, claim, clean, clear, clever, cliché, clothe, coagulate, cold, collision, comfort, comfortable, comment, commit, common, complete, complex, conceit, condemn, conduct, confidence, confirm, conflict, confuse, consider, contain, contaminate, contemporary, continual, convert, convey, cool, correct, corrupt, count, crisis, criticize, crowd, crude, cruel, crush, cry, cure, curious, dark, daze, dead, decay, deceive, decide, decision, decisive, decrease, decry, defeat, defend, defer, defy, degrade, delicate, delicious, demand, demote, deny, dependent, deplete, depressed, describe, desire, despise, despondent, development, deviation, devote, dexterous, dialect, dictate, dictatorial, differ, difference, difficulty, dip, dirty, disadvantage, disappear, discord, discourage, discover, discuss, disguise, disgust, dishonest, dismay, dismiss, display, disposition, dissuade, distinct, distort, distribute, doctrine, dominant, dry, dull, earn, easy, eat, echo, effect, effective, eject, elaborate, element, elevation, eliminate, embarrass, emphasis, empty, enclose, encourage, endanger, enemy, engagement, enmity, enormous, enrapture, envy, equipment, erase, escape, estimate, estrange, evoke, exaggerate, example, excel, excessive, existence, expect, explain, explicit, expressive, extemporaneous, extricate, fair, faithful, faithless, fantastic, fashion, fashionable, fast, fasten, fat, fatal, favorable, fawn, fear, feat, feeling, female, fertile, fidelity, field, figure, flagrant, flash, flexible, flirt, flock, flourish, flow, follow, foolish, forbid, force, foreign, foretell, forgive, form, forte, found, fragile, fragrance, frank, freedom, frighten, frown, function, furnish, futile, gather, gaudy, gaze, general, gesture, ghastly, giddy, glad, glib, gossip, gracious, grand, graphic, grieve, gruff, guide, habit, hamper, handle, happen, happy, harass, hard, harden, haste, hateful, healthy, heap, heavy, help, heritage, hesitate, hide, hinder, honor, humane, idea, ideal, imagination, imitate, immaterial, impetuous, importance, impression, improper, improve, inactive, incalculable, incisive, incline, include, increase, indicate, indispensable, infinite, inflexible, injustice, innate, inquiry, insanity, instinctive, insubordinate, intelligent, intense, intention, interfere, intimidate, introduce, irrelevant, isolate, item, jealous, jerk, join, joke, judge, justify, keep, kind, knowledge, lack, large, last, latent, lazy, lean, learned, lethargy, letter, level, liberal, lie, lift, likeness, limit, limp, living, logical, loose, loud, love, lure, luxury, makeshift, male, malign, malleable, manipulate, mark, mature, living, logical, mercy, method, meticulous, mind, miscellaneous, mix, mixture, moderate, moment, monopolize, mood, moral, morale, moving, multitude, muscular, mysterious, naive, native, nautical, neat, negligent, new, news, noise, noted, noticeable, nuance, nurture, object, oblige, observe, obstacle, obstinate, occurrence, offend, offensive, offer, old, opinion, opportunity, oppose, opposite, orderly, origin, outline, overthrow, pacify, pain, palliate, pamper, partner, passion, pathetic, patience, pause, pedantic, penitence, pensive, perceptible, perfect, perform, period, periodic, permission, persuade, phase, pity, plain, plan, plausible, please, plentiful, poisonous, polite, poor, possible, posture, practice, praise, predicament, predict, predilection, preliminary, presume, prevailing, prevent, produce, proficient, profuse, promise, proportion, propose, proud, provoke, prudence, pull, punish, pure, push, puzzle, quality, qualm, quibble, range, reach, real, reap, reason, recede, reciprocate, reckless, recover, refer, refrain, refuse, regard, regret, relevant, reliable, relieve, religious, relinquish, rely, remember, reparation, repeat, replace, represent, resort, responsible, restrain, revere, reverse, revive, rich, ridicule, right, rise, rival, room, rough, rude, ruin, rural, sad, sarcastic, satisfy, save, saying, scatter, scold, secret, see, seem, send, sensuous, sentimental, separate, series, serious, severe, shade, shake, shameless, shapeless, sharp, shelter, shorten, shout, show, showy, shrewd, shy, sign, silent, sinister, slant, sleek, slide, sloppy, slow, small, smell, social, solitude, solve, sour, spacious, sparing, speak, speed, spend, spontaneous, stain, standard, state, stay, steal, steep, stem, stench, stiff, still, stoop, stop, strange, streak, strength, subject, substance, sufficient, suggest, summit, superfluous, supervise, support, supposed, sure, surprise, surrender, surround, swerve, swing, tact, tardy, task, taste, teach, tear, teem, temporary, tend, tendency, theoretical, think, think, tight, tire, tireless, tool, touch, treat, trial, trivial, trouble, trust, truth, turn, ugly, uncertainty, unctuous, unfortunate, unruly, unspeakable, urgent, use, usual, vain, valid, vent, versatile, vertical, victory, vigor, vociferous, voluntary, voracious, wander, waste, way, weak, weird, wet, whole, wile, wit, wonder, wordy, work, yield, young, zest

[ Word Histories ]

abacus, abracadabra, accolade, acorn, adder, adolescent, agnostic, alcohol, Allegheny River, alligator, amateur, Amazon, an, anesthesia, appendicitis, arena, arrowroot, artery, artichoke, Aryan, asparagus, assassin, automatic, avocado, baby-sit, badger, ballyhoo, banquet, barnacle, bayonet, beef, belfry, berserk, Betelgeuse, bigot, bless, Bolshevik, book, boomerang, boycott, Brazil, brickbat, broker, buccaneer, buffalo, bumpkin, bury, butterfly, bylaw, Canada, canter, cappuccino, caricature, carouse, casino, caterpillar, caviar, chagrin, chameleon, chaperon, check, Chicago, china, chivalry, chortle, churl, ciao, circus, cleric, cockroach, codex, cologne, comet, comrade, coroner, cot, coupon, coward, crayfish, croissant, crucial, cuckold, cushy, cute, cynic, dandelion, debunk, deer, delta, dervish, desert, diabetes, diatribe, digitalis, dinner, dirge, ditto, do-gooding, Don River, drench, dress, dungeon, dynamite, easel, economy, edit, eleven, empty, encyclopedia, English, ennui, enthusiasm, erudite, ethnic, eunuch, exorcise, fascism, fear, fee, fellow, fey, fiction, film, fire, fizzle, flunky, fool, fornication, fraction, freeze, friend, fuck, funky, garage, gauntlet, geezer, gerrymander, giddy, glitch, goatee, goodbye, gorilla, Gothic, grass widow, Greenland, gremlin, gringo, guillotine, hall, hamburger, harlot, hassle, haywire, hectic, helicopter, hell, helpmate, hex, high muckamuck, hobnob, holocaust, hooker, Hoosier, hubbub, husband, iconoclast, ilk, impeach, industry, inkling, interloper, internecine, island, item, janitor, Japan, jaunty, junk, kangaroo, ketchup, kidnap, kiosk, kith and kin, laconic, landscape, larva, lava, lemon, leprechaun, lieutenant, limbo, lingo, lion, loaf, lobster, long-lived, lucre, macabre, maharajah, malaprop, mannequin, mantis, marshal, mascot, mattress, mealy-mouthed, Melba toast, menu, mesmerism, metal, midwife, milquetoast, Minnesota, misericord, Mississippi, modern, mortgage, mosquito, Muse, mutt, namby-pamby, nap, naughty, neighbor, nerd, nest, New Jersey, noise, nonchalant, numb, OK, ombudsman, one, opossum, orange, orgy, oscillate, otorhinolaryngology, Ouse River, outlaw, oyez, Pakistan, pal, pant, paradise, pariah, pay, peeping Tom, penthouse, period, petard, Philistine, pickle, pilot, plane, Platonic, plumber, Plymouth, poison, pollster, Pomerania, posh, posthumous, powwow, premise, pretzel, prison, prude, Pueblo, Punjab, Quaalude, quark, queen, queue, quiz, raid, rajah, rankle, rapt, read, reindeer, resent, rhinestone, Riot Act, robot, role, rose, roster, rune, sack, salad, sanction, sanguine, Sanskrit, sarcophagus, scan, scarce, scold, scuba, séance, seersucker, senile, serendipity, shadow, shambles, sherbet, short shrift, shyster, Singapore, slave, sleuth, slivovitz, soldier, soothsayer, Sophocles, south, speak, speed, spill, spoof, spree, stampede, stove, sunbeam, superman, surly, syphilis, taboo, tangerine, tattoo, tea, telephone, temple, testis, testy, Thames, theater, they, third, ticket, tin, tithe, toady, Tokyo, tomato, tooth, trek, trivial, true, tulip, tweed, tycoon, typhoon, umpire, underling, uranium, valentine, vegetable, vixen, vogue, vulgar, Wales, wallflower, war, water, Wednesday, went, werewolf, whiskey, whore, wigwam, window, winsome, worry, write, xylophone, Yankee, Zeus, zipper, zloty

[ Our Living Language ]

a-, agreement, all, as far as, ax, bad, basket case, be, breathe, call, cent, chill, comparative, cool, dig, downsize, dude, dumb, foot, geek, go, gung ho, hisself, historical present, hornswoggle, I'm, igg, it, izzard, knockout, like, me, might, mine, Ocracoke Island, of, plural, rap, redundancy, rent, right, schlock, sleigh, Smith Island, strike, trashed, were, za, zero copula

[ Regional Notes ]

absquatulate, agin, andiron, anymore, as, bare-naked, beignet, birth, bodacious, boughten, cayuse, chaw, chesterfield, chirren, clever, critter, damned, dogie, dope, dornick, dragonfly, drudge, everwhere, fair, faubourg, favor, feist, ferninst, fix, frosting, frying pan, gallery, goober, greasy, gum band, gunnysack, gutter, hey, highfalutin, holler, hosey, intervale, johnnycake, juke, kindling, krewe, krumkake, lagniappe, light bread, lightning bug, loblolly, luminaria, milk shake, mill, mozo, mud dauber, muffuletta, need, neutral ground, Old Scratch, old-field colt, olla, parking, pocosin, poke, pone, possum, powerful, preacher, purty, quoit, ramada, redd, reeling, run, scoot, shivaree, slatch, smart, so, spa, stateside, stob, stoop, submarine, summercater, tarnation, ted, teeter-totter, thataway, tit, tonic, tule, tumbleset, ugly, ukulele, vaquero, vum, wake, wanigan, whiffletree, woodchuck, yonder, you-all, you-uns

2014-02-25 Tue

#1765. 日本で充実している英語語源学と Klein の英語語源辞典

 日本にもたびたび訪れている英語史界の重鎮,ポーランドの Fisiak (8) に,日本の英語語源学が充実している旨,言及がある.

One important area of research in Japan is English etymology. At least two important recent dictionaries should be mentioned: Osamu Fukushima An etymological dictionary of English derivatives, 1992 (in English), and Yoshio Terasawa.(sic) The Kenkyusha dictionary of English etymology, 1997 (in Japanese), I received both of them in 1997. Fushima's (sic) dictionary is unique in its handling solely derivatives. Terasawa's opus magnum is in Japanese but with some explanations it can be used by people who do not read Japanese. . . . The dictionary is a magnificent piece of work. It is the largest etymological dictionary of English. Its scope is unusually wide. In the notes sent to me Professor Terasawa wrote that the dictionary "includes approximately 50.000 words, the majority of which are common words found in general use, new coinages, slang, and such technical terms as seen in science and technology, such components of a word as prefixes, suffixes, linking forms, as well as major place names and common personal names" (private correspondence). It is comprehensive and up-to-date, well-researched and contains a fairly large number of entries thoroughly revised in comparison with earlier etymological dictionaries. Onions' Oxford dictionary of English etymology, 1966 contains 38.000 words with the derivatives and as could be expected many of the etymologies require revisions. From a linguistic point of view Terasawa's dictionary compares favorably with Klein's comprehensive etymological dictionary of the English language, 1966--67.

 寺澤,福島による語源辞典を愛用する者として,おおいに歓迎すべき評である.Fisiak は,『英語語源辞典』を Klein の辞典に比較すべき労作であるとしているが,ここで引き合いに出されている Klein の英語語源辞典とはどのようなものか,確認しておこう.Klein については,寺澤自身が『辞書・世界英語・方言』 (80) で次のように評している.

本辞典は,'history of words' と同時に 'history in words' を明らかにすることを目標としている.その副題も "Dealing with the origin of words and their sense development thus illustrating the history of civilization and culture" とあり,巻頭のモットーにも "To know the origin of words is to know the cultural history of mankind" と揚言されている.言い換えれば,単語を,言語の一要素であると同時にそれを用いる人間の一要素,自然・人文・科学の諸分野の発達を写し出す鏡の役目をもつものと捉える.これが本辞書の第一の特色である.第二は,印欧語根に遡る場合,従来の英語辞典であまり取り上げられなかったトカラ語 (Tocharian) の同族語を記載する,第三は750に及ぶセム語 (Semitic) 起源の語について,印欧語に準ずる記述を行なう.第四は人名のほか,神話・伝説上の固有名詞(例:Danaüs.ただし,その語源解には問題あり)を豊富に採録.第五は科学・技術の専門語を重視する,などである

 Klein は1日11時間,18年の年月をかけてこの辞典を編んだというから,まさに労作中の労作である.Klein については,荒 (100) も次のように評している.「E. クラインは,初めチェッコスロヴァキアでラビ(ユダヤ教の教師)をしていたが,ナチの強制収容所に捕えられ,その間,父,妻,一人息子,三人姉妹の二人を失った.戦後,カナダに移り,イギリス語の語原辞典の編集を思い立ち,文明と文化に重点をおき,これまで無視されていたセミティック系の諸言語との関係を究明した点では,画期的なもの」である.

 この労作と比肩するものとして日本の英語語源辞典が紹介されているということは,素直に賞賛と受け取ってよいだろう.ただし,Klein の辞典の利用には注意が必要である.英語史内での語史記述が不十分であること,編者の経歴からセム語(特にヘブライ語)の記述は期待されそうだが必ずしも正確ではないことなどは,気にとめておく必要がある.
 関連して,「#600. 英語語源辞書の書誌」 ([2010-12-18-1]) も参照.

 ・ Fisiak, Jacek. "Discovering English Historical Linguistics in Japan." Phrases of the History of English: Selection Papers Read at SHELL 2012. Ed. Michio Hosaka, Michiko Ogura, Hironori Suzuki, and Akinobu Tani. Frankfurt am Main: Peter Lang, 2013.
 ・ 寺澤 芳雄 (編集主幹) 『英語語源辞典』 研究社,1997年.
 ・ 福島 治 編 『英語派生語語源辞典』 日本図書ライブ,1992年.
 ・ Klein, Ernest. A Comprehensive Etymological Dictionary of the English Language, Dealing with the Origin of Words and Their Sense Development, Thus Illustrating the History of Civilization and Culture. 2 vols. Amsterdam/London/New York: Elsevier, 1966--67. Unabridged, one-volume ed. 1971.
 ・ 寺澤 芳雄(編) 『辞書・世界英語・方言』 研究社英語学文献解題 第8巻.研究社.2006年.
 ・ 荒 正人 『ヴァイキング 世界史を変えた海の戦士』 中央公論新社〈中公新書〉,1968年.

2013-09-22 Sun

#1609. Cawdrey の辞書をデータベース化

 英語史上初の英英辞書 Robert Cawdrey の A Table Alphabeticall (1604) について,cawdrey の各記事で話題にしてきた.オンライン版をもとに,語彙項目記述を検索可能とするために,簡易データベースをこしらえた.半ば自動でテキストを拾ってきたものなので細部にエラーがあるかもしれないが,とりあえず使えるようにした.


 以下,使用法の説明.SQL対応で,テーブル名は "cawdrey" として固定.select 文のみ有効.フィールドは7項目で,ID (整理番号),LEMMA (登録語),INITIAL (登録後の頭文字1文字),LENGTH (登録後の文字数),LANGUAGE (借用元言語),DEFINITION (定義語句),DEF_WC (定義語句の語数).典型的な検索式を例として挙げておこう.

# データベース全体を表示
select * from cawdrey

# 登録語をイニシャルにしたがってカウント
select INITIAL, count(*) from cawdrey group by INITIAL

# 登録語を文字数にしたがってカウント
select LENGTH, count(*) from cawdrey group by LENGTH

# 登録語を語源にしたがってカウント
select LANGUAGE, count(*) from cawdrey group by LANGUAGE

# 語源と語の長さの関係
select LANGUAGE, avg(LENGTH) from cawdrey group by LANGUAGE

# 登録語を定義語数にしたがってカウント
select DEF_WC, count(*) from cawdrey group by DEF_WC

# 語源と定義語数の関係
select LANGUAGE, avg(DEF_WC) from cawdrey group by LANGUAGE

# 定義に "(k)" (kind of) を含むもの
select LEMMA, DEFINITION from cawdrey where DEFINITION like '%(k)%'

# 定義に " or " を含むもの
select LEMMA, DEFINITION from cawdrey where DEFINITION like '% or %'

# 定義に " and " を含むもの
select LEMMA, DEFINITION from cawdrey where DEFINITION like '% and %'

# 定義がどんな句読点で終わっているか集計
select substr(DEFINITION, -1, 1), count(*) from cawdrey group by substr(DEFINITION, -1, 1)

 ・ ポール・バケ 著,森本 英夫・大泉 昭夫 訳 『英語の語彙』 白水社〈文庫クセジュ〉,1976年.

2013-04-22 Mon

#1456. John Walker の A Critical Pronouncing Dictionary (1791)

 後期近代英語期,主として18世紀に英語の規範を作った個人名を挙げよと言われたら,辞書(綴字)は Samuel Johnson (1709--84),文法は Robert Lowth (1710-87),では発音は誰か.
 答えは,John Walker (1732--1807) である.彼の著わした A Critical Pronouncing Dictionary (1791) は,正しい権威ある発音を求めた18世紀のイギリス庶民たちに確かな道しるべを与えた.初版以降,100版以上を重ねて人気を博し,英米では "Elocution Walker" と呼ばれるまでに至った.18世紀末に Walker が定着させ方向づけた正音主義路線は,19世紀末から20世紀にかけて容認発音 (RP = Received Pronunciation) が生み出される基盤を提供し,現代標準英語にまで大きな影響を及ぼしている.
 辞書の表題は例によって長い."A Critical Pronouncing Dictionary and Expositor of the English Language: to which are prefixed Principles of English Pronunciation: Rules to be Observed by the Natives of Scotland, Ireland, and London, for Avoiding their Respective Peculiarities; and Directions to Foreigners for Acquiring a Knowledge of the Use of this Dictionary." 表題の表現が示すとおり,ロンドン中心の相当に凝り固まった規範主義である.序文でもロンドン発音こそが "undoubtedly the best" と断言しているが,ロンドンとはいっても Cockney 発音は例外であり,スコットランドやアイルランドの発音を引き合いに出しながら Cockney を "a thousand times more offensive and disgusting" と糾弾している.
 Walker の辞書の発音解説は実に詳細で,例えば drama の語義説明は22語ほどで終わっているが,発音説明は770語に及ぶ詳しさだ.収録語数36,600語は,ライバル辞書ともいえる Thomas Sheridan の A General Dictionary of the English Language (1780) の約38,000語には少々及ばないが,発音説明の詳細さは比較にならない.
 British Library の English Timeline にある Walker's correct pronunciation より,見出し語 "BACK" で始まる辞書のページ画像を閲覧できる.以上,Crystal (52) および寺澤 (19--20) を参照して執筆した.
 正音主義の伝統については,「#571. orthoepy」 ([2010-11-19-1]) を参照.

 ・ Crystal, David. Evolving English: One Language, Many Voices. London: The British Library, 2010.
 ・ 寺澤 芳雄(編) 『辞書・世界英語・方言』 研究社英語学文献解題 第8巻.研究社.2006年.

[ 固定リンク | 印刷用ページ ]

2013-03-21 Thu

#1424. CELEX2

 英単語の頻度に関連する諸研究(Betty Phillips など)で,CELEX という語彙データベースが使用されているのを見かけることがある.現在取りかかっている研究で,巨大コーパスに基づいた信頼できる語彙頻度統計が必要になったので,郵送料込みで350ドルするこの高価なデータベースを入手してみた.現行版は第2版であり,CELEX2 として購入できる.(なお,予想していなかったが,入手した CD-ROM には,LDC99T42 というデータベースも含まれていた.ここには tagged Brown Corpus, Wall Street Journal, Switchboard tagged など Treebank 系のコーパスが入っている.)
 さて,CELEX2 には,英語語彙に関する複数のデータベースが納められている.それぞれのデータベースには,正書法,音韻,音節,形態,統語の各観点から,見出し語 (lemma) あるいは語形 (wordform) ごとに,ソース・コーパス内での頻度等の情報が格納されている.具体的には,次の11のデータベースが利用可能である.

 ect (English Corpus Types)
 efl (English Frequency, Lemmas)
 efs (English Frequency, Syllables)
 efw (English Frequency, Wordforms)
 eml (English Morphology, Lemmas)
 emw (English Morphology, Wordforms)
 eol (English Orthography, Lemmas)
 eow (English Orthography, Wordforms)
 epl (English Phonology, Lemmas)
 epw (English Phonology, Wordforms)
 esl (English Syntax, Lemmas)

 見出し語あるいは語形ごとの token 頻度の取り出しに強いデータベースという認識で購入したが,実際には,含まれている情報の種類は驚くほど豊富で,11のデータベースすべてを合わせたフィールド数はのべ250以上に及ぶ.行数は efl で52,447行,efw で160,595行という巨大さだ.検索用の SQLite DB をこしらえたら,容量にして90MBを超えてしまった.
 CELEX2 のソースは,辞書情報については Oxford Advanced Learner's Dictionary (1974) 及び Longman Dictionary of Contemporary English (1978) であり,頻度情報については 1790万語からなる COBUILD/Birmingham corpus である.このコーパスの構成は,1660万語 (92.74%) が書き言葉コーパス,130万語 (7.26%) が話し言葉コーパスで,前者を構成する284テキストのうち44テキスト (15.49%) がアメリカ英語である.しかし,これらのアメリカ英語はほとんどがイギリス英語の綴字に直されていることに注意したい.
 CELEX2 における "lemma" の定義は,以下の5点に依存する.

 (1) orthography of the wordforms: peek vs peak
 (2) syntactic class: meet (adj.) vs meet (adv.)
 (3) inflectional paradigm: water (v.) vs water (n.)
 (4) morphological structure: rubber (someone or something that rubs) vs rubber (the elastic substance)
 (5) pronunciation of the wordforms: recount [ˈriː-kaʊnt] vs recount [rɪ-ˈkaʊnt]

 したがって,通常異なる lexeme として扱われる bank (土手)と bank (銀行)などは,CELEX2 では同一の lemma として扱われているので注意が必要である.
 このように CELEX2 は非常に強力な語彙頻度データベースだが,その他にも語彙頻度研究に資するデータベースやツールは存在する.本ブログで触れたものとしては,frequency statistics lexicology の各記事や,特に以下の記事が参考になるだろう.

 ・ 「#308. 現代英語の最頻英単語リスト」 ([2010-03-01-1])
 ・ 「#607. Google Books Ngram Viewer」 ([2010-12-25-1])
 ・ 「#708. Frequency Sorter CGI」 ([2011-04-05-1])
 ・ 「#1159. MRC Psycholinguistic Database Search」 ([2012-06-29-1])

 ・ Baayen R. H., R. Piepenbrock and L. Gulikers. CELEX2. CD-ROM. Philadelphia: Linguistic Data Consortium, 1996.

[ 固定リンク | 印刷用ページ ]

2013-03-17 Sun

#1420. Johnson's Dictionary の特徴と概要

 「#898. OED2Web3 の比較対照表」 ([2011-10-12-1]) で現代を代表する2大英語辞書の特徴を比較したが,今回は近代英語を代表する Samuel Johnson (1709--84) の A Dictionary of the English Language (2 vols. London: J. & P. Knapton et al., 1755) の特徴をかいつまんで紹介したい.以下は,寺澤(編),pp. 15--19 及び Crystal による同辞書に関するイントロを参考にした.
 1747年,当時すでに文豪としてならしていた Johnson は,"The Plan of A Dictionary of the English Language" を発表し,辞書編纂の意欲を示していた.パトロンからの支援も特にない状態で,6名の助手とともに地道な辞書編纂作業が始められた.結果としてできた辞書の初版は,約3万9千語の収録語数を誇り(1773年の第4版は約4万2,700語),引用文は約11万6千を数える全2巻,約2,500ページの大辞典となった.
 Johnson の辞書の最大の特徴を2つ挙げれば,(1) 各単語の語義ごとに引用例文を加えたこと,(2) 語義を細分化して,適切な定義で示したことである.(1) については,他言語では先例があったものの,英語辞書史上,画期的な試みであり,Johnson が純正な英語の純粋な源泉とみなした王政復古以降の作家群から採録されている.具体的には,Philip Sidney (1554--86), Richard Hooker (c1554--1600), Francis Bacon (1561--1626), Walter Raleigh (c1552--1618), William Shakespeare (1564--1616), Edmund Spenser (c1552--99), John Milton (1608--74), John Dryden (1631--1700), Joseph Addison (1672--1719) などで,計500を超える著者から引用されている(うち,Shakespeare, Dryden, Addison, Bacon で引用の3分の1を占める).原典を参照せずに,Johnson が博覧強記により引用したものも多かったという.
 (2) については,動詞 take を例にとれば,他動詞と自動詞で合わせて134の語義にまで分類しており,先行する Bailey の辞書 (1730) の対応箇所が6行しかないのに比べると,桁違いの細かさである.豊富な引用文例に基づいた定義にも定評があり,OED なども (J.) として Johnson の定義をしばしば借用しているほどである.古典的に有名な oats の定義 "grain, which in England is generally given to horses, but in Scotland supports the people" は,Johnson の個性と主観,独断と偏見を示すものとされているが,確かにそのような例も散見されるものの,概して簡潔で的確な定義が与えられている.
 他の特徴としては,強勢母音の直後に強勢記号が付されていること(ただし,これは先行の Bailey に帰すべき新機軸),語源情報が必ずしも正確でないこと(William Jones に先立つこと30年という時代を考えればやむを得ないか),百科辞典的な知識を盛り込もうとする態度などが挙げられるが,"Plan" を読めばよく分かるように近代辞書に求められるほとんどの項目が盛り込まれているといってよく,Johnson の斬新さが際立つ.
 この辞書は,1810年までに10版を重ね,1815--18年には J. H. Todd による改訂版(1827年に第2版)も著わされた.Johnson 以降 OED に至るまでは,辞書編纂活動は Johnson の補完という意味合いが強く,優に100年以上にわたり英語辞書界に君臨した歴史的な辞書といってよいだろう.Johnson の辞書に基づいて,ドイツ語,イタリア語,ベンガル語との2カ国語辞典が編纂されたように,海外への影響力も甚大だった.
 さて,Crystal が Johnson の辞書から4000語を選りすぐった選集が,出版の250年の節目にあたる2005年に出版された."Plan" 及び "Preface" とともに手軽に参照できるので,最近は机上に置いて,たまに引いている.

 ・ Johnson, Samuel. A Dictionary of the English Language: An Anthology. Selected, Edited and with an Introduction by David Crystal. London: Penguin, 2005.
 ・ 寺澤 芳雄(編) 『辞書・世界英語・方言』 研究社英語学文献解題 第8巻.研究社.2006年.

[ 固定リンク | 印刷用ページ ]

2012-10-18 Thu

#1270. 類義語ネットワークの可視化ツールと類義語辞書

 [2010-08-11-1]の記事「#471. toilet の豊富な婉曲表現を WordNet と Visuwords でみる」で,オンラインで利用できる類義語ネットワークの可視化ツールを2点紹介したが,同趣旨のツールとして WordNet のデータベースに基づいた Graph Words を追加したい.以下に,関連するツールのリンクを挙げておく.

 ・ Graph Words: フリー.出力がシンプル.
 ・ Visuwords: フリー.出力が凝っている.
 ・ Visual Thesaurus: 有料だがトライアルあり.出力が凝っている.

 ・ Merriam-Webster Thesaurus: 語義ごとに豊富な類義語群が得られる.
 ・ The Free Online Dictionary, Thesaurus and Encyclopedia: 語義もついており,単語学習によい.
 ・ Thesaurus.com: 手早く類義語リストを得られる.
 ・ HyperDictionary.com: 上に同じ.


 ・ WordWeb:英語辞書ソフトウェアとして人気がある.
 ・ TheSage's English Dictionary and Thesaurus:インターフェースがきれい.

 ・ HTOED (Historical Thesaurus of the Oxford English Dictionary)
 ・ TOE (A Thesaurus of Old English)

 類義語ネットワークの可視化ツールをいじっているうちに,単にキーワードに関連する語彙のネットワークを示すものとしてだけでなく,キーワードの語義の広がりを示すものとして利用することができることを発見した.例えば,Graph Words で多義語 "star" のネットワークを覗いてみると,およそ区別される語義ごとに枝のグループができていることがわかる.各語義が,単語置換による示唆というかたちではあるが,荒っぽく「定義」されているといえる(以下,拡大は画像をクリック).

Graph Words for "star"

 "star" のような多義語については,類義語可視化ツールは語義の広がりを見せてくれる,辞書代わりのツールとしても有効なのではないか.

2012-07-31 Tue

#1191. Pronunciation Search

 綴字ではなく発音で引ける(電子)辞書はいくつかあるが,ある発音をもつ語を一覧にするなどの目的には,今ひとつ使い勝手が悪い.特に,本格的なリストを作るというよりは,軽く単語例を列挙したいなどの日常的な目的には,もっと簡便に使える検索ツールが欲しい.そこで,Grady Ward's Moby からダウンロードできる Moby Pronunciator の圧縮ファイルに含まれている,無償で無制限に利用可能な発音データベース The Carnegie Mellon Pronouncing Dictionary を下敷きにした発音検索ツールを作成した.このデータベースは110935個のエントリーからなるアメリカ英語の発音辞書である(3MB以上あるデータファイルはこちら).


 検索の指定は,Carnegie Mellon Pronouncing Dictionary の発音表記に対して正規表現で与えるという仕様である.発音表記の凡例は以下の通り.音素間は半角スペースで区切られている.また,強勢は母音表記に続く 0 (no stress), 1 (primary stress), 2 (secondary stress) で示される.例えば,dictionary の発音表記は,"D IH1 K SH AH0 N EH2 R IY0" などとなる.なお,発音検索は,[2012-06-29-1]の記事で公開した「#1159. MRC Psycholinguistic Database Search」の機能の1部を利用することもできる.

AOoughtAO T
CHcheeseCH IY Z
DdeeD IY
FfeeF IY
GgreenG R IY N
KkeyK IY
LleeL IY
NkneeN IY
PpeeP IY
RreadR IY D
SseaS IY
TteaT IY
VveeV IY
YyieldY IY L D
ZzeeZ IY
ZHseizureS IY ZH ER

[ 固定リンク | 印刷用ページ ]

2012-07-18 Wed

#1178. MED Spelling Search

 MED (Middle English Dictionary) が2001年にオンライン化されてから,中英語の研究環境はとてつもなく便利になった.見出し語と異綴りの検索に関しては,通常のインターフェースのほか正規表現対応インターフェースも用意されており,自由度が高い.
 検索対象は,辞書の各エントリーの "headword and forms" 部分である.正規表現検索では,辞書上の母音に付された長音記号や短音記号のは無視される.<æ, Æ> は <A>, <þ, Þ, ð, ð> は <T>, <ȝ, Ȝ> は <3>, <œ> は <O> として検索文に指定できる.例として,一般の見出し語検索には "^taken\b" を,-li 副詞を一覧するには "li\b \(adv\.\)" を指定(前後の引用符は除く).


2012-07-03 Tue

#1163. オンライン語彙データベース DICT.ORG

 The DICT Development Group による DICT.ORG は,ウェブ上の様々な語彙データベースや辞書を利用するための統一的な仕様を提供するサービスである.登録されている語彙データベースを利用するインターフェースはこちら
 DICT.ORG で利用できる辞書はオンライン上で公開されている無料のものが多いが,語彙データベースとしての使用を前提とすれば,機能的には十分である.条件指定の方法("strategy" と呼ばれる;以下参照)は,電子辞書などでお馴染みの,綴字の完全一致,前方一致,後方一致,部分一致のほか,正規表現も完全にサポートしており,近似した綴字の語を取り出す Levenshtein distance 検索や Soundex algorithm 検索も実装されている.

 Strategy   Description
---------   -----------
    first : Match the first word within headwords
    exact : Match headwords exactly
       re : POSIX 1003.2 (modern) regular expressions
     last : Match the last word within headwords
  nprefix : Match prefixes (skip, count)
  soundex : Match using SOUNDEX algorithm
      lev : Match headwords within Levenshtein distance one
     word : Match separate words within headwords
   suffix : Match suffixes
   regexp : Old (basic) regular expressions
substring : Match substring occurring anywhere in a headword
   prefix : Match prefixes

 出力が非常にシンプルであり,まさに語の一覧という体裁なので,この一覧を拾い上げて,別の語彙ツールに投げ込むという使い方もできる.語彙研究に役立つツールを開発するためのベースとして利用できるのではないか.ウェブ上のインターフェースのほか,ローカルからは,Perl で書かれた dict というクライアントなどを経由して利用できる.
 DICT.ORG からは,英語の語彙データベースや辞書への役立つリンクが張られていて便利.特に Dictionary Database SiteOther Database InformationLinguistic Data Resources on the Internet: Dictionaries, Lexica, and Lexical Resources の情報が有用.

2012-01-08 Sun

#986. COCA の "WORD AND PHRASE . INFO"

 COCA ( Corpus of Contemporary American English ) を運営する Mark Davies 氏が,年末に,COCAベースで語に関する諸情報を一覧できるサービス WORD AND PHRASE . INFO を公開した.語(lemma 頻度で上位60,000語以内に限る)を入力すると,ジャンルごとの生起頻度やそのコンコーダンス・ラインはもとより,WordNet に基づいた定義や類義語群までが画面上に現われる.ほとんどの項目がクリック可能で,さらなる機能へとアクセスできる.インターフェースが直感的で使いやすい.
 類義語研究や collocation 研究には相当に役立つ仕様になったのではないか.例えば,semantic_prosody を扱った[2011-03-12-1]の記事「#684. semantic prosody と文法カテゴリー」で,強意語 utterly, absolutely, perfectly, totally, completely, entirely, thoroughly についての研究を紹介したが,WORD AND PHRASE . INFO で utterly を入力すれば,これらの類義語群が左下ウィンドウに一覧される.あとは,各語をクリックしてゆくだけで,頻度や collocation の詳細が得られる.このような当たりをつけるのに効果を発揮しそうだ.


2011-12-05 Mon

#952. Etymology Search

search mode: non-regex regex
search range: word-form definition (in one-line regex only)

 [2010-04-03-1]英語語源情報ぬきだしCGIの上位互換である,[2010-04-23-1]英語語源情報ぬきだしCGI(一括版)のさらに上位互換となる,多機能版「Etymology Search」を作成した.情報源は引き続き Online Etymology Dictionary
 初期設定のとおりに "non-regex" かつ "word-form" として検索すると,通常の見出し語検索となる.カンマや改行で区切られた複数の単語を指定すれば,対応する語源記述が得られる.
 search mode として "regex" を指定すると,perl5 相当の正規表現(改行区切りで複数指定可)を用いた検索が可能となる.正規表現を駆使すれば,語形の一部のみにマッチさせて,多数の語を拾い出すことも可能だ.
 さらに,search range に "definition (in one-line regex)" を指定すれば,定義(語源解説)内の文字列を対象として検索できる.この機能では,search mode の値にかかわらず,自動的に正規表現検索(改行区切りにより複数の正規表現を指定することは不可)となるので注意."(?i)" を正規表現の先頭に付加すれば,case-intensive の機能となる.例えば,次のような検索例は有用かもしれない.

 ・ 音位転換を経た(かもしれない)語を一覧
 ・ かばん語(かもしれない)例を一覧
 ・ 異化を経た(かもしれない)語を一覧
 ・ 日本語からの借用語(かもしれない)語を一覧

2011-11-20 Sun

#937. 語形成の生産性 (3)

 [2011-11-18-1], [2011-11-19-1]に引き続き,語形成の生産性について.生産性の議論には様々な側面があるということを見てきたが,具体的に生産性を測る段には,何をどう測ればよいのだろうか.例えば,形容詞から名詞を作る接尾辞 -ness による語形成の生産性を測定するにはどうすればよいのか.
 単純に考えると,辞書を参照して -ness 語を数え上げるという方法が挙げられるかもしれない.しかし,これでは正確に生産性を測ることはできない.なぜだろうか.

 (1) 辞書ごとに掲載されている -ness 語の数はまちまちである.[2011-11-05-1]の記事「#922. の定義がなぜ難しいか (5)」を始めとして の各記事で触れたように,辞書はそれぞれ独自の方針で編纂されており,どれを選択するかによって数え上げる語数が著しく異なる可能性がある.
 (2) 生産性は,問題の接辞を含む既存の語の数に依存するというよりは,むしろその接辞の添加によって派生される潜在的な語の数に依存すると考えられる.潜在的な語は辞書には載っていないので,辞書を参照しても無意味である.
 (3) 生産性の高い語形成は,音韻・意味において透明性の高い(=予測可能性の高い)語形成であり ([2011-11-18-1]) ,予測可能性が高いということは,その語が辞書に掲載される必要も薄く,実際に掲載されることが少ないということである.一方,生産性の低い語形成は,音韻・意味において透明性の低い(=予測可能性の低い)語形成であり,その語はぜひとも辞書に掲載されるべき語であるということになる.つまり,以下の逆説が成立する."[L]ess productive processes would be represented by more entries in the dictionary than more productive processes!" (Lieber 66) .

 例えば,手持ちのどの辞書も bovine (ウシの)に対応する派生名詞 bovineness を掲載していないが,だからといって -ness がその分だけ生産性が低いかといえば,むしろ逆である.辞書にいちいち掲載する必要がないほどに,-ness による名詞派生が音韻的にも意味的にも透明だということであり,それだけ生産性が高いということだろう.

 ・ Lieber, Rochelle. Introducing Morphology. Cambridge: CUP, 2010.

2011-11-05 Sat

#922. の定義がなぜ難しいか (5)

 標題の話題について,##910,911,912,921 の記事の続編.言語学の研究者は例外なく辞書好き人間だが,辞書が絶対的ではないということもよく知っている.自分が語とは何かという究極の問いに対する答えを知らないにもかかわらず,辞書編纂に関わる可能性すらあるからだ.
 市販の辞書 (dictionary) は,理論と現実の妥協の産物であり,脳内の語彙目録 (lexicon) を反映しているわけではない.前者は,あくまで現実的な諸事情を反映した便宜的な語彙リストである.というのは,辞書編纂者は,編集に際して以下の条件に縛られるからである.Lieber (27) より,辞書編纂者が考慮しなければならない要点を引用しよう.

 ・ the size of the dictionary, which determines the number of words it can hold;
 ・ the intended audience of the dictionary (adults, children, language learners, etc.);
 ・ whether a word has a sufficiently broad base of usage;
 ・ whether it's likely to last;
 ・ whether it's too specialized or technical for the intended audience;
 ・ for a word borrowed from another language, whether it's assimilated enough to be considered part of English.

 近年の online dictionary の興隆により,紙幅の都合という従来の辞書の旧弊は克服されつつある.しかし,online とはいえども,辞書としてある種の読者を対象とする以上,他の条件は満たさざるを得ない.
 市販の辞書は多かれ少なかれ複数の言語使用者をターゲットにするが,mental lexicon は言語使用者一人ずつに存在するものである.この両者を調和させるということ自体が,無理な注文なのかもしれない.dictionary と (mental) lexicon という用語の間に横たわる考え方の違いを認識することが重要である.

 ・ Lieber, Rochelle. Introducing Morphology. Cambridge: CUP, 2010.

2011-11-04 Fri

#921. の定義がなぜ難しいか (4)

 [2011-10-26-1]の記事「#912. の定義がなぜ難しいか (3)」の (2) で触れたが,辞書には意味が不詳であるにもかかわらず見出し語として掲げられているものがありうる.語の意味が不詳であるということは辞書編纂者の情報収集の問題であるという可能性は排除できないにせよ,その語が一般的に知られていない語であるということは恐らく間違いないだろう.
 OED では,そのような語が少なくとも77個は登録されている.以下は,OED の定義部検索で "meaning obscure" あるいは "obscure meaning" というキーワードにより引き出された語である.Lieber (26) では,OED での同種の検索により87語が引き出されたとしているが,ここには語義の1つのみが意味不明というものも含まれている.それを手作業で排除した結果の77語だ.

cremitoried (ppl. a.), †emporture (v.), †gestyll (v.), †leary (a.), †leg-saw, †minority waiter, notchet, †rag (v.4), †reordi (a.), †reprobitant (a.), †resaille, †residence (v.), †rok, †romb (v.), †rompering, †rownfol(d, †rubell, †rum (n.3), †ruvell, †ryne2, scuncheon anglers, -crest, †sheer-point, short-coat vicarage, †shreake, shuffle-breeches, †sidder (v.), †sithy-coat, †skyvald, †slampamb, †slope (v.3), †smazky (a.), †spanner2, †sparth2, †spen (n.), †spencer (v.), †spene (n.), †sperring (vbl. n.), †sperware, †splet (n.), †splete, †spleyer, †spyccard, †squaleote (v.), †squalm, †squirgliting (a.), †start-rope, †strothe (a.), †threte (n.), †thwerl (v.), †traythly (adv.), †trice (n.3), umbershoot, †unbrede (v.), †uncape (v.), †underdrawn (ppl. a.), †uniable (a.), †unthwyuond (pres. pple.), †untwitten (ppl. a.), †val-dunk, †ver (n.2), †verge-salt, †verling-line, †versing box, †very(e), †vezon, †viridary (a.), †vitremyte, †vounde (a.), †vowgard, †vrycloth, †wandclot, †way-flax, Welsh brief, †werder, †wesel, †wranchevel, †wrast (? n.)

 71語が廃語というのが現実だが,要点はこのような語が辞書にエントリーされているという事実があることである.dictionary の見出し語と mental lexicon の登録が必ずしも一致しないということは,これらの例からも明らかだろう.語とは何かという問いへの答えを辞書編集者に任せるわけにはいかないということを示す好例だ.

 ・ Lieber, Rochelle. Introducing Morphology. Cambridge: CUP, 2010.

2011-10-26 Wed

#912. の定義がなぜ難しいか (3)

 [2011-10-24-1], [2011-10-25-1]に引き続き,語の定義の難しさを垣間見る記事の第3弾.語を定義する最も単純な方法,語の範囲を限定する最も直感的な方法は,辞書を参照することだろうと思われるかもしれない.辞書の見出し語はすべて「語」のはずであり,大型辞書を参照すれば当該言語の語の目録 (lexicon) を作成することができる,と.しかし,語の範囲を限定する際に,辞書に頼ってはならないいくつかの理由がある.Lieber (13--15) に拠って,列挙しよう.

 (1) 辞書は,編集者によってある方針に基づいて編まれている.編集者の想定する語の定義によっては収録語彙の範囲に差が生じる可能性があり,実際に,語に対する考え方は辞書間で異なっていることが普通である.差別用語や専門用語を掲載するかどうか,俗語や古語はどうか,新語はどの程度社会に浸透していれば収録可とみなせるか,接辞は語に含まれるか,派生語や複合語はどこまで納めるか,等々の決定において,各辞書編集者は独自の方針をもっている.世界最大の英語辞書 OED であっても,事情は変わらない.また,参照者においてもどの辞書を選ぶかという決定は恣意的である.辞書に語の定義を委ねることは,問題を一段階さかのぼらせたにすぎず,問題の解決になっていない.
 (2) 辞書には,一度しか文証されない語(臨時語,nonce word, hapax legomenon)が収録されている場合がある.例えば,OED では umbershoot という語が見出し語として挙げられており,James Joyce の Ulysses からの唯一の例が引かれているが,定義欄に "a word of obscure meaning" とある.果たして,これを実際的な意味において語とみなしてよいのだろうか.文豪 Joyce だから許されるのか,一般の話者の発する臨時語はどうなのか.
 (3) 誤植,勘違い,民間語源などにより,間違えて辞書に忍び込んでしまった幽霊語 (ghost word) なる語がある.OED には,ambassady なる hapax legomenon が収録されているが,これは ambassade の単純な綴り間違い,あるいは誤植ではないかと考えられている.辞書を盲信すると,実在しないかもしれない語を語としてみなす誤りが生じうる.特殊で意図的な幽霊語として,"mountweazel" 語と呼ばれるものがある.これは,辞書編纂者が他の辞書編纂者による辞書の著作権侵害を見破るために,意図的に密かに挿入した幽霊語であり,実在の語ではない.このような mountweazel 語の存在は,辞書を絶対的な語彙目録として用いることの危険を物語っている.
 辞書やその他の権威は,"Is xyz a word?" という問いに必ずしも正しい答えを与えてくれるとは限らないことが分かるだろう.

 ・ Lieber, Rochelle. Introducing Morphology. Cambridge: CUP, 2010.

Powered by WinChalow1.0rc4 based on chalow