01 02 03 04 05 06 07 08 09 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31
2024 : 01 02 03 04 05 06 07 08 09 10 11 12
2023 : 01 02 03 04 05 06 07 08 09 10 11 12
2022 : 01 02 03 04 05 06 07 08 09 10 11 12
2021 : 01 02 03 04 05 06 07 08 09 10 11 12
2020 : 01 02 03 04 05 06 07 08 09 10 11 12
2019 : 01 02 03 04 05 06 07 08 09 10 11 12
2018 : 01 02 03 04 05 06 07 08 09 10 11 12
2017 : 01 02 03 04 05 06 07 08 09 10 11 12
2016 : 01 02 03 04 05 06 07 08 09 10 11 12
2015 : 01 02 03 04 05 06 07 08 09 10 11 12
2014 : 01 02 03 04 05 06 07 08 09 10 11 12
2013 : 01 02 03 04 05 06 07 08 09 10 11 12
2012 : 01 02 03 04 05 06 07 08 09 10 11 12
2011 : 01 02 03 04 05 06 07 08 09 10 11 12
2010 : 01 02 03 04 05 06 07 08 09 10 11 12
2009 : 01 02 03 04 05 06 07 08 09 10 11 12
Cordorelli (5) によると,直近30年ほどの英語綴字に関する歴史的な研究は,広い意味で "sociolinguistic" なものだったと総括されている.念頭に置いている中心的な時代は,後期中英語から初期近代英語にかけてだろうと思われる.以下に引用する.
The first studies to investigate orthographic developments in English within a diachronic sociolinguistic framework appeared especially from the late 1990s and the early 2000s . . . . The main focus of these studies was on the diffusion of early standard spelling practices in late fifteenth-century correspondence, the development of standard spelling practices, and the influence of authors' age, gender, style, social status and social networks on orthographic variation. Over the past few decades, book-length contributions with a relatively strong sociolinguistic stance were also published . . . . These titles have touched upon different aspects of spelling patterns and change, providing useful frameworks of analysis and ideas for new angles of research in English orthography.
一言でいえば,綴字の標準化 (standardisation) の過程は,一本線で描かれるようなものではなく,常に社会的なパラメータによる変異を伴いながら,複線的に進行してきたということだ.そして,このことが30年ほどの研究で繰り返し確認されてきた,ということになろう.
英語史において言語現象が変異を伴って複線的に推移してきたことは,何も綴字に限ったことではない.ここ数十年の英語史研究では,発音,形態,統語,語彙のすべての側面において,同趣旨のことが繰り返し主張されてきた.学界ではこのコンセンサスがしっかりと形成され,ほぼ完全に定着してきたといってよいが,学界外の一般の社会には「一本線の英語史」という見方はまだ根強く残っているだろう.英語史研究者には,この新しい英語史観を広く一般に示し伝えていく義務があると考える.
過去30年ほどの英語歴史綴字研究を振り返ってみたが,では今後はどのように展開していくのだろうか.Cordorelli はコンピュータを用いた量的研究の新たな手法を提示している.1つの方向性として注目すべき試みだと思う.
・ Cordorelli, Marco. Standardising English Spelling: The Role of Printing in Sixteenth and Seventeenth-Century Graphemic Developments. Cambridge: CUP, 2022.
先日,言語学の立場から商標 (trademark) を研究している目白大学の五所万実さんと Voicy 「英語の語源が身につくラジオ (heldio)」で対談しました.その様子は,昨日公開したアーカイヴ放送としてお聴きいただけます.「#667. 五所万実さんとの対談 --- 商標言語学とは何か?」です.
この hellog としては先日前振りのように「#5078. 法言語学 (forensic linguistics)」 ([2023-03-23-1]),「#5079. 商標 (trademark) の言語学的な扱いは難しい」 ([2023-03-24-1]) で関連する話題を取り上げ,その上で今回の対談に臨んだという次第です.
今回は対談のパート1ということで,五所さん自身のご紹介,商標の社会における存在感,商標は固有名詞なのかそうでないのか,商標は英語で何というのか,といった導入的な話題となりました.そして,最後は「商標と著作権の違いは何?」という宿題で締めることになりました.今後,パート2,パート3と続いていき,商標についての議論がどんどん深まっていきますので,どうぞ楽しみにしていてください.
五所さんには,先週より YouTube 「井上逸兵・堀田隆一英語学言語学チャンネル」にもご出演いただいています.そこでも商標言語学 (trademark linguistics) に関連する話題に言及していますので,ぜひご視聴ください.YouTube でもすでに2回分が公開されていますが,来週水曜日に第3回が公開される予定です.
・ 「#112. 商標の言語学 --- 五所万実さん登場」(3月22日公開)
・ 「#114. マスクしていること・していないこと・してきたことは何を意味するか --- マスクの社会的意味 --- 五所万実さんの授業」(3月29日公開)
皆さんもこれを機に商標という身近な対象を言語学的に考えてみませんか? 固有名詞学 (onomastics) や言語と権力の問題とも接点がありますし,意味変化 (semantics) とも関連が深いので十分に英語史マターとなり得る領域です.
現代英語の標準綴字はいつ成立したか.英語の標準化 (standardisation) の時期をピンポイントで指摘することは難しい.言語の標準化の過程は,多かれ少なかれ緩慢に進行していくものだからだ(cf. 「#2321. 綴字標準化の緩慢な潮流」 ([2015-09-04-1])).
私はおおよその確立を1650年辺りと考えているが,研究者によってはプラスマイナス百数十年の幅があるだろうことは予想がつく.「#4093. 標準英語の始まりはルネサンス期」 ([2020-07-11-1]) で見たように,緩く英国ルネサンス期 (renaissance),あるいはさらに緩く初期近代英語期 (emode) と述べておくのが最も無難な答えだろう.
実際,Cordorelli による英語綴字の標準化に関する最新の研究書の冒頭でも "the Early Modern Era" と言及されている (1) .
English spelling is in some ways a product of the Early Modern Era. The spelling forms that we use today are the result of a long process of conscious development and change, most of which occurred between the sixteenth and the seventeenth centuries. This portion of history is marked by a number of momentous events in England and the Continent, which had an immediate effect on English culture and language.
初期近代英語期とその前後に生じた様々な歴史的出来事や社会的潮流が束になって,英語綴字の標準化を推し進めたといってよい.現代につらなる正書法は,この時代に,諸要因の複雑な絡み合いのなかから成立してきたものなのである.以下に関連する記事へのリンクを挙げておく.
・ 「#297. 印刷術の導入は英語の標準化を推進したか否か」 ([2010-02-18-1])
・ 「#871. 印刷術の発明がすぐには綴字の固定化に結びつかなかった理由」 ([2011-09-15-1])
・ 「#1312. 印刷術の発明がすぐには綴字の固定化に結びつかなかった理由 (2)」 ([2012-11-29-1])
・ 「#1384. 綴字の標準化に貢献したのは17世紀の理論言語学者と教師」 ([2013-02-09-1])
・ 「#1385. Caxton が綴字標準化に貢献しなかったと考えられる根拠」 ([2013-02-10-1])
・ 「#1386. 近代英語以降に確立してきた標準綴字体系の特徴」 ([2013-02-11-1])
・ 「#1939. 16世紀の正書法をめぐる議論」 ([2014-08-18-1])
・ 「#2321. 綴字標準化の緩慢な潮流」 ([2015-09-04-1])
・ 「#3243. Caxton は綴字標準化にどのように貢献したか?」 ([2018-03-14-1])
・ 「#3564. 17世紀正音学者による綴字標準化への貢献」 ([2019-01-29-1])
・ 「#4628. 16世紀後半から17世紀にかけての正音学者たち --- 英語史上初の本格的綴字改革者たち」 ([2021-12-28-1])
・ Cordorelli, Marco. Standardising English Spelling: The Role of Printing in Sixteenth and Seventeenth-Century Graphemic Developments. Cambridge: CUP, 2022.
一昨日,YouTube 「井上逸兵・堀田隆一英語学言語学チャンネル」の最新回が公開されました.「#113. スプーナリズム!言語景観!痛快エッセイ!---ご著書紹介・安藤聡『英文学者がつぶやく 英語と英国文化をめぐる無駄話』」と題して,spoonerism に注目しています.car park を par cark,King Richard を Ring Kichard のように言い間違えてしまう現象のことです.
動画でも簡単に説明していますが,spoonerism という用語は,Oxford 大学 New College の学寮長 Rev. William Archibald Spooner (1844--1930) がこの種の言い間違いの達人(?)だったことにちなみます.OED によると,初出は1900年ですが,Oxford 大の内部では1885年頃から口語として使用されていたようです.OED の与えている語義と例文を覗いてみましょう.
An accidental transposition of the initial sounds, or other parts, of two or more words.
Known in colloquial use in Oxford from about 1885.
1900 Globe 5 Feb. To one unacquainted with technical terms it sounds as if the speaker were guilty of a spoonerism.
1923 Notes & Queries 27 Oct. 331/2 In my childhood..an old cousin used to entertain me with what we now call spoonerisms, but which she termed morowskis...Her mother (who dated from the eighteenth century) had taught her the game, stating that the original perpetrator of these strange transpositions was a Polish Count, who was well known in London society of that period.
1976 Oxf. Diocesan Mag. July 15/1 I am not going to put on any weight until I'm fifty, when I shall allow myself to become matronly, ready to be a follower of 'soda and gobbly matrons', as enjoined by the marriage service. (A good Spoonerism that, created quite involuntarily by my mother some years ago.)
2つめの例文にもある通り,この用語が現われる以前より,つまり Spooner 先生の登場以前より,この種の言い間違い自体は,別の名前で呼ばれていたこともあったようで,ありふれた現象だったことが分かる.
3つめの例文中の何が spoonerism かお分かりでしょうか? 答えは soda and gobbly matrons が sober and godly matrons の言い間違いだったということですね.
関連して「#5035. 1900年以降の -ism 語」 ([2023-02-08-1]) を参照.
・ 安藤 聡 『英文学者がつぶやく英語と英国文化をめぐる無駄話』 平凡社,2022年.
Cordorelli による初期近代英語期の綴字に関する新刊の研究書を読んでいる.そこでは語源的綴字 (etymological_respelling) の問題も詳しく論じられているのだが,興味深い説が提示されている.語源的綴字の多くの例は,dout に対する doubt,receit に対する receipt のように1文字長くなることが多い.労働時間ではなく植字文字数(より正確には文字幅の総量)で賃金を支払われるようになった16世紀の植字工は,文字数,すなわち稼ぎを増やすために,より長くなりがちな語源的綴字のほうを選んだのではないかという.もちろん文字数を水増しする方法は他にもいろいろあったと思われるが,語源的綴字もそのうちの1つだったのではないか,という議論だ.Cordorelli (184--85) の説明を引用する.
With regard to remuneration, large-scale etymological developments were initially prompted, I suggest, by a change in the economic organisation of the printing labour. From the turn of the sixteenth century, the mode of remuneration changed in accordance with the pressures exerted by modernisation: printers no longer received time-based wages, but were generally paid according to their output . . . . For typesetters, wages were set taking into account the kind of printing form, the publication format, the typefaces and the languages that were used in the texts . . . . As a result of a first move towards a performance-based pay, compositors' output also began to be measured, rather roughly, by the page or by the sheet; later, a more accurate measurement by ens was adopted. One en corresponded to half an em of any size of type, and the number of ens in a setting of type was proportional to the number of pieces of type used in it . . . . With compositors' output being measured by page first, and by ens later, typesetters became increasingly more prone to using as many types as possible when composing a book, while also having to make sure that the overall meaning of the text would not be corrupted by this practice. As a rule, the more types were used on a given page, the more ens were likely to result, which in turn meant that compositors would be paid a higher rate for a given project. Making the most of each typesetting project was more important than one might think, especially during the first half of the sixteenth century, when the English printing industry was still growing on unstable economic ground . . . . The flow of jobs that characterised most staff roles in the EModE printing industry was variable and often irregular for everyone, especially for compositors. The irregularity of the market could keep compositors short of work for long periods of time, and forced them either into part-time employment with another printer or even into joining the vast reservoir of employed labour . . . .
印刷術の発明,その産業化,植字工の雇用といった技術・経済上の要因が,初期近代英語期の語源的綴字の興隆と関わっているとなれば,これはたいへんおもしろいトピックである.この仮説を実証するには,当時の社会事情と綴字習慣を詳細に調査する必要があるだろう.
Cordorelli (185) 自身による要約となる1文も引用しておきたい.
From this point of view, etymological spelling would have worked as a convenient means to increase average pay, to such an extent that printers evidently compromised linguistic correctness with personal profit, accepting or perhaps even enforcing the diffusion of 'false' etymological spellings like phantasy and aunswar.
・ Cordorelli, Marco. Standardising English Spelling: The Role of Printing in Sixteenth and Seventeenth-Century Graphemic Developments. Cambridge: CUP, 2022.
「#5074. 英語の談話標識,43種」 ([2023-03-19-1]),「#5075. 談話標識の言語的特徴」 ([2023-03-20-1]) で談話標識 () 的にとらえていくのがよいだろうという見解である.
実はこの3つのアプローチは,談話標識の意味にとどまらず,一般の語の意味を分析する際にもそのまま応用できる.要するに,同音異義 (homonymy) の問題なのか,あるいは多義 (polysemy) の問題なのか,という議論だ.これについては,以下の記事も参照されたい.
・ 「#286. homonymy, homophony, homography, polysemy」 ([2010-02-07-1])
・ 「#815. polysemic clash?」 ([2011-07-21-1])
・ 「#1801. homonymy と polysemy の境」 ([2014-04-02-1])
・ 「#2823. homonymy と polysemy の境 (2)」 ([2017-01-18-1])
・ 松尾 文子・廣瀬 浩三・西川 眞由美(編著) 『英語談話標識用法辞典 43の基本ディスコース・マーカー』 研究社,2015年.
今年の1月半ばに一般発売となった新著『文献学と英語史研究』(開拓社)の共著者である家入葉子先生(京都大学)の「【KOTOBA-カタリナ】ブログ」を紹介します.
家入先生はいくつかのサイトを運営されていますが,そのうちの1つ「コトバと文化のフォーラム - Castlecliffe」のなかで「コトバと文化をテーマに不定期に更新」する「【KOTOBA-カタリナ】ブログ」を運営されています.書籍の紹介,英語史や言語学の専門的な記事,日本と世界の文化の話題を数多く投稿されています.今月投稿された最新の9件を新しい順に挙げてみます.
・ 言語接触を考える(2023年3月23日)
・ カテゴリーシフト(2023年3月14日)
・ 語順についての考え方(2023年3月10日)
・ 英語の否定構文についての論文集(2023年3月6日)
・ 言語変化のあり方(2023年3月5日)
・ 英語学と英語教育の接点(2023年3月4日)
・ 歴史社会言語学・歴史語用論という分野(2023年3月4日)
・ 分野をつなぐ共通のテーマ(2023年3月4日)
・ 語形成に関すること(2023年3月1日)
家入先生が運営されている他のサイト等も,ご案内します.「コトバと文化のフォーラム - Castlecliffe」と合わせて,英語史に直接・間接に関わる膨大で良質な情報が蓄積されています.
・ もう1つのHP 「Yoko Iyeiri(家入葉子)のホームページ」より,とりわけ「研究・授業関連の投稿ページ」にはご著書の一覧が掲載されています.関連記事も英語史を学ぶ者にとってたいへん有用です.
・ 家入先生による英語史導入 YouTube 動画もあります.「京大先生シアター「英語史 ことばが変化し続けることの意味」」よりどうぞ.
・ 家入先生が代表世話役を務められている英語史研究会も紹介します.年1度開催されていますが,次の第32回は来たる4月8日(土)にオンライン開催の予定です.
家入先生と堀田が対談形式で新著『文献学と英語史研究』(開拓社)を紹介した Voicy 「英語の語源が身につくラジオ (heldio)」の放送回2件も,ぜひお聴きください.なお,今朝の heldio 放送回の Chapter 2 でも,家入先生の上記ブログを簡単に紹介しています.
・ 「#609. 家入葉子先生との対談:新著『文献学と英語史研究』(開拓社)を紹介します」
・ 「#611. 家入葉子先生との対談の第2弾:新著『文献学と英語史研究』より英語史コーパスについて語ります」
・ 家入 葉子・堀田 隆一 『文献学と英語史研究』 開拓社,2022年.
昨日の記事で紹介した「#5078. 法言語学 (forensic linguistics)」 ([2023-03-23-1]) は広く「法と言語」を扱う分野ととらえてよい.そこで論じられる問題の1つに商標 (trademark) がある.商標にはコピーライトが付与され,法的に守られることになるが,対応する商品があまりに人気を博すると,商標は総称的 (generic) な名詞,つまり普通名詞に近づいてくる.法的に守られているとはいえ,社会の大多数により普通名詞として用いられるようになれば,法律とて社会の慣用に合わせて変化していかざるを得ないだろう.商標を言語的に,社会的にどのように位置づけるかは実際的な問題である.
McArthur の用語辞典を参照すると,trademark が言語学的に厄介であることがよく分かる.
TRADEMARK, also trade mark, trade-mark, [16c]. . . . A sign or name that is secured by legal registration or (in some countries) by established use, and serves to distinguish one product from similar brands sold by competitors: for example, the shell logo for Shell, the petroleum company, and the brand name Jacuzzi for one kind of whirlpool bath. Legal injunctions are often sought when companies consider that their sole right to such marks has been infringed; the makers of Coke, Jeep, Jell-O, Kleenex, Scotch Tape, and Xerox have all gone to court in defence of their brand (or proprietary) names . . . . Although companies complain when their trademarks begin to be used as generic terms in the media or elsewhere, their own marketing has often, paradoxically, caused the problem: 'Most marketing people will try hard to get their brand names accepted by the public as a generic. It's the hallmark of success. But then the trademarks people have to defend the brand from becoming a generic saying it is unique and owned by the company' (trademark manager, quoted in Journalist's Week, 7 Dec. 1990).
There is in practice a vague area between generic terms proper, trademarks that have become somewhat generic, and trademarks that are recognized as such. The situation is complicated by different usages in different countries: for example, Monopoly and Thermos are trademarks in the UK but generics in the US. Product wrappers and business documents often indicate that a trademark is registered by adding TM (for 'trademark') or R (for 'registered') in a superscript circle after the term, as with English TodayTM, Sellotape®. The term usually differs from trade name [first used c.1860s] by designating a specific product and not a business, service, or class of goods, articles, or substances: but some trademarks and trade names may happen to be the same. Everyday words of English that were once trademarks (some now universal, some more common in one variety of English than another, some dated, all commonly written without an initial capital) include aspirin, bandaid, cellophane, celluloid, cornflakes, dictaphone, escalator, granola, hoover, kerosene, lanolin, mimeograph, nylon, phonograph, shredded wheat, zipper. Trademarks facing difficulties include Astroturf, Dacron, Formica, Frisbee, Hovercract, Jacuzzi, Laundromat, Mace, Muzak, Q-Tips, Scotch Tape, Styrofoam, Teflon, Vaseline, Xerox. The inclusion of such names in dictionaries, even when marked 'trademark' or 'proprietary term', indicates that their status has begun to shift. Trademark names used as verbs are a further area of difficulty, both generally and in lexicography. One solution adopted by publishers of dictionaries is to regard the verb forms as generic, with a small initial letter: that is, Xerox (noun), but xerox (verb).
商標の位置づけが空間的に変異し,時間的に変化し得るとなれば,言語変化や歴史言語学の話題としてみることもできるだろう.「商標の英語史」というのもなかなかおもしろそうなテーマではないか.
・ McArthur, Tom, ed. The Oxford Companion to the English Language. Oxford: OUP, 1992.
応用言語学の1分野として法言語学 (forensic linguistics) があります.昨日の朝の Voicy 「英語の語源が身につくラジオ (heldio)」で「#660. 「法言語学」 (forensic linguistics) とは?」として紹介しました.さらに夜の YouTube 「井上逸兵・堀田隆一英語学言語学チャンネル」で「#112. 商標の言語学 --- 五所万実さん登場」として,関連する話題について井上氏および五所氏と雑談しています.ぜひ聴取・視聴していただければ.
いくつかの用語辞典で "forensic (socio)linguistics" を引いてみました.以下,3点ほど引用します.同分野の守備範囲がおおよそ分かってくるかと思います.
forensic linguistics In Linguistics, the use of linguistic techniques to investigate crimes in which language data forms part of the evidence, such as in the use of grammatical or lexical criteria to authenticate police statements. The field of forensic phonetics is often distinguished as a separate domain, dealing with such matters as speaker identification, voice line-ups, speaker profiling, tape enhancement, tape authentification, and the decoding of disputed utterances. (Crystal, Dictionary)
forensic sociolinguistics The use of sociolinguistic knowledge and techniques in the investigation of crime, and in the prosecution and defence of people accused of crimes. Sociolinguists have been employed, for instance, to demonstrate that a defendant could not have made a telephone call recorded by police because his dialect did not tally with that on the recording; and to decode recordings of communication between criminal speaking in an antilanguage such as Pig Latin. (Trudgill)
FORENSIC LINGUISTICS
Most stylostatistical studies are of literary works; but the same techniques can be applied to any spoken or written sample, regardless of the 'standing' of the user. In everyday life, of course, there is usually no reason to carry out a stylistic analysis of someone's usage. But when someone is alleged to have broken the law, stylisticians might well be involved, in an application of their subject sometimes referred to as 'forensic' linguistics.
Typical situations involve the prosecution arguing that incriminating utterances heard on a tape recording have the same stylistic features as those used by the defendant---or, conversely, the defence arguing that the differences are too great to support this contention. A common defence strategy is to maintain that the official statement to the police, written down and used in evidence, is a misrepresentation, containing language that would not be part of the defendant's normal usage.
Arguments based on stylistic evidence are usually very weak, because the sample size is small, and the linguistic features examined are often not very discriminating. (Crystal, Encyclopedia)
・ Crystal, David, ed. A Dictionary of Linguistics and Phonetics. 6th ed. Malden, MA: Blackwell, 2008. 295--96.
・ Trudgill, Peter. A Glossary of Sociolinguistics. Oxford: Oxford University Press, 2003.
・ Crystal, David. The Cambridge Encyclopedia of Language. Cambridge: CUP, 1995. 2nd ed. 2003. 3rd ed. 2019.
昨日の記事「#5076. キリスト教の普及と巻子本から冊子本へ --- 高宮利行(著)『西洋書物史への扉』より」 ([2023-03-21-1]) で紹介した髙宮利行(著)『西洋書物史への扉』より,今回は publish の文化史の話題をお届けする.
publish はラテン語の形容詞 pūblicus (public) の動詞形 pūblicāre に由来し,フランス語における変形を経て14世紀に英語に入ってきた.意味は語源に従って「公にする」であり,それが「書き物として公にする」を経て,現代的な「出版する」へと発展した.
私たちは,publish と聞くとまず印刷物を思い浮かべるだろう.しかし,この単語は実際には印刷術の発明以前にも用いられていた.もともとは,むしろ声に出して文章を読み上げる朗読文化と結びついていた.髙宮 (75--76) を引用する.
古代や中世のヨーロッパ社会にあっては,詩人や作家による新作の朗読は,「出版」という概念と結びついていた.出版にあたる英語の動詞は publish であるが,これはもともと意見や書物を公 (public) にするという意味であり,印刷術を用いて同一作品を多くの部数で一度に出版する以前から存在した.作者が自作を原稿から朗読し,そこにいるパトロンから転写の許しを頂戴することが,近代以前の出版形態だったといってよい.例えば,一二世紀のイングランド王ヘンリー二世に仕えた歴史家の司祭ギラルドゥス・カンブレンシス(ウェールズのジェラルド)は,ジョン王子に随行した体験をもとに,一一八八年に『アイルランド地誌』(青土社,一九九六)を完成した.まもなく彼は,大学制度の芽が出始めたオクスフォードで,三日間を費やしてラテン語原稿を読み続けた.現存する写本には「本文を朗唱する前に」という序文と,「ヘンリー二世陛下へのご挨拶」という第二の序文が付されている.
つまり,publish は「出版する」というよりも「お披露目する」に近かったということになる.現代では自作コンテンツを様々な媒体で publish できるようになっているが,この単語のもともとの語源や背景を押さえておくと味わい深い.
・ 髙宮 利行 『西洋書物史への扉』 岩波書店〈岩波新書〉,2023年.
この2月に髙宮利行(著)『西洋書物史への扉』が岩波新書より出版されています.西洋における本の歴史が,多くの写真やエピソードとともにコンパクトにまとめられています.参考文献も整理されており,次の一冊に進むのに有用です.
本の歴史には数々の論点がありますが,巻子本(かんすぼん;volume)から冊子本 (codex) へと本の形態がシフトした問題について「冊子本の登場」と題する章で紹介されています.
巻子本は冊子本に比べて検索しにくかったということがしばしば言われます.シフトの背景にはそのような実用的な要因もあったことは確かと思われますが,キリスト教の普及と関係する社会的な要因もあったと考えられています.
髙宮 (pp. 45--45) では,紀元1--5世紀に作られた現存するギリシア古典作品の本について,巻子本と冊子本の比率を比べた調査が紹介されています.それによると,1世紀には冊子本はほとんどなかったものの,2世紀には2%,3世紀には17%,4世紀には70%,5世紀初頭には90%と加速度的に増えていきました.一方,キリスト教関連の本について調査すると,ずっと早い段階から冊子本が広範囲で採用されており,2世紀までに100%に達していました.つまり,キリスト教関連本と冊子本は歴史的に密接な関係にあったということです.
これについて髙宮 (pp. 46--48) は次のように説明しています.
ここで論じられている写本が発見されているのはエジプトである.かねてより,冊子本という形態の出現とキリスト教伝播が並行して起こっていることは指摘されてきたが,冊子本は三世紀に増加,四世紀に支配的となり,同様にキリスト教も三世紀に急速に普及し,三一三年に公認されていく.
巻子本から冊子本への形態的な転換は,いずれが使用に便利かといった実用的・経済的判断だけから起こったのではないだろう.冊子写本は,巻子本を用いていたユダヤ教や周辺に存在していた異教に対して,原始キリスト教がユダヤ教から分派し,成立したことを示す象徴的な形態として,選ばれたのである.キリスト教の教えを説き普及させる聖書の形態として,キリスト教の写字生を異教徒の書記から区別するために,冊子本は採用されたのであった.ユダヤ教典が現在でもなお,羊皮紙巻子本の形態で作られている点に注目すれば,紀元後まもなくキリスト教関係者の中に,聖書およびその関連書の写本を冊子本の形態に転換すべく努力した重要な人物がいたであろうことが浮かび上がる.
宗教と本の形態が関与しているとは,まさに驚きです.
・ 髙宮 利行 『西洋書物史への扉』 岩波書店〈岩波新書〉,2023年.
昨日の記事「#5074. 英語の談話標識,43種」 ([2023-03-19-1]) で紹介した松尾ほか編著の『英語談話標識用法辞典』の補遺では,談話標識 (discourse_marker) についての充実した解説が与えられている.特に「談話標識についての基本的な考え方」の記事は有用である.
談話標識は品詞よりも一段高いレベルのカテゴリーであり,かつそのカテゴリーはプロトタイプ (prototype) として解釈されるべきものである,という説明から始まる.談話標識そのものがあるというよりも,談話標識的な用法がある,という捉え方に近い.その後に「談話標識の一般的特徴」と題するコラムが続く (333--34) .とてもよくまとまっているので,ここに引用しておきたい.
談話標識に共通する最も一般的な特徴は,「話し手の何らかの発話意図を合図する談話機能を備えている」ことである.ただし,「談話」 (discourse) は広義にとらえて,談話標識が現れる前後の文脈や,テクストとして具現化される文脈のみならず発話状況 (utterance situation) 全体を含むものとする.さらに,その発話状況に参与する話し手・聞き手の知識やコミュニケーションの諸要素が談話標識の機能に関与する.以下,いくつかの観点から談話標識の特徴をまとめる.
【語彙的・音韻的特徴】
(a) 一語からなるものが多いが,句レベル,節レベルのものも含まれる.
(b) 伝統的な単一の語類には集約できない.
(c) ポーズを伴い,独立した音調群を形成することが多い.
(d) 談話機能に応じ,さまざまな音調を伴う.
【統語的特徴】
(a) 文頭に現れることが多いが,文中,文尾に生じるものもある.
(b) 命題の構成要素の外側に生じる,あるいは統語構造にゆるやかに付加されて生じる.
(c) 選択的である.
(d) 複数の談話標識が共起することがある.
(e) 単独で用いられることがある.
【意味的特徴】
(a) それ自体で,文の真偽値に関わる概念的意味をほとんど,あるいは全く持たないものが多い.
(b) 文の真偽値に関わる概念的意味を持つ場合にも,文字通りの意味を表さ場合が多い.
【機能的特徴】
多機能的で,いくつかの談話レベルで機能するものが多い.
【社会的・文体的特徴】
(a) 書き言葉より話し言葉で用いられる場合が多い.
(b) くだけた文体で用いられるものが多い.
(c) 地域的要因,性別,年齢,社会階層,場面などによる特徴がある.
様々な角度から分析することのできる奥の深いカテゴリーであることが分かるだろう.昨日の記事 ([2023-03-19-1]) の43種の談話標識を思い浮かべながら,これらの特徴を確認されたい.
・ 松尾 文子・廣瀬 浩三・西川 眞由美(編著) 『英語談話標識用法辞典 43の基本ディスコース・マーカー』 研究社,2015年.
近年,語用論 (pragmatics) の研究で盛んになってきている分野の1つに,談話標識 (discourse_marker) がある.「#2041. 談話標識,間投詞,挿入詞」 ([2014-11-28-1]),「#3267. 談話標識とその形成経路」 ([2018-04-07-1]),「#3268. 談話標識のライフサイクルは短い」 ([2018-04-08-1]) を始めとするいくつかの記事で取り上げてきた.
英語の談話標識の事始めに,松尾 文子・廣瀬 浩三・西川 眞由美(編著)『英語談話標識用法辞典 43の基本ディスコース・マーカー』(研究社,2015年)を紹介しておきたい.
副題にある通り,43の具体的な談話標識が取り上げられ,各々の用法が詳述されています.本書の補遺には,談話標識についての充実した解説も含まれています(「談話標識研究の歩み」「談話標識についての基本的な考え方」「談話標識の機能的分類」).
43種の談話標識は以下の5つのカテゴリーに分かれています.いずれも談話において独特な用いられ方をする表現であることが感じられると思いますが,これこそが「談話標識」です.
[ 副詞的表現 ]
actually
anyway
besides
first(ly) [last(ly)]
however [nevertheless, nonetheless, still]
kind [sort] of
like
now
please
then
though
whatever
[ 前置詞句表現 ]
according to
after all
at last
at least
by the way
in fact
in other words
of course
on the other hand [on [to] the contrary]
[ 接続詞的表現 ]
and
but [yet]
plus
so
[ 間投詞的表現 ]
ah
huh
look
oh
okay
say
uh
well
why
yes/no
[ レキシカルフレイズ ]
I mean
if anything
if you don't mind
if you like
mind (you)
you know
you know what?
you see
・ 松尾 文子・廣瀬 浩三・西川 眞由美(編著) 『英語談話標識用法辞典 43の基本ディスコース・マーカー』 研究社,2015年.
「#193. 15世紀 Chancery Standard の through の異綴りは14通り」 ([2009-11-06-1]) で紹介した通り,中英語も終わりに近づいた15世紀の公的な文書ですら,綴字にはまだ相当の変異や揺れがあった.14世紀末に始まりかけていた綴字の標準化は,あくまでゆっくりと進行していたのである.An Anthology of Chancery English のグロッサリーを眺めていると,through 以外にも,異綴りの観点からおもしろい単語はいくつもある.目についた3単語 (England, merchant, notwithstanding) を取り上げ,異綴りを鑑賞してみよう.括弧内の数字は頻度である.
England (35), Englande (10), Engeland (7), Englond (28), Englonde (3), Engelond (1), Inglond (6), Ingelond (3), Ingland (1), Yngelond (2), Ynglond (1)
merchant (1), marchant (8), marchaunt (6), merchaunt (4); (pl.) marchauntȝ (10), merchauntȝ (6), marchaunts (4), merchauntes (3), marchantes (3), merchantes (2), marchantȝ (2), merchandes (1), marchandes (1), marchauntes (1), merchantȝ (1)
notwithstanding (3), notwithstondyng(e) (16), natwiþstandyng (6), notwiþstandyng(e) (3), notwiþstanding (2), notwithstonding (1), notwyþstandyng (1), notwythstondyng (1), notwistanding (1), natwithstandyng (1), naughtwithstandinge (1), nogthwithstondyng (1), nottewithstondyng (1), notwythstondyng (1)
国号ですらこれだけ揺れているというのが興味深い.もちろんこの3語は氷山の一角である.他も推して知るべし.
関連して England については「#1145. English と England の名称」 ([2012-06-15-1]) と「#2250. English の語頭母音(字)」 ([2015-06-25-1]) を,notwithstanding については「#5064. notwithstanding」 ([2023-03-09-1]) を参照.
・ Fisher, John H., Malcolm Richardson, and Jane L. Fisher, comps. An Anthology of Chancery English. Knoxville: U of Tennessee P, 1984. 392.
この2日間の記事「#5070. ソーシャルメディアと中英語の綴字のヴァリエーションは酷似している」 ([2023-03-15-1]) と「#5071. ソーシャルメディアは自然言語データの最大の発生源である」 ([2023-03-16-1]) に引き続き,ソーシャルメディアの言語について.今回は同メディアにおける語彙の増加率が著しい件を取り上げる.
Vajjala 他 (296) に「増え続ける語彙」という1節がある(引用中の図の再掲は省略する).
ほとんどの言語では,毎年新しい単語が増えることはほとんどありません.しかし,「ソーシャルの言語」では,非常に早いスピードで語彙が増えています.毎日のように新しい単語が現れるのです.つまり,ソーシャルメディアのテキストを処理する NLP システムは,学習データの語彙に含まれていない大量の新語を扱うことになります.
この問題の深刻さを知るために,図8-5を見てみましょう.これは数年前に行った実験で,大規模なツイートのコーパスを集め,月ごとに新語の数を可視化したものです.この図は,1か月間に見られた新語の割合を前月のデータと比較しています.画像からもわかるように,前月の数字と比較すると,毎月10~15%の新しい単語が増えています.
冒頭の「ほとんどの言語では,毎年新しい単語が増えることはほとんどありません」は正確ではないが,ソーシャルメディアでの語彙増加率として提示されている「10~15%」を信じるならば,それと比較して微々たるものだという主張としては受け入れられそうだ.
自然言語処理のシステムは,このような日々の語彙爆発に対応するために,新単語をひたすら学習し,語彙体系を最新状態に保たなければならない.疲れ知らずの機械とはいえ,処理効率を維持するにあたり,大きな負荷になっているという.自然言語処理のシステムは,そもそも動的に更新されなければならない宿命なのである.
システムの動的性格について,Vajjala 他は別の箇所で次のようにも述べている (398) .
NLP のモデルは,静的なものではありません.本番環境でも頻繁にモデルの更新を求められます.これについてはいくつかの理由があります.本番環境では,以前の学習データとは異なる,より多くの(そしてより新しい)データを得られます.この変化に合わせてモデルを更新しなければ,モデルはすぐに陳腐化してしまい,予測性能は低下するでしょう.また,モデルの予測が間違っている場合について,ユーザーからフィードバックを得られることがあります.その際には,モデルとその特徴を反映し,適宜修正を加える必要があります.いずれの場合も,現行モデルを定期的に再学習して更新し,新しいモデルを本番にデプロイするプロセスを構築する必要があります.
ここまで考察して,これは機械による自然言語処理のシステムに限った話しではなく,まさに人間の言語処理にもそのまま当てはまることだと気づいた.人間も,周囲で生じている言語環境の変化に合わせて常に言語体系を最新状態に更新しているのであり,その点では特に機械と異なるところはない.言語は複雑系 (complex_system) の動的システムであり,動的平衡 (dynamic_equilibrium) を保ちながら機能し続けているのである.
人間の言語知識を再現しようとしている自然言語処理の分野の知見が,むしろ人間の言語知識とは何かという問いに示唆を与えてくれる1例ではないか.
・ Vajjala, Sowmya, Bodhisattwa Majumder, Anuj Gupta, Harshit Surana (著),中山 光樹(訳) 『実践 自然言語処理 --- 実世界 NLP アプリケーション開発のベストプラクティス』 オライリー・ジャパン,2022年.
Vajjala 他の自然言語処理 (nlp) に関する本を読み終えた.機械学習やディープラーニングを含むこの発展著しい分野について,ようやく概要をつかめた気がする.自然言語処理は経験的で帰納的な手法に基づいているが,言語(の知識)とは何かという問題に,新技術の観点から新たな光を当てており,非常にエキサイティングな領域である.
自然言語処理の技術は様々に応用されているが,ソーシャルメディアの言語の分析も注目が集まっている分野の1つだ.Vajjala 他 (289) によると,ソーシャルメディアの言語の質と量を概観する目安として,以下を2020年の統計として挙げている.
量
Twitter の月間アクティヴユーザー数は1億5,200万人,Facebook は25億人
速度
6,000ツイート/秒,57,000投稿/秒 (Facebook)
多様性
トピック,言語,文体,文字体系
さらに,2019年の統計として,様々なソーシャルプラットフォームで1分間に生成されているデータの量が与えられている (290) .主要なものを抜き出して箇条書きする.
・ Google: 380万 検索クエリ数
・ facebook: 100万 ログイン数
・ YouTube: 450万 動画視聴数
・ Google Play/App Store: 390,030 ダウンロードされたアプリ数
・ Instagram: 347,222 スクロール数
・ Twitter: 87,500 ツイートしている人数
・ 電子メール: 1億8,800万 送信されたメール数
・ NETFLIX: 694,444 視聴時間
・ オンラインショップ: 996,956ドル オンライン上での買い物額
これらのデータのすべてが言語データではないにせよ,毎分計り知れない量の言語データが行き交っていることが分かる.もちろんこのようなメディアの外部,例えば日常的な対話などにおいても,交わされている言語データの量は計り知れないほどあることは容易に想像されるが,理論的/現実的にデータを入手し得るという点を考慮すれば「ソーシャルプラットフォームは自然言語データの最大の発生源であることは間違いない」 (290) .
英語史や英語歴史言語学の分野では,言語研究の主戦場となるメディアは現存する資料に刻まれた書き言葉だった.では,現代の共時的な英語(言語)研究の分野では,主戦場となるメディアは何になるのだろう.ソーシャルメディアの話し言葉や書き言葉が有力候補の1つになっていくことは確かである.
・ Vajjala, Sowmya, Bodhisattwa Majumder, Anuj Gupta, Harshit Surana (著),中山 光樹(訳) 『実践 自然言語処理 --- 実世界 NLP アプリケーション開発のベストプラクティス』 オライリー・ジャパン,2022年.
ソーシャルメディアの書き言葉は,省略やタイポが多い.英語でいえば単語の省略の仕方は一通りではなく,いずれの省略綴字が用いられるかは予測できない.自然言語処理 (nlp) においては,このような省略綴字を正規化するなどの前処理が必要となり,なかなか厄介な問題のようだ.
一方,中英語の綴字のヴァリエーションも豊富である.綴り方は一通りではなく,いずれの綴字が用いられるかは,方言ごとに緩い傾向はあるものの,完全には予測できない.中英語を読んだり分析する際には,多様な綴字を「正規化」する必要があり,かなり厄介な問題だ.
両者は,このようにとても似ている."tomorrow" という単語の綴字ヴァリエーションを例に取り,比較してみよう.ソーシャルメディアの例は Vajjala 他 (p. 295) から,中英語の例は MED から取った.
[ ソーシャルメディアからの "tomorrow" の綴字 ]
tmw, tomarrow, 2mrw, tommorw, 2moz, tomorro, tommarrow, tomarro, 2m, tomorrw, tmmrw, tomoz, tommorow, tmrrw, tommarow, 2maro, tmrow, tommoro, tomolo, 2mor, 2moro, 2mara, 2mw, tomaro, tomarow, tomoro, 2morr, 2mro, tmoz, tomo, 2morro, 2mar, 2marrow, tmr, tomz, tmorrow, 2mr, tmo, tmro, tommorrow, tmrw, tmrrow, 2mora, tommrow, tmoro, 2ma, 2morrow, tomrw, tomm, tmrww, 2morow, 2mrrw, tomorow
[ MED からの "tomorrow" の綴字 ]
tōmōrn, tomorne, -moroun(e, -morwen, -morwin, -morewen, -morgen, tomor3en, -moregan, -moreuin, -marewene, -marwen, -marhen, -mar3an, -mar3en, -mær3en, temarwen; tōmōrwe, tomorewe, -moreu, -mor(r)owe, -mor(r)ou, -morou, -moru(e, -mor3e, -marewe, temorwe, tomoruwe, -more3e, -mar3e, -mær3e
もう主旨はお分かりだろう.ソーシャルメディアを対象とする自然言語処理技術の発展は,中英語研究にも有用にちがいない! 笑い話のようでありながら,いや,なかなかおもしろい比較ではないか.
・ Vajjala, Sowmya, Bodhisattwa Majumder, Anuj Gupta, Harshit Surana (著),中山 光樹(訳) 『実践 自然言語処理 --- 実世界 NLP アプリケーション開発のベストプラクティス』 オライリー・ジャパン,2022年.
本日発売の『英語教育』(大修館書店)の4月号に,標記の本について私が執筆した書評が掲載されています (p. 69) .昨年10月に出版された,安藤 聡 『英文学者がつぶやく英語と英国文化をめぐる無駄話』(平凡社)です(本体2,400円+税).英語文化史を中心とした,気軽に読めるエッセイ集です.
本書は,もともと著者が学生向けに書きためた文章がベースになっており,そこに書き下ろし数編を加えてエッセイ集としたものです.第1章「奇妙なイギリス英語の世界」,第2章「一筋縄では行かない発音の話」,第3章「英語で旅する英国」,第4章「英国文化は英語表現に学べ」という章立てで,コラムと合わせて28編のエッセイが収録されています.詳しい目次はこちらよりご確認できます.
英語の雑学的な話題が満載ですが,著者がへりくだってタイトルに含めたような「無駄」話では決してありません.予想される通り英語史に関連する話題も豊富に盛り込まれているので,本ブログをお読みの皆さんにも,楽しく読める一冊となっていると思います.
今回紹介した本と関連して,1ヶ月半程前に「#5025. 最長の英単語をめぐって --- 『英文学者がつぶやく英語と英国文化をめぐる無駄話』より」 ([2023-01-29-1]) という記事も書いています.よろしければそちらもどうぞ.
・ 安藤 聡 『英文学者がつぶやく英語と英国文化をめぐる無駄話』 平凡社,2022年.
・ 堀田 隆一 「書評:安藤 聡(著)『英文学者がつぶやく英語と英国文化をめぐる無駄話』(平凡社)」 『英語教育』(大修館) 2023年4月号,2023年.69頁.
一昨日の3月11日(土)の午後に,JACET中部支部2022年度第2回定例研究会(オンライン)にて講演させていただきました.40名超の方々のご参加を賜わり,ありがとうございました.また,支部長の今井隆夫先生(南山大学)をはじめ,事前準備にご尽力いただいた事務局の先生方に感謝いたします.
講演後の質疑応答のなかで,英語教育において AI といかに付き合っていくべきかという大きな論題が提示されました.DeepL や ChatGPT など昨今の AI の自然言語処理の飛躍的発展を前に,語学教員は一人残らず頭を悩ませていることと思います.私もその一人です.
しかし,今回の講演では,いかにして英語史が英語教育に貢献できるかという点に注目してきたので,この質問に対しても主にそちらの観点からお答えしました.英語史の知識・智恵は AI に負けることはないので動揺するに値しない,というのが私の回答です.
講演でのこの質疑応答について,昨日の Voicy 「英語の語源が身につくラジオ (heldio)」にて取り上げました.「#650. 英語史の知恵が AI に負けない3つの理由」と題して23分ほどお話ししていますので,ぜひお聴きいただければと思います.
講演でも放送でも述べましたが,(英語)教育における英語史活用には3つのレベルがあると考えています.もう少し丁寧に整理する必要がありますが,当面のものをこちらに示します.
1. intra-disciplinary: 語源を用いた語彙学習,綴字と発音の関係,文法変化など
2. inter-disciplinary: 英語教育や英語学との協力,他の科目(歴史,地理,国語,他の外国語)との連動など
3. extra-disciplinary: 言葉に限らず物事の通時的見方を養う,言語の変化・変異・多様性,言語・国籍・民族・性・宗教の inclusion など
理想的には,この3つのレベルすべてに関わるような英語史の話題を選び,それを用いて英語(史)教育を行なっていくのがよいと考えています.
heldio の上記の放送回には多くのコメントが寄せられてきています(こちらのページの下方を参照).新たな議論が展開しており,私自身も思考を促されています.エキサイティングな議論ですので,ぜひ hellog 読者の皆さんも,そちらのコメント欄を通じてこの議論に加わっていただければと思います.
自然言語処理 (nlp) の対象となるほとんどすべてのテキストのソースは,そのまま自然言語処理にフィードするわけにはいかない.適切な「前処理」を施して入力に相応しい形に整えた上でフィードすることが求められる.典型的な前処理としては,Vajjala (52ff) によれば次のようなものがある.それぞれタスクとして難易度の差があり,テキストソースの特徴や施したい処理の目的に応じて,必要なタスクと不要なタスクがあることに注意したい.
・ 文の分割
・ 単語への分割
・ ストップワード (stop word) の除去
・ ステミング
・ 見出し語化
・ 数字・句読点の除去
・ 小文字化
・ テキストの正規化 (text normalization)
・ 言語検出
・ コードミキシング
・ 翻字 (transliteration)
・ 品詞タグ付け
・ 構文解析
・ 共参照解決 (coreference resolution)
・ 関係抽出 (relation extraction)
・ 固有表現認識 (named entity recognition)
昨今は,多くの前処理タスクが,簡単なスクリプトにより,かなりの程度自動化できるようになってきているのでありがたい.ただし,既製の自動化スクリプトの利用はブラックボックスとなりがちなので,例えばコーパスの自作や編纂などをしようと思うのであれば,前処理の基本的な考え方は知っているほうがよいだろう.
・ Vajjala, Sowmya, Bodhisattwa Majumder, Anuj Gupta, Harshit Surana (著),中山 光樹(訳) 『実践 自然言語処理 --- 実世界 NLP アプリケーション開発のベストプラクティス』 オライリー・ジャパン,2022年.
この1週間は hellog でも Voicy 「英語の語源が身につくラジオ (heldio)」でも前置詞 (preposition) に注目する機会がたまたま多く,途中から「前置詞ウィーク」と呼んで発信していました.前置詞にご関心のある方は,ぜひこの数日間の記事や放送回を振り返っていただければと思います..
今日も同じ流れで,意外性のある前置詞として sans を紹介します.without に相当するフランス語の前置詞でフランス語では sans /sɑ̃/ と発音されますが,英語としては綴字通りに /sænz/ と発音されます.フランス語からそのまま取り入れた慣用表現の前置詞句は,例えば sans doute 「疑いもなく」 /sɑ̃ duːt/ のように,フランス語風に発音されますが,そうでない場合には英語化した /sænz/ で発音されます.英語の文脈では,たいてい古風,あるいは冗談めかした connotation で用いられます.例文を挙げてみましょう.
・ Sans teeth, sans eyes, sans taste, sans everything. 「(老いぼれて)歯もなく,目もなく,味もなければ何もなし」(Shakespeare, As You Like It II. vii)
・ a wallet sans cash
・ There were no potatoes so we had fish and chips sans the chips.
・ He came to the door sans shirt.
・ She went to the party sans her husband.
・ She would not be happy with people seeing her sans makeup.
・ He was wearing running shoes, sans socks.
こうしてみると,なかなか使ってみたくなる前置詞ですね.
OED の sans, prep. によると,英語での初出は初期近代英語の Kyng Alisaunder です.
c1300 K. Alis. 134 Of gold he made a table Al ful of steorren, saun fable.
ただし,Shakespeare 以前の用法はいずれも目的語としてフランス単語を伴っており,いわばフランス語の慣用表現をそのまま英語に取り込んだもののようです (ex. sans delay, sans doubt, sans fable, sans pity, sans return).英語において生産的な前置詞として発達したのは,かの言葉遊びの天才がユーモアを交えて再導入したからといってよさそうです.
私の直接の専門からはほど遠いが,今をときめく言語に関する分野の1つに自然言語処理 (Natural Language Processing) がある.これ自体がとてつもなく広い領域を扱うし,来たるべきAI時代にあっては応用範囲も無限大だろう.コンピュータ・サイエンス,AI,機械学習,ディープ・ラーニングなどとも関連をもつ,この分野の本を読み出している.
私の専攻する英語史や歴史言語学の分野では,どのような話題が自然言語処理と関係してきただろうかと問うてみると,おおよそコーパス周りの技術だろう.正規化,レマ化,品詞タグ付け,コンコーダンスなど自然言語処理のタスクのなかでは最も基本的な部類に入るタスクだ.より直接的には,近代英語より前の時代のスペリングの正規化・標準化などの問題に関心がある.
入門書によれば,自然言語処理の基本タスクには様々なものがある.Vajjala 他の pp. 6--7 には,主要なものが列挙されている.
言語モデル
言語モデルは,単語の履歴に基づいて,次の単語を予測するタスクです.このタスクの目標は,ある言語における単語系列の出現確率を学習することです.言語モデルは,音声認識,光学式文字認識,手書き文字認識,機械翻訳,スペル修正など,幅広い問題のソリューションを構築するのに役立ちます.
テキスト分類
テキスト分類は,テキストをその内容に基づいて,事前に定義したカテゴリへ分類するタスクです.テキスト分類は NLP でもっとも一般的なタスクであり,電子メールのスパム識別からセンチメント分析まで,さまざまなツールで使われています.
情報抽出
情報抽出は,その名が示すように,テキストから関連情報を抽出するタスクです.たとえば,電子メールから予定を抽出したり,ソーシャルメディアの投稿で言及されている人名などの抽出に使えます.
情報検索
情報検索は,ユーザーのクエリに関連する文書を大規模な文書集合から検索するタスクです.よく知られたユースケースとして,Google 検索があります.
会話エージェント
会話エージェントは,自然言語での会話が可能な対話システムを構築するタスクです.よく知られたアプリケーションとして,Alexa や Siri があります.
テキスト要約
テキスト要約は,テキストの主な事柄と全体的な意味を維持しながら,元のテキストより短い要約を作成するタスクです.
質問応答
質問応答は,自然言語で尋ねられた質問に自動的に回答できるシステムを構築するタスクです.
機械翻訳
機械翻訳は,テキストをある言語から別の言語に変換するタスクです.よく知られたアプリケーションとして,Google 翻訳があります.
トピックモデル
トピックモデルは,大規模な文書集合のトピック構造を明らかにするタスクです.トピックモデルはテキストマイニングツールとしてよく使われており,文学からバイオインフォマティクスまで,幅広い分野で使われています.
自然言語処理は実用的なタスクをこなすための技術だが,そのベースには当然ながら言語学の知見が多く含まれている.そこから再出発して,自然言語処理の技術によって可能となった問題解決の手法が,いかにして英語史や歴史言語学の学術的問題に適用され得るのか.この辺りを考察していくことが,今後エキサイティングな課題となりそうだ.
・ Vajjala, Sowmya, Bodhisattwa Majumder, Anuj Gupta, Harshit Surana (著),中山 光樹(訳) 『実践 自然言語処理 --- 実世界 NLP アプリケーション開発のベストプラクティス』 オライリー・ジャパン,2022年.
昨日の記事「#5063. 前置詞は名詞句以外の補文を取れるし「後置詞」にすらなり得る」 ([2023-03-08-1]) で取り上げた前置詞 notwithstanding 「~にもかかわらず」について,もう少し掘り下げてみたい.前置詞 (preposition) でありながら目的語の後に置かれることもあるという変わり種だ.notwithstanding + NP と NP + notwithstanding の例文を各々挙げてみよう.
・ Notwithstanding some members' objections, I think we must go ahead with the plan.
・ Notwithstanding his love of luxury, his house was simple inside.
・ They started notwithstanding the bad weather.
・ His relations with colleagues, differences of opinion notwithstanding, were unfailingly friendly.
・ Injuries notwithstanding, he won the semi-final match.
・ She is an intolerable person, her excellent work notwithstanding.
意味としては,in spite of や despite が積極的で強めの反対を含意するのに対し,notwithstanding は障害があることを暗示する程度で弱い.また,格式張った響きをもつ.
副詞として Notwithstanding, the problem is a significant one. のように単体で用いられるほか,接続詞として I went notwithstanding (that) he told me not to. のような使い方もある.
OED によると,この単語は1400年頃に初出し,アングロノルマン語や古フランス語の non obstant,あるいは古典時代以降のラテン語の non obstante のなぞりとされる.要するに,現在分詞の独立分詞構文として「○○が障害となるわけではなく」ほどを意味した慣用表現が,文法化 (grammaticalisation) し前置詞として独り立ちしたという経緯である.この前置詞の目的語は,由来としてはもとの分詞構文の主語に相当するために,前に置かれることもあるというわけだ.
前置詞のほか,副詞,接続詞としての用法も当初から現われている.いくつか例を挙げてみよう.
・ c1400 Bk. to Mother (Bodl.) 113 (MED) And ȝut notwiþstondinge al þis..religiouse men and wommen trauelen..to make hem semliche to cursed proude folk.
・ 1490 W. Caxton tr. Eneydos vi. 23 This notwystondyng, alwaye they be in awayte.
・ c1425 J. Lydgate Troyyes Bk. (Augustus A.iv) iv. 5474 Not-wiþstondynge þat he trouþe ment, ȝit for a worde he to exile went.
・ ?a1425 tr. Catherine of Siena Orcherd of Syon (Harl.) (1966) 22 (MED) Which synne worþily askide and disceruede a peyne þat schulde haue noon eende, notwiþstondynge þe deede of synne had eende.
・ 1425 Rolls of Parl. IV. 274/1 Which proves notwithstondyng, yat hie and myghti Prince my Lord of Glouc'..and your oyer Lordes..will not take upon hem declaration for my said place.
なお,問題の前置詞のもととなる動詞 withstand の接頭辞 with は,現在普通の「~といっしょに」の意味ではなく,古い「~に対抗して」ほどの意味を表わしている.
昨日の記事「#5062. 前置詞の伝統的な定義」によれば,前置詞 (preposition) は名詞あるいは代名詞を支配するものとされる.より正確には,名詞句 (noun phrase) を支配するといっておくのがよいだろうか.しかし,実際には典型的な前置詞とみられる語の後ろに,一見したところ名詞句ではない別のものが続くケースも少なくない.例えば,Huddleston and Pullum (599) より4つの例を挙げよう.
i The magician emerged [from behind the curtain]. [PP]
ii I didn't know about it [until recently]. [AdvP]
iii We can't agree [on whether we should call in the police]. [interrogative clause]
iv They took me [for dead]. [AdjP]
それぞれ前置詞の後に,別の前置詞句,副詞句, 疑問節,形容詞句が続いている例となっているが,このような例は珍しくない.ただし,前置詞が一般にこれらの異なる補文を取り得るというわけではない.前置詞ごとに,どのような補文を取れるかが決まっている,ということである.例えば until は副詞句を支配することができるが,疑問節は支配できない.逆に on は副詞句を支配できないが,疑問節は取れる.ちょうど個々の動詞によって支配できる補文のタイプが決まっているのと同じことである.
また,伝統的な定義によれば,前置詞は補文の前に置かれるものである(だからこそ「前置」詞と呼ばれる).しかし,一部の前置詞については補文の後に置かれることがあり,その限りにおいては「後置」詞とすら呼べるのである.Huddleston and Pullum (631) より,notwithstanding と apart/aside (from) が異なる語順で用いられている例文を挙げよう.
i a. [Notwithstanding these objections,] they passed ahead with their proposal.
i b. [These objections notwithstanding,] they passed ahead with their proposal.
ii a. [Apart/Aside from this,] he performed very creditably.
ii b. [This apart/aside,] he performed very creditably.
前置詞を議論する場合には,今回挙げたような,らしくない振る舞いをする前置詞(の用法)にも注意する必要がある.関連して heldio 「#133. 前置詞ならぬ後置詞の存在」も参照.
・ Huddleston, Rodney and Geoffrey K. Pullum, eds. The Cambridge Grammar of the English Language. Cambridge: CUP, 2002.
一昨日に公開された YouTube 「井上逸兵・堀田隆一英語学言語学チャンネル」の最新回は「#107. 英語に前置詞はなぜこんなに多いのか?」です.現代英語には前置詞が194種類もあるのですが,古英語では30種類ほどでした.英語の歴史に何が起こり,前置詞がここまで増えてしまったのでしょうか.12分ほどの動画です.どうぞご視聴ください.
今回の動画と関連して,以下の関連する hellog 記事や heldio 放送もご参照ください.
・ hellog 「#30. 古英語の前置詞と格」 ([2009-05-28-1])
・ hellog 「#947. 現代英語の前置詞一覧」 ([2011-11-30-1])
・ hellog 「#1201. 後期中英語から初期近代英語にかけての前置詞の爆発」 ([2012-08-10-1])
・ hellog 「#4190. 借用要素を含む前置詞は少なくない」 ([2020-10-16-1])
・ heldio 「#133. 前置詞ならぬ後置詞の存在」
・ heldio 「#260. 英語史を通じて前置詞はどんどん増えてきた」
・ heldio 「#343. 前置詞とは何?なぜこんなにいろいろあるの?」
・ heldio 「#374. ラテン語から借用された前置詞 per, plus, via」
そもそも前置詞 (preposition) とは何なのでしょうか.現代英語の前置詞の伝統的な定義・解説を Huddleston and Pullum (598) より引用しましょう.
The general definition of a preposition in traditional grammar is that it is a word that governs, and normally precedes, a noun or pronoun and which expresses the latter's relation to another word. 'Govern' here indicates that the preposition determines the case of the noun or pronoun (in some languages, certain prepositions govern an accusative, others a dative, and so on). In English, those pronouns that have different (non-genitive) case forms almost invariably appear in the accusative after prepositions, so the issue of case government is of less importance, and many definitions omit it.
ただし,この伝統的な定義よりも広く前置詞をとらえる立場もあり,前置詞とは何かという問いは思いのほか容易ではありません.194種類あるとはいえ,あくまで小さな語類ではありますが,なかなか奥の深い品詞です.
・ Huddleston, Rodney and Geoffrey K. Pullum, eds. The Cambridge Grammar of the English Language. Cambridge: CUP, 2002.
今年度,私の英語史ゼミから7本の卒業論文と1本の修士論文が提出されました.先日,論文面接と論文発表会の機会を持ちましたが,研究成果に基づき,実りのあるディスカッションを楽しむことができました.以下に各々の題目を紹介します.ゼミの雰囲気がつかめるかと思います.
[ 卒業論文 ]
・ How Dialects are Used in Disney Movies: Trends of the Dialect Application in Disney Movies from 1940s--2020s
・ Belonging and Representation of LGBTQ People
・ The Transition of British Standard English --- The Shifting Status of Received Pronunciation and the Rise of Estuary English
・ "Make America Great Again" and Its Extended Use: A Corpus-Based Study of Donald Trump's Presidential Election Slogan and Its Parodies
・ The Lexical Erosion of American English on British English in Note Value Expressions
・ if it were not for or were it not for?: A Corpus-Based Study on Subjective Inversions
・ The Meaning Shift of "better" as a Colloquial Expression Compared with "had better": A Study Based on Both Corpus and Video Productions
[ 修士論文 ]
・ Variation between OV and VO in Subordinate Clauses in The Peterborough Chronicle
英語史ゼミといっても,現代英語のテーマが多いのは例年の通りです.古い英語を扱うばかりが英語史ではなく,むしろポイントは歴史的・通時的な視点が含まれているかどうかです.ゼミとしては社会言語学の視点も重視しています.今年度については,多くの研究が英語史や社会言語学の視点を内包していたと思います.昨今の英語史研究のトレンドを反映して社会寄りのテーマが多かったですが,伝統的な語彙や文法のテーマも健在でした.来年度はどんな卒論・修論が提出されてくるでしょうか.
過年度のゼミ卒業論文の題目についてはこちらの記事セットあるいは sotsuron をどうぞ.英語史分野のテーマ探しのヒントにもなるはずです.khelf ホームページより「研究テーマ紹介」も役立つと思います.
昨日3月4日,朝日カルチャーセンター新宿教室にて,シリーズ講座「英語の歴史と世界英語」の最終回となる「21世紀の英語のゆくえ」を対面・オンラインでお話ししました.これにて,昨年6月に始まった全4回にわたるシリーズが終了となりました.毎回質問を寄せ議論を盛り上げてくださったご出席の方々には,感謝申し上げます.ありがとうございました.
改めてシリーズ全体の趣旨を振り返ります.以下を掲げていました.
英語は現代世界において最も有力な言語です.しかし,英語の世界的拡大の結果,通常私たちが学んでいる「標準英語」以外にも様々な英語が発達しており,近年はその総体を「世界(諸)英語」 "World Englishes" と呼ぶことが増えてきました.
この全4回のシリーズでは,世界英語とは何か,英語はいかにしてここまで拡大したのか,英語の方言の起源はどこにあるのか,そして今後の英語はどうなっていくのかといった問題に英語の歴史という視点から迫ります.
目下,世界は急速に変化しています.このような現代世界において人と人をつなぐリンガ・フランカである英語と,私たちは今後どのように付き合っていけばよいのか.英語史の観点から世界英語に迫った今回のシリーズ講座は,この問題を考える糧となったはずです.
世界英語 (world_englishes) については,本ブログや Voicy 「英語の語源が身につくラジオ (heldio)」でも関連する話題を多くお届けてしてきました.以下では,とりわけ講座と併走しつつ提供してきた記事・放送回を列挙します.復習などに役立てていただければ幸いです.
なお,来年度は同じ朝日カルチャーセンター新宿教室にて新シリーズ「文字と綴字の英語史」を開始します.こちらについての詳細は近日中に改めてご案内致します.どうぞお楽しみに.
[ 第1回 世界英語入門 (2022年6月11日)]
・ hellog 「#4775. 講座「英語の歴史と世界英語 --- 世界英語入門」のシリーズが始まります」 ([2022-05-24-1])
・ heldio 「#356. 世界英語入門 --- 朝カル新宿教室で「英語の歴史と世界英語」のシリーズが始まります」
・ heldio 「#378. 朝カルで「世界英語入門」を開講しました!」
[ 第2回 いかにして英語は拡大したのか (2022年8月6日)]
・ hellog 「#4813. 朝カル講座の第2回「英語の歴史と世界英語 --- いかにして英語は拡大したのか」のご案内」 ([2022-07-01-1])
・ heldio 「#393. 朝カル講座の第2回「英語の歴史と世界英語 --- いかにして英語は拡大したのか」」
[ 第3回 英米の英語方言 (2022年10月1日)]
・ hellog 「#4875. 朝カル講座の第3回「英語の歴史と世界英語 --- 英米の英語方言」のご案内」 ([2022-09-01-1])
・ heldio 「#454. 朝カル講座の第3回「英語の歴史と世界英語 --- 英米の英語方言」」
[ 第4回 21世紀の英語のゆくえ (2022年3月4日)]
・ hellog 「#4954. 朝カル講座の第4回(最終回)「英語の歴史と世界英語 --- 21世紀の英語のゆくえ」のご案内」 ([2022-11-19-1])
・ hellog 「#5048. heldio で朝カル講座の第4回(最終回)「英語の歴史と世界英語 --- 21世紀の英語のゆくえ」の予告編をお届けしています」 ([2023-02-21-1])
・ heldio 「#630. 世界英語の ENL, ESL, EFL モデルはもう古い? --- 3月4日,朝カル新宿教室で「英語の歴史と世界英語」のシリーズが完結します」
昨日3月3日の午後「英語史クイズ」を開催しました.先日よりお知らせしていたように本来は heldio 生放送としてお届けする予定でしたが,収録機器の不具合などにより何度試みてもうまくいかず,生放送は断念しました.お待ちいただいていたリスナーの皆さんには,ご迷惑をおかけしました.
「英語史クイズ」の収録自体は成功しましたので,今朝の Voicy 「英語の語源が身につくラジオ (heldio)」の通常回として配信しています.「#642. heldio 初の「英語史クイズ」」よりお聴きください.1時間ほどの長丁場ですので,お時間のあるときに楽しんでいただければと.
今回の「英語史クイズ」イベントは,専修大学,熊本学園大学,khelf(慶應英語史フォーラム)の3大学合同の企画・主催でした.昨日は朝から夕方まで40名ほどが対面・オンラインにて集い「英語史フェス」(春の英語史合宿)を開いていました.そのうちの1セッションである「英語史クイズ」を,今回一般公開とした次第です.
英語史クイズの出題・解説には,heldio の「千本ノック」 (senbonknock) でお馴染みの菊地翔太先生(専修大学),矢冨弘先生(熊本学園大学),khelf 会長のまさにゃんの3名に加え,高橋佑宜先生(名古屋外国語大学)にもご協力いただきました.そして,解答者の学生たちにもおおいに盛り上げてもらいました.
一見すると英語史らしからぬ,意表を突いた出題もありましたが,いえいえ,すべて英語史に関わる話題です.英語史の幅広さと魅力が伝わるイベントとなったと思います.いずれまたこのメンバーで英語史クイズの第2弾,あるいは類似のイベントを企画できればと.
昨日の記事「#5057. because の語源と歴史的な用法」 ([2023-03-02-1]) で,この日常的な接続詞を歴史的に掘り下げた.もともとは節を導くために that の支えが必要であり,because that として用いられたが,14世紀末までには that が省略され,現代風に because 単体で接続詞として用いられる例も出てきた.しかし,その後も近代英語期まで because that が並行していたことに注意を要する.
さて,because は意味機能としては「理由・原因」を表わすと解されているが,「目的」を表わす例も歴史的にはあった.昨日の記事の最後に「because + to 不定詞」の構造に触れたが,その意味機能は「目的」だった.理由・原因と目的は意味的に関連が深く,例えば前置詞 for は両方を表わすことができるわけなので,because に両用法があること自体はさほど驚くべきことではない.しかし,because の場合には,当初可能だった目的の用法が,歴史の過程で廃されたという点が興味深い(ただし方言には残っている).
OED によると,because, adv., conj., n. の接続詞としての第2語義の下に,(廃用となった)目的を表わす15--17世紀からの例文が4つ挙げられている.
†2. With the purpose that, to the end that, in order that, so that, that. Obsolete. (Common dialect.)
1485 W. Caxton tr. Paris & Vienne (1957) 31 Tolde to hys fader..by cause he shold..doo that, whyche he wold requyre hym.
1526 Bible (Tyndale) Matt. xii. f. xvv They axed hym..because [other versions 'that'] they myght acuse him.
1628 R. Burton Anat. Melancholy (ed. 3) iii. ii. iii. 482 Annointing the doores and hinges with oile, because they shall not creake.
1656 H. More Antidote Atheism (1712) ii. ix. 67 The reason why Birds are Oviparous is because there might be more plenty of them.
問題の because 節中にはいずれも法助動詞が用いられており,目的の読みを促していることが分かる.
現代に至る過程で because は理由・原因のみを表わすことになり,目的は他の方法,例えば (so) that などで表わされることが一般的となった.冒頭で述べたように,もともと形式としては because that から始まったとすると,that を取り除いた because が理由・原因に特化し,because を取り除いた that が目的に特化したとみることもできるかもしれない.
ちなみに18世紀の規範文法家 Lowth は目的用法の because の使用に注意を促している.「#3036. Lowth の禁じた語法・用法」 ([2017-08-19-1]) を参照.
理由を表わす副詞節を導く because は英語学習の早い段階で学ぶ,きわめて日常的で高頻度の語である.しかし,身近すぎて特別な感情も湧いてこない表現にこそ,おもしろい歴史が隠れていることが少なくない.
because を分解すると by + cause となる.前者は古英語から続く古い前置詞であり,後者はフランス語からの借用語である.もともとは2語からなる前置詞句だったが,それが形式的にも機能的にも合一したのがこの単語である.その観点からすると,1種の混成語 (blend) とみてよい.
以下 OED を参照して,because の来歴を紹介しよう.この語の英語での初出は14世紀初めのことである.Bi cause whi (= "because why") のように用いられているのがおもしろい.
c1305 Deo Gratias 37 in Early Eng. Poems & Lives Saints (1862) 125 Þou hast herd al my deuyse, Bi cause whi, hit is clerkes wise.
ほかに because that のように that を接続詞マーカーとして余剰的に用いる例も,後期近代英語から初期近代英語にかけて数多くみられる(「#2314. 従属接続詞を作る虚辞としての that」 ([2015-08-28-1])).そもそも cause は名詞にすぎないので,節を導くためには同格の that の支えが必要なのである.because that の例を3つ挙げよう.
・ c1405 (c1395) G. Chaucer Franklin's Tale (Hengwrt) (2003) l. 253 By cause that he was hir neghebour.
・ 1611 Bible (King James) John vii. 39 The Holy Ghost was not yet giuen; because that Iesus was not yet glorified.
・ 1822 Ld. Byron Heaven & Earth i. iii, in Liberal 1 190 I abhor death, because that thou must die.
接続詞としての because は定義上後ろに節が続くが,現代にも残る because of として句を導く用法も早く14世紀半ばから文証される.初例は Wyclif からである.
1356 J. Wyclif Last Age Ch. (1840) 31 Þe synnes bi cause of whiche suche persecucioun schal be in Goddis Chirche.
もう1つ興味深いのは,because の後ろに to 不定詞が続く構造である.現代では残っていない構造だが,16世紀より2例が挙げられている.意味が「理由」ではなく「目的」だったというのもおもしろい.
・ 1523 Ld. Berners tr. J. Froissart Cronycles I. ccxxxix. 346 Bycause to gyue ensample to his subgettes..he caused the..erle of Auser to be putte in prison.
・ 1546 T. Langley tr. P. Vergil Abridgem. Notable Worke i. xv. 28 a Arithmetike was imagyned by the Phenicians, because to vtter theyr Merchaundyse.
because はさらに歴史的に深掘りしていけそうな単語である.これまでも以下の記事でこの単語に触れてきたので,ご参照を.
・ 「#1542. 接続詞としての for」 ([2013-07-17-1])
・ 「#1744. 2013年の英語流行語大賞」 ([2014-02-04-1])
・ 「#2314. 従属接続詞を作る虚辞的な that」 ([2015-08-28-1])
・ 「#3036. Lowth の禁じた語法・用法」 ([2017-08-19-1])
・ 「#4569. because が表わす3種の理由」 ([2021-10-30-1])
今日から3月ですね.三寒四温ですが,だいぶん春めいてきた感があります.今月も「hel活」に力を入れていきたいと思います (cf. 「#5054. もろもろ「hel活」しています --- Voicy heldio, note, インスタ,YouTube,『英語史新聞』, Mond,著書」 ([2023-02-27-1])) .
3月のhel活の第1弾は,明後日3月3日(金)の15:40--16:40に,Voicy 「英語の語源が身につくラジオ (heldio)」で生放送でお届けする予定の「英語史クイズ」 (helquiz) です.初企画ということで,どういうことになるか,やってみないと分からないのですが,すでに生放送を予約しました.当日の予定時刻が近づきましたらこちらよりお聴きください.
今回の「英語史クイズ」企画は,専修大学,熊本学園大学,khelf(慶應英語史フォーラム)の3大学合同による主催となります.heldio の「千本ノック」 (senbonknock) でお馴染みの菊地翔太先生(専修大学),矢冨弘先生(熊本学園大学),khelf 会長のまさにゃん,その他の英語史研究者が出題者となり,その場に居合わせている(予定の)数十名の学生とともにワイワイ楽しく英語史する,というイベントです.もちろん答え合わせと解説も付いています.ぜひ音声配信を通じて,皆さんとイベントの雰囲気を共有できればと思います.
過去の「イベント×生放送」の雰囲気を知っていただくために,「千本ノック」やその他の回がお薦めです.「#5050. 2022年度の khelf 活動の振り返り」 ([2023-02-23-1]) の末尾のリンクよりお聴きいただければと思います.
なお今回の生放送の模様は翌朝アーカイヴとしても配信する予定ですので,ライヴ時間には都合がつかない,聴きそびれたという方もご安心ください.
それでは皆さん,3月も実りある英語史ライフを!
2024 : 01 02 03 04 05 06 07 08 09 10 11 12
2023 : 01 02 03 04 05 06 07 08 09 10 11 12
2022 : 01 02 03 04 05 06 07 08 09 10 11 12
2021 : 01 02 03 04 05 06 07 08 09 10 11 12
2020 : 01 02 03 04 05 06 07 08 09 10 11 12
2019 : 01 02 03 04 05 06 07 08 09 10 11 12
2018 : 01 02 03 04 05 06 07 08 09 10 11 12
2017 : 01 02 03 04 05 06 07 08 09 10 11 12
2016 : 01 02 03 04 05 06 07 08 09 10 11 12
2015 : 01 02 03 04 05 06 07 08 09 10 11 12
2014 : 01 02 03 04 05 06 07 08 09 10 11 12
2013 : 01 02 03 04 05 06 07 08 09 10 11 12
2012 : 01 02 03 04 05 06 07 08 09 10 11 12
2011 : 01 02 03 04 05 06 07 08 09 10 11 12
2010 : 01 02 03 04 05 06 07 08 09 10 11 12
2009 : 01 02 03 04 05 06 07 08 09 10 11 12
最終更新時間: 2024-11-21 08:03
Powered by WinChalow1.0rc4 based on chalow