hellog〜英語史ブログ     ChangeLog 最新     カテゴリ最新     前ページ 1 2 3 4 5 6 7 8 9 10 11 12 次ページ / page 9 (12)

japanese - hellog〜英語史ブログ

最終更新時間: 2024-04-22 09:31

2014-06-04 Wed

#1864. ら抜き言葉と頻度効果 [frequency][lexical_diffusion][japanese][ranuki][japanese]

 言語変化における項目の頻度 (frequency) の役割について,frequency の各記事,とりわけ「#694. 高頻度語と不規則複数」 ([2011-03-22-1]),「#1091. 言語の余剰性,頻度,費用」 ([2012-04-22-1]),「#1239. Frequency Actuation Hypothesis」 ([2012-09-17-1]),「#1242. -ate 動詞の強勢移行」 ([2012-09-20-1]),「#1243. 語の頻度を考慮する通時的研究のために」 ([2012-09-21-1]),「#1265. 語の頻度と音韻変化の順序の関係に気づいていた Schuchardt」 ([2012-10-13-1]),「#1286. 形態音韻変化の異なる2種類の動機づけ」 ([2012-11-03-1]),「#1287. 動詞の強弱移行と頻度」 ([2012-11-04-1]) で様々に議論してきた.
 理論的な扱いとしては Phillips による「#1239. Frequency Actuation Hypothesis」 ([2012-09-17-1]) に関心を抱いているが,先日,現代日本語(東京共通語)のら抜き言葉 (innovative potential) の拡散を頻度の観点から調査した論文を見つけ,そこで提起されている "Revised Frequency Hypothesis of Analogical Leveling (RFH)" に目を引かれた.
 その論文で,著者の Matsuda はこれまでに指摘されてきた様々な言語学的,社会言語学的,文体的な要因がいかに関与的かを量的に明らかにしようとした.考慮されている変数は以下の通りである (12) .

I. Linguistic
   1. Length of the stem [measured in mora]
   2. Conjugation type of the verb: i-stem/e-stem
   3. Conjugation form following the potential suffix: Negative/Others
   4. Morphological structure of the preceding stem: Monomorphemic verb/Compound verb/Auxiliary verb/Causative verb
   5. Type of clause in which the potential form is embedded:
      Main clause
      Semi-embedded clause (Adverbial clause/Gerund)
      Embedded clause (Quote/Relative clause/Predicate complement clause/Noun complement clause)
II. Social
   1. Age
   2. Sex
   3. Area of residence: Uptown/Downtown
III. Style (taken from Labov & Sankoff, 1988)
   Casual (narrative, group, kids, tangent)
   Careful (response, language, soapbox, careful)


 Matsuda はこれらの変数(の組み合わせ)の効き目を量的に確かめていき,概ね各々がら抜き言葉の革新に関与的であることを示したが,Sex や Area of residence など有意差の出ない変数もあった.そして,これらの分析のあとで,従来の研究では考慮されてこなかった頻度という変数を導入した.Matsuda は,頻度効果というものを考えようとするときに,いったい何の頻度を考慮すればよいのかという本質的な問題に言及している.例えば mirare(ru)/mire(ru) (見られ(る)/見れ(る))の場合には,語幹 mir- の頻度を数えるべきのか,あるいは問題の接辞 -are/-e の頻度を数えるべきなのか.前者であれば,mir- のトークン頻度とタイプ頻度のどちらを問題にすべきなのか.英語の drive--drove など不規則変化動詞に見られる屈折現象を頻度の観点から分析する場合には,屈折した語形そのものの頻度を問題にすればよさそうだが,膠着的な日本語の mir-e(-ru) (見れ(る))の場合には,どの形態素の頻度を数えればよいのだろうか.
 以上のような考察を経て,Matsuda は屈折型と膠着型とでは考慮すべき頻度の単位が異なっているのではないかという仮説を唱える.これが上述の "Revised Frequency Hypothesis of Analogical Leveling (RFH)" (24) である.

In analogical leveling, the token frequency of the unit undergoing the leveling and its degree/rate of leveling tend to show an inverse correlation, where the "unit" is defined according to the degree of fusion of the form undergoing the leveling with its neighboring morpheme(s). If the form is highly fused with the neighboring morpheme, the whole (morpheme, form) combination counts as a "unit" whose frequency is to be measured. If it is not, the form alone counts as a "unit," and its own frequency suffices as a correlate of the rate of leveling.


 この仮説を採用すれば,今回のら抜き言葉の調査の結果が無理なく解釈できるという.つまり,ら抜き言葉の拡散に対して(反比例的に)関与的な頻度とは,問題の可能を表わす接辞 -are/-e それ自体のトークン頻度であり,前接する動詞語幹のトークン頻度やタイプ頻度ではない,と.
 おもしろい仮説のようにも思えるが,素朴な疑問として,頻度の低い接辞だからといって,なぜそれ自身の水平化(ら抜き化)が進むことになるのだろうか.-are にしても -e にしても頻度が低いのであれば,なぜ前者が後者に置換されてゆくことになるのだろうか.

 ・ Matsuda, Kenjiro. "Dissecting Analogical Leveling Quantitatively: The Case of the Innovative Potential Suffix in Tokyo Japanese." Language Variation and Change 5 (1993): 1--34.

[ 固定リンク | 印刷用ページ ]

2014-06-04 Wed

#1864. ら抜き言葉と頻度効果 [frequency][lexical_diffusion][japanese][ranuki][japanese]

 言語変化における項目の頻度 (frequency) の役割について,frequency の各記事,とりわけ「#694. 高頻度語と不規則複数」 ([2011-03-22-1]),「#1091. 言語の余剰性,頻度,費用」 ([2012-04-22-1]),「#1239. Frequency Actuation Hypothesis」 ([2012-09-17-1]),「#1242. -ate 動詞の強勢移行」 ([2012-09-20-1]),「#1243. 語の頻度を考慮する通時的研究のために」 ([2012-09-21-1]),「#1265. 語の頻度と音韻変化の順序の関係に気づいていた Schuchardt」 ([2012-10-13-1]),「#1286. 形態音韻変化の異なる2種類の動機づけ」 ([2012-11-03-1]),「#1287. 動詞の強弱移行と頻度」 ([2012-11-04-1]) で様々に議論してきた.
 理論的な扱いとしては Phillips による「#1239. Frequency Actuation Hypothesis」 ([2012-09-17-1]) に関心を抱いているが,先日,現代日本語(東京共通語)のら抜き言葉 (innovative potential) の拡散を頻度の観点から調査した論文を見つけ,そこで提起されている "Revised Frequency Hypothesis of Analogical Leveling (RFH)" に目を引かれた.
 その論文で,著者の Matsuda はこれまでに指摘されてきた様々な言語学的,社会言語学的,文体的な要因がいかに関与的かを量的に明らかにしようとした.考慮されている変数は以下の通りである (12) .

I. Linguistic
   1. Length of the stem [measured in mora]
   2. Conjugation type of the verb: i-stem/e-stem
   3. Conjugation form following the potential suffix: Negative/Others
   4. Morphological structure of the preceding stem: Monomorphemic verb/Compound verb/Auxiliary verb/Causative verb
   5. Type of clause in which the potential form is embedded:
      Main clause
      Semi-embedded clause (Adverbial clause/Gerund)
      Embedded clause (Quote/Relative clause/Predicate complement clause/Noun complement clause)
II. Social
   1. Age
   2. Sex
   3. Area of residence: Uptown/Downtown
III. Style (taken from Labov & Sankoff, 1988)
   Casual (narrative, group, kids, tangent)
   Careful (response, language, soapbox, careful)


 Matsuda はこれらの変数(の組み合わせ)の効き目を量的に確かめていき,概ね各々がら抜き言葉の革新に関与的であることを示したが,Sex や Area of residence など有意差の出ない変数もあった.そして,これらの分析のあとで,従来の研究では考慮されてこなかった頻度という変数を導入した.Matsuda は,頻度効果というものを考えようとするときに,いったい何の頻度を考慮すればよいのかという本質的な問題に言及している.例えば mirare(ru)/mire(ru) (見られ(る)/見れ(る))の場合には,語幹 mir- の頻度を数えるべきのか,あるいは問題の接辞 -are/-e の頻度を数えるべきなのか.前者であれば,mir- のトークン頻度とタイプ頻度のどちらを問題にすべきなのか.英語の drive--drove など不規則変化動詞に見られる屈折現象を頻度の観点から分析する場合には,屈折した語形そのものの頻度を問題にすればよさそうだが,膠着的な日本語の mir-e(-ru) (見れ(る))の場合には,どの形態素の頻度を数えればよいのだろうか.
 以上のような考察を経て,Matsuda は屈折型と膠着型とでは考慮すべき頻度の単位が異なっているのではないかという仮説を唱える.これが上述の "Revised Frequency Hypothesis of Analogical Leveling (RFH)" (24) である.

In analogical leveling, the token frequency of the unit undergoing the leveling and its degree/rate of leveling tend to show an inverse correlation, where the "unit" is defined according to the degree of fusion of the form undergoing the leveling with its neighboring morpheme(s). If the form is highly fused with the neighboring morpheme, the whole (morpheme, form) combination counts as a "unit" whose frequency is to be measured. If it is not, the form alone counts as a "unit," and its own frequency suffices as a correlate of the rate of leveling.


 この仮説を採用すれば,今回のら抜き言葉の調査の結果が無理なく解釈できるという.つまり,ら抜き言葉の拡散に対して(反比例的に)関与的な頻度とは,問題の可能を表わす接辞 -are/-e それ自体のトークン頻度であり,前接する動詞語幹のトークン頻度やタイプ頻度ではない,と.
 おもしろい仮説のようにも思えるが,素朴な疑問として,頻度の低い接辞だからといって,なぜそれ自身の水平化(ら抜き化)が進むことになるのだろうか.-are にしても -e にしても頻度が低いのであれば,なぜ前者が後者に置換されてゆくことになるのだろうか.

 ・ Matsuda, Kenjiro. "Dissecting Analogical Leveling Quantitatively: The Case of the Innovative Potential Suffix in Tokyo Japanese." Language Variation and Change 5 (1993): 1--34.

[ 固定リンク | 印刷用ページ ]

2014-05-07 Wed

#1836. viz. と「流石」 [latin][grapheme][grammatology][japanese][kanji][spelling_pronunciation_gap]

 昨日の記事「#1835. viz.」 ([2014-05-06-1]) に引き続き,英語で namely と読み下す viz. について.今回は,文字論の立場から論じる.
 英語において viz. と表記される語の構成要素である3文字(省略を表わす period を除く)は,当然ながらいずれもアルファベット文字(=表音文字)である.しかし,個々の文字で考えても,3文字が合わさった全体で考えても,まるで /neɪmli/ の発音を示唆するところがない.<viz.> はこの点において非表音的である.意味についても同様に,字面を個々に考えても全体で考えても,とうてい「すなわち」の意味は浮かび上がってこない.<viz.> はこの点において非表意的である.つまり,英語の <viz.> は,語源形であるラテン語 videlicet を想起するまれな場合を除き,通常は音も意味も示唆しない.
 にもかかわらず,<viz.> は英語の副詞 namely と同等であるとして,英語使用者の意識のなかでは密接に結びついている.言い換えれば,<viz.> は,3文字全体としてむりやりに namely を表語している.<viz.> の綴字は,表音 (phonographic) でも表意 (ideographic) でもなく,表語 (logographic) の機能を果たしているのであり,記号論の用語を使えば,<viz.> が指し示しているものは,namely という記号 (signe) の能記 (signifiant) でも所記 (signifié) でもなく,namely という記号そのものである,ということになる.むりやりの結びつきであるから,英語使用者は,この <viz.> = namely の関係を暗記しなければならない.<viz.> のもつこの表語機能は,「#1042. 英語における音読みと訓読み」 ([2012-03-04-1]) で挙げた,<e.g.> (for example), <i.e.> (that is) にも見られる.
 そこで,典型的に表語文字といわれる漢字を使いこなす日本語において,これと比較される類例があるだろうかと考えてみた.しかし,案外と見つからないものだ.漢字は確かに表語的ではあるが,同時に表意機能も果たすのが普通だし,形声文字の場合には表音機能も備わっている.英語の <viz.> の場合のように,発音も意味も示唆すらしないという徹底的な例は,なかなかない.
 頭をひねってやっと思いついたのが,熟字訓として /さすが/ と読ませる <流石> という例だ.<流> も <石> も,さらにはそれを組み合わせた <流石> 全体も,なんら /さすが/ の発音を示唆するところがないし,「何といってもやはり」の意味を匂わせるところがない.<流石> は表音的でも表意的でもなく,副詞「さすが」をむりやりに表語しているのである.<viz.> と <流石> の唯一の差異は,前者の構成要素であるアルファベット文字が本質的に表音的であるのに対して,後者の構成要素である漢字は本質的に表語・表意的であるという点だろう.しかし,いずれの表記も全体としては結局のところ非表音的かつ非表意的であり,発現している機能はもっぱら表語機能である点では同じだ.
 一見すると,「流石」 に代表される熟字訓は,純粋な表語機能(=非表音かつ非表意かつ表語)の好例を提供してくれそうだが,<私語> /ささやき/,<五月雨> /さみだれ/,<海苔> /のり/,<紅葉> /もみじ/ などでは,漢字の組み合わせが意味を匂わせてしまっており(しかも美しく詩的に),<viz.> = namely の純粋な表語機能には達していない.むしろ英語はアルファベットという表音文字体系をベースに置いている言語であるからこそ,<viz.> = namely のような例において,稀ではあるが純粋な表語機能を獲得し得たのかもしれない.文字論の観点からは,この逆説は興味深い.
 なお,<流石> を /さすが/ と訓読するのは,以下の故事によるものとするのが通説である(『学研 日本語「語源」辞典』より).

中国、西晋の国の孫楚が「石に枕し、流れに漱ぐ」というべきところを、誤って「石に漱ぎ、流れに枕す」と言ってしまった。これを聞いた親友の王済が「流れは枕にできないし、石では口をすすげない」と言ってからかうと、孫楚は「流れを枕にするのは耳を洗うためであり、石に漱ぐというのは歯を磨くためである」と言って言い逃れたという。この故事を「さすがにうまいこじつけだ」と評し、「流石」の字が当てられたとする説がある。


 上の議論では,一般の日本語話者がこの故事を知らない,あるいは普段は特に意識せずに,<流石> = /さすが/ の関係を了解していることを前提とした.故事を意識していれば,<流石> が非常に間接的ながらも何らかの表意機能をもっていると主張できるかもしれないからである.
 文字の表語機能については,「#1332. 中英語と近代英語の綴字体系の本質的な差」 ([2012-12-19-1]),「#1386. 近代英語以降に確立してきた標準綴字体系の特徴」 ([2013-02-11-1]),「#1655. 耳で読むのか目で読むのか」 ([2013-11-07-1]),「#1829. 書き言葉テクストの3つの機能」 ([2014-04-30-1]) を参照.

[ 固定リンク | 印刷用ページ ]

2014-04-19 Sat

#1818. 日本語の /r/ [phonetics][consonant][japanese][phoneme][r][l]

 「#1618. 英語の /l/ と /r/」 ([2013-10-01-1]) および昨日の記事「#1817. 英語の /l/ と /r/ (2)」 ([2014-04-18-1]) に引き続き,/r/ の話題.今回は日本語の /r/ の音声的実現についてである.
 日本語のラ行の子音 /r/ は,典型的には,有声歯茎はじき音 [ɾ] として実現される.特に「あられ」のように,母音に挟まれた環境ではこれが普通である.この音は,BrE の merry や AmE の letter の第2子音として典型的に現れる音でもある.調音音声学的には,この音は有声歯茎閉鎖音 /d/ にかなり近いが,[ɾ] では舌尖と歯茎による閉鎖が弱く,その時間も短いという特徴がある.「ライオン」などの語頭や「アッラー」などの促音の後では接触が強くなり,/d/ にさらに近づくが,閉鎖の開放は弱めである.
 意外と知られてないことだが,日本語母語話者の個人によっては,有声側面接近音 [l] に近い子音がラ行子音として用いられている.語頭や撥音の後で現われることが多いが,母音間でも側音に近くなる人もいる.ぴったりの音声標記はないが,有声そり舌破裂音 [ɖ] や 有声歯茎側面はじき音 [ɺ] や(接触が長い場合の)舌尖による有声歯茎側面接近音 [l̺] にも近いので,これらで代用する方法もある.有声歯茎側面はじき音 [ɺ] は,いわば [l] をはじき音化したものだが,タンザニアのチャガ語などで聞かれる子音である.
 ほかにも「べらんめえ口調」に典型的とされる有声歯茎ふるえ音 [r] が,日本語 /r/ の自由異音として現れることがある.
 以上,斉藤 (91) と佐藤 (43) を参照した.

 ・ 斉藤 純男 『日本語音声学入門』改訂版 三省堂,2013年.
 ・ 佐藤 武義(編著) 『展望 現代の日本語』 白帝社,1996年.

Referrer (Inside): [2019-05-29-1] [2015-05-04-1]

[ 固定リンク | 印刷用ページ ]

2014-03-16 Sun

#1784. 沖縄の方言札 [sociolinguistics][language_planning][japanese][linguistic_imperialism][dialect][language_shift][language_death][linguistic_right]

 「#1741. 言語政策としての罰札制度 (1)」 ([2014-02-01-1]) の記事で沖縄の方言札を取り上げた後で,井谷著『沖縄の方言札』を読んだ.前の記事で田中による方言札舶来説の疑いに触れたが,これはかなり特異な説のようで,井谷にも一切触れられていない.国内の一部の文化人類学者や沖縄の人々の間では,根拠のはっきりしない「沖縄師範学校発生説」 (170) も取りざたされてきたようだが,井谷はこれを無根拠として切り捨て,むしろ沖縄における自然発生説を強く主張している.
 井谷の用意している論拠は多方面にわたるが,重要な点の1つとして,「少なくとも表面的には一度として「方言札を使え」などというような条例が制定されたり,件の通達が出たりしたことはなかった」 (8) という事実がある.沖縄の方言札は20世紀初頭から戦後の60年代まで沖縄県・奄美諸島で用いられた制度だが,「制度」とはいっても,言語計画や言語政策といった用語が当てはまるほど公的に組織化されたものでは決してなく,あくまで村レベル,学校レベルで行われた習俗に近いという.
 もう1つ重要な点は,「「方言札」の母体である間切村内法(「間切」は沖縄独自の行政区分の名称)における「罰札制度」が,極めて古い歴史的基盤の上に成り立つ制度である」 (8) ことだ.井谷は,この2点を主たる論拠に据えて,沖縄の方言札の自然発生説を繰り返し説いてゆく.本書のなかで,著者の主旨が最もよく現れていると考える一節を挙げよう.

先述したように,私は「方言札」を強権的国家主義教育の主張や、植民地主義的同化教育、ましてや「言語帝国主義」の象徴として把握することには批判的な立場に立つものである。ごく単純に言って、それは国家からの一方的な強制でできた札ではないし、それを使用した教育に関しては、確かに強権的な使われ方をして生徒を脅迫したことはその通りであるが、同時に遊び半分に使われる時代・場所もありえた。即ち強権的であることは札の属性とは言い切れないし、権力関係のなかだけで札を捉えることは、その札のもつ歴史的性格と、何故そこまで根強く沖縄社会に根を張りえたのかという土着性をみえなくする。それよりも、私は「方言札」を「他律的 identity の象徴」として捉えるべきだと考える。即ち、自文化を否定し、自分たちの存在を他文化・他言語へ仮託するという近代沖縄社会の在り方の象徴として捉えたい。それは、伊波が指摘したように、昨日今日にできあがったものではなく、大国に挟まれた孤立した小さな島国という地政学的条件に基盤をおくものであり、近代以前の沖縄にとってはある意味では不可避的に強いられた性格であった。 (85--86)


 井谷は,1940年代に本土の知識人が方言札を「発見」し,大きな論争を巻き起こして以来,方言札は「沖縄言語教育史や戦中の軍国主義教育を論じる際のひとつのアイテムに近い」 (30) ものとして,即ち一種の言説生産装置として機能するようになってしまったことを嘆いている.実際には,日本本土語の教育熱と学習熱の高まりとともに沖縄で自然発生したものにすぎないにもかかわらず,と.
 門外漢の私には沖縄の方言札の発生について結論を下すことはできないが,少なくとも井谷の議論は,地政学的に強力な言語に囲まれた弱小な言語やその話者がどのような道をたどり得るのかという一般的な問題について再考する機会を与えてくれる.そこからは,言語の死 (language_death) や言語の自殺 (language suicide),方言の死 (dialect death), 言語交替 (language_shift),言語帝国主義 (linguistic_imperialism),言語権 (linguistic_right) といったキーワードが喚起されてくる.方言札の問題は,それがいかなる仕方で発生したものであれ,自らの用いる言語を選択する権利の問題と直結することは確かだろう.
 言語権については,本ブログでは「#278. ニュージーランドにおけるマオリ語の活性化」 ([2010-01-30-1]),「#280. 危機に瀕した言語に関連するサイト」 ([2010-02-01-1]),「#1537. 「母語」にまつわる3つの問題」 ([2013-07-12-1]),「#1657. アメリカの英語公用語化運動」 ([2013-11-09-1]) などで部分的に扱ってきたにすぎない.明日の記事はこの話題に注目してみたい.

 ・ 井谷 泰彦 『沖縄の方言札 さまよえる沖縄の言葉をめぐる論考』 ボーダーインク,2006年.
 ・ 田中 克彦 『ことばと国家』 岩波書店,1981年.

[ 固定リンク | 印刷用ページ ]

2014-03-12 Wed

#1780. 言語接触と借用の尺度 [contact][borrowing][sociolinguistics][loan_word][typology][japanese]

 2言語間の言語接触においては,一方向あるいは双方向に言語項の借用が生じる.その言語接触と借用の強度は,少数の語彙が借用される程度の小さいなものから,文法範疇などの構造的な要素が借用される程度の大きいものまで様々ありうるが,古今東西の言語接触の事例から,その尺度を類型化することは可能だろうか.
 この問題については,「#902. 借用されやすい言語項目」 ([2011-10-16-1]),「#903. 借用の多い言語と少ない言語」 ([2011-10-17-1]),「#934. 借用の多い言語と少ない言語 (2)」 ([2011-11-17-1]) ほかで部分的に言及してきたが,昨日の記事「#1779. 言語接触の程度と種類を予測する指標」 ([2014-03-11-1]) で引用した Thomason and Kaufman (74--76) による借用尺度 ("BORROWING SCALE") が,現在のところ最も本格的なものだろう.著者たちは言語接触を大きく borrowing と shift-induced interference に分けているが,ここでの尺度はあくまで前者に関するものである.5段階に区別されたレベルの説明を引用する.

(1) Casual contact: lexical borrowing only
    Lexicon:
        Content words. For cultural and functional (rather than typological) reasons, non-basic vocabulary will be borrowed before basic vocabulary.

(2) Slightly more intense contact: slight structural borrowing
    Lexicon:
        Function words: conjunctions and various adverbial particles.
    Structure:
        Minor phonological, syntactic, and lexical semantic features. Phonological borrowing here is likely to be confined to the appearance of new phonemes with new phones, but only in loanwords. Syntactic features borrowed at this stage will probably be restricted to new functions (or functional restrictions) and new orderings that cause little or no typological disruption.

(3) More intense contact: slightly more structural borrowing
    Lexicon:
        Function words: adpositions (prepositions and postpositions). At this stage derivational affixes may be abstracted from borrowed words and added to native vocabulary; inflectional affixes may enter the borrowing language attached to, and will remain confined to, borrowed vocabulary items. Personal and demonstrative pronouns and low numerals, which belong to the basic vocabulary, are more likely to be borrowed at this stage than in more casual contact situations.
    Structure:
        Slightly less minor structural features than in category (2). In phonology, borrowing will probably include the phonemicization, even in native vocabulary, of previously allophonic alternations. This is especially true of those that exploit distinctive features already present in the borrowing language, and also easily borrowed prosodic and syllable-structure features, such as stress rules and the addition of syllable-final consonants (in loanwords only). In syntax, a complete change from, say, SOV to SVO syntax will not occur here, but a few aspects of such a switch may be found, as, for example, borrowed postpositions in an otherwise prepositional language (or vice versa).

(4) Strong cultural pressure: moderate structural borrowing
    Structure:
        Major structural features that cause relatively little typological change. Phonological borrowing at this stage includes introduction of new distinctive features in contrastive sets that are represented in native vocabulary, and perhaps loss of some contrasts; new syllable structure constraints, also in native vocabulary; and a few natural allophonic and automatic morphophonemic rules, such as palatalization or final obstruent devoicing. Fairly extensive word order changes will occur at this stage, as will other syntactic changes that cause little categorial alteration. In morphology, borrowed inflectional affixes and categories (e.g., new cases) will be added to native words, especially if there is a good typological fit in both category and ordering.

(5) Very strong cultural pressure: heavy structural borrowing
    Structure:
        Major structural features that cause significant typological disruption: added morphophonemic rules; phonetic changes (i.e., subphonemic changes in habits of articulation, including allophonic alternations); loss of phonemic contrasts and of morphophonemic rules; changes in word structure rules (e.g., adding prefixes in a language that was exclusively suf-fixing or a change from flexional toward agglutinative morphology); categorial as well as more extensive ordering changes in morphosyntax (e.g., development of ergative morphosyntax); and added concord rules, including bound pronominal elements.


 英語史上の主要な言語接触の事例に当てはめると,古英語以前におけるケルト語,古英語以降のラテン語との接触はレベル1程度,中英語以降のフランス語との接触はレベル2程度,古英語末期からの古ノルド語との接触はせいぜいレベル3程度である.英語は歴史的に言語接触が多く,借用された言語項にあふれているという一般的な英語(史)観は,それ自体として誤っているわけではないが,Thomason and Kaufman のスケールでいえば,たいしたことはない,世界にはもっと激しい接触を経てきた言語が多く存在するのだ,ということになる.通言語的な類型論が,個別言語をみる見方をがらんと変えてみせてくれる好例ではないだろうか.
 日本語についても,歴史時代に限定すれば中国語(漢字)からの重要な影響があったものの,BORROWING SCALE でいえば,やはり軽度だろう.しかし,先史時代を含めれば諸言語からの重度の接触があったかもしれないし,場合によっては borrowing とは別次元の言語接触であり,上記のスケールの管轄外にあるとみなされる shift-induced interference が関与していた可能性もある.

 ・ Thomason, Sarah Grey and Terrence Kaufman. Language Contact, Creolization, and Genetic Linguistics. Berkeley: U of California P, 1988.

[ 固定リンク | 印刷用ページ ]

2014-02-21 Fri

#1761. 屈折形態論と派生形態論の枠を取っ払う「高さ」と「高み」 [suffix][japanese][morphology][derivation][productivity][neurolinguistics]

 日本語の名詞形成接尾辞「さ」と「み」について,Hagiwara et al. の論文を読んだ.いずれも形容詞の語幹に接続して名詞化する機能をもっているが,「さ」は著しく生産的である一方で,「み」は基体を選ぶということが知られている.「温かい」「甘い」「明るい」「痛い」「重い」「高い」「強い」「苦い」「深い」「丸い」「柔らかい」などはいずれの接尾辞も取ることができるが,「冷たい」「固い」「安い」などは「み」を排除するし,複合形容詞「子供らしい」「奥深い」なども同様だ.実際,「み」の接続できるものは30語ほどに限られ,生産性が極めて限定されている.意味上も,「さ」名詞は無標で予測可能性が高いが,「み」名詞は有標で予測可能性が低い.例えば,「高さ」は抽象的な性質名詞だが,「高み」は「高いところ」ほどのより具体的な意味をもつ名詞である.
 この「さ」と「み」の形態的・意味的な性質の違いは,英語の -ness と -ity の違いとおよそ平行している.英語の2つの名詞形成接尾辞については「#935. 語形成の生産性 (1)」 ([2011-11-18-1]) で取り上げたので,そちらを参照していただきたいが,日本語と英語のケースとでの差異は,英語の非生産的な接尾辞 -ity は基体の音韻形態を変化させ得る (ex. válid vs valídity) のに対して,日本語の非生産的な接尾辞「み」は基体の音韻形態を保つということだ.しかし,全体としては,日英語4接尾辞のあいだの平行性には注目すべきだろう.
 Hagiwara et al. の議論の要点はこうである.英語の規則動詞の活用形は規則により生成されるが,不規則動詞の活用形は記憶から直接引き出される.それと同じように,日本語の「さ」名詞は規則により生成されるが,「み」名詞は記憶から直接引き出されているのではないか.この際に,英語の動詞の例は屈折形態論 (inflectional morphology) に属する話題であり,日本語の「さ」「み」の例は派生形態論 (derivational morphology) に属する話題ではあるが,これは同じ原理が両形態論をまたいで働いている証拠ではないか,と.従来,屈折形態論と派生形態論は峻別すべき2つの部門と考えられてきたが,生産性の極めて高い派生の過程は,むしろ屈折に近い振る舞いをすると考えられるのではないか,というのが Hagiwara et al. の提案である.以上の議論が,失語症患者のテストや神経言語学 (neurolinguistics) の観点からなされている.結論部を引用しよう.

Our investigation of the Japanese nominal suffixes -sa annd -mi led us to the conclusion that the affixation of these two suffixes involves two different mental mechanisms, and that the two mechanisms are supported by different neurological substrates. The results of our study constitute a new piece of evidence for the dual-mechanism model of morphology, where default rule application and associative memory are supposed to operate as mutually independent mechanisms. Furthermore, we have demonstrated that the dual-mechanism model is valid for morphological processes in general, and is not limited to inflectional ones. This, in turn, shows that some derivational processes can involve default rules or computation, much like those in inflection or syntactic operations. From the neurolinguistic point of view, our study has contributed to the clarification of the localization of linguistic functions, namely, the Broca's area functions as the rule-governed grammatical computational system whereas the left-middle and inferior temporal areas subserve the unproductive/semiproductive memory-based lexical-semantic processing system. (758)


 屈折形態論と派生形態論の枠を部分的に取っ払うというという,この神経言語学上の提案は,例えば「#456. 比較の -er, -est は屈折か否か」 ([2010-07-27-1]) のような問題にも新たな光を投げかけることになるかもしれない.

 ・ Hagiwara, Hiroko, Yoko Sugioka, Takane Ito, Mitsuru Kawamura, and Jun ichi Shiota. "Neurolinguistic Evidence for Rule-Based Nominal Suffixation." Language 75 (1999): 739--63.

Referrer (Inside): [2016-08-01-1] [2014-03-19-1]

[ 固定リンク | 印刷用ページ ]

2014-02-06 Thu

#1746. 看板表記のローマ字 [language_planning][japanese][writing][grammatology][linguistic_landscape]

 社会言語学の概念で,言語環境あるいは言語景観というものがある.「#1612. 道路案内標識,ローマ字から英語表記へ」 ([2013-09-25-1]) および「#1613. 道路案内標識の英語表記化と「言語環境」」 ([2013-09-26-1]) で話題にしたように,街にある標識や看板などの文字の使い方は,街の印象を決定すると同時に,諸々の言語の重要性やその象徴的な威信を反映していると考えられる.このような観点から,日本でも街の看板表記のフィールドワークが行われるようになってきた.
 2001--02年にかけて染谷が小田急線沿線の駅周辺で行った店名看板調査も,そのような試みの1つである.日常生活の匂いがする商店街をターゲットに,計千件の看板の文字種を調査した.漢字・ひらがな・カタカナ・ローマ字のうち,どの文字種(の組み合わせ)が看板に用いられているかを示したのが以下の表である(染谷,p. 224 より).

組み合わせ看板数(件)
漢字197
ひらがな21
カタカナ49
ローマ字109
1種合計376
漢字+ひらがな220
漢字+カタカナ130
漢字+ローマ字30
ひらがな+カタカナ10
ひらがな+ローマ字10
カタカナ+ローマ字42
2種合計442
漢+ひら+カタ77
漢+ひら+ロマ27
漢+カタ+ロマ44
ひら+カタ+ロマ9
3種合計157
漢+ひら+カタ+ロマ24
4種合計24


 概ね直感と合う結果と思われる,漢字のみ,あるいは漢字+ひらがなで表記される看板が最も多い.現代日本語の最も一般的な表記の状況を反映しているといってよいだろう.しかし,思いのほか多かったのがローマ字単独表記である.他の文字種との組み合わせも足し合わせると,ローマ字の存在感は決して小さくない.BAR, CAFE, CLEANING, COSMETIC, HAIRCUT, PUB など店の業種や扱っている商品によってローマ字使用が多いケースがあることは容易に理解できるが,WADAYA, LaLaLa, ASTORIA, Sis., FRAIS, Pappa Duduu など業種が想像できないようなものも多かったという.
 染谷 (239) は,看板におけるローマ字表記について次のような可能性を指摘している.

むしろ最近気になるのは、ローマ字表記の縦書き看板である。たとえば、JRの駅の柱には駅名が「Shinjuku」のように横書きで九〇度回転した状態で表示してある。日常こういう表記に慣れていたが、今回の最終で「HOTEL」、「英会話NOVA」、「ZOO」(店名)のようなローマ字の縦書き看板は多くはないが確実に見られる。首を横にしないで見られるローマ字の縦書き看板は今後増える可能性があるかもしれない。とすれば、一般の表記にも影響する可能性がある。縦書きの文章に縦書きのローマ字表記が出てくる時代がくるのだろうか。


 染谷 (243) は続けて,危惧をも表明している.

外国語表記を主体としたローマ字だけの店名看板も少なからず見え、日常と関わりの深いところでこのような表記を目にしていると、自ずから日本人の文字生活にも影響を与えるのではないかという危惧がある。特に、一部に見える縦書きローマ字が進出してくれば、綴り字が複雑でない英単語などが漢字仮名交じり文に入り込む可能性も十分考えられ得るのではないか。


 通常,言語環境は一般の言語使用の影響を受けていると考えられるが,逆に言語環境が一般の言語使用に影響を及ぼすという方向も十分にありうると思われる.言語環境は,言語使用を反映すると同時に,それに影響を及ぼしもするのだ.2020年の東京オリンピックをにらんで,東京(そして日本全国)にローマ字の標識や看板の増えてくる可能性が高いが,そのような言語環境の変化は,徐々に一般の日本語使用にも影響を及ぼさずにはおかないだろう

 ・ 染谷 裕子 「看板の文字表記」『現代日本語講座 第6巻 文字・表記』(飛田 良文,佐藤 武義(編)) 明治書院,2002年,221--43頁.

Referrer (Inside): [2015-03-05-1] [2014-06-19-1]

[ 固定リンク | 印刷用ページ ]

2013-10-28 Mon

#1645. 現代日本語の語種分布 [japanese][lexicology][statistics][etymology][loan_word][lexical_stratification]

 英語語彙の語種別の割合について,これまで多くの記事で各種統計を示してきた.

 ・ [2012-09-03-1]: 「#1225. フランス借用語の分布の特異性」
 ・ [2012-08-11-1]: 「#1202. 現代英語の語彙の起源と割合 (2)」
 ・ [2012-01-07-1]: 「#985. 中英語の語彙の起源と割合」
 ・ [2011-09-18-1]: 「#874. 現代英語の新語におけるソース言語の分布」
 ・ [2011-08-20-1]: 「#845. 現代英語の語彙の起源と割合」
 ・ [2010-12-31-1]: 「#613. Academic Word List に含まれる本来語の割合」
 ・ [2010-06-30-1]: 「#429. 現代英語の最頻語彙10000語の起源と割合」
 ・ [2010-05-16-1]: 「#384. 語彙数とゲルマン語彙比率で古英語と現代英語の語彙を比較する」
 ・ [2010-03-02-1]: 「#309. 現代英語の基本語彙100語の起源と割合」
 ・ [2009-11-15-1]: 「#202. 現代英語の基本語彙600語の起源と割合」
 ・ [2009-11-14-1]: 「#201. 現代英語の借用語の起源と割合 (2)」
 ・ [2009-08-19-1]: 「#114. 初期近代英語の借用語の起源と割合」
 ・ [2009-08-15-1]: 「#110. 現代英語の借用語の起源と割合」

 「#334. 英語語彙の三層構造」 ([2010-03-27-1]),「#335. 日本語語彙の三層構造」 ([2010-03-28-1]),「#1526. 英語と日本語の語彙史対照表」 ([2013-07-01-1]) で見たように,英語と日本語の語彙は比較される歴史をたどってきており,結果として現代の共時的な語彙構成にも共通点が見られる.今回は,現代英語との比較のために,現代日本語の語種別の割合をみよう.一般的にこの種の語彙統計を得るのは難しいが,『日本語百科大事典』 (420--21) に拠りながら3種の調査結果の概観を示す.

 (1) 明治から昭和にかけての3種の国語辞典『言海』(明治22年;1889年),『例解国語辞典』(昭和31年;1956年),『例解国語辞典』(昭和44年;1969年)の収録語を語種別に数えた研究がある.総語数は,『言海』39,103,『例解国語辞典』40,393,『角川国語辞典』60,218 である.以下に割合を示す表と図を示そう.

明治から昭和にかけての国語辞典調査

和語漢語外来語混種語
『言海』55.8%34.71.48.1
『例解国語辞典』36.653.63.56.2
『角川国語辞典』37.152.97.82.2


 時代が進むにつれて,和語に対する漢語と外来語の割合が高まってきているのがわかる.昭和では,1/2強が漢語,1/3強が和語という割合だ.

 (2) 現代の書きことばについては,国立国語研究所の『現代雑誌九十種の用語用字』調査のデータがよく参照される.昭和31年(1956年)の雑誌から,助詞,助動詞,固有名詞を除いて語彙を収集したものである.得られた語彙は,異なり語数で30,331,延べ語数で411,972.21世紀の現在から見ると古いデータではあるが,質において比肩する新しい調査は行われていない.

『現代雑誌九十種の用語用字』調査

和語漢語外来語混種語
異なり語数36.7%47.59.86.0
延べ語数53.941.32.91.9


 異なり語数と延べ語数では数値がかなり異なっており,特に和語と漢語の順位が入れ替わっているのが注目に値する.

 (3) 現代の話しことばの調査としては,知識層を対象としたものがある.日本語教育および語学関係の研究者7人とその話し相手の会話を延べ42時間分録音し,分析したものである.異なり語数は4,617で,延べ語数は64,023.

現代話しことば調査

和語漢語外来語混種語
異なり語数46.9%40.010.13.0
延べ語数71.823.63.21.4


 話しことばでは,書きことばと異なり,異なり語数と延べ語数の間で和漢語の順位入れ替えはない.いずれの数え方でも和語の割合が最も多いが,とりわけ延べ語数では和語が圧倒している.
 この話しことばの調査では,公的な場面や私的な場面など場面別に分析がなされたが,全体的な傾向として,和語は (1) 私的な場面でのほうが多い,(2) 延べ語数でのほうが多い,(3) 使用頻度の高い語ほど多い,(4) 話し言葉でのほうが多い,という結果が出た.私的な話しことばで高頻度に用いられる語は,和語である確率が最も高いということになる.この結果は直感と一致するだろう.
 英語においても本来語は「私的な場面の話しことばで高頻度に用いられる」確率が高いと想像されるが,これについては統計は見たことはなく,今後,実証してゆく必要があるかもしれない.

 ・ 『日本語百科大事典』 金田一 春彦ほか 編,大修館,1988年.

[ 固定リンク | 印刷用ページ ]

2013-10-13 Sun

#1630. インク壺語,カタカナ語,チンプン漢語 [japanese][kanji][katakana][waseieigo][lexicology][emode]

 初期近代英語期,主としてラテン語に由来するインク壺語 (inkhorn_term) と呼ばれる学者語が大量に借用されたとき,外来語の氾濫に対する大議論が巻き起こったことは,「#1408. インク壺語論争」 ([2013-03-05-1]) や「#1410. インク壺語批判と本来語回帰」 ([2013-03-07-1]) などの記事で触れた.Bragg (116) の評価によれば,"This controversy was the first and probably the greatest formal dispute about the English language." ということだった.
 現代日本語において似たような問題が,カタカナ語の氾濫という形で生じている.インク壺語とカタカナ語の問題の類似点については,「#1615. インク壺語を統合する試み,2種」 ([2013-09-28-1]) と「#1616. カタカナ語を統合する試み,2種」 ([2013-09-29-1]) で取り上げたが,借用語彙の受容を巡る議論は,およそ似たような性質を帯びるものらしい.そこへもう1つ新語彙の受容を巡る問題を加えるとすれば,近代期の日本の新漢語問題が思い浮かぶ.昨日の記事「#1629. 和製漢語」 ([2013-10-12-1]) でも話題にした,和製漢語を種とする新漢語の大量生産である.
 幕末以降,特に明治初期以来,英語をはじめとする大量の西洋語を受け入れるのに,それを漢訳して受容した.当時の知識人に漢学の素養があったからである.漢訳に当たっては,古来の漢語を利用したり,W. Lobscheid の『英華字典』を参照したり(例えば,文学,教育,内閣,国会,階級,伝記など)して対処したものもあったが,和製漢語を作り出す場合が多かった.この大量の新漢語は「漢語の氾濫」問題を惹起し,一般庶民にまで影響を及ぼすことになった.
 例えば,『日本語百科大事典』 (453--54) によれば,『都鄙新聞』第1号(慶應4・明治1)に「此は頃鴨東ノの芸妓,少女ニ至ルマデ,専ラ漢語ヲツカフコトヲ好ミ,霖雨ニ盆地ノ金魚ガ脱走シ,火鉢ガ因循シテヰルナド,何ノワキマヘモナクイヒ合フコトコレナリ」という皮肉が聞かれたし,『漢語字類』(明治2)には「方今奎運盛ニ開ケ,文化日ニ新タナリ。上ミハ朝廷ノ政令,方伯ノ啓奏ヨリ,下モ市井閭閻ノ言談論議ニ至ルマデ,皆多ク雑ユルニ漢語ヲ以テス」とある.『我楽多珍報』(明治14. 9. 30)では「生意気な猫ハ漢語で無心いひ」とまである.このように新漢語が流行していたようだが,庶民がどの程度理解していたかは疑問で,「チンプン漢語」とまで呼ばれていたほどである."inkhorn terms" や「カタカナ語」という呼称と比較されよう.そして,漢語を統合する試みの1つとして,漢語字引が次々と出版されたことも,他の2例と驚くほどよく似ている.
 現代日本語のカタカナ語問題を議論するのに,16世紀後半のイングランドや19世紀後半の日本の言語事情を参照することは,意味のあることだろう.

 ・ Bragg, Melvyn. The Adventure of English. New York: Arcade, 2003.
 ・ 『日本語百科大事典』 金田一 春彦ほか 編,大修館,1988年.

[ 固定リンク | 印刷用ページ ]

2013-10-12 Sat

#1629. 和製漢語 [japanese][kanji][waseieigo][lexicology]

 「#1624. 和製英語の一覧」 ([2013-10-07-1]) で和製英語の一覧を掲げたが,今回は和製漢語の例を列挙したい.英単語の借用に慣れた日本語が大正期に和製英語を作り出し始めたように,それにもまして長らく日本語になじんできた漢語がモデルとなって,数々の和製漢語が生み出されてきたことは,まったく自然なことである.和製英語の場合と同様に,ある漢語が和製であるか否かを定めるには日本語および中国語の双方における文献学的な考証が必要となり,たやすい問題ではないが,現代中国の専門家によれば,次の漢語は和製漢語である可能性が高いという(以下の例はすべて『日本語百科大事典』 pp. 1029--30 より).

備品,参看,参照,成因,寵児,単純,等外,敵視,読本,番号,方針,風位,服務,復式,副食,公立,公判,公認,公営,国立,集中,集結,記号,尖兵,堅持,簡単,金額,巨匠,巨星,克服,労作,落選,明確,内勤,農作物,権限,権益,人選,肉弾,実績,実権,私立,訴権,台車,特長,外勤,校訓,興信所,学会,学歴,訓話,訓令,銀翼,印鑑,原動力,原意,原作,陣容,支部,重点,手動,組成,座談


 日本の文物を表す漢語も,和製と考えてよいだろう.例としては,和服,和文,人力車,浄瑠璃,能楽,三味線,茶道,弓道,柔道などがある.
 また,以下の漢語も和製漢語の可能性をもつが,近代日本と中国の間での移入・移出の関係は複雑であり,一応のリストとして理解しておきたい.これらの多くは,近代期に,英語などを取り入れる際に漢訳して取り入れたことに由来する.

暗示,白金,半径,飽和,保険,悲劇,背景,本質,比重,必要,標語,表決,波長,不動産,財閥,挿話,成分,乗客,抽象,出版,触媒,大気,代議士,単元,蛋白質,道具,登記,低調,抵抗,地質,電波,電車,電話,電流,電子,動産,独占,隊商,対象,対照,法人,反動,反感,反射,反応,範疇,方程式,方式,雰囲気,否定,附着,複製,改編,改訂,概括,概略,概念,感性,幹部,幹線,高潮,高炉,歌劇,工業,公報,公称,公民,公僕,公訴,共産主義,共鳴,関係,観測,観念,光年,光線,広告,広義,帰納,国際,国庫,国税,寒帯,寒流,航空母艦,号外,化膿,化石,化学,化粧品,画廊,幻灯,幻想曲,回収,会話,会社,会談,活躍,火成岩,積極,基調,基準,集団,計画,技師,仮定,尖端,間接,建築,鑑定,講壇,交際,交響楽,膠着語,脚本,教科書,教養,酵素,接吻,結核,解放,解剖,介入,金剛石,金婚式,金牌,金融,緊張,進度,進化,進化論,進展,経験,景気,警察,警官,浄化,静脈,競技,就任,巨頭,決算,絶対,看護婦,看守,抗議,科学,可決,客観,客体,肯定,空間,会計,拡散,類型,冷蔵,冷蔵庫,理論,理念,理想,理智,力学,立憲,例会,了解,領海,領空,領主,領土,論理学,漫画,盲従,媒質,美感,密度,免許,民法,敏感,命題,黙示,母体,母校,目標,目的,内容,内在,能動,能率,擬人法,年度,暖流,派遣,判決,陪審,配給,批評,平面,評価,企業,気分,気体,気質,汽船,汽笛,契機,前線,強制,軽工業,清教徒,清算,情報,権威,熱帯,人格,人権,任命,溶体,入場券,入超,商法,商業,社交,審判,昇華,生理学,生態学,失恋,施工,施行,時間,実感,実業,使徒,士官,世界観,市場,市長,事態,手工業,受難,水素,思潮,死角,素材,素描,速度,速記,随員,索引,談判,探険,特権,体育,鉄血,統計,投影,投資,図案,外在,温床,温度,文庫,文学,無産者,物質,喜劇,系列,係数,細胞,狭義,繊維,現実,現象,現役,憲兵,相対,想像,象徴,消防,消費,消極,小夜曲,効果,協定,協会,心理学,信号,信託,性能,序幕,序曲,宣戦,旋盤,学位,血栓,血吸虫,巡洋艦,圧延,亜鉛,演出,演奏,燕尾服,陽極,要素,業務,液体,議会,議員,議院,意訳,因子,陰極,銀行,銀婚式,栄養,影像,優生学,油槽車,遊離,予後,元素,園芸,原理,原則,原子,原罪,遠足,運動,運動場,雑誌,債権,債務,展覧会,戦線,哲学,証券,政策,政党,支線,直観,直接,直径,直流,止揚,指標,指導,指数,制裁,制限,制約,質量,終点,仲裁,重工業,主筆,主観,資料,紫外線,宗教,総合,総動員,総理,作品


 和製英語にせよ和製漢語にせよ,相手の言語からの直接の語彙借用に十分なじんでくると,今度はそれをモデルとして自家製の語彙を生み出そうとしてきた点が似ている.相手の言語に呑まれていると考えれば語彙借用反対論となるし,相手の言語を手なずけていると考えれば賛成論となる.私は,和製○語の存在は日本語が借用元言語の手なずけに成功し,高次に進んだ借用段階にあることを示すものとして解釈している.

 ・ 『日本語百科大事典』 金田一 春彦ほか 編,大修館,1988年.

[ 固定リンク | 印刷用ページ ]

2013-10-09 Wed

#1626. 現代日本語書き言葉均衡コーパス BCCWJ の各種インターフェース [web_service][corpus][link][japanese]

「#1567. 英語と日本語のオンラインコーパスをいくつか紹介」 ([2013-08-11-1]) で,現代日本語のコーパスとしてKOTONOHA 「現代日本語書き言葉均衡コーパス」に言及した.この『現代日本語書き言葉均衡コーパス』 (BCCWJ: Balanced Corpus of Contemporary Written Japanese) は,大学共同利用機関法人人間文化研究機構国立国語研究所と文部科学省科学研究費特定領域研究「日本語コーパス」プロジェクトが共同で開発した本格的なコーパスである.
 コーパスの内容については,同サイトに「2012年3月現在、検索対象となっているのは、以下の11種のデータ、合計約1億500万語です」とある.サンプルは,1976--2008年にかけての文書で,その11のジャンルは書籍,雑誌,新聞,白書,教科書,広報紙,Yahoo!知恵袋,Yahoo!ブログ,韻文,法律,国会会議録にわたる.各テキストからは2種類のサンプルが取られており,「ひとつは長さを1000字に固定したサンプル (固定長サンプル)、もうひとつは、節や章など文章の意味上のまとまりに対応した単位の全体です (可変長サンプル)。これまでの調査によれば、可変長サンプルの平均長は新聞で約1000字、書籍で4000字弱です。」とある.
 BCCWJ を利用する方法やインターフェースはいくつかあるが,もっとも簡便なものが,上にもリンクを張った少納言である.登録不要で,表層の文字列によるコーパスの全文検索ができる.出力は無作為の500件と制限があるが,お手軽に試すことができる.
 一方,利用申請が必要な中納言では,同コーパスに対して,短単位・長単位・文字列の3つの方法により,形態論的な複雑な検索をかけることができる.
 また別のインターフェーとして,NINJAL-LWP for BCCWJ (NLB) がある.現行の1.20版では,BBCWJ のほとんどのデータを対象として,検索をかけることができる.検索ページはこちら
 関連して,NLB と同じインターフェースで利用できるもう1つの日本語コーパスを紹介する.筑波大学がウェブサイトからテキストを収集して編纂した11億語からなる筑波ウェブコーパス (Tsukuba Web Corpus: TWC) へのインターフェース,NINJAL-LWP for TWC (NLT)である.検索ページはこちら

[ 固定リンク | 印刷用ページ ]

2013-10-07 Mon

#1624. 和製英語の一覧 [waseieigo][japanese][katakana][borrowing][semantic_change][word_formation][lexicology][false_friend]

 9月21--22日に,大連大学日本言語文化学院で開かれた第五回『中・日・韓日本言語文化研究国際フォーラム』に参加し,中央大学の同僚とチームを組んで「言語使用の前景と背景---言語研究と文学研究について」と題するパネルディスカッションを行った.私は「和製英語の自然さ・不自然さ」という題目で少し話しをした.専門外ではあるが,日本語学において和製英語や外来語の研究は,英語の研究者によるものが少なくないということなので,私もその立場からわずかばかり参与させていただいた,という次第である.
 この発表のために,記事末に挙げたような参考図書等から和製英語といわれている表現を収集した.結果として231個が集まった.各々が本当に和製英語か否かという問題については,「#1492. 「ゴールデンウィーク」は和製英語か?」 ([2013-05-28-1]) で触れたように,本来,詳細な文献学的調査が必要だが,今回はそこまでは掘り下げていない.また,和製英語の厳密な定義が難しいという事情もある.したがって,以下の個々の例については疑問が呈されるかもしれないが,上記のような但し書きをつけたうえで,集めたものを一覧として公開しておくことは役に立つだろう.
 和製英語の分類については,まだ仮のものにすぎないが,以下のように (1) 記号的和製英語,(2) 意味的和製英語,(3) 形態的和製英語に3分類してみた.分類の精緻化は今後の課題としたい.

和製英語の分類

(1) 記号的和製英語
 アイスキャンディー (popsicle),アイドリングストップ (shutting off the engines),アウトコース (outside),アパート (apartment, apartmenthouse),アフターケア/アフターサービス (after-sales service, after-the-sale service),アフレコ (post recording),アメリカン(コーヒー) ((regular) coffee),イメージアップ (improve one's image),イメージチェンジ (change one's image),ウェストバッグ (fanny bag, bum bag),エステ (beauty salon, beauty spa, beauty-treatment clinic),エッチ (dirty-minded, sex-mad, have a one-track mind, indecent, salacious, pervert, abnormal),オーエル(オフィスレディ) (office worker),オーダーメード (custom-made, made-to-order),オートバイ (motorbike, motorcycle),オービー (alumnus, alumna, graduate),オーブントースター (toaster oven),オープンカー (convertible),オールバック (combed (straight) back, combed towards the back),カフスボタン (cuff links),ガード (overpass),ガードマン ((security) guard, watchman),ガソリンスタンド (gas station),ガッツポーズ (victory pose),キッチンペーパー (paper towel),キャッチコピー (slogan),キャッチホン (call-waiting),キャッチボール (play catch),クーラー (air conditioner),グラビア (glamour photos, cheesecake, Page Threes),グレードアップ (upgrade),ゲームセンター (amusement arcade),コインランドリー (launderette),コストダウン (lower costs, reduce costs),コンセント (outlet, outlet box, receptacle, wall outlet, wall socket),コンビニ (drugstore, grocery),ゴールデンアワー (prime time),ゴールデンウィーク (holidays in May),サイドビジネス (side job),サラリーマン (company employee),シーズンオフ (off-season),シーチキン (canned tuna),シェイプアップ (become thin, lose weight),システムキッチン (organized kitchen),シティホテル (big hotel),シャーペン (mechanical pencil, automatic pencil),シャッターチャンス (the right moment on film),シルバーウィーク (holidays in November),シルバーシート (priority seat),ジージャン (denim jacket, jeans jacket),ジーパン (jeans),ジェットコースター (roller coaster),ジューサー (blender),スーパー (supermarket),スキンシップ (touching, bonding, physical contact),スクールカラー (the traditional feature of a school),スケールメリット (economies of scale),スタメン (starting lineup),スタンドプレー (grandstand play),スピードダウン (slow down),スリーサイズ ((bust-waist-hip) measurement),ゼネコン (big construction company, large construction company),ソーラーシステム (solar power),ソフト (software),ソフトクリーム (soft-serve ice cream, ice cream cone, swirl ice-cream cone),ターミナルホテル (station hotel),タイムサービス (blue-light special, limited time offer (special)),タイムリーヒット (RBI hit),タッチアウト (tagged and out),ダイニングキッチン (kitchenette),ダンプカー (dump truck),チアガール (cheerleader a),チャンスメーカー (table setters),テーブルスピーチ (speech at a party),テレビゲーム (video game),テンキー (numeric keypad),デコレーションケーキ (birthday cake, decorated cake),デッドボール (hit by (a) pitch),デリバリーヘルス (massage parlor),トレーニングパンツ(トレパン) (sweat pants),ドクターストップ (doctor's orders),ドライブイン (rest area, rest stop),ナイター (night game),ニューハーフ (drag queen, transvestite),ネイティヴチェッカー (proof reader, native-speaking proof reader),ネットショッピング (on-line shopping),ノーカット (uncut (movie)),ノースリーブ (sleeveless dress),ノータイ(ノーネクタイ) (without a tie),ノートパソコン (laptop),ノンステップバス (bus without steps),ノンセクション (trivia),ハートフル (heartwarming),ハーフ (someone of mixed race),ハイソックス (knee socks),ハイティーン (late teens),ハイテンション (excitable, overexcited, carried away),ハローワーク (Job Centre),バックミラー (rearview mirror),バトンガール (baton twirler),バトンタッチ (baton pass, hand over),パタンナー (pattern maker),パトカー (police car),パネラー (panelist),パンチパーマ (tight-perm, short-perm),ビーチパラソル (beach umbrella),ビジネスホテル (economy hotel, budget hotel),フィールドアスレチック (obstacle course),フォアボール (base on balls, walk),フライドポテト (French fries, chips),フライング (false start),フリーサイズ (one-size-fits-all),フリーダイヤル (toll-free number),フロントガラス (windshield),ブックカバー (book jacket, dust jacket),プレーガイド (booking office),ヘアヌード (full-frontal nudity (photo)),ヘディングシュート (header),ヘルスメーター (bathroom scale),ベースアップ (raise of the wage base),ベッドタウン (bedroom suburb),ベビーサークル (playpen),ペーパーカンパニー (shell company),ペーパードライバー (person with a driving licence but no practice, driver in name only),ペアルック (dressed in matching outfits),ペットボトル (plastic bottle),ホーム (platform),ホットカーペット (electric carpet),ホットケーキ (pancake),ボディチェック (frisk, security check, body search),マイカー (one's own car),マイナスイメージ (negative image),マイペース (go one's own way),マカロニウェスタン (spaghetti Western),マグカップ (mug),マザコン (mummy's boy),マンツーマン (one-on-one (one-to-one) lesson, private lesson),ミシン (sewing machine),ミニコミ (free paper),ミルクティー (tea with milk),メタボ (big, overweight, fat),モーニングコール (wake-up call),モーニングサービス (breakfast special),ライブハウス (club with live music, live music club),ラブホテル (hot-pillow hotel, no-tell motel),ランニングシャツ (undershirt),ランニングホームラン (inside-the-park home run),リクルートスーツ (suit for an interview),リサイルクルショップ (secondhand shop, recycled-goods shop),リップクリーム (lip balm, chapstick),リフティング (keepy-uppy),ルーズソックス (loose-fitting socks),ローティーン (early teens),ロスタイム (additional time, injury time, stoppage time),ワイシャツ (business shirt),ワイドショー (talk and variety (TV) show, tabloid show, TV magazine show),ワンパターン (predictable, routine)

(2) 意味的和製英語
 アイドル (pop idol),アットホーム (cozy, homey),アバウト (irresponsible),(イベント)コンパニオン (booth girl, promotional model, trade show model),カンニング (cheating),クラクション (car horn),クレーム (complaint),サイン (autograph, signature),シール (sticker),スタンド (grandstand),スナック (bar, pub),スマート (slender, slim),センス(服装) (good dress sense, well-dressed, stylish),ソープ(風俗) (bordello, house of ill repute, whorehouse, knocking shop),タレント (celebrity, entertainer, TV personality),ダッチワイフ (blow-up doll),チャック (zipper, zip-fastener),トランプ ((playing) cards),ドライ (businesslike),ドライバー(工具) (screwdriver),ナイーブ (uncorrupted, unspoiled),ネック (weak link, dead wood, disadvantage, burden),ハンドル ((steering) wheel),バーコード(髪型) (Bobby Charlton),バイキング (buffet),パワーアップ (build),ファイト (Go for it, Do your best),フロント (front desk, reception),ブーム (fad),プリント (handout, printout),プロデューサー (coordinator),マジック (felt tip pen, marker pen),マンション (condominium, apartment),メリット/デメリット (pros and cons, advantages and disadvantages),モニター (test user, product tester),ヤンキー (good-for-nothings, layabouts, hooligans, thugs),リフォーム (alteration, refurbish, renovate),リベンジ (rematch),ルーズ (lax, careless, negligent, irresponsible)

(3) 形態的和製英語
 アイロン (flat iron),アクセル (accelerator),アプリ (application),アポ/アポイント (appointment),ウイルス (virus),エンスト (engine stall),オンザロック (on the rocks),カレーライス (curry and rice, curry with rice),コーンビーフ (corned beef),コネ (connection),サンオイル (suntan oil),スモークハム (smoked ham),セクハラ (sexual harassment),セットローション (setting lotion),デパート (department store),トイレ (bathroom, restroom),ドンマイ (Don't worry about it, Never mind),ニス (varnish),ネーブル (navel orange),ノート (notebook),ノンプロ (nonprofessional),パーマ (permanent),パソコン (personal computer),パンク (flat tyre, puncture),ビタミン (vitamin),ビル (building),ファンタジック (fantastic),プリン (pudding, custard pudding),プロレスラー (professional wrestler),マイク (microphone),マスコミ (mass communication, mass media, the media),マニア (maniac, fan),リストアップ (list),リストラ (restructuring, corporate downsizing),レジ (cash register)

 ・ スティーブン・ウォルシュ 『恥ずかしい和製英語』 草思社,2005年.
 ・ 桐生 りか 『カタカナ語・外来語事典』 汐文社,2006年.
 ・ 『新版日本語教育事典』 日本語教育学会 編,大修館書店,2005年.
 ・ デイビッド・セイン 『日本人がつい間違えるNGカタカナ英語』 主婦と生活社,2012年.
 ・ 『日本語学研究事典』 飛田 良文ほか 編,明治書院,2007年.
 ・ 『日本語百科大事典』 金田一 春彦ほか 編,大修館,1988年.
 ・ 村石 利夫 『カタカナ語おもしろ辞典』 さ・え・ら書房,1990年.
 ・ 山口 理 『国語おもしろ発見クラブ 外来語・和製英語』 2012年.

[ 固定リンク | 印刷用ページ ]

2013-09-30 Mon

#1617. 日本語における外来語の氾濫 [japanese][katakana][loan_word][lexicology][language_planning]

 日本語における「外来語の氾濫」の問題は,長らくメディアを賑わわせている.最近目についたところでは,9月4日(水)の朝日新聞朝刊13面に「耕論 カタカナ語の増殖」として3名の識者による議論が掲載されていた.「フランス語の未来」協会長のアルベール・サロン氏による「過剰な英語化,無味乾燥」,英語言語帝国主義批判の論客,津田幸男氏による「「言語法」で日本語を守れ」,クリエーティブディレクター岡康道氏による「取り込んで,面白がろう」の3論である.サロン氏は英語支配の観点から,津田氏は英語支配および日本の伝統維持という立場からそれぞれカタカナ語の氾濫を厳しく批判しているが,岡氏は日本語の同化力と創造力を評価して外来語の流入を歓迎している. *
 確かに,戦前から戦後を経て21世紀初頭の現在に至るまで,主として英語起源のカタカナ語の流入はおびただしい.この「氾濫」に対して,上記の議論のように様々な立場から反論が加えられてきたし,逆に擁護論が展開されたりもしてきた.しかし,とりわけ目につくのは反対論のほうである.このような問題における支持論は,およそ反対論に対する反論として唱えられるのが常であるようだ.
 『新版日本語教育事典』 (261) によると,外来語問題とは次の通りである.

「カタカナ語の氾濫」として問題にされ,急増している外来語への対応がさまざまな角度から議論される。背景には,英語とアメリカ文明の圧倒的な優位があるといってよい。議論の方向は,大きく2つの立場に分かれる。一つは,日本語そのものが良き文化的伝統とともに崩壊するのではないかと懸念する伝統重視の立場からのもの,もう一つは,一般になじみのうすい外来語が出まわることによって,基本的な情報のやりとりや意志疎通に支障が生ずることを問題視する機能重視の立場からのものである。後者に関しては,とくに公共性の高い場面における外来語使用について,個々の語の定着度に配慮した適切な対応を求める動きが国のレベルでも見られる。


 このような問題意識を受けて,昨日の記事「#1616. カタカナ語を統合する試み,2種」 ([2013-09-29-1]) でも触れたとおり,2002年より国立国語研究所の「外来語」委員会が「外来語」言い換え提案について議論することになった次第である.委員会設立趣意書では,機能主義の立場から外来語の問題点を指摘している.

外来語・外国語の問題点
 近年,片仮名やローマ字で書かれた目新しい外来語・外国語が,公的な役割を担う官庁の白書や広報紙,また,日々の生活と切り離すことのできない新聞・雑誌・テレビなどで数多く使われていると指摘されています。例えば,高齢者の介護や福祉に関する広報紙の記事は,読み手であるお年寄りに配慮した表現を用いることが,本来何よりも大切にされなければならないはずです。多くの人を対象とする新聞・放送等においても,一般になじみの薄い専門用語を不用意に使わないよう十分に注意する必要があります。ところが,外来語・外国語の使用状況を見ると,読み手の分かりやすさに対する配慮よりも,書き手の使いやすさを優先しているように見受けられることがしばしばあります。


 日本語教育の立場からも,外来語の問題点が指摘されている.以下,遠藤(編) (205--06) より引用するが,これも広い意味では機能主義的な議論の一種だろう.

 日本語の中に外来語が多いことは、日本人にとってだけでなく、日本語学習者にとっても、いろいろな問題を生んでいる。
 日本人にとっては、次々に生まれるカタカナの外来語の意味するところがわからなくて、困惑する人が多くなっている。政府関係の白書に使われる外来語の多さが、論議を呼び、外来語使用を自粛するように通達も出されたこともある。しかし、減る気配はいっこうに見えなくて、意思疎通に支障を来すことをおそれて国立国語研究所が言い換え案を出すことになった。その効果についてはまだ、報告されていない。
 ショートステイ・ケアマネージャー・ケアプログラム・バリアフリーなど、福祉関係の用語が外来語で占められているが、これではその主な対象者である高齢者にはわかりにくい。ノーマライゼーション・アカウンタビリティなどのように新しい概念を移入するとき、原語をそのままカタカナにするために、外来語が増えるのであるが、そのカタカナの表す音と原語の発音の差が大きすぎて、原語のわかる人にもそのカタカナ語はわからない。まして、日本で適当に原語を組み合わせて作られる語(=和製語)は、原語を知っている人でもまったく類推が利かない。
 そのために、英語の話者は倍の苦労をする。日本人はカタカナの語を見ると、英語だと思い、外国人には英語で言えば通じると思う。しかし、それは英語でも何でもない日本での造語である。英語話者に通じるはずがないのに、通じると思われて多く使ってこられるとしたら、ますます負担は大きくなるのである。
 発音のわかりにくい、英語もどきのことばより、いっそ本来の日本語で言ってくれたほうがはるかにわかりやすいと、日本語を知る英語話者は嘆いているのである。
 日本語を教える際に、カタカナ外来語は、原語とは関連がなく、まったく新たな日本語であるということを認識しておく必要がある。


 このように外来語の氾濫は様々な批判の対象とはなっているが,実際のところ,多くの日本語母語話者は外来語の受容と使用について議論こそすれ,本格的に敵視し排除しようというわけではなさそうだ.外来語を法によって規制しようという動きにまで発展したことはないし,今後もそこまで行くかどうかは疑問だ.全体として現状肯定,あるいは消極的な支持という向きが支配的のように思う.

 ・ 『新版日本語教育事典』 日本語教育学会 編,大修館書店,2005年.
 ・ 遠藤 織枝(編) 『日本語教育を学ぶ 第二版』 三修社,2011年.

[ 固定リンク | 印刷用ページ ]

2013-09-29 Sun

#1616. カタカナ語を統合する試み,2種 [japanese][katakana][loan_word][lexicography][lexicology][language_planning][binomial]

 昨日の記事「#1615. インク壺語を統合する試み,2種」 ([2013-09-28-1]) で,16世紀に大量にラテン語から流入したインク壺語の理解を促すための主たる方法として,辞書の出版と言い換え表現があったことを述べた.おもしろいことに,現代日本語におけるカタカナ語の大増殖にも,ほとんど同じことがいえる.大正以降,とりわけ戦後の洋語(ほとんどが英語)の語彙借用はおびただしいが,それを日本語語彙に統合しようとする試みの1つとして,カタカナ語辞書の出版が目につく.図書検索サイトなどで,「カタカナ語」や「外来語」を題名に含む本を検索すると,非常に多くの参考図書がヒットする.地元の公立図書館のこども用書棚をちょっとのぞくだけでも,例えば『カタカナ語おもしろ辞典』(村石 利夫,さ・え・ら書房,1990年)や『カタカナ語・外来語事典』(桐生 りか,汐文社,2006年)が簡単に見つかる.この日本の著者たちの意図は,かつてのイングランドの Mulcaster, Cawdrey, Bullokar, Cockeram の意図と重ね合わせることができるだろう.
 インク壺語統合のために用いられたもう1つの方法,すなわち言い換え表現もまた,カタカナ語統合のために利用されている.ただし,カタカナ語の場合には,近年,より公的な言語政策が関与していることに注意したい.2002--06年,国立国語研究所の「外来語」委員会が「外来語」言い換え提案の活動を行い,その成果を公開した.言い換え手引きは書籍としても出版されたし,オンラインでも公開されている.委員会設立趣意書提案した語の一覧ほか,様々な参考資料や研究論文がオンラインで閲覧できる.趣意書に「緩やかな目安・よりどころを具体的に提案することを目指しています」とあるとおり,強制力のない提案ではあるが,公的な機関が策定しているという点で,国による言語政策の一環(とりわけ corpus planni ng と呼ばれるもの)と考えてよいだろう.「アーカイブ〔保存記録〕」「インフォームドコンセント〔納得診療〕」「ワーキンググループ〔作業部会〕」などの表記は,かつてのイングランドにおける "education or bringing up of children", "agility and nimbleness" を想起させる.かっこ付きで補助的に表記するとき,それは一種の日本語版 2項イディオム (binomial idiom) であるといえる.
 時代も言語も異なるが,インク壺語もカタカナ語も,その統合のための努力と手段については大きく変わるところがない.個々の語が定着するか廃用となるかが時間の問題であることも,変わらないだろう.

[ 固定リンク | 印刷用ページ ]

2013-09-21 Sat

#1608. multilingualism は世界の常態である (2) [bilingualism][japanese][world_languages][sign_language][language_or_dialect]

 [2013-05-30-1]の記事の続編.多言語使用が世界の常態であるという事実について,Crystal (409--10) に言及を見つけたので,追加したい.

[M]ultilingualism is the normal human condition. It is a principle which often takes people by surprise. If you have lived your whole life in a monolingual environment, you could easily come to believe that this is the regular way of life around the world, and that people who speak more than one language are the exceptions. Exactly the reverse is the case.
   Speaking two or more languages is the natural way of life for three-quarters of the human race. There are no official statistics, but with over 6,000 languages co-existing in fewer than 200 countries . . . it is obvious that an enormous amount of language contact must be taking place; and the inevitable result of languages in contact is multilingualism, which is most commonly found in an individual speaker as bilingualism.
      There is no such thing as a totally monolingual country. Even in countries that have a single language used by the majority of the population, such as Britain, the USA, France, and Japan, there exist sizeable groups that use other languages. In the USA, around 10% of the population regularly speak a language other than English. In Britain, over 350 minority languages are in routine use. In Japan, one of the most monolingual of countries, there are substantial groups of Chinese and Korean speakers. In Ghana, Nigeria, and many other African countries that have a single official language, as many as 90% of the population may be regularly using more than one language. (409--10)


 引用にもあるとおり,日本は世界でも最も典型的な単一言語国家とみなされるがちだ.しかし,少数言語としてアイヌ語や,朝鮮・韓国語その他の移民言語,日本手話などの手話言語も行われている.また,琉球語なのか琉球方言なのかという問いの答えいかんによっては,その話者のすべてが標準日本語を理解するという意味において,2言語使用者と呼びうる.また,ビジネスなどで英語や中国語などを常用する多くの日本語母語話者の日本人も,日本国内外の多言語使用に貢献している人々であるとみなすことができる.程度の差こそあれ,日本も世界の他の地域と同様に多言語使用地域であるという認識は重要だろう.
 日本の多言語使用状況については,EthnologueJapan を参照されたい.

 ・ Crystal, David. How Language Works. London: Penguin, 2005.

Referrer (Inside): [2016-01-08-1] [2014-11-12-1]

[ 固定リンク | 印刷用ページ ]

2013-09-14 Sat

#1601. 英語と日本語の母音の位置比較 [phonetics][japanese][vowel][rp]

 英語と日本語の調音の異同については,どの音声学の教科書でも詳述されているが,母音を調音する際の舌の位置については母音四辺形で対比的に示すのが最もわかりやすい.今井 (2) より,短母音と長母音の図を掲載する.

Vowel Trapezoid of Japanese and English

 上記の母音調音位置はそれぞれの言語の標準変種に基づいているが,その内部において,異音の幅もあれば,個人差もある.しかし,この図をみれば,日本語を母語とする英語学習者が,発音上,一般的に気をつけるべき点を多く見いだすことができるだろう.日本語の [エ] はやや高いので,ときに英語の [e] ではなく [ɪ] に近づくこと.英発音の [ʌ] は,案外と日本語の [ア] に近いこと.日本語の [ウ] と [オ] の差は比較的少ないが,英語で対応するとみなされている [uː] や [ʊ] と [ɔː] の差は比較的大きいこと.「ア(ー)」と音訳される [ɑː], [ɑ], [ɒ] は,いずれも英語では相当に奥まっていること,等々.
 概して,英語には周辺部や突端部で調音する母音が多く,口腔内が広く使われるという印象だ.一方,日本語の母音調音は,口腔の中央寄りにこじんまりと分布しているようだ.ぼそぼそ感といおうか,確かに口をあまり動かさずに「アイウエオ」と発音できてしまう.
 ただし,上の図の調音位置を不変の静的なものととらえるのは誤りである.この100年ほどの間の英語における調音位置の変化をみてみると,意外と変化の幅は大きい.Bauer (121) によると,RP をとってみても,[uː] の調音は上の図で表わされるよりも顕著に前寄りになってきているという.[ʌ] についても,明らかに前舌化が進んできているし,[æ] も図よりも若干後ろ寄りでの調音の傾向を示す証拠がある.言語変化は常に進行してるために避けられないことではあるが,概説書などの調音図は,原則として多少なりとも時代遅れの調音を表わすものだと考えておいてよい.

 ・ 今井 邦彦 『ファンダメンタル音声学』 ひつじ書房,2007年.
 ・ Bauer, Laurie. Watching English Change: An Introduction to the Study of Linguistic Change in Standard Englishes in the Twentieth Century. Harlow: Longman, 1994.

Referrer (Inside): [2021-06-21-1] [2015-04-17-1]

[ 固定リンク | 印刷用ページ ]

2013-08-11 Sun

#1567. 英語と日本語のオンラインコーパスをいくつか紹介 [web_service][corpus][efl][link][japanese]

 ウェブ上で用いることのできるコーパスをいくつか紹介したい.
 まず,「#1441. JACET 8000 等のベース辞書による語彙レベル分析ツール」 ([2013-04-07-1]) で取り上げた染谷泰正氏は,Business Letter Corpus のオンライン・コンコーダンサーをこちらで公開している.27種のコーパスからの検索が選択可能となっているが,メインは100万語超からなる Business Letter Corpus (BLC2000) とそれにタグ付けした POS-tagged BLC の2つだ.これは1970年代以降の英米その他の出版物から収集したデータである.
 Instructions for the First-Time User でまとめられているように,種々のコーパスのなかには,167万語を超える State of the Union Address (1790--2006) などデータをダウンロードできるものもあり,有用である.英作文の学習・教育や,独自データベースのコンコーダンサー作成のために参考になる.
 なお,同サイトでは,上述の各種コーパスから N-Gram Search を行なえる Bigram Plus の機能も提供している.N-Gram の検索には,本ブログより「#956. COCA N-Gram Search」 ([2011-12-09-1]) も参照.
 次は,英国のリーズ大学 (University of Leeds) が作成した大規模な Leeds collection of Internet corpora.英語を始め,フランス語,日本語などの様々な言語のコーパスをオンラインで検索できる.
 日本語のコーパスの情報については詳しくないが,KOTONOHA 「現代日本語書き言葉均衡コーパス」は充実しているようだ.ほかの日本語コーパスの情報源としては,コーパス日本語学のための情報館 --- コーパス紹介が有用.

Referrer (Inside): [2013-10-09-1]

[ 固定リンク | 印刷用ページ ]

2013-08-02 Fri

#1558. ギネスブック公認,子音と母音の数の世界一 [phonology][phoneme][vowel][consonant][altaic][japanese][language_family][world_languages][austronesian]

 日本語のルーツについての有力な説の1つに,オーストロネシア系 (Austronesian) とアルタイ系 (Altaic) の言語が融合したとする説がある.オーストロネシア語族の音韻論的な特徴としては,開音節が多い,区別される音素が少ないというものがあり,確かに日本語の比較的単純な音素体系にも通じる.
 日本語の音素が比較的少ない点については「#1021. 英語と日本語の音素の種類と数」 ([2012-02-12-1]) および「#1023. 日本語の拍の種類と数」 ([2012-02-14-1]) で触れたが,そこでは関連してハワイ語にも触れた.ハワイ語もオーストロネシア語族に属する言語で,8つの子音 /w, m, p, l, n, k, h, ʔ/ と5つの母音 /a, i, u, e, o/ を区別するにすぎない(コムリー,p. 95).ところが,世界にはもっと音素が少ない言語があるのである.
 地理的にオーストロネシア語族と隣接しているパプア諸語も,音韻体系は単純である.そのなかでも,東パプアニューギニアの Bougainville Province で4千人ほどの話者によって話されているロトカス語 (Rotokas) は,6つの子音 /b, g, k, p, r, t/ と5つの母音 /a, e, i, o, u/ の計11音素(と対応する11の文字)しかもたない(Ethnologue より,関連する言語地図はこちら).コムリー (106) によれば,これは世界最少の音素数であり,とりわけ子音の少なさについては1985年のギネスブック (199) に登録されているほどである.
 子音についていえば,最多を誇るのは「#1021. 英語と日本語の音素の種類と数」 ([2012-02-12-1]) でも触れたウビフ語である.80--85個の子音をもつという.母音の最少は,コーカサス地方のアブハズ語で2母音しかもたない.母音音素の最多はベトナム中央部のセダン語で,明確に区別できる55の母音をもつという.世界は広い.
 同じギネスブック (198--201) では,言語についての興味深い「世界一」が,他にもいろいろと挙げられており,一見の価値がある.言語のびっくり統計は,Language statistics & facts も参考になる.

 ・ バーナード・コムリー,スティーヴン・マシューズ,マリア・ポリンスキー 編,片田 房 訳 『新訂世界言語文化図鑑』 東洋書林,2005年.
 ・ ノリス・マクワーター 編,青木 栄一・大出 健 訳 『ギネスブック』 講談社,1985年.

[ 固定リンク | 印刷用ページ ]

2013-07-23 Tue

#1548. アルタイ語族 [altaic][family_tree][japanese][language_family][map][mongolian]

 「#496. ウラル語族」 ([2010-09-05-1]) と合わせてウラル・アルタイ大語族の仮説を構成するアルタイ語族 (Altaic) について,バーナード・コムリー他 (46--47) より紹介する.アルタイ語族は,実証されてはいないものの朝鮮語や日本語が所属するとも提案されてきた重要な語族である.コムリーの与えているアルタイ語系統図を見てみよう.

Altaic Family Tree

 この語族の故地はアルタイ山脈付近(下図参照)にあるとされ,西のチュルク語派 (Turkic),中央のモンゴル語派 (Mongolian),東のツングース語派 (Tungus) が区分される.その後,担い手である遊牧民によって拡散し,現在ではトルコからシベリア北東部にいたる大草原地帯に広く分布する.

Map of the Altaic Mountains

 アルタイ諸語のあいだの系統関係は,語彙よりも文法上の類似に基づくものが多く,研究者間で必ずしも意見の一致を見ているわけではない.共通する特徴として指摘されるのは,語順が SOV であること,膠着語であること,母音調和をもっていることが挙げられるが,後者2点についてはウラル語族の特徴とも一致する.日本語の所属が提案されているのも,これらの特徴ゆえである.主流派の見解によれば,日本語はアルタイ語族とオーストロネシア語族の混成語とも言われるが,証明は難しい.
 満州語は,中国最後の皇帝の言語であり,清王朝 (1644--1911) のもとで優遇されたが,現在では大多数の話者が中国語へ言語交替したため,消滅の危機に瀕している.
 アルタイ語族の各言語の詳細については,Ethnologue report for Altaic を参照.

 ・ バーナード・コムリー,スティーヴン・マシューズ,マリア・ポリンスキー 編,片田 房 訳 『新訂世界言語文化図鑑』 東洋書林,2005年.

[ 固定リンク | 印刷用ページ ]

Powered by WinChalow1.0rc4 based on chalow