hellog〜英語史ブログ     ChangeLog 最新    

software - hellog〜英語史ブログ

最終更新時間: 2024-11-21 08:03

2009-07-15 Wed

#78. Verbix とコーパス [software][web_service][conjugation][inflection][oe][me][corpus][variation]

 昨日の記事[2009-07-14-1]で,Verbix の古英語版の機能を紹介し,評価して終わったが,実は述べたかったことは別のことである.
 動詞の不定詞形を入れると活用表が自動生成されるという発想は,標準語として形態論の規則が確立している現代語を念頭においた発想である.これは古英語や中英語などには,あまりなじまない発想である.確かに古英語にも Late West-Saxon という「標準語」が存在し,古英語の文法書では,通常この方言にもとづいた動詞の活用表が整理されている.だが,Late West-Saxon の「標準語」内ですら variation はありうるし,方言や時代が変われば活用の仕方も変わる.中英語にいたっては,古英語的な意味においてすら「標準語」が存在しないわけであり,Verbix の中英語版というのは果たしてどこの方言を標準とみなして活用表を生成しているのだろうか.
 Verbix 的な発想からすると,方言や variation といった現象は,厄介な問題だろう.このような問題に対処するには,Verbix 的な発想ではなくコーパス検索的な発想が必要である.タグ付きコーパスというデータベースに対して,例えば「bēon の直説法一人称単数現在形を提示せよ」とクエリーを発行すると,コーパス中の無数の例文から該当する形態を探しだし,すべて提示してくれる.その検索結果は,おそらく Verbix 型のきれいに整理された表ではなく,変異形 ( variant ) の羅列になるだろう.古英語の初学者にはまったく役に立たないリストだろうが,研究者には貴重な材料だ.
 英語史研究,ひいては言語研究における現在の潮流は,標準形を前提とする Verbix 的な発想ではなく,variation を許容するコーパス検索的な発想である.同じプログラミングをするなら,Verbix のようなプログラムよりも,コーパスを検索するプログラムを作るほうがタイムリーかもしれない.
 とはいえ,Verbix それ自体は,学習・教育・研究の観点から,なかなかおもしろいツールだと思う.だが,個人的な研究上の都合でいうと,古英語や中英語の名詞の屈折表の自動生成ツールがあればいいのにな,と思う.誰か作ってくれないだろうか・・・.自分で作るしかないのだろうな・・・.

[ 固定リンク | 印刷用ページ ]

2009-07-14 Tue

#77. 動詞の活用表を生成してくれる「Verbix」 [software][web_service][conjugation][inflection][oe]

 Verbix: conjugate Old-English verbsでは,古英語の動詞(不定詞)をキーワードとして入れると,活用表が自動的に生成されるというウェブサービスを無償で提供している.
 古英語のみならず,現代英語を含め,世界の諸言語に対応しており,各言語の学習者,教育者,研究者にとって有益である.このサイトでは,ダウンロード可能な単体で動く同機能のアプリケーションもシェアウェアとして提供しており,一ヶ月までなら試用もできる.アプリケーション版では,機能拡張を施せば,中英語にも対応するようになるというから興味深い.

conjugation of beon

 上のスクリーンショットは,アプリケーション版で古英語の bēon "to be" の活用表を生成させた場面だが,みごとに wesan ( bēon に代わる別の動詞)の活用表に置き換えられてしまっている.現代英語でもそうだが bēon は著しく不規則な活用を示すわけで,こんな動詞をキーワードに入れてくれるなという Verbix からのメッセージとも受け取れる.
 そもそもアプリケーションのプログラム内では,どのように活用表が生成されているのだろうか.最初は,おそらく各動詞の活用形がそのままデータベースに納められており,プログラム側がそれを呼び出すだけなのではないかと思っていた.だが,bēon の例を見ると,そのようなきめ細かなデータ格納法はとられていないように思える.
 考えられるもう一つの方法は,最少限の基底形(古英語であれば「不定形 -- 第一過去形 -- 第二過去形 -- 過去分詞形」の4形態[2009-06-09-1])と所属クラスだけがデータベースに登録されており,あとは形態音韻規則によってプログラムに各活用形を生成させるという方法だ.こうすると,データ部の容量は節約できる.
 人間の脳では,上の二つの仕組みが連携して作用していると考えられる.大半の動詞についてはルールに基づいて活用形が生成されるが,bēon のような不規則活用をする動詞の場合には,ルールでは導かれないので,活用形がそのままデータとして格納されているというわけである.Verbix でも二つの方法が組み合わさって活用表の生成機能が実現されているのかもしれないが,bēon まではサポートが及ばなかったというだけのことかもしれない.
 上記のような問題はあるが,古英語動詞の活用の練習には使えそうだ.かつて学んだ動詞活用を Verbix で復習してみよう.

 ・Verbix の古英語版
 ・Verbix の現代英語版
 ・Verbix の対応言語一覧

Referrer (Inside): [2009-07-15-1]

[ 固定リンク | 印刷用ページ ]

Powered by WinChalow1.0rc4 based on chalow