hellog〜英語史ブログ

#5280. 本年度も大学院生とデジタル資料を用いた研究の功罪について議論しました[methodology][corpus]

2023-10-11

 年に一度,人文系研究のためのデジタル資料の扱い方について大学院生と議論する機会があります.昨年度の議論の経緯は,以下の記事で報告しました.

 ・ 「#4915. 英語史のデジタル資料 --- 大学院のデジタル・ヒューマニティーズ入門講義より」 ([2022-10-11-1])
 ・ 「#4916. デジタル資料を用いた研究の功罪について議論しました」 ([2022-10-12-1])

 先日,今年度も改めて同じ趣旨で議論する機会を得ました.参加者の大学院生は昨年度とは異なるメンバーで,それぞれ人文系の様々な分野に所属しています.まず私自身が英語史を専攻していることもあり英語史分野におけるデジタル資料の利用とその課題について概要をお話しました.その上で,各大学院生に,自身の分野に引きつけてデジタル資料の利用法について顧みてもらい,その功罪を箇条書きで挙げてもらいました.おもしろい見解がたくさん出てきましたので,以下に列挙し,本ブログ読者の皆さんと共有したいと思います.



 功:地理的に閲覧が難しい史料を扱えるようになった
 罪:デジタル化されている史資料のみを扱う傾向が加速する
 罪:デジタル化が進んでいる地域の言語のみで研究が発達し,言語帝国主義が加速する
 罪:物質的に書いてある文字を画像にスキャンする際に失われてしまう情報がある(インクの染みなのか句読点なのかがわかりにくい,透かしのデザインに気が付かないなど)
 功:デジタル化される際に何らかのフォーマットで統一されるため,データ同士の参照がしやすくなった
 功:1人の手作業では絶対にできなかった研究が容易にできるようになった
 罪:逆引き辞典により,古典語の実際の学習効率が落ちている(自分で覚えようという気にならない).また,逆引きの間違いに気づかない.
 罪:地域によっては,資料のデジタル化のばらつきが激しい
 功:言語哲学においてコーパスの使用により実証的な概念分析ができるようになった
 罪:デジタル化されている資料とそうでない資料の間の参照される度合いに格差が生じてしまった
 罪:研究に要求される調査範囲が,デジタル化で際限なく拡大してしまった
 罪:データを収集する際に,サービス提供側のルールが急に変わったりすることがある(例:X(旧Twitter)ツイートの収集)
 功:特定の言葉について長い期間で意味の変化を追うことができるようになった
 罪:実物資料から読み解けることに対する理解が乏しくなる可能性がある
 罪:あまり質の良くない論文(査読無し)も見つかる
 罪:提供されているデータの範囲や性質について考えずに使っても,一見それなりの結果を出せてしまうので,研究の目的から見たときのデータの妥当性について考えない場合も出てきてしまう(研究する側の問題ですが)
 罪:データ閲覧に端末の種類,スペックに制限がある
 功:量的分析に取り組みやすくなる
 罪:質的分析の方が適切な場合でも,量的分析を選びがちになってしまうおそれがある
 功:書籍の中の語句を検索できることにより,参照したい箇所をすぐに見つけられるようになった
 功:時期やテーマと言った研究範囲を指定しやすくなった
 罪:デジタル化される際に行われた編集作業を把握するのが難しいため,本来の資料と編集者の意図が一体化してしまう
 罪:参照すべきと思わせる文献が増えた
 功:情報がリンク化されていれば,素早くアクセスできる.
 罪:出てくるデータ量が大きすぎて事後処理に時間がかかるようになってしまった
 功:API を用いて大規模なデータの取得ができるようになった
 功:逆引き辞典により,古典語学習初期段階から読める一次史料が増える
 功:臨床群等の貴重なデータを使用することができる
 功:3Dスキャンによって,実物資料にアクセスしなくても資料閲覧ができるようになった.
 功:作品における一つの言葉について注目し研究したい場合,検索をかけることで簡単に調べられる(一作品において特定の単語が何回使用されたか等)
 罪:用例や言葉が多すぎて,調べた結果をまとめるだけでも,時間がかかる
 功:提供されるデジタル化された文献に関連する文献を探しやすくなった
 功:ファンダム研究において,ブログなどのSNSにより,ファンの声が記録でき,貴重なデータベースである
 功:デジタル化により資料の共有・二時配布が容易になった(著作権侵害も容易になりこれは罪でもある)
 功:一般人でも一次史料にアクセスできるようになった
 罪:コーパスで調べても,当時の具体的な意味については同時代の史料を読む必要があり,便利になったとは言い切れない
 罪:捏造,やらせ,デマを飛ばすような信ぴょう性の低い内容もデータになってしまう
 罪:アーカイブ調査では,資料同士の物理的な距離感を知ることから得られる情報もあるため,個々人がデジタル化されたもののうち必要な箇所だけを見ることで「資料間の距離感」が失われるのではないか




 全38件中,功18件に対して罪20件となりました.思いのほか罪がよく挙がるのは昨年も同様でした.私自身も思い当たるところがありますが,このお題を示されると,問題意識が呼び覚まされるのかもしれません.非常に気づきの多いブレストでした.

[ | 固定リンク | 印刷用ページ ]

Powered by WinChalow1.0rc4 based on chalow