文学と言語コーパスのマイニング

文学と言語コーパスのマイニング

金 明哲/中村 靖子/上阪 彩香/土山 玄/孫 昊/劉 雪琴

内容紹介

古文や現代文、話し言葉などを対象とする人文学研究において、近年、テキストアナリティクスが注目を集めている。『源氏物語』「宇治十帖」の著者問題、芥川龍之介や宇野浩二の文体の変遷、日本の方言分類分析など、文献研究に統計的手法を融合させた「計量文献学」における最新の研究成果をわかりやすく紹介した入門書。
はじめに

第1章スタイロメトリー分析
 1. 1 スタイロメトリー
 1. 2 書き言葉におけるスタイロメトリー
 1. 3 書き手の文体特徴量
 1. 4 特徴量の分析方法

第2章古典文学の数理的研究と実例
 2. 1 問題の所在
 2. 2 数理的手法を用いた研究
 2. 3 日本語の特徴
 2. 4 公開されているテキスト資料とソフトウェア
 2. 5 形態素解析について
 2. 6 分析用ツール
 2. 7 西鶴浮世草子の著者判別

第3章『源氏物語』を中心とした平安文学の計量分析
 3. 1 文章の計量分析における研究テーマ
 3. 2 『源氏物語』における計量的な研究課題と研究事例
 3. 3 古典文学作品への計量的なアプローチ
 3. 4 平安時代の文学作品を対象とした計量的な研究の今後の展望

第4章リルケでテキストマイニング!
 4. 1 問題設定
 4. 2 『マルテの手記』と他の作品・評論との比較
 4. 3 2 つの文体:「短編小説」と「評論」
 4. 4 『マルテの手記』の特徴
 4. 5 まとめ
 付表 文体判別に用いたサンプル文書

第5章 文学作品の代筆問題
 5. 1 はじめに
 5. 2 著者識別
 5. 3 文体特徴量
 5. 4 著者識別の方法
 5. 5 川端康成の代筆問題
 5. 6 まとめ

第6章 計量文体学からたどる文体の変化
 6. 1 文体論
 6. 2 文体の変化
 6. 3 芥川龍之介の文体変化
 6. 4 宇野浩二の文体変化
 6. 5 総括

第7章 文学作品の模倣に関する計量的比較分析
 7. 1 模倣作品の計量分析への誘い
 7. 2 夏目漱石著『明暗』と水村美苗著『続明暗』について
 7. 3 コーパスの構築
 7. 4 主たる分析手法
 7. 5 文体の比較
 7. 6 トピックの時系列変化
 7. 7 おわりに
 付表 コーパスリスト

第8章 コーパスにおけるモーラ情報を用いた日本の方言分類分析
 8. 1 はじめに
 8. 2 分析データと研究方法
 8. 3 岐阜・愛知の東西所属
 8. 4 おわりに
 付表1 自立モーラ一覧表
 付表2 モーラunigram相対頻度表(上位12)

参考文献
索引

この本をシェア

X LINE Facebook はてブ

価格比較(新品・中古)

価格を確認中...
Amazon直販
他の価格を読み込み中...

図書館で借りる

カーリルでこの本の詳細を見る →