実践 R によるテキストマイニング
- 著者:
- 石田 基広
- 出版社:
- 森北出版
- 出版日:
- 2020年03月28日頃
- ISBN:
- 9784627885110
- 価格:
- ¥2,640
- 在庫:
- 1
- 判型:
- 単行本
★★★★☆4.0(1 件)
中級者向け
Rテキストマイニングセンチメント分析単語分散表現機械学習深層学習自然言語処理データ分析社会科学文学分析
書籍紹介
今やテキストマイニングは,文章を単語に切り分けて,単語の出現頻度を数えるだけにはとどまりません. 商品やイベントに対する SNS 上の意見をポジティブ・ネガティブに分ければ,何が評価されて,どこを改善すべきかが一目瞭然. 政治家の演説のトピックが,時代とともにどう移り変わってきたかを解析すると,社会の変化を見て取ることもできます. 小説の話題展開の流れや,登場人物とキーワードの結びつきも,自動で分析可能です. 文書解析で本当にやりたかったこれらのことは,R で手軽に実現できます. テキストマイニング定番書の著者による,次の一歩のためのやさしい手引きです. [もっと基本的なことから学びたい方は,同著者による「 R によるテキストマイニング入門[第 2 版] (森北出版) 」もご覧ください] 〈本書で扱う主な内容〉 ●センチメント分析 日本語極性辞書を用いて,単語の極性からテキスト全体がポジティブかネガティブか判断. ●単語分散表現 単語の頻度だけでなく,出現位置に注目し,単語どうしの意味の関連性を数値化. ●機械学習,ディープラーニング 機械学習を用いて,より高度な解析も実現.Python を前提とした訓練済みモデルやディープラーニングのフレームワークも,RStudio から簡単に利用可能. 第 1 章 R による日本語テキスト解析の基礎 第 2 章 センチメント分析 第 3 章 構造的トピックモデル 第 4 章 Twitter 投稿テキストの評価 第 5 章 機械学習による予測 第 6 章 単語分散表現 第 7 章 R から Python ライブラリを実行
シークレットブーツを見てみる →