実践 R によるテキストマイニング(ジッセンアールニヨルテキストマイニング)
- 著者:
- 石田 基広(イシダ モトヒロ)
- 出版社:
- 森北出版
- 出版日:
- 2020年03月28日頃
- ISBN:
- 9784627885110
- 価格:
- ¥2,640
- 在庫:
- 1
- 判型:
- 単行本
書籍紹介
今やテキストマイニングは,文章を単語に切り分けて,単語の出現頻度を数えるだけにはとどまりません.
商品やイベントに対する SNS 上の意見をポジティブ・ネガティブに分ければ,何が評価されて,どこを改善すべきかが一目瞭然.
政治家の演説のトピックが,時代とともにどう移り変わってきたかを解析すると,社会の変化を見て取ることもできます.
小説の話題展開の流れや,登場人物とキーワードの結びつきも,自動で分析可能です.
文書解析で本当にやりたかったこれらのことは,R で手軽に実現できます.
テキストマイニング定番書の著者による,次の一歩のためのやさしい手引きです.
[もっと基本的なことから学びたい方は,同著者による「 R によるテキストマイニング入門[第 2 版] (森北出版) 」もご覧ください]
〈本書で扱う主な内容〉
●センチメント分析
日本語極性辞書を用いて,単語の極性からテキスト全体がポジティブかネガティブか判断.
●単語分散表現
単語の頻度だけでなく,出現位置に注目し,単語どうしの意味の関連性を数値化.
●機械学習,ディープラーニング
機械学習を用いて,より高度な解析も実現.Python を前提とした訓練済みモデルやディープラーニングのフレームワークも,RStudio から簡単に利用可能.
第 1 章 R による日本語テキスト解析の基礎
第 2 章 センチメント分析
第 3 章 構造的トピックモデル
第 4 章 Twitter 投稿テキストの評価
第 5 章 機械学習による予測
第 6 章 単語分散表現
第 7 章 R から Python ライブラリを実行
言及の推移
言及 Qiita 記事 (5 件)
【データ分析の必読10冊+差をつける10冊+100冊超】データサイエンス、データ分析、機械学習関連の本
♡ 1633本, 機械学習, 数学, データ分析, データサイエンスhashアルゴリズムとハッシュ値の長さ一覧(+ハッシュ関数の基本と応用)
♡ 507hash, ipfs, ハッシュ関数, ブロックチェーン, NFT【随時更新】マテリアルズインフォマティクスに関する最新動向まとめ
♡ 70まとめ, bioinformatics, chemoinformatics, MaterialsInformatics, マテリアルズインフォマティクス統計検定「データサイエンス基礎」の学習あと
♡ 34Excel, データサイエンス, 統計検定2024年版機械学習・データ分析の必須10冊+ガチ67冊+Next5冊=82冊(Rユーザー向け)
♡ 9R, 本, 機械学習, データ分析, データサイエンス