スモールデータ解析と機械学習(スモールデータカイセキトキカイガクシュウ)
- 著者:
- 藤原 幸一(フジワラ コウイチ)
- 出版社:
- オーム社
- 出版日:
- 2022年02月19日頃
- ISBN:
- 9784274227783
- 価格:
- ¥3,520
- 在庫:
- 1
- 判型:
- 単行本
書籍紹介
スモールなデータの解析手法・ノウハウが身につく!
人工知能によるビッグデータ解析が近年、広く注目されています。しかし、製造メーカなどのほとんどの一般企業においてはデータ量が少なかったり偏っていたりする、スモールデータがデータの中心です。本書はそのようなスモールデータの解析手法を解説するものです。
Web データや気象データに代表されるようなビッグデータが注目される一方で、機械の故障データのように発生自体がまれであったり、臨床データのように倫理的な問題からデータ収集が困難、あるいはラベリングが専門家以外困難で教師データが集まらなかったりするスモールなデータ、すなわちスモールデータが存在します。
これらのデータは測定されている変数の数に比べて統計モデリングに必要なデータが不足していたり、正負双方のサンプルが必要となる分析において、その取得が困難といったような問題があり、そのままビッグデータの考え方を適用するのは適当ではありません。
本書は、はじめにスモールデータとは何かから、データの作り方となる次元削減と回帰分析の手法、つづいてスパースなデータのモデリング、クラスタリング、不均衡なデータの解析手法、異常検出を述べていきます。そして最後にスモールデータの解析においてのポイント・考え方を述べて、読者がスモールデータを有効に解析できるようになるようまとめました。
第 1 章 スモールデータとは
第 2 章 相関関係と主成分分析
第 3 章 回帰分析と部分的最小二乗法
第 4 章 線形回帰モデルにおける入力変数選択
第 5 章 分類問題と不均衡データ問題
第 6 章 異常検知問題
第 7 章 データ収集や解析の心構え
言及の推移
言及 Qiita 記事 (4 件)
この本に興味がある方におすすめ
この本に関連
関連記事
関連用語
データレイク
構造化・非構造化データを生の形式で大量に保存し、後から分析・加工するストレージ基盤
データウェアハウス
分析用に最適化された大規模データストアで、複数のデータソースを統合して意思決定を支援する
Redshift
AWS のペタバイト規模のデータウェアハウスサービスで、大量データの分析クエリを高速に実行する
AWS Glue
AWS のサーバーレス ETL サービスで、データの抽出・変換・ロードとデータカタログ管理を提供する
MapReduce
大規模データを Map (分割・変換) と Reduce (集約) の 2 段階で並列処理する分散処理モデル
Python
読みやすさを重視した汎用プログラミング言語で、データサイエンス、AI、Web 開発で広く使われる