[増補改訂]ビッグデータを支える技術 --ラップトップ 1 台で学ぶデータ基盤のしくみ(ゾウホカイテイ ビッグデータヲササエルギジュツ ラップトップイチダイデマナブデータキバンノシクミ)
- 著者:
- 西田 圭介(ニシダ ケイスケ)
- 出版社:
- 技術評論社
- 出版日:
- 2021年02月13日頃
- ISBN:
- 9784297119522
- 価格:
- ¥3,520
- 在庫:
- 1
- 判型:
- 単行本
書籍紹介
「ビッグデータ」をテーマに、データ分析基盤技術をまとめた解説書。
AI の発展、コンテナ技術の進歩をはじめ、ビッグデータを取り巻く技術が大きく変わり始めました。ビッグデータの技術には、元々大きく分けて 2 つのバックグラウンドがありました。一つは業務系システムで、 RDB (Relational Database) から取り出したデータをバッチ処理して役立つ情報を提供する。もう一つは Web/IoT 系システムで、 RDB では扱いきれない大量のログを分散システムを使い、データ処理をする。この 2 つの流れが融合し、膨大なデータを収集/変換し、分析/可視化するための一連の基盤システムの重要度は格段に上がりました。さらに昨今の AI/機械学習の台頭で、新たな潮流が生まれています。
本書では、ビッグデータを支える基盤技術の「今」に焦点を当て、前半ではデータ量や分散処理など基本概念の整理と、代表的なテクノロジーを徹底解説。合わせて、各技術登場の歴史的な背景も丁寧に追います。後半は実践編としてオープンソースや無償版が利用できるソフトウェアを中心にラップトップ 1 台でビッグデータを体験しながら学べるよう解説を進めます。今回の改訂では、ビッグデータの技術を活用した応用分野のうち注目度の高い機械学習や特徴量ストア、 MLOps の話題も新たに盛り込み、充実の内容でお届けします。
言及 Qiita 記事 (2 件)
関連記事
関連用語
データレイク
構造化・非構造化データを生の形式で大量に保存し、後から分析・加工するストレージ基盤
MapReduce
大規模データを Map (分割・変換) と Reduce (集約) の 2 段階で並列処理する分散処理モデル
データウェアハウス
分析用に最適化された大規模データストアで、複数のデータソースを統合して意思決定を支援する
Python
読みやすさを重視した汎用プログラミング言語で、データサイエンス、AI、Web 開発で広く使われる
AWS Glue
AWS のサーバーレス ETL サービスで、データの抽出・変換・ロードとデータカタログ管理を提供する
代数的データ型
直和型と直積型を組み合わせてデータを表現する型システムの概念