AWSではじめるデータレイクの表紙

AWS ではじめるデータレイク(エーダブリューエスデハジメルデータレイク)

クラウドによる統合型データリポジトリ構築入門

著者:
上原 誠/志村 誠/下佐粉 昭/関山 宜孝(ウエハラ マコト/シムラ マコト/シモサコ アキラ/セキヤマ ノリタカ)
出版社:
テッキーメディア
出版日:
2020年07月09日頃
ISBN:
9784910313016
価格:
¥3,080
在庫:
1
判型:
単行本
★★★★☆3.75(4 件)
言及数
78
総合
361
1 ランクアップ42 件の言及
中級者向け
AWSデータレイクデータ分析機械学習オブジェクトストレージAmazon S3Amazon AthenaAmazon RedshiftAmazon SageMaker統計

書籍紹介

データレイク」は、大量データ分析/生成データの活用を視野に入れた新しいデータストアのかたちです。従来のデータベース/データウェアハウスの範囲に収まらない多様なデータを大量に保管し、高度な統計分析や機械学習に役立つ情報基盤を作ることが可能です。
本書ではデータレイクの概念や特徴、必要とされる機能などを基本から解説し、さらに Amazon が運営するパブリッククラウドサービス AWS (Amazon Web Services) で実現する方法を解説します。

従来では想定しえなかった大量のデータを確実に保管するため、データレイクの世界ではクラウドのようなサービス型インフラストラクチャの活用が注目されます。さらに AWS ではオブジェクトストレージ S3 上のデータを直接分析する Amazon Athenaデータウェアハウスの Amazon Redshift 、機械学習を実現する Amazon SageMaker など、データレイクを支えるさまざまな仕組みが存在します。

本書ではそれらの活用の指針を解説するとともに、後半ではシステムの構築例を具体的に解説していきます。ビジネスデータ分析とログなどの生成データ分析を例に、システム構築の流れを詳しく紹介し、機械学習や統計分析をビジネスの現場で活かせる仕組みの技術的なヒントを数多く提供します。

第 1 部 データレイクの概念と知識

序章 データレイ クを始めよう
第 1 章 データレイクの構築

第 2 章 データレイクの活用

第 3 章 データレイクの運用

第 4 章 データレイクのセキュリティ

第 2 部 データレイクの実践 (基礎編)

第 5 章 ハンズオンの概要 -ビジネスデータのデータレイクー
第 6 章 データを可視化する

第 7 章 サーバーレス SQL によるデータ分析

第 8 章 データを変換する

第 9 章 データを分析する (データウェアハウス)

第 3 部 データレイクの実践 (応用編)

第 10 章 システムの概要 -ログデータのデータレイクー
第 11 章 ログを集める

第 12 章 ログの保管とカタログ化

第 13 章 ログを加工する

第 14 章 ログを分析する

言及の推移

03620222023202420252026

言及 Qiita 記事 (28 件)

言及 Zenn 記事 (1 件)

この本に興味がある方におすすめ

この本に関連

関連記事

関連用語

共有:Xはてブ