当サイトではアフィリエイト広告を利用しています
自然科学全般
数学
物理学
化学
地学・天文学
生物学
植物学
動物学
医学・薬学
工学
建築学
|
|
出荷目安の詳細はこちら内容詳細Apache Sparkの仕組みとビッグデータ向けの大規模処理とML開発を徹底解説本書は、ビッグデータを主な対象としたデータ分析フレームワークであるApache Spark、mlflow、delta lakeの中級入門書です。 「動かしてみる」だけではなく、どのような仕組みになっているのか、どうすれば効率的な実装が行えるかまで踏み込みつつ、データAIの実装者がApache Spark、MLflow およびdelta lakeを使いこなすための解説を行います。 本書では、単純なデータ分析と複雑なデータ分析を実行し、どのように機械学習アルゴリズムを採用していくか、解説していきます。 Apache Sparkの導入から解説をはじめ、Spark SQLとデータフレーム、データセットを紹介していきます。 そこから、Apache Sparkを利用した実践的な機械学習の方法を解説していきます。 本書での学習を通じて、次のことが学習できます。 ・Python、SQL、Scala、またはJavaの高レベルの構造化APIの学習・Spark の操作とSQLエンジンの理解・Spark 構成とSpark UIを使用したSpark操作の検査、調整、デバッグ・JSON、Parquet、CSV、Avro、ORC、Hive、S3、またはKafkaといったデータソースへの接続・構造化ストリーミングを使用してバッチ データとストリーミング データの分析を実・オープンソースのDelta LakeとSparkを使用して信頼性の高いデータ パイプラインを構築・MLlibを使用する機械学習パイプラインの開発、MLflowを使用するモデルの管理、本番化・[日本語版オリジナルコンテンツ]pandas dataframe、spark dataframeに関する各種データフレームの使い分け ・[日本語版オリジナルコンテンツ]LLMやEnglish SDK for SparkなどAIを活用した新たなコーディングスタイル、LLMの利用方法の実践 ※本書は『Learning Spark: Lightning-Fast Data Anarytics 2nd Edition』の邦訳です。
商品を詳しく見る
¥ 4,400-(税込)
#ショップ名 :
HMV&BOOKS online 1号店
#送料 :
送料別
#クレジットカード :
利用可
#海外配送 :
海外配送不可
#あす楽 :
翌日配送不可
#ギフト :
ギフト包装不可能
商品を詳しく見る
「その他」の関連商品を見る
「その他」の人気商品を見る
| | |
|