ISBN/价格: | 978-7-302-64536-8:CNY118.00 |
---|---|
作品语种: | chi eng |
出版国别: | CN 110000 |
题名责任者项: | Python和PySpark数据分析/.(加) 乔纳森·里乌著/.殷海英译 |
出版发行项: | 北京:,清华大学出版社:,2023.10 |
载体形态项: | 13, 402页:;+图, 肖像:;+24cm |
丛编项: | 数据科学与大数据技术 |
相关题名附注: | 版权页英文题名:Data analysis with Python and PySpark |
提要文摘: | 本书是一本精心设计的教程,可帮助读者使用PySpark交付任何规模的数据驱动应用程序。这本清晰的实践指南展示了如何使用来自任何来源的数据(从基于Hadoop的集群到Excel工作表)扩大多台机器的处理能力。通过阅读本书,读者将学习如何将大型分析任务分解为可管理的块,以及如何为您的独特需求选择和使用最佳PySpark数据抽象。完成后,您将能够编写和运行速度极快的PySpark程序,这些程序可扩展、操作高效且易于调试。本书中将介绍如何打包你的PySpark代码,管理跨多台机器扩展的数据,在PySpark中重写Pandas、R和SAS作业,排查常见数据流水线问题,并创建可靠的长期工作。 |
并列题名: | Data analysis with Python and PySpark eng |
题名主题: | 程序语言 程序设计 |
题名主题: | 数据处理 |
非控主题词: | Python |
中图分类: | TP312PY |
中图分类: | TP274 |
个人名称等同: | 里乌 著 |
个人名称次要: | 殷海英 译 |
记录来源: | CN YNAU 20240508 |