通过这些电子书你将会学到的
- 电子书中使用了数多个数据集,作为教学示范,其中包含了youtube 排名数据、Google股价、美国婴儿姓名统计资料、泰坦尼克号乘客名单、世界各国饮酒统计资料
- 多 个数据分析课程单元,你将学会数据分析的知识,切割出数据和排序、将分散的数据群组化后分析、结合链接多组资料、整并分析等各种技巧
- 通过学习这些电子书,当你透过Code Gym 的课程打下扎实的基础之后,还能够继续不断成长,自我学习,这才是这一堂课程带给你最重要的价值
- 许多电子书都有练习题目,练习开始之前都有影片解说,练习之后也有提供正确答案的代码,让同学能够将所学的技巧活用在解决问题上
- 透过绘制图表的工具,将数据绘制出精美的图表,让使用者能够清楚理解你分析后的知识和重点,最后使用台股的资料,绘制出股票专用的K线图,观察股价涨跌和交易量
- 资料不干净怎么办? 数据清理和整理是资料分析初期的重要步骤,如果你没有一个干净完整的资料,分析出来的资料也不会正确,所以课程将会教你这个重要步骤的方法
从无到有,学会数据分析技术,这些书中没有艰涩难懂的算法,高阶程序语言技巧,书中包括你将用得到的数据分析技术。
通过这些电子书您将会学会:
* 数据分析基础知识
* 切割出重要的数据和排序的技巧
* 将分散的数据群组化后分析结果
* 结合链接多组数据,整并分析
* 如何使用时间序列
* 统计应用实战分析
* 字符串处理技巧
* 数据不干净怎么办? 数据清理和整理
这些电子书的适合阅读对象
- 初入数据分析领域的新鲜人
- 想理解资料科学方法与应用情境的专业人士
- 商学院背景,想学习资料科学的大学或研究所学生
- 程序语言初学者
Python 数据分析 - 入门实战的参考学习电子书推荐
《适合所有人的Pandas:Python 数据分析》

《适合所有人的Pandas:Python 数据分析》
在 Python 中使用 Pandas 管理和自动化数据分析
如今,分析师必须管理具有非凡多样性、速度和数量特征的数据。使用开源的 Pandas 库,您可以使用 Python 快速自动化和执行几乎任何数据分析任务,无论任务有多大或多复杂。Pandas 可以帮助您确保数据的真实性,将其可视化以进行有效决策,并可靠地跨多个数据集重现分析。
《Pandas for Everyone,第2版》汇集了解决Pandas实际问题的实用知识和见解,即使您不熟悉Python数据分析。Daniel Y. Chen 通过简单但实用的示例介绍了关键概念,并逐步构建这些概念以解决更困难的现实世界数据科学问题,例如使用正则化来防止数据过度拟合,或者何时使用无监督机器学习方法来查找数据集中的底层结构。
本书第二版的新内容包括:
- 扩展绘图和 seaborn 数据可视化库的覆盖范围
- 扩展的示例和资源
- 更新了Python 3.9代码和软件包覆盖范围,包括statsmodel和scikit-learn库
- 关于地理熊猫、Dask 和使用 Altair 创建交互式图形的在线奖励材料
Chen为您提供了使用具有真实数据集的Pandas的快速入门,并涵盖了组合数据集,处理缺失数据以及构建数据集以便于分析和可视化。他演示了强大的数据清理技术,从基本的字符串操作到跨数据帧同时应用函数。
数据准备就绪后,Chen 将指导您完成用于预测、聚类、推理和探索的拟合模型。他提供了有关性能和可伸缩性的提示,并向您介绍了更广泛的Python数据分析生态系统。
- 使用数据帧和系列,以及导入或导出数据
- 使用matplotlib,seaborn和pandas创建绘图
- 合并数据集并处理缺失的数据
- 重塑、整理和清理数据集,使其更易于使用
- 转换数据类型和操作文本字符串
- 应用函数来扩展数据操作
- 使用分组依据聚合、转换和筛选大型数据集
- 利用熊猫的高级日期和时间功能
- 使用统计模型和scikit-learn库拟合线性模型
- 使用广义线性建模拟合具有不同响应变量的模型
- 比较多个模型以选择“最佳”模型
- 正则化以克服过度拟合并提高性能
- 在无监督机器学习中使用聚类
《用于地理空间数据分析的 Python:位置智能的理论、工具和实践》

《用于地理空间数据分析的 Python:位置智能的理论、工具和实践》
在空间数据科学中,彼此靠近的事物可能比相距较远的事物有更多的共同点。通过这本实用的书,地理空间专业人员、数据科学家、业务分析师、地理学家、地质学家和其他熟悉数据分析和可视化的人将学习空间数据分析的基础知识,以更深入地了解他们的数据问题。
本书的作者Bonny P. McClain解释了为什么检测和量化地理空间数据中的模式至关重要。专有和开源平台都允许您处理和可视化空间信息。本书适用于熟悉数据分析或可视化、渴望探索与Python的地理空间集成的人。
本书可帮助您:
- 了解在数据科学中应用空间关系的重要性
- 选择并应用光栅和矢量图形的数据分层
- 应用位置数据以利用空间分析
- 设计信息丰富且准确的地图
- 使用 Python 脚本自动执行地理数据
- 探索 Python 包以获取其他功能
- 使用非典型数据类型,例如多边形, 形状文件和投影
- 了解空间数据科学的图形语法以激发好奇心
《使用Python 和 PySpark 进行数据分析》

《使用Python 和 PySpark 进行数据分析》
在数据分析方面,大胆思考是值得的。PySpark将强大的Spark大数据处理引擎与Python编程语言相结合,提供了一个数据分析平台,几乎可以扩展到任何任务。《使用 Python 和 PySpark 进行数据分析》是交付成功的 Python 驱动数据项目的指南。
使用 Python 和 PySpark 进行数据分析是一个精心设计的教程,可帮助您使用 PySpark 交付任何规模的数据驱动应用程序。这份清晰的实践指南向您展示了如何使用来自任何来源的数据(从基于 Had oop 的群集到 Excel 工作表)在多台计算机上扩展处理能力。您将学习如何将大型分析任务分解为可管理的块,以及如何选择和使用最佳的 PySpark 数据抽象以满足您的独特需求。
Spark数据处理引擎是一个了不起的分析工厂:原始数据进来,洞察力出来。由于其能够处理分布在集群中的大量数据,Spark已被大大小小的组织采用为标准。PySpark将核心Spark引擎与基于Python的API打包在一起,将基于Spark的数据管道交到使用Python编程语言的程序员和数据科学家手中。PySpark简化了Spark陡峭的学习曲线,并在Spark和基于Python的数据科学工具生态系统之间提供了无缝的无缝桥梁。
《用于ArcGIS Pro的Python:使用 ArcGIS Python 模块、Jupyter Notebooks 和 pandas 自动执行制图和数据分析》

《用于ArcGIS Pro的Python:使用 ArcGIS Python 模块、Jupyter Notebooks 和 pandas 自动执行制图和数据分析》
通过解锁 Python 编程世界来扩展您的 ArcGIS 专业知识。一个完全动手的指南,使用真实数据和真实问题引导您进行一次又一次的锻炼。注意:本书与 ArcGIS Pro 2.9 兼容。
本书的主要特点:
- 了解适用于 ArcGIS 的两个 Python 模块的核心组件:适用于 Python 的 ArcPy 和 ArcGIS API
- 在 ArcGIS Pro 笔记本中使用 ArcPy、pandas、NumPy 和 ArcGIS 来大规模管理和分析地理空间数据
- 使用 Python 与 ArcGIS Online 集成以发布和管理数据
书籍简介:
在处理大量地理空间数据时,强烈建议将 Python 集成到日常 ArcGIS 工作中。《Python for ArcGIS Pro 》旨在帮助您更快地完成工作,提高可重复性和更高的结果可信度。
两位经验丰富的 ArcGIS 专业人员转为 Python 程序员,从编程基础开始,从 Python 程序员开始,教您如何在每一步合并脚本:自动生成要打印的地图、管理 ArcGIS Pro 和 ArcGIS Online 之间的数据、创建用于共享的自定义脚本工具,然后在 ArcGIS 地理空间库上运行数据分析和可视化, 都使用Python。
您将使用 ArcGIS Pro 笔记本来浏览和分析地理空间数据,并编写数据工程脚本来管理正在进行的数据处理和数据传输。这本基于练习的书还包括三个丰富的真实案例研究,让您有机会应用和扩展您之前学习的概念。
无论您对 Esri 软件或 Python 语言的专业水平如何,您都将受益于本书的实践方法,该方法将带您了解 Python for ArcGIS Pro 的主要用途,以提高您的 ArcGIS 工作效率。
通过本书你将学到什么:
- 自动制作地图以按比例制作和编辑地图,减少重复性任务
- 将地图图层数据发布到 ArcGIS Online
- 使用 ArcPy 数据访问模块和光标自动执行数据更新
- 将脚本转换为 ArcGIS Pro 的脚本工具
- 了解如何在 ArcGIS Online 上管理数据
- 查询、编辑和追加到要素图层,并使用渲染器和着色器创建符号系统
- 将pandas和 NumPy 应用于栅格和矢量分析
- 了解管理整个城市或大型公司数据的新技巧
这本书是为谁而写的:
本书非常适合任何希望将Python添加到其ArcGIS Pro工作流程中的任何人,即使您之前没有编程经验。这包括 ArcGIS 专业人员、中级 ArcGIS Pro 用户、ArcGIS Pro 高级用户、学生以及希望从 GIS 技术人员转变为 GIS 分析师的人员;GIS 分析师到 GIS 程序员;或 GIS 开发人员/程序员到 GIS 架构师。基本熟悉地理空间/GIS 语法、ArcGIS 和数据科学 (pandas) 会有所帮助,但并非必需。
本书的目录:
- Python for GIS 简介
- ArcPy 的基础知识
- 适用于 Python 的 ArcGIS API
- 数据访问模块和游标
- 发布到 ArcGIS Online
- ArcToolbox 脚本工具
- 自动化地图制作
- pandas、数据框和矢量数据
- 使用 Python 进行栅格分析
- 使用 NumPy 进行地理空间数据处理
- 案例研究:ArcGIS 在线管理和数据管理
- 案例研究:高级地图自动化
- 案例研究:预测作物产量
《面向初学者的Python Pandas:面向数据科学家的Pandas专业化》

《面向初学者的Python Pandas:面向数据科学家的Pandas专业化》
《Python NumPy & Pandas for Beginners》
Python 库教科书初学者与代码文件夹
Python无疑是最通用的编程语言。
但是你是否认真地精通Python?
如果是,那么你需要成为两个基本Python库——NumPy和Pandas的大师。你根本不能忽视这个事实。
在数据科学中,NumPy和Pandas是迄今为止使用最广泛的Python库。这些库的主要特点是强大的数据分析工具和易于使用的结构。
《Python NumPy & Pandas for Beginners 》为您提供了一种快速学习 Python 的动手、简单的方法。这本书令人耳目一新,因为除了阅读之外,还有很多事情要做。您涵盖的每个理论概念后面都有实际示例,从而更容易掌握该概念。
本书的分步布局简化了您的学习。作者不遗余力地确保您学到的东西坚持下去。在 11 章中的每一章的末尾,您都有简短的练习,以测试您对所学理论概念的了解。
本书将为您介绍:
- Pandas的坚实基础。
- 对基础和中级主题的深刻理解。
- 在 Python 中编码的要点。
- 链接到与您学习的主题相关的参考资料。
- 快速访问外部文件以练习和学习Pandas的高级概念。
- 包含 书籍中使用的所有数据集的 Resources 文件夹。
本书的重点是边做边学:
在这本边做边学的书中,您将从第一章的 Python 安装开始。然后在第一章的后半部分有一个Python速成课程。在第二章中,你直接跳到NumPy。在本书中,您将使用 Jupyter Notebook 编写代码。您还可以快速访问本书中使用的数据集。
这本书充满了不言自明的脚本、图表和图像。它们经过精心设计,可帮助您轻松理解新概念。因此,即使你精通Python,这本书也是自学的最佳选择。
您可以自信地解决新的数据科学问题,并在现实世界中开发可行的解决方案。最后,你可以依靠这种通过做书来学习来更快地实现你的Python职业目标。
本书将帮助您快速掌握以下主题:
- 环境设置和 Python 速成课程
- Pandas基础知识
- 操作Pandas数据帧
- 与Pandas的数据分组、聚合和合并
- 用于数据可视化的Pandas
- 使用Pandas处理时间序列数据
- 使用 Jupyter Notebook
请立即阅读本书,开始您的Python精通之旅。
《面向初学者的Python NumPy:数据科学的NumPy专业化》

《面向初学者的Python NumPy:数据科学的NumPy专业化》
《Python NumPy for Beginners》
Python 库教科书初学者与代码文件夹
Python无疑是最通用的编程语言。
但是你是否认真地精通Python?
如果是,那么你需要成为两个基本Python库——NumPy和Pandas的大师。你根本不能忽视这个事实。
在数据科学中,NumPy和Pandas是迄今为止使用最广泛的Python库。这些库的主要特点是强大的数据分析工具和易于使用的结构。
《Python NumPy for Beginners》为您提供了一种动手,简单的方法来快速学习Python。这本书令人耳目一新,因为除了阅读之外,还有很多事情要做。您涵盖的每个理论概念后面都有实际示例,从而更容易掌握该概念。
本书的分步布局简化了您的学习。作者不遗余力地确保您学到的东西坚持下去。在 11 章中的每一章的末尾,您都有简短的练习,以测试您对所学理论概念的了解。
本书将为您介绍:
- NumPy的坚实基础。
- 对基础和中级主题的深刻理解。
- 在 Python 中编码的要点。
- 链接到与您学习的主题相关的参考资料。
- 快速访问外部文件以练习和学习NumPy的高级概念。
- 包含 书籍中使用的所有数据集的 Resources 文件夹。
本书的重点是边做边学:
在这本边做边学的书中,您将从第一章的 Python 安装开始。然后在第一章的后半部分有一个Python速成课程。在第二章中,你直接跳到NumPy。在本书中,您将使用 Jupyter Notebook 编写代码。您还可以快速访问本书中使用的数据集。
这本书充满了不言自明的脚本、图表和图像。它们经过精心设计,可帮助您轻松理解新概念。因此,即使你精通Python,这本书也是自学的最佳选择。
您可以自信地解决新的数据科学问题,并在现实世界中开发可行的解决方案。最后,你可以依靠这种通过做书来学习来更快地实现你的Python职业目标。
本书将帮助您快速掌握以下主题:
- 环境设置和 Python 速成课程
- NumPy基础知识
- NumPy数组操作
- NumPy提示和技巧
- 使用NumPy进行算术和线性代数运算
- 使用 NumPy 实现深度神经网络
- 使用 Jupyter Notebook
立即阅读本书,开始您的Python精通之旅。
《Pandas工作手册:使用Python进行数据分析的综合指南以及现实世界的案例研究》

《Pandas工作手册:使用Python进行数据分析的综合指南以及现实世界的案例研究》
通过分析真实数据集和使用pandas 解决问题来学习 Python 数据科学的基础知识
主要特点
- 了解如何使用 pandas 应用数据检索、转换、可视化和建模技术
- 高效从数据(包括数据库、Web 数据等)中获取更深入的见解
- 通过动手练习和活动建立您的经验和信心
书籍简介
《Pandas 工作手册》将教您如何提高数据效率,并生成真正的业务见解,为您的决策提供信息。您将被指导解决现实世界的数据科学问题,并展示如何在实际示例和练习的背景下应用关键技术。然后,引人入胜的活动将挑战您以为真正的数据科学项目做好准备的方式应用您的新技能。
您将看到经验丰富的数据科学家如何使用Pandas 的数据分析来解决各种问题。与其他专注于理论并在枯燥的技术解释上花费太长时间的 Python 书籍不同,这个研讨会旨在快速让你编写干净的代码并通过动手实践来建立你的理解。在阅读这本 Python Pandas 书时,您将处理各种现实世界的场景,例如使用空气质量数据集来了解城市中二氧化氮排放的模式,以及分析交通数据以改善公交运输服务。
在完成这本数据分析书时,您将拥有与Pandas 一起解决自己具有挑战性的数据科学问题所需的知识、技能和信心。
你将学到什么
- 使用Pandas 访问和加载来自不同来源的数据
- 使用一系列数据类型和结构来了解您的数据
- 执行数据转换以准备进行分析
- 使用 Matplotlib 进行数据可视化以创建各种绘图
- 创建数据模型以查找关系并测试假设
- 操作时间序列数据以执行日期时间计算
- 优化代码以确保更高效的业务数据分析
这本书是为谁写的
这本数据分析书适用于任何具有使用Python编程语言经验的人,他们想要学习Pandas 数据分析的基础知识。以前对Pandas 的了解是没有必要的。
目录
- Pandas 简介
- 使用数据结构
- 数据 I/O
- Pandas 数据类型
- 数据选择 – 数据帧
- 数据选择 – 系列
- 数据探索和转换
- 数据可视化
- 数据建模 – 预处理
- 数据建模 – 建模基础知识
- 数据建模 – 回归建模
- 在Pandas 中使用时间系列
- 探索时间序列
- 将Pandas 数据处理应用于案例研究