《Python 中的动手数据预处理:了解如何有效地为成功的数据分析准备数据》

作者:

日期:2023-02-25

出版:

  • 210
  • 0
  • 0

作品总结

《Python 中的动手数据预处理:了解如何有效地为成功的数据分析准备数据》

清理原始数据并准备好进行处理,以设计更好的数据分析解决方案

本书的主要特点

  • 培养执行数据清理、数据集成、数据缩减和数据转换的技能
  • 通过强大的数据转换和处理技术充分利用原始数据
  • 执行彻底的数据清理,包括处理缺失值和异常值

本书的内容简介

动手数据预处理是一本关于最佳数据清理和预处理技术的入门书,由一位开发过数据预处理和相关主题的大学水平课程的专家撰写。

通过本书,您将从多个角度配备最佳的数据预处理技术,确保您从数据中获得最佳见解。

您将了解数据预处理的不同技术和分析方面 - 数据收集,数据清理,数据集成,数据缩减和数据转换 - 并掌握使用开源Python编程环境实现它们。

动手示例和易于遵循的章节将帮助您全面阐明数据预处理、原因和方式,并确定数据分析可以导致更有效决策的机会。随着本章的深入,您还将了解数据管理系统和技术在有效分析中的作用,以及如何使用 API 提取数据。

在这本 Python 数据预处理书结束时,您将能够使用 Python 来读取、操作和分析数据;执行数据清理、集成、缩减和转换技术,并处理异常值或缺失值,以便有效地为分析工具准备数据。

你将学到什么

  • 使用 Python 对数据执行分析功能
  • 了解数据库的角色以及如何有效地从数据库中提取数据
  • 执行由分析目标定义的数据预处理步骤
  • 识别并解决数据集成挑战
  • 确定数据缩减的需求并执行它
  • 发现通过数据转换改进分析的机会

这本书是为谁写的

本书面向希望对大量数据进行预处理和数据清理的初级和高级数据分析师、商业智能专业人员、工程本科生和数据爱好者。您不需要任何数据预处理经验即可开始使用本书。但是,基本的编程技能(例如使用变量、条件和循环)以及 Python 的初学者知识和简单的分析经验是先决条件。

本书的目录

  1. 回顾NumPy和Pandas的核心模块
  2. 回顾另一个核心模块 - Matplotlib
  3. 数据 – 它到底是什么?
  4. 数据库
  5. 数据可视化
  6. 预测
  7. 分类
  8. 聚类分析
  9. 数据清理级别 I - 清理表
  10. 数据清理级别 II - 解包、重组和重新制定表
  11. 数据清理级别 III - 缺失值、异常值和错误
  12. 数据融合与数据集成
  13. 数据缩减
  14. 数据转换和处理
  15. 案例研究 1 - 科技行业的心理健康
  16. 案例研究 2 - 预测 COVID-19 住院情况
  17. 案例研究3:美国县聚类分析
  18. 总结、实践案例研究和结论

0条评论