密歇根大学应用数据科学硕士学位专业的课程和参考学习书籍介绍

作者:

日期:2023-01-16

密歇根大学应用数据科学硕士学位专业的课程和参考学习书籍介绍

profile-avatar
万物云联网2023-01-16 07:44

密歇根大学应用数据科学硕士学位专业介绍

向美国排名第一的公立研究型大学学习,加入下一代数据科学家行列。

密歇根大学信息学院的应用数据科学硕士 (MADS) 学位旨在帮助有抱负的数据科学家通过实践项目学习和应用技能。 您将学习如何使用数据来改善结果并实现雄心勃勃的目标。

申请密歇根大学信息学院的应用数据科学硕士 (MADS) 学位的学生将会有机会从以下数据科学课程开始:

应用数据科学导论(Introduction to Applied Data Science)

本课程探讨数据科学家在数据科学的四个阶段应用于项目的专业知识、观点和道德承诺:问题制定、数据采集、建模和分析以及结果呈现。通过这个过程,学生将定义他们希望如何发展数据科学职业的愿景。

数据操作(Data Manipulation)

数据操作使用流行的Python Pandas数据科学库呈现操作和清理技术。在本课程结束时,学生将掌握获取表格数据、清理数据、操作数据以及运行基本推理统计分析所需的技能。

数据科学的数学方法(Math Methods for Data Science)

数学方法将审查并建立数据科学家工具包所需的基础数学概念。学生将学习和应用线性代数(如矩阵和向量)、基本优化技术(如梯度下降)和统计学(如贝叶斯规则)的概念。

信息可视化 I(Information Visualization I)

信息可视化 我将重点介绍可视化在理解一维和多维数据中的作用。它涵盖了感知、认知和良好的设计如何增强可视化。本课程还介绍了用于可视化构建的 API。

实验设计与分析(Experiment Design and Analysis)

实验设计与分析介绍了实验室和现场实验的技术。学生将讨论实验的逻辑以及实验用于调查社会和技术现象的方式。学生还将学习设计实验和分析实验数据的方法。

数据的可视化探索(Visual Exploration of Data)

数据的可视化探索使学生能够使用 matplotlib 库识别数据中的聚合模式,并了解与探索和表示数据相关的挑战。学生还将提高他们对各种统计方法应用的理解。

数据挖掘 I(Data Mining I)

数据挖掘 I 介绍了数据挖掘的基本概念。本课程介绍如何将真实世界的信息表示为有助于下游分析任务的基本数据类型(项集、矩阵和序列)。学生将学习如何通过模式提取和相似性度量来表征每种类型的数据。

密歇根大学应用数据科学硕士学位专业课程的参考学习书籍介绍

《应用数据科学研讨会 - 第二版:开始应用数据科学和技术有效地探索和评估数据(The Applied Data Science Workshop - Second Edition: Get started with the applications of data science and techniques to explore and assess data effectively)》

《应用数据科学研讨会 - 第二版:开始应用数据科学和技术有效地探索和评估数据》

该研讨会专为初学者而设计,可帮助您充分利用 Python 库和 Jupyter Notebook 的功能,了解如何应用数据科学来解决现实世界的数据问题。

本书的主要特点

  • 获得有关数据科学和机器学习的有用见解
  • 探索 Jupyter 笔记本的不同功能和特性
  • 了解 Python 库如何与 Jupyter 一起使用进行数据分析

书籍简介

从银行和制造业到教育和娱乐,将数据科学用于商业已经彻底改变了现代世界的几乎每个领域。它在从应用程序开发到网络安全的所有方面都发挥着重要作用。

本书采用互动式方法学习基础知识,非常适合初学者。你将学习在实际场景和示例上下文环境中应用数据科学的所有最佳做法和技术。

从介绍数据科学和机器学习开始,您将首先掌握 Jupyter 的功能和特性。您将使用sci-kit learn,pandas,Matplotlib和Seaborn等Python库,在您自己的Jupyter环境中对真实世界的数据集进行数据分析和数据预处理。在本章中,您将使用 sci-kit learn 训练分类模型,并使用高级验证技术评估模型性能。最后,您将使用 Jupyter Notebooks 来记录您的研究、构建利益相关者报告,甚至分析 Web 性能数据。

在应用数据科学研讨会结束时,您将准备好通过自信地将数据科学技术和工具应用于现实世界的项目,从初学者发展到将您的技能提升到一个新的水平。

本书你将学到什么

  • 了解数据科学中的关键机遇和挑战
  • 使用 Jupyter 执行数据分析和建模等数据科学任务
  • 在 Jupyter 笔记本中运行探索性数据分析
  • 使用成对散点图和分段分布可视化数据
  • 使用高级验证技术评估模型性能
  • 解析 HTML 响应并分析 HTTP 请求

这本书是为谁写的

如果你是一个有抱负的数据科学家,想要在数据科学领域建立自己的职业生涯,或者是一个想要从头开始探索数据科学的应用并使用Python库分析Jupyter数据的开发人员,那么这本书适合你。虽然建议对Python编程和机器学习有简要的了解,以帮助你更快地掌握本书中涵盖的主题,但这不是强制性的。

《产品分析:应用数据科学技术提供切实可行的消费者洞察(Product Analytics: Applied Data Science Techniques for Actionable Consumer Insights)》

《产品分析:应用数据科学技术提供切实可行的消费者洞察》

本指南介绍如何将数据科学与社会科学相结合,以获得对客户行为的前所未有的洞察力,以便您可以改变它。Joanne Rodrigues-Craig弥合了预测数据科学和统计技术之间的差距,揭示了为什么重要的事情会发生 - 为什么客户购买更多,或者为什么他们立即离开您的网站 - 因此您可以获得更多想要的行为,而不是您不需要的行为。
凭借丰富的企业经验和对人口统计学和社会学的深入了解,罗德里格斯-克雷格展示了如何创建更好的理论和指标,以便您可以加速获得洞察力、改变行为和赚取商业价值的过程。通过本书您将学习如何:

  • 开发复杂的、可测试的理论,以了解网络产品中的个人和社会行为
  • 像社会科学家一样思考,并将当今社会环境中的个人行为置于情境中
  • 为任何 Web 产品或系统构建更有效的指标和 KPI
  • 进行信息更丰富且可操作的 A/B 测试
  • 探索因果效应,反映对相关性和因果关系之间差异的更深入理解
  • 在复杂的 Web 产品中更改用户行为
  • 了解相关的人类行为如何发展,以及改变它们的先决条件
  • 为常见任务(如多状态和提升建模)选择正确的统计技术
  • 使用先进的统计技术对多维系统进行建模
  • 在 R 中执行所有这些操作(示例代码在单独的代码手册中提供)

《实用 R 4:将 R 应用于数据处理、处理和集成(Practical R 4: Applying R to Data Manipulation, Processing and Integration)》

《实用 R 4:将 R 应用于数据处理、处理和集成》


开始加速介绍 R 生态系统、编程语言和工具,包括 R 脚本和 RStudio。本书利用许多示例和项目,教你如何将数据导入R以及如何使用R处理这些数据。一旦以基础知识为基础,Practical R 4的其余部分将 深入到特定的项目和示例,从使用R和LimeSurvey运行和分析调查开始。接下来,您将使用 R 和 MouselabWeb 执行高级统计分析。然后,你将了解 R 如何在没有统计信息的情况下为你工作,包括如何使用 R 自动执行数据格式设置、操作、报告和自定义函数。

本书的最后一部分讨论了在服务器上使用 R;你将使用 R 生成一个脚本,该脚本可以运行 RStudio 服务器并监视报告源的更改,以便在发生更改时提醒用户。该项目包括常规电子邮件警报和推送通知。最后,你将使用 R 创建个人最重要信息(如天气预报、每日日历、待办事项等)的自定义每日摘要报告。这演示了如何自动执行此过程,以便每天早上,用户导航到同一网页并获取更新的报告。

您将学到什么

  • 设置并运行 R 脚本,包括在新计算机上安装以及下载和配置 R
  • 将任何机器变成强大的数据分析平台,可通过 RStudio Server 从任何地方访问
  • 编写基本的 R 脚本并修改现有脚本以满足自己的需要
  • 在 R 中创建基本 HTML 报表,根据需要插入信息
  • 生成基本 R 包并分发它


这本书是为谁写的 :建议事先接触统计数据、编程和 SAS,但它们并不是必需的。

《使用数学和 Python 进行机器学习的内核方法:构建逻辑的 100 个练习(Kernel Methods for Machine Learning with Math and Python: 100 Exercises for Building Logic)》

《使用数学和 Python 进行机器学习的内核方法:构建逻辑的 100 个练习》

机器学习和数据科学最关键的能力是掌握其本质的数理逻辑,而不是依赖知识或经验。这本教科书通过考虑相关的数学问题和构建 Python 程序来解决机器学习内核方法的基础知识。

本书的主要特点如下:

  • 内容以易于遵循和独立的风格编写。
  • 本书收录了100个练习,经过精心挑选和完善。由于他们的解决方案在正文中提供,读者可以通过阅读本书来解决所有练习。
  • 证明了内核的数学前提,并提供了正确的结论,帮助读者理解内核的本质。
  • 提供了源程序和运行示例,以帮助读者更深入地了解所使用的数学。
  • 一旦读者对第2章中涵盖的功能分析主题有了基本的了解,将在后续章节中讨论这些应用。在这里,没有假设数学的先验知识。
  • 本书考虑了再现核希尔伯特空间(RKHS)的核和高斯过程的核;两者之间有明显的区别。

《人机界面和信息管理:交互、可视化和分析(Human Interface and the Management of Information. Interaction, Visualization, and Analytics)》

《人机界面和信息管理:交互、可视化和分析》

这套两卷本的LNCS 10904和10905构成了2018年7月在美国内华达州拉斯维加斯举行的第20届人机界面和信息管理国际会议(HIMI 2018)的参考论文集,该会议是HCI International 2018的一部分。
本卷书中介绍的56篇论文按主题部分组织,分别是:信息可视化;多模态相互作用;虚拟现实和增强现实中的信息;信息和愿景;以及文本和数据挖掘和分析。

《实验设计与分析第一课程(A First Course in Design and Analysis of Experiments)》

《实验设计与分析第一课程》

Oehlert的书籍适用于非统计学研究生或统计学专业的服务课程。与实验设计一学期研究生/高级课程的大多数教材不同,Oehlert的新书提供了分析和设计的完美平衡,向学生展示了三个实用主题:
•何时使用各种设计

•如何分析结果
•如何识别各种设计选项
此外,与其他旧书籍不同,本书完全面向使用统计软件分析实验。

《知识引导的机器学习:使用科学知识和数据加速发现(Knowledge-Guided Machine Learning: Accelerating Discovery Using Scientific Knowledge and Data)》

《知识引导的机器学习:使用科学知识和数据加速发现》

鉴于机器学习(ML)模型在商业应用中的巨大成功,在许多学科中,机器学习(ML)模型越来越多地被视为基于科学的模型的替代品。然而,这些“黑匣子”ML模型的成功有限,因为它们无法在有限的训练数据下很好地工作,也无法推广到看不见的场景。因此,科学界对创建将科学知识整合到ML框架中的新一代方法越来越感兴趣。这个新兴领域被称为科学知识引导的ML(KGML),寻求与现有的“仅数据”或“仅科学知识”方法截然不同,以平等地使用知识和数据。事实上,KGML涉及不同的科学和ML社区,来自不同背景和应用领域的研究人员和从业者不断为这一新兴领域的问题表述和研究方法增加丰富性。

《知识引导的机器学习:使用科学知识和数据加速发现》,通过使用说明性示例、案例研究以及来自不同应用领域和研究社区的评论作为领先研究人员的书籍章节,讨论 KGML 研究的一些常见主题,介绍了这个快速增长的领域。

本书的主要特点:

  • 在科学和数据科学领域受到广泛关注的新兴研究领域的首本此类书籍
  • 可供数据科学、科学和工程领域的广泛受众访问
  • 使用来自不同应用领域的说明性示例,为新兴的KGML领域的问题表述和研究方法提供连贯的组织结构
  • 包含领先研究人员的章节,从多个角度说明KGML研究中的前沿研究趋势,机遇和挑战

《实验设计与分析(Design and Analysis of Experiment)》

《实验设计与分析》

这本畅销的专业参考书已帮助超过 100,000 名工程师和科学家成功完成了实验。新版本包括更多软件示例,这些示例取自该领域三个最主要的程序:Minitab、JMP 和 SAS。在几章中还添加了其他材料,包括鲁棒设计和因子设计的新发展。本书还提出了新的示例和练习,以说明在服务和交易组织中使用设计实验。工程师将能够应用这些信息来提高工作系统的质量和效率。

道格拉斯·蒙哥马利为读者提供了最有效的方法来学习如何设计、进行和分析实验,以优化产品和流程的性能。他展示了如何使用统计设计的实验来获取用于表征和优化系统的信息,改进制造工艺以及设计和开发新的工艺和产品。您还将学习如何评估产品设计中的材料替代方案,提高产品的现场性能,可靠性和制造方面,并有效和高效地进行实验。通过这本广受好评的书了解如何提高工作系统的质量和效率。本书重点关注计算机的使用,提供两种软件产品的输出:Minitab 和 DesignExpert;提供了及时的新示例,并扩大了将游程添加到分数阶乘到去混叠效应的覆盖范围;包括关于目前如何使用计算机进行实验分析和设计的详细讨论;提供关于许多重要主题的新材料,包括后续实验和分割地块设计;并且更加关注阶乘和分数阶乘设计。