频道:
分类:
时间:
排序:
大规模数据集(“大数据”)的复杂性刺激了用于分析它们的高级计算方法的发展。 有两种不同的方法可以帮助做到这一点。 基于模型的方法使用概率模型和似然以及贝叶斯理论,而无模型方法不需要概率模型、似然或贝叶斯理论。 这两种方法基于概率论的不同哲学原理,由著名的统计学家罗纳德·费舍尔和杰日·内曼所拥护。
本书对有关统计推断的基本问题进行了连贯的描述,并展示了统计学如何帮助我们仅基于有限的数据集(例如从较大人群中抽取的随机样本)对更广泛的背景进行归纳推断。通过将这些基础知识与与p值和统计显著性检验相关的推理错误的方法论辩论联系起来,读者可以清楚地掌握统计推断的前提,以及它可以做什么和不能做什么。为了便于直觉,整本书的表述尽可能非技术性。
Fay和Brittain提出了统计假设检验和兼容置信区间,重点是应用和正确的解释。重点是为应用统计学家提供足够的工具——以及在其中选择的建议——为几乎任何问题找到合理的方法,并通过修改现有方法找到足够的理论来解决新问题。
密歇根大学信息学院的应用数据科学硕士 (MADS) 学位旨在帮助有抱负的数据科学家通过实践项目学习和应用技能。 您将学习如何使用数据来改善结果并实现雄心勃勃的目标。
这本畅销的专业参考书已帮助超过 100,000 名工程师和科学家成功完成了实验。新版本包括更多软件示例,这些示例取自该领域三个最主要的程序:Minitab、JMP 和 SAS。在几章中还添加了其他材料,包括鲁棒设计和因子设计的新发展。本书还提出了新的示例和练习,以说明在服务和交易组织中使用设计实验。工程师将能够应用这些信息来提高工作系统的质量和效率。
鉴于机器学习(ML)模型在商业应用中的巨大成功,在许多学科中,机器学习(ML)模型越来越多地被视为基于科学的模型的替代品。然而,这些“黑匣子”ML模型的成功有限,因为它们无法在有限的训练数据下很好地工作,也无法推广到看不见的场景。
Oehlert的书籍适用于非统计学研究生或统计学专业的服务课程。与实验设计一学期研究生/高级课程的大多数教材不同,Oehlert的新书提供了分析和设计的完美平衡
本卷书中介绍的56篇论文按主题部分组织,分别是:信息可视化;多模态相互作用;虚拟现实和增强现实中的信息;信息和愿景;以及文本和数据挖掘和分析。
机器学习和数据科学最关键的能力是掌握其本质的数理逻辑,而不是依赖知识或经验。这本教科书通过考虑相关的数学问题和构建 Python 程序来解决机器学习内核方法的基础知识。
开始加速介绍 R 生态系统、编程语言和工具,包括 R 脚本和 RStudio。本书利用许多示例和项目,教你如何将数据导入R以及如何使用R处理这些数据。一旦以基础知识为基础,Practical R 4的其余部分将 深入到特定的项目和示例,从使用R和LimeSurvey运行和分析调查开始。接下来,您将使用 R 和 MouselabWeb 执行高级统计分析。然后,你将了解 R 如何在没有统计信息的情况下为你工作,包括如何使用 R 自动执行数据格式设置、操作、报告和自定义函数。