终于到了《描述统计学入门》的最后一章,抽样分布,你即将可以开始入门机器学习了。 在《描述统计学入门》抽样分布中,你可以学习中心极限定理,抽样分布,以及将概率知识和归一化应用到样本数据集上。 ...
接下来,我们需要好好学习一下正态分布,这是自然社会中最为重要的分布。 在《描述统计学入门》正态分布中,你可以学习概率密度函数(PDF),正态分布和 z 表格。 ...
归一化是处理数据的重要过程,这一过程目的在于将原始数据转化为成熟的数学模型(正态分布、T分布等),便于分析和计算。 在《描述统计学入门》归一化中,你可以学习使用 Z 值将分布转化为标准正态分布,并学习如何使用归一化分布计算比例。 ...
当两组数据的众数、均值、中位数均相同的时候,如何再比较这两组数据呢? 在《描述统计学入门》可变性中,你可以学习如何使用方差和标准差定量分析数据的分布,并学习如何使用箱线图和四分位距找出异常值。 ...
在机器学习中,数据相当重要,可视化之后,就要来找数据的特征了! 在《描述统计学入门》集中趋势的内容中,你可以学习到三种量度:均值、中位数、众数。 ...
在机器学习中,数据相当重要,但是数据就是未整理的信息,我们在研究数据的时候,如果不加以整理和可视化,分析和研究起来是相当枯燥和耗时的。 在《描述统计学入门》数据可视化中,你可以学习到关于:通过创建和解读直方图、柱状图和频数图,学习数据可视化基础知识。 ...
机器学习的重点应该是数据、模型、算法等,编程语言的学习固然重要,但是我觉得机器学习的本质还是数学内容。样本是机器的学习资料,样本是否好与坏,直接决定了训练的结果,所以,开始前还是务必入门一下统计学。 在《描述统计学入门》研究方法入门中,你可以学习到关于:构建、总体与样本、相关与因果、假设与试验 等的内容。 ...