专为程序员设计的统计课 彻底学会统计分析
第1章 课程介绍【欢迎学习,学习中有任何疑问请在问答区进行问答,祝愉快学习!】
本章将介绍统计学的思考方式,统计学的整体框架,学习统计学有什么用,以及统计学与机器学习的密切联系;并对学习此门课程讲解的形式(编程+可视化)和需要具备的知识和技能进行说明,让大家从这个课程开始,真正学懂统计学!…
1-1 课程导学 试看
1-2 课程学习的注意事项
1-3 课程编程环境搭建
第2章 认识数据【必备基础知识,不能跳过】
数据是统计学处理的对象,而数据是由变量组成的。本章将讲解什么数据和变量,以及变量的类型和测量尺度。这些基本概念是统计分析的基石。
2-1 数据和变量 试看
2-2 测量尺度
第3章 描述统计【核心内容,重点学习】
本章讲解描述统计的知识,针对不同类型的变量,讲解其主要的数字特征和常用的刻画数据特征或两个变量之间的关系的可视化方法。
3-1 什么是描述统计
3-2 一个分类变量的特征和可视化
3-3 一个数值变量的特征和可视化(上)
3-4 一个数值变量的特征和可视化(下)
3-5 分布的形状
3-6 变量间的关系
3-7 极端值与缺失值
3-8 本章小结
第4章 描述统计的编程实现【重点实战章节,建议跟着老师一起敲代码实现】
本章对上一章所学知识进行代码的实现,让大家对所学知识进行巩固与应用。
4-1 频数
4-2 频率
4-3 集中趋势
4-4 离散趋势
4-5 散点图和折线图 试看
4-6 条形图和直方图
4-7 箱线图
第5章 概率和概率分布【重点章节,必须掌握的概率论知识】
本章将讲解概率的基本概念和性质,这是进行统计推断的基石,学习离散型和连续型随机变量及其分布等。
5-1 什么是概率论
5-2 概率
5-3 编程理解小数和大数定律
5-4 再谈变量
5-5 离散型随机变量及其分布
5-6 连续型随机变量及其分布
5-7 本章小结
第6章 样本和抽样分布【重点章节,样本均值的分布】
假如我们想了解全中国程序员的工资水平,但是却无法拿到所有人的数据,该怎么办呢?统计学中,我们通过随机采集一些人的数据(样本),来构造样本函数(统计量),并与统计量的分布(抽样分布)相联系,从而为估计总体的参数和进行不确定性的刻画提供基础。 …
6-1 总体与样本
6-2 抽样分布
6-3 常用统计量的分布
6-4 正态总体的样本均值和样本方差的分布
6-5 编程理解中心极限定理
6-6 随机抽样, 误差源, 随机分配
6-7 本章小结
第7章 参数估计【点和区间估计】
通常我们无法准确获知总体参数(比如全中国程序员的平均工资)。在统计学中,我们通过样本提供的信息来对总体的情况进行估计。我们既可以使用一个数字(点估计)作为总体估计,也可以使用一个区间(区间估计)代表总体参数可能的范围。…
7-1 点估计
7-2 编程理解无偏性
7-3 编程理解相合性
7-4 区间估计
7-5 置信区间:一个正态总体的情况(上)
7-6 置信区间:一个正态总体的情况(下)
7-7 编程求置信区间:一个正态总体的情况(上)
7-8 编程求置信区间:一个正态总体的情况(下)
7-9 置信区间:两个正态总体的情况(上)
7-10 置信区间:两个正态总体的情况(下)
7-11 编程求置信区间:两个正态总体的情况(上)
7-12 编程求置信区间:两个正态总体的情况(下)
7-13 单侧置信区间
7-14 本章小结
第8章 假设检验【频率论方法】
顾名思义,假设检验是对假设进行验证的过程。比如我们有两个相互关联的假设:程序员的平均工资等于A(零假设) vs 程序员的平均工资不等于(大于或小于)A。我们基于样本得到的对总体的估计,就可以和假设中的数字A去进行比较,从而接受或拒绝零假设。在这一过程中,我们还可以对犯错(比如错误地拒绝零假设)的概率进行控制。 …
8-1 什么是假设检验
8-2 正态总体均值的假设检验(上)
8-3 正态总体均值的假设检验(下)
8-4 置信区间与假设检验的关系
8-5 编程实现正态总体均值的假设检验(上)
8-6 编程实现正态总体均值的假设检验(下)
8-7 正态总体方差的假设检验
8-8 编程实现正态总体方差的假设检验
8-9 决策错误与统计功效
8-10 统计显著性与实际显著性
8-11 z检验, t检验, 卡方检验, F检验的前提条件
8-12 本章小结
第9章 方差分析【多于两个总体均值的比较方法】
上一章我们讲解了单个总体(比如程序员的平均工资是否等于某个数值)和两个总体的检验(比如全国男程序员的工资是否比全国女程序员的工资高)。本章我们将介绍如何拆解和分析结构更加复杂的数据(比如性别和学历这两个因素如何交互影响程序员的工资)。 …
9-1 什么是方差分析
9-2 单因素方差分析(上)
9-3 单因素方差分析(下)
9-4 多重比较
9-5 编程实现单因素方差分析
9-6 双因素方差分析(上)
9-7 双因素方差分析(下)
9-8 本章小结
第10章 线性回归【重难点,建议多看视频】
很多时候,数据/变量之间是相互关联和影响的。比如,我们不仅关心程序员的工资是多少,我们也关心工资是否以及如何随性别、学历等因素而变化,这种变化是否受到其他因素(比如年龄)的调节等。这一章,我们不仅讲解如何使用回归分析刻画变量之间的关系,更会从回归分析的角度去重新审视假设检验的方法。此外,我们还会探讨统…
10-1 协方差
10-2 相关
10-3 编程理解协方差和相关
10-4 一元线性回归(上)
10-5 一元线性回归(下)
10-6 一元线性回归的前提条件
10-7 回归模型的评价指标
10-8 一元线性回归的假设检验
10-9 编程实现一元线性回归
10-10 多元线性回归(上)
10-11 多元线性回归(下)
10-12 常用的检验都是回归的一种特殊形式
10-13 统计中的回归与机器学习中的回归
10-14 本章小结
第11章 非参数检验【重难点,请认真学习】
在前面几章中,我们做统计推断的一个基础是,我们知道总体来自于哪种分布(比如总体服从正态分布),但是我们不知道总体分布的某些参数(比如均值或方差),于是我们使用基于样本获得的信息对总体的参与进行估计与检验。然而,有些时候,我们并不清楚总体来自于哪种分布,怎么办呢?让我们一起来进行非参数检验。…
11-1 什么是非参数方法
11-2 非参数方法举例
11-3 Bootstrap
11-4 Permutation
11-5 本章小结
第12章 贝叶斯统计【重在掌握方法,请好好学习】
基于频率论的假设检验首先认为零假设(模型)是正确的,然后通过从样本获取的信息来接受或拒绝零假设。那么,如果我们同时有多个模型,并且想知道基于现有数据,哪个模型最有可能是正确,要怎么办呢?贝叶斯统计不仅为我们解决这类问题提供了方法,而且允许我们随着数据的积累而对模型正确的可能性进行更新。…
12-1 什么是贝叶斯统计
12-2 概率知识
12-3 概率树
12-4 贝叶斯推断(上)
12-5 贝叶斯推断(下)
12-6 置信区间
12-7 本章小结
第13章 更广阔的的统计学世界【祝大家学以致用】
恭喜大家完成了这门课程的学习。本章将回顾和梳理同学们在这门课程中学习到的统计学知识,强化统计学的思维方式,并向大家介绍更广阔的统计学世界。祝大家收获满满,学习愉快!
13-1 课程结语