最常用的统计学分析方法--假设检验

天天见闻 天天见闻 2024-05-29 科技 阅读: 2
摘要: 本期不写机器学习,而是写统计学中一个最广泛的应用---假设检验。假设检验是一种常见的基于样本的“统计证据”来对总体进行推断的方法。3、选定统计方法,根据需求选择方法,比如最常用的Z检验,T检验或卡方检验等,将样本观察值按公式计算出统计量的大小。

作者写本文时的面部活动

大家好,这篇的题目是早就列入计划的。本期不写机器学习,而是写统计学中一个最广泛的应用---假设检验。作为数据科学一个硬币的两面(统计学与机器学习),统计学往往在科研数据分析中应用的次数更多。

一、假设检验( Test)概述

一句话定义:用一些特定的数值来确定样本是否来自某一个总体。假设检验是一种常见的基于样本的“统计证据”来对总体进行推断的方法。

这么讲很抽象,我们来举个例子,假设有人说:“在马萨诸塞州某一天(没错我就直接搬中的例子了),1加仑汽油的平均价格是1.15美元”。我们想知道他说的对不对。怎么能确定这个说法的真实性呢?你可以在每个加油站询问价格。这种方法当然是最准确的,但它耗时、昂贵,实际操作是不可能的。

一种更简单的方法是在全州范围内随机选择少数几个加油站询问价格,然后计算样本平均值。由于选择过程中的随机性,样本的平均值会各不相同。假设我们的样本均值是1.18美元。那么这0.03美元的差价到底是随机抽样的结果(1加仑汽油的平均价格就是1.15美元),还是1加仑汽油的平均价格实际上大于1.15美元的重要证据?此时就可以用假设检验的方法,用于做出此类决策。

假设检验有很多不同种类,不同的假设检验对数据中被抽样的随机变量的分布做出不同的假设(都有哪些假设后面讲)。而在选择方法时,必须考虑这些假设。所有的假设检验都有相同的基本术语和结构。

1.零假设:也称为原假设,是关于你想检验的总体的某一种判断。它在某种意义上是“无效”的,因为它通常代表着一种“现状”。它通过 “断言”一个总体参数或总体参数的组合具有一定的值来形式化。在我们的例子中,零假设是“整个州的平均汽油价格就是1.15美元”。零假设写作H0,那么H0:µ=1.15。

2.备择假设:是一种与原假设相反的关于总体的断言。在我们的例子中,可能的备择假设有:

H1:µ≠1.15 即州平均价格不是1.15美元(对应双尾检验)

H1:µ>1.15 -即州平均价格大于1.15美元(对应右尾检验)

H1:µ

从这里面选一个,作为你的备择假设。在选择原假设和备择假设时,我们通常根据是希望收集证据予以支持还是拒绝的判断作为选择依据。一般来说,将希望收集证据予以拒绝的假设作为原假设,而将研究者希望通过搜集证据予以支持的假设作为备择假设。

3.检验统计量:为了进行假设检验,从总体中随机抽取样本,计算相关统计量。这个统计量随检验类型的不同而不同,但是它在零假设下的分布必须是已知的(或假设的)。

(1)p:检验的p值是零假设下,得到检验统计量或比样本值更极端的值的概率。那么自然,这个p越小,就代表零假设成立的概率越小。因此实验中,我们希望p越小越好。

(2)α:显著性水平α是检验的一个阈值,α的数值必须在假设检验前确定好。一个典型的α的值是0.05。此时比较p和α。

a.如果一个检验的p值小于α,检验拒绝零假设。

b.如果p值大于α,没有足够的证据拒绝零假设。注意,拒绝原假设的证据不足并不代表接受原假设。

显著性水平α可以解释为:拒绝零假设时, 零假设实际上是正确的概率——第一类错误。即使零假设没有被拒绝,它也可能是错误的——第二类错误。第二类错误通常是由于样本量小造成的。

4.置信区间:假设检验的结果通常用置信区间表示。置信区间是一个估计值范围,其上界和下界是根据样本的值和样本已知(或假设)的抽样分布计算的。较宽的置信区间对应较差的估计(较小的样本);较窄的区间对应较好的估计(较大的样本)。如果零假设断言总体参数的值位于该置信区间之外时,将拒绝零假设。比如我们计算出,置信区间为1.17-1.19美元,那就可以拒绝零假设,因为零假设认为价格是1.15美元。

二、假设检验步骤

1、提出H0和H1。往往先建立备择假设,备择假设H1一旦建立,再根据完备与互斥性,确定零假设。

2、设定显著性水平α。我们经常取0.05,也有时取0.01.但这不是绝对的,有的实验α必须取非常小(如0.0001以下)。

3、选定统计方法,根据需求选择方法,比如最常用的Z检验,T检验或卡方检验等,将样本观察值按公式计算出统计量的大小。

4、根据统计量的大小及其分布确定检验假设成立的可能性P的大小并判断结果。若P>α,结论为(按所取显著性水平α)不显著,无充足理由拒绝H0,如果P

其他相关
机器学习中的概率论与梳理统计(Python实现数学期望、方差等)

机器学习中的概率论与梳理统计(Python实现数学期望、方差等)

作者: 天天见闻 时间:2024-05-03 阅读: 1
一、概率论数理统计常见的统计量实现总结#1、数学期望(俗称平均值)二、求相关系数的实现总结2、通过numpy的方法计算相关性系数泊松分布的实现和二项分布有些类似,在泊松分布中我们需要指定比率参数。泊松分布的输出是一个数列,包含了发生0次、1次、2次,直到10次事故的概率。...
卧底揭秘 | 太阳能路灯超暴利 售价竟是成本6倍!

卧底揭秘 | 太阳能路灯超暴利 售价竟是成本6倍!

作者: 天天见闻 时间:2024-04-11 阅读: 1
在这些项目中,太阳能路灯售价少则三千多一盏,贵的甚至五六千。那么太阳能路灯的真实成本又是怎样的呢?伏妹还真的就拿到一份太阳能路灯各部分的成本价格表。那么成本才一千多块钱的东西,怎么售价就能到五六千了呢?事实上,质量好的太阳能路灯是一款性价比非常好的市政产品。...
谈谈估值、十种公司估值方法!

谈谈估值、十种公司估值方法!

作者: 天天见闻 时间:2024-04-10 阅读: 1
目前最广泛使用的DCF估值法提供了严谨的分析框架,系统地考虑影响公司价值的每一个因素,最终评估一个公司的投资价值。NAV估值即净资产价值法,目前地产行业的主流估值方法。...
要提升认知,就要了解整合的认知系统框架

要提升认知,就要了解整合的认知系统框架

作者: 天天见闻 时间:2024-03-31 阅读: 2
我们常说认知提升,它不是知识的增加,而是智慧的提升。前者是知识内容性的增加,后者是思维模式的变化。认知要提升,内容增加的作用不是根本,必须要有思维模式、逻辑结构的改变才能真正提升。只有不断尝试用不同的方式去管理,找到适合公司和下属状况的方法才有管理认知方面的提升。...
游戏陪玩水有多深

游戏陪玩水有多深

作者: 天天见闻 时间:2024-03-18 阅读: 19
”在多个平台上注册为陪玩的颜军表示,身边有很多喜欢玩游戏的朋友都在关注陪玩行业,很多也已经加入注册成为陪玩,“这个行业对学历没要求,对于喜欢打游戏的人来说是提供了一个新的就业机遇,边玩游戏边赚钱,这也是很多喜欢玩游戏的人想做的事情”。...
计量经济学 | 门限模型原理及应用

计量经济学 | 门限模型原理及应用

作者: 天天见闻 时间:2024-03-17 阅读: 18
门限模型计量经济学门限模型原理门限模型又称门槛模型,主要用来解决自变量在不同值域内对因变量影响不同的问题。仍旧以上一篇推送中参考的文章《生产性服务投入与制造业全球价值链地位:影响机制与实证检验》为例介绍门限效应的应用。门槛效应为非线性经济关系的研究提供了新的方法,但也提出了新的问题。...
我来说两句

年度爆文