抛硬币,显著性水平α=0.01,假设-硬币正反面概率相同,请问需要至少抛多少次,假设成立?

一个硬币扔100次,正反面各50次的概率是多少?正反相差3次以上的概率是多少?不要求说的太复杂,直接说结果,百分之多少就行

}

  在研究大数据分析的统计数据时,你不可避免地需要学习概率。在概率背后的公式和理论中很容易迷失自己,但在工作和日常生活中都有重要的用途。我们之前已经讨论了描述性统计中的一些基本概念;现在,我们将探讨统计学与概率的关系。

  大数据分析为什么要学习概率统计假定没有先验统计知识,但至少需要具备Python的一般知识和一般的大数据分析知识。如果你对for循环和列表不满意,建议在继续之前在我们的Python入门课程中简要介绍它们。

  在最基本的层面上,概率试图回答以下问题:“事件发生的机会是什么?” 一个事件是一些令人感兴趣的结果。要计算事件发生的机会,我们还需要考虑所有可能发生的其他事件。概率的典型代表是谦虚的抛硬币。在抛硬币过程中,唯一可能发生的事件是:

  这两个事件构成了示例空间,即所有可能发生的事件的集合。为了计算事件发生的可能性,我们计算感兴趣事件可以发生多少次(例如翻转),并将其除以样本空间。因此,概率将告诉我们,理想的硬币有正面或反面的二分之一的机会。通过查看可能发生的事件,概率为我们提供了进行预测的框架关于事件发生的频率。但是,即使看起来很明显,但如果我们实际上尝试扔掉一些硬币,偶尔也会有一次异常高或低的正面计数。如果我们不想假设硬币是公平的,该怎么办?我们可以收集数据!我们可以使用统计数据基于对现实世界的观察来计算概率,并检查其与理想情况的比较。

  我们的数据将通过掷硬币10次并计数我们获得多少次来生成。我们将召集一组10个抛硬币试验。我们的数据点将是我们观察到的磁头数量。我们可能没有“理想”的5位负责人,但是我们不会担心太多,因为一次试验只是一个数据点。如果我们进行很多次试验,我们希望所有试验的平均脑袋数接近50%。下面的代码模拟10、100、1000和1000000次试验,然后计算观察到的头部的平均比例。下图也总结了我们的过程。

  该coin_trial功能代表了10次抛硬币的模拟。它使用该random()函数生成介于0和1之间的浮点数,heads如果它在该范围的一半以内,则增加计数。然后,simulate根据你想要的次数重复这些试验,并返回所有试验中平均头数。投币模拟给了我们一些有趣的结果。

  首先,数据证实我们的平均正面人数确实接近了应该达到的概率。此外,随着更多的试验,该平均值得到提高。在10个试验中,有一些轻微的错误,但是在进行1,000,000次试验后,该错误几乎完全消失了。随着更多的试验,偏离平均值的偏差减小。听起来有点熟?当然,我们本来可以自己扔掉硬币的,但是Python允许我们在代码中对该过程进行建模,从而为我们节省了很多时间。随着我们获得越来越多的数据,现实世界开始类似于理想状态。

  因此,在给定足够的数据的情况下,统计数据使我们能够使用现实世界的观察来计算概率。概率提供了理论,而统计学提供了使用数据测试该理论的工具。描述性统计,特别是均值和标准差,成为理论上的代理。你可能会问:“如果我仅能自己计算理论概率,那为什么需要代理?” 抛硬币是一个简单的玩具示例,但更有趣的概率却不那么容易计算。

  随着时间的推移,某人患上疾病的机会有多大?开车时关键的汽车部件发生故障的概率是多少?没有简单的方法来计算概率,因此我们必须依靠数据和统计数据来计算它们。在提供越来越多的数据的情况下,我们可以更加放心,我们计算出的值代表了这些重要事件发生的真实概率。话虽这么说,但请记住,根据我们之前的统计信息,你是一名培训侍酒师。在开始购买葡萄酒之前,你需要确定哪些葡萄酒比其他葡萄酒更好。你手头上有很多数据,因此我们将使用我们的统计数据来指导我们的决策。

  在解决“哪种葡萄酒比平均水平更好”的问题之前,我们必须考虑数据的性质。直观地讲,我们想用葡萄酒的分数来比较各组,但是有一个问题:分数通常在一定范围内。我们如何比较葡萄酒类型之间的分数组,并在一定程度上确定一种葡萄酒优于另一种葡萄酒?输入正态分布。正态分布是指概率和统计领域中的一个特别重要的现象。正态分布如下所示:

  关于正态分布,要注意的最重要特征是其对称性和形状。我们一直称其为分布,但是究竟分布了什么?这取决于上下文。在概率上,正态分布是所有事件之间概率的特定分布。x轴代表我们想知道概率的事件的值。y轴是与每个事件相关的概率,范围是0到1。

  我们在这里没有深入讨论概率分布,但是知道正态分布是一种特别重要的概率分布。在统计数据中,是分布的数据值。在此,x轴是我们数据的值,而y轴是这些值中每个值的计数。这是正态分布的同一张图片,但根据概率和统计上下文进行了标记:

  在概率上下文中,正态分布中的最高点表示发生概率最高的事件。随着你从任一端离此事件越来越远,几率迅速下降,形成了熟悉的钟形。统计上下文中的最高点实际上代表平均值。正如概率一样,当你远离均值时,频率会迅速下降。也就是说,存在与平均值的极高和极低的偏差,但极为罕见。

  如果你怀疑通过正态分布的概率与统计量之间存在其他关系,那么你是正确的!我们将在大数据分析为什么要学习概率统计后面探讨这种重要的关系,因此请紧紧抓住。由于我们将使用分数分布来比较不同的葡萄酒,因此我们将进行一些设置以捕获一些我们感兴趣的葡萄酒。我们将引入葡萄酒数据,然后分离出一些葡萄酒的分数对我们感兴趣。要带回数据,我们需要以下代码:

  数据以表格形式显示在下面。我们需要该points列,因此我们将其提取到其自己的列表中。我们从一位葡萄酒专家那里听说匈牙利的青岛啤酒葡萄酒非常出色,而一位朋友则建议我们从意大利哈尔滨啤酒开始。我们有数据可以比较这些葡萄酒!如果你不记得数据是什么样子,这里有个快速的表格供你参考并重新认识。

  如果我们将每组分数可视化为正态分布,则可以根据它们的位置立即判断出两个分布是否不同。但是我们将很快遇到这种方法的问题,如下所示。由于我们拥有大量数据,因此我们假设得分将呈正态分布。尽管这里的假设还可以,但是稍后我们将讨论这样做的实际风险。

  当两个分数分布重叠太多时,最好假设你实际上来自相同的分布并且没有不同。在另一个没有重叠的极端情况下,可以安全地假设分布不相同。我们的麻烦在于一些重叠的情况。鉴于一种分布的极高点可能与另一种分布的极低点相交,我们如何说这些组是否不同?在这里,我们必须再次呼吁正态分布给我们一个答案,并为统计和概率之间架起一座桥梁。

  由于两个因素,正态分布对概率和统计意义重大:中心极限定理和三西格玛规则。

  在上一节中,我们证明了如果我们多次重复进行10次抛掷试验,那么所有这些试验的平均总人数将接近理想硬币预期的50%。通过更多的试验,即使单个试验本身并不完美,这些试验的平均值也越接近真实概率。这个想法是中心极限定理的关键原则。在我们掷硬币的示例中,一次尝试10次投掷就产生了对应该发生什么可能性的单个估计(5头)。我们称其为估算值是因为我们知道它不是完美的(即,我们每次不会获得5个头)。

  如果我们做出许多估计,则中心极限定理指示这些估计的分布看起来像正态分布。此分布的顶点将与估算值应采用的真实值一致。在统计中,正态分布的峰值与平均值一致,这正是我们观察到的。因此,以多个“试验”作为我们的数据,中心极限定理表明即使我们不知道真实的概率,我们也可以磨练概率给出的理论理想。中心极限定理让我们知道许多试验均值的平均值将接近真实均值,三西格玛规则将告诉我们围绕该均值分布的数据量。

  三西格玛(Triple Sigma)规则,也称为经验规则或68-95-99.7规则,表达了我们有多少观测值落在均值的一定距离内。请记住,标准差(也称为“ sigma”)是数据集中观察值与平均值之间的平均距离。三西格玛规则规定,给定正态分布,则68%的观察值将落在平均值的一个标准偏差之间。95%将落在两个范围内,而99.7%将落在三个范围内。这些值的推导涉及很多复杂的数学运算,因此不在大数据分析为什么要学习概率统计讨论范围之内。关键要点在于,三西格玛规则使我们能够知道正态分布的不同间隔下包含多少数据。下图是“三个西格玛规则”代表的摘要。

  我们将把这些概念与我们的葡萄酒数据联系起来。作为一名侍酒师,我们想非常有信心地知道霞多丽和黑比诺比普通葡萄酒更受欢迎。我们有成千上万的葡萄酒评论,因此根据中央极限定理,这些评论的平均分数应与葡萄酒质量的所谓“真实”表示一致(由评论者判断)。尽管“三西格玛”规则说明了多少数据属于已知值,但也说明了极值的稀有性。与平均值相差超过三个标准偏差的任何值都应谨慎对待。利用三西格玛规则和Z分数,我们终于可以为霞多丽和黑比诺与普通葡萄酒的差异开出一个值。

  Z分数是一个简单的计算,它回答了以下问题:“给定一个数据点,它与平均值之间有多少标准偏差?” 下面的方程式是Z分数方程式。

  就其本身而言,Z评分不会为你提供太多信息。与Z表比较时,它获得的价值最高,该表列出了直到给定Z分数之前标准正态分布的累积概率。标准正态是均值为0,标准偏差为1的正态分布。即使我们的正态分布不是标准分布,Z分数也可以让我们参考Z表。累积概率是直到给定点之前所有值出现的概率之和。

  一个简单的例子就是平均值。平均值是正态分布的精确中间值,因此我们知道从左侧一直到平均值获得值的所有概率之和为50%。如果你尝试计算标准偏差之间的累积概率,则实际上会出现“三西格玛规则”中的值。下图提供了累积概率的可视化。我们知道所有概率之和必须等于100%,因此我们可以使用Z表在正态分布下计算Z分数两侧的概率。这种计算超过某个Z分数的概率对我们很有用。它让我们问:从“平均值离平均值有多远”到“距平均值有这么远的值来自同一组观察值的可能性有多大?” 因此,从Z分数和Z表得出的概率将回答我们基于葡萄酒的问题。

  这对我们朋友的推荐来说不太好!出于大数据分析为什么要学习概率统计的目的,我们将青岛啤酒和哈尔滨啤酒分数均视为正态分布。因此,每种葡萄酒的平均分数将代表其质量的“真实”分数。我们将计算Z分数,并查看青岛啤酒平均值与哈尔滨啤酒的距离。

  答案很小,但是究竟是什么意思呢?这种可能性的无穷小需要一些仔细的解释。假设我们相信朋友的哈尔滨啤酒和葡萄酒专家的青岛啤酒之间没有区别。也就是说,我们认为哈尔滨啤酒和青岛啤酒的质量大致相同。同样,由于葡萄酒之间的个体差异,这些葡萄酒的分数也会有所不同。如果我们对青岛啤酒和朗布斯科葡萄酒进行直方图分析,这将产生正态分布的分数,这要归功于中央极限定理。

  现在,我们有了一些数据,可以计算出所讨论的两种葡萄酒的均值和标准差。这些值使我们可以实际检验我们对哈尔滨啤酒和青岛啤酒具有相似品质的看法。我们以哈尔滨啤酒的葡萄酒得分为基础,并比较了青岛啤酒的平均值,但反之则可以轻松实现。唯一的区别是Z得分为负。Z分数是4.01!请记住,“三西格玛规则”告诉我们,假设青岛啤酒和哈尔滨啤酒相似,则99.7%的数据应在3个标准差之内。

  在一个假设哈尔滨啤酒和青岛啤酒葡萄酒相同的世界中,获得平均得分与青岛啤酒一样极端的可能性非常小。太小了,我们不得不考虑相反的情况:青岛啤酒葡萄酒不同于哈尔滨啤酒葡萄酒,并且会产生不同的分数分布。我们在这里精心选择了措辞:我注意不要说“青岛啤酒葡萄酒比哈尔滨啤酒好。” 他们很有可能成为。这是因为我们计算出的概率虽然在微观上很小,但不为零,确切地说,我们可以说哈尔滨啤酒和青岛啤酒葡萄酒肯定不是来自相同的分数分布,但是我们不能说一个比另一个更好或更差。

  这种类型的推理属于推论统计的领域,大数据分析为什么要学习概率统计仅旨在向你简要介绍其背后的原理。我们在大数据分析为什么要学习概率统计中介绍了很多概念,因此,如果你发现自己迷路了,请回过头慢慢来。拥有这种思维框架非常强大,但是容易被滥用和误解。

  我们从描述性统计开始,然后将它们与概率联系起来。根据概率,我们开发了一种方法来定量显示两组是否来自同一分布。在这种情况下,我们比较了两种葡萄酒建议,发现它们很可能并非来自相同的分数分布。换句话说,一种葡萄酒最有可能比另一种更好。统计信息不必仅限于统计学家。作为大数据分析家,对常见的统计量表示具有直觉的理解将使你在开发自己的理论上具有优势,并且可以随后测试这些理论。我们在这里几乎没有涉及推论统计的内容,但这里的相同一般思想将有助于指导你进行统计之旅。

}

一般说到概率,就喜欢拿抛硬币做例子。大多数时候,会简单认为硬币正背面的概率各为二分之一,其实事情远没有这么简单。这篇文章会以抛硬币试验为例子并贯穿全文,引出一系列概率论和数理统计的基本内容。这篇文章会涉及的有古典概型、公理化概率、二项分布、正态分布、最大似然估计和假设检验等一系列内容。主要目的是以抛硬币试验为例说明现代数学观点下的概率是什么样子以及以概率论为基础的一些基本数理统计方法。

好吧,首先我们要回答一个基本问题就是概率为什么是存在的。其实这不是个数学问题,而是哲学问题(貌似一般存在不存在啥的都是哲学问题)。之所以要先讨论这个问题,是因为任何数学活动都是在一定哲学观点前提下进行的,如果不明确哲学前提,数学活动就无法进行了(例如如果在你的哲学观点下概率根本不存在,那还讨论啥概率论啊)。

概率的存在是在一定哲学观点前提下的,我不想用哲学术语拽文,简单来说,就是你首先得承认事物是客观存在的,并可以通过大量的观察和实践被抽象总结。举个例子,我们经常会讨论“身高”,为什么我们都认为身高是存在的?因为我们经过长期的观察实践发现一个人身体的高度在短期内不会出现大幅度的变动,因此我们可以用一个有单位的数字来描述一个人的身体在一段不算长的时间内相对稳定的高度。这就是“身高”作为被普遍承认存在的哲学前提。

与此相似,人们在长期的生活中,发现世界上有一些事情的结果是无法预料的,例如抛硬币得到正面还是背面,但是,后来有些人发现,虽然单次的结果不可预料,但是如果我不断抛,抛很多次,正面结果占全部抛硬币次数的比率是趋于稳定的,而且次数越多越接近某个固定的数值。换句话说,抛硬币这件事,单次结果不可预料,但是多次试验的结果却在总体上是有规律可循的(术语叫统计规律)。

下面是历史上一些著名的抛硬币试验的数据记录:

可以看到,虽然这些试验在不同时间、不同地点由不同的人完成,但是冥冥中似乎有一股力量将正面的占比固定在50%附近。

后来,人们发现还有很多其它不可预测的事情都与抛硬币类似,例如掷骰子、买六合彩等等,甚至渐渐发现不只这些简单的事情,人类社会方方面面从简单到复杂的很多不可预测的事情宏观上看都具有统计规律。于是人们推测,在某些条件下的一些不可预测事件,都是有统计规律的,或者直观说很多不可预测结果的试验在多次进行后总体上看结果会趋近于一些常数(这个现象后来被严格定义为大数定律,成为概率论最基础的定理之一,下文会提到)。这种可观测现象,成为概率存在的哲学基础,而这些常数就是概率在朴素观点下的定义。

在认识到上述事实后,人们希望将这种规律加以利用(人类文明的发展不就是发现和利用规律么,呵呵),但是想要利用就首先要对概率进行严格的形式化定义,也就是要建立数学模型。比较知名的数学模型有古典概型、几何概率模型和公理化概率,本文将会讨论古典概型和公理化概率。

古典概型是人类对概率和统计规律最早的建模尝试,表达了朴素的数学原则下人们对概率的认识。在表述古典概型之前,需要先定义一些概念。

如果一个同时试验满足下面三条原则,则这个试验称为随机试验:

1、可在相同条件下(相对来说)重复进行。

2、可能出现的结果不止一个,但事先明确知道所有可能的结果(可以是无限个,例如所有自然数,但必须事先明确知道结果的取值范围)。

3、事先无法预测在一次试验中哪一个结果会出现。

显然上面的抛硬币试验是一个随机试验。

然后需要定义样本空间和样本点。一个随机试验的样本空间是这个试验所有可能结果组成的集合,而其中每个元素是一个样本点。例如,抛硬币试验中,样本空间为,其中F表示正面,B表示背面,而F、B就是两个样本点。

另一个非常重要的概念就是随机事件(简称事件):样本空间的一个子集称为一个事件。例如,抛硬币试验有四个不同的事件:,,,,分别表示“既不出现正面也不出现反面”,“出现正面”,“出现反面”和“出现正面或反面”。在不考虑硬币立起来等特殊情况时,第一个事件不可能出现,但它确实是一个合乎定义的事件,叫不可能事件;而最后一个事件必然出现,叫必然事件。

有了上面概念,就可以定义古典概型了:

如果一个概率模型满足 1)样本空间是一个有限集合,2)每一个基本事件(只包含一个样本点的事件)出现的概率相同,则这是一个古典概型。例如,在上面的抛硬币试验中,再定义,的概率均为0.5,则就构成了一个古典概型。

古典概型简单、直观,在早期的概率研究中广泛被使用。但是这个模型太朴素太不严格了,在这种不完善的定义下,根本没有办法做严格的数学推理,而且有限样本空间和等可能性在很多现实随机试验中并不满足,甚至对等可能不同定义会导致不同结论。因此必须使用一个更严格的定义,以符合现代数学公理化推导的要求,这就是公理化概率。

公理化概率对概率做如下定义:

概率是事件集合到实数域的一个函数,设事件集合为E,则如若满足:

对于两两互斥的事件,有。

公理化概率对概率做了严格的数学定义,可以较好的基于公理系统进行推导和证明。但是,概率模型只是给出了概率“是什么”(定性),没有回答“是多少”(定量)这个问题。也就是说,仅有概率模型,是不能定量回答抛硬币问题的。下面介绍对概率进行定量分析的方法。

从公理化概率的角度,我们可以这样定义抛硬币试验的概率:设是全部抛硬币的次数,而是正面向上的次数,则如下函数定义了这个概率:

容易验证,这个定义完全符合公理化概率的所有条件。下面就是确定和。不幸的是,显然N是无法穷尽的,因为理论上你不可能抛无数次硬币。由于不能精确度量这个概率,因此你必须通过某个可以精确度量的值去估计这个概率,而且还要从数学上证明这个估计方法是靠谱的,最好能定量给出这个估计量的可信程度。而对不可直接观测概率的一个估计度量值就是频率。

频率是这样定义的:事件A的频率是在相同条件下重复一个实验n次,事件A发生的次数在n次实验中的占比。一种简单的估计概率的方法就是用频率当做概率的估计。

例如,我刚刚抛完十次硬币,其中六次正面,四次背面,因此根据此次实验,我估计我这枚硬币出现正面的概率为0.6。这就是频率估计。

不过你一定有疑惑,为什么可以使用频率估计概率?有上面理论依据?如何对估计的准确性做出定理的分析?下面解答这些问题。

频率估计的理论基础是大数定律。毫不夸张的说,大数定律是整个现代概率论和统计学的最重要基石,几乎一切统计方法的正确性都依赖于大数定律的正确,因此大数定律被有些人称为概率论的首要定律。

大数定律直观来看表述了这样一种事实:在相同条件下,随着随机试验次数的增多,频率越来越接近于概率。注意大数定律陈述的是一个随着n趋向于无穷大时频率对真实概率的一种无限接近的趋势。

下面给出大数定律的数理表述,大数定律有多重数学表述,这里取伯努利大数定律:

其中表述在n次试验中事件x出现的次数。伯努利大数定律代表的意义是,当试验次数越来越多,频率与概率相差较大的可能性变得很小。大数定律从数学上严格证明了频率对概率的收敛性以及稳定性。这就是频率估计的理论基础。在后面关于中心极限定理的部分,还将定量给出估计的置信度(表示这个估计有多可靠)。

下面给出另一种估计概率的方法,就是最大似然估计。最大似然估计是参数估计的一种方法,用于在已知概率分布的情况下对分布函数的参数进行估计。而这里分布函数的参数刚好是要估计的概率。

最大似然估计基于这样一个朴素的思想:如果已经得到一组试验数据,在概率分布已知的情况下,可以将出现这组试验数据的概率表述为分布函数参数的函数。

看到上面的话很多人肯定又晕了,我还是举个具体的例子吧(非数学严格的例子,但思想一致)。我来到一所陌生的大学门口,想知道这所大学男生多还是女生多,我蹲在校门口数了走出校门的100名同学,发现80个男生20个女生,如果我认为这所学校每个学生这段时间内出校门的概率都是差不多的,那么我会推断男生多。因为男生多的学校更大可能性产生我观察的结果。所以,最大似然估计的核心思想就是:知道了结果,但不知道结果所在总体的情况,然后计算在总体在每种可能下产生这个结果的概率,哪种情况下产生已知结果的概率最大,就认为这种情况是总体的情况。

下面正式使用这个方法估计硬币正面出现的概率。

还是上面的实验,我已经得到“抛了十次,六次正面”这个结果,下面我想知道正面向上的概率。由于这个概率是一定存在的(第一节已经说明了哈,在既定哲学观点下),而且这个概率的取值范围应该是0到1的开区间(正面背面都出现过,所以不可能是0或1):

由一些背景知识知道,每抛十次硬币,正面出现的次数服从二项分布:

由于已知n=10,k=6,将其带入,得到一个函数:

其中p的定义域为。这个函数表示的是,当出现正面的真实概率为p时,“抛十次六次正面”这个事件出现的概率。我们希望估计的p让这个函数取值最大,以下是求解过程:

因为在(0,1)区间,ln(x)是x的单调递增函数,所以最大化lnL(p)就等于最大化L(p)。这样做主要是取对数可以让连乘变成连加,方便后面求导。

让这个导数为0,解得p为0.6,这就是我们对概率的最大似然估计,与概率估计的结果一致。

到此为止,我们已经说明了概率是存在的、建立了概率的数学模型,并能对不可直接观测的概率进行估计。但似乎还缺点什么。

大数定律只说明了理论上我们的估计是靠谱的,但是到底有多靠谱,却无法通过大数定律定量计算。这一节,我们就来解决这个问题:定量计算出估计的可靠性(术语叫显著性)。

还是上面我抛那十次硬币的试验。根据最优的频率估计和最大似然估计,均估计p(出现正面的概率)为0.6。但是如果有人提出异议,说我的估计可能是错的,p实际是0.5,我那个出现六次正面是因为只是偶然性的结果。这时我需要找证据反驳他,由于不能做无数次试验,我只能给出一个较高可信度的证据,例如,我想证明至少95%的可能性出现六次正面是因为p不等于0.5,也就是说,证明如果p为0.5,则偶然出现我这个结果的可能性不超过5%(5%称作显著水平)。

要评估显著性,首先要借助于中心极限定理。中心极限定理也是统计学的基石定理之一,它的一种表述是:

设随机变量独立同分布,且数学期望为,方差为。则其均值近似服从期望为,方差为的正态分布。等价的,近似服从标准正态分布。

中心极限定理的直观意义是,随便一个服从什么的总体中,你独立随机的抽取一组样本,那么样本的均值服从正态分布,并且可以根据总体的期望和方差推导出这个均值服从的正态分布的期望和方差,然后简单变换一下就可以得到一个服从标准正态分布的随机量。由于标准正态分布的概率密度函数是已知的,那么就可以得到这个量出现的概率。

这样说貌似太抽象了,我们下面还是看这个定理的应用实例吧。

上面说过,我要反驳的是抛硬币得到正面的实际概率是0.5,那么我就要证明如果p是0.5,则得到这组结果的概率是很小的(上面要求小于5%)。

设正面取值为1,背面取值为0。如果p是0.5,则每一次抛硬币的取值服从一个p为0.5的0-1分布。由期望及方差的定义可知,这个分布的期望和方差分别为:

由中心极限定理近似服从标准正态分布。

而我抛的十次硬币可以看做十个独立随机抽样,它们的均值是0.6,变换后的值为。

标准正态分布的概率密度公式为:

上面说过,我们希望显著水平是5%,所以,我需要找到x=z,使得此概率密度函数从-z到z的定积分为0.95,然后看0.632在不在[-z, z]内,如果在的话,我会认为我确实错了,至少我没有95%以上的把握说p不等于0.5,而如果0.632不再这个范围内,则我可以拍着胸脯说,我已经从理论上证明我有95%以上的把握,p不是0.5(换句话说,如果p是0.5,抛十次六次正面的可能性不足5%)。

坦白说这个z不是很好算,不过还好由于这东西特别常用,任何一本概率课本后面都可以找到标准正态分布表(或者很多工具如R语言可以直接计算分位点),下面就是我在网上找到的一个(来源):

这是一个单侧表,要保证显著水平为5%,则单侧积分上限不能低于0.475,通过查上表,可知0.475对应的z是1.96,远大于我们算出的0.632。很不幸,我在5%的显著水平下无法拒绝p=0.5的假设。同时通过上表可以看到,0.63对应的单侧概率是0.2357,也就是说,通过抛十次得到六次正面,我们只有约50%的把握说出现正面的概率不是0.5。换句话说,抛十次硬币来做频率估计是不太合适的,于是,我们需要增加试验次数。

假如,我又做了100次实验,抛出了60次正面,40次背面。那么这个试验结果可以显著的认为p不是0.5吗?用同样的方法算出。很显然,2.0大于1.96,所以这个试验结果可以充分(超过95%的可能)说明这枚硬币正面朝上的概率确实不是0.5。通过查表可以看到,2.0的显著水平约为0.046,换句话说,这次试验结果95.4%以上表明硬币正面出现的概率不是0.5。当然,也有可能结论是错误的,因为毕竟还有4.6%的可能这是在p=0.5的情况下偶然出现的。

通过假设检验理论,可以通过增加试验次数,将犯错的概率缩小到任意小的值。

这篇文章以抛硬币试验为引子引出了一系列现代数学中概率的基本模型、定理及基本的估计及显著性检验方法。写这篇文章是我无聊抛硬币时一时兴起,其中对很多东西只是给出一个轮廓,没有处处给出严格的定义和证明,不过大约说明了常用的一些统计方法及其理论基础,限于篇幅不能面面俱到,例如一个假设检验如果展开写可以单独写一篇文章。目前随着大数据概念的热炒,基于互联网的数据挖掘和机器学习也变得火热,其实很多数据挖掘和机器学习都是基于概率和统计理论的,很多方法甚至只是传统统计方法的应用。因此如果准备在这方面深入学习,不妨考虑先在概率论和数理统计方面打好基础。

}

我要回帖

更多关于 抛硬币50次正反面的概率 的文章

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信