根据已知条件,设置函数的方法及步骤是:
1、打开Excel工作表;
2、根据下述已知条件:
可以通过IF函数建立一个嵌套条件函数;
3、在A2单元格输入以下公式
公式表示:A1加上根据A1条件的不同而返回的不同的数值。
1、打开Excel工作表;
2、根据已知条件,判断条件规律,是在一个升序的数列中,返回对应的数值;可以将这组升序数值整理到一个区域,也可以直接在公式中罗列,通过LOOKUP函数返回升序数列中小于条件的最大值所对应的数值。
公式表示:在升序数列D列中,查找比A1数值小的最大值,并返回其对应的E列的数值,然后加上A1
1、打开Excel工作表;
2、根据已知条件判断,返回值与5的倍数有关系,可以建立与5的倍数的关系式。
公式表示:A1单元格数值除以5的整数,加上A1,再加上2 。
说明:为什么要存在拉普拉斯平滑,因为在P(W|C)中,在C分类的条件下,W为多个特征,但是如果W中存在一个为0的情况,那个整个结果就为0,这样不合理。概率统计,为了是统计在分类条件下,特征的成立数
3)决策树和随机森林
信息熵:
说明:log 低数为2,单位比特,H(X)为熵,x为特征具体值,p(x)为该值在x特征值中的概率
说明:随机森林是在决策树的基础上,种植多颗树的方式,只是每一颗树的深度没有决策树那么深。
特征复杂度决定了决策树的深度,不是树的深度越深,就越好的,有可能存在计算不出结果。
信息熵:是确定树深度的最大值。
信息增益:得知特征X的信息而使得类Y的信息的不确定性的减少程度。
b、损失函数(最小二乘法)
损失函数(最小二乘法)(误差的平方和): yi:训练样本的真实值, hw(xi):第i个训练样本的特征、组合预测值
说明:当损失值在最小的时候,说明,函数的拟合状态最好,这种方式,也就更加接近具体的预测轨迹
说明:在求最小损失值的时候,需要不断的求解W(权重值),权重值的求解方式一般为上面两种。求出的值,然后在计算损失值,然后在反过来推导,权重值。如此得出结果,速率越慢当然拟合程度越高,但都是拟合越高越好。
最理想的状态不是第三种,而是第二种。
1、具有l2正则化的线性最小二乘法
说明:从结果可以看出差异并不是很大,那是因为训练次数的原因,可以通过多次的训练来达到效果
说明:逻辑回归,是算一种二分类算法。比如:是否是猫、狗等。我们不能完全确认,他是否是猫,那就用概率的方式来确认分类。概率值越高说明是,反之否。通过大约阈值来确认分类,这种方式人图像识别中还是比较常用的方式。
对数似然损失函数表现:(目前没有好的方式去解决确认最低点的问题)
1、多次随机初始化,多次比较最小值结果
2、求解过程中,调整学习率
上面两种方式只是改善,不是真正意义上的解决这个最低点的问题。虽然没有最低点,但是最终结果还是不错的。
损失函数,表现形式:
说明:如果真实值为y=1时,当hθ(x)的概率越接近1时,说明损失函数的值越小。图形公式 -log(P)
说明:如果真是值为y=0时,概率越小,损失值就越小
五、上面说的都是监督学习的算法,下面介绍一种非监督学习的算法(k-mean)
1)步骤和优缺点
第4章 计划任务数为平均数时 (ⅰ)当计划任务数表现为提高率时 ⅱ)当计划任务数表现为降低率时 时间进度= 对于分组数据,众数的求解公式为: 对于分组的数值型数据,中位数按照下述公式求解: 对于分组的数值型数据,四分位数按照下述公式求解: (1)简单算数平均数 (2)加权算数平均数 各变量值与算术平均数的离差之和为零。 各变量值与算术平均数的离差平方和为最小。 2、调和平均数(Harmonic mean) (1)简单调和平均数 (2)加权调和平均数 3、几何平均数 (1)简单几何平均数 (2)加权几何平均数 一、分类数据:异众比率 二、顺序数据:四分位差 三、数值型数据的离散程度测度值 1、极差(Range) 2、平均差 (1)如果数据是未分组数据(原始数据),则用简单算术平均法来计算平均差: (2)如果数据是分组数据,采用加权算术平均法来计算平均差: 3、方差(Variance)与标准差 总体方差和标准差的计算公式: 方差:(未分组数据) (分组数据) 标准差:(未分组数据) (分组数据) 样本方差和标准差 方差的计算公式 未分组数据 : 分组数据: 标准差的计算公式 未分组数据 : 分组数据: 4、变异系数(离散系数) 标准差系数计算公式 (样本离散系数)(总体离散系数) (样本离散系数) (总体离散系数) 一、分布的偏态 对未分组数据 对分组数据 二、分布的峰态 (未分组数据) 对已分组数据 第5章 离散型随机变量的概率分布 (2)二项分布 (3) 泊松分布: 当n很大,p很小时,B(n,p)可近似看成参数l=np的P(l).即, 分布函数 F(x) 的性质: (a)单调性 若 ,则 (b)有界性 (c)右连续性 (d)对任意的x0 若F(x)在X=x0处连续,则 连续型随机变量的概率分布 概率密度函数 f(x)的性质 (a)非负性 f(x) ≥0; (b)归一性 ; (c) ; (d)在f(x)的连续点x处,有 (e) 几种常见的连续型分布 (1)均匀分布 若随机变量X的概率密度为 则称X在(a,b)上服从均匀分布,记为X~U (a,b). 另:对于 , 我们有 (2) (2)指数分布 若随机变量X的概率密度为 其中常数 ,则称X服从参数为 的指数分布,相应的分布函数为 .随机变量的数学期望 连续型随机变量的数学期望: 数学期望的性质 性质1. 设C是常数,则E(C)=C; 性质2. 若X和Y相互独立,则 E(XY)=E(X)E(Y); 性质3. E(X±Y) =E(X) ±E(Y) ; 性质4. 设C是常数,则 E(CX)=C E(X)。 性质2可推广到任意有限多个相互独立的随机变量之积的情形。 常见的离散型随机变量的数学期望 : (a)两点分布 若X~B(1,p),则EX=p. (b)二项分布 若X~B(n,p),则EX=np. (c)泊松分布 若X~P( ),则EX= . 常见的连续型随机变量的数学期望: (a)均匀分布: 设X~U (a,b),则EX=(a+b)/2。 (b)指数分布: 设X服从参数为 的指数分布,则
版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。