线性相关与秩的关系是线性表示的一种吗?

一种统计方法,用于将两种或多种技术进行比较,通常是将当前采用的技术与新技术进行比较。A/B 测试不仅旨在确定哪种技术的效果更好,而且还有助于了解相应差异是否具有显著的统计意义。A/B 测试通常是采用一种衡量方式对两种技术进行比较,但也适用于任意有限数量的技术和衡量方式。

分类模型预测准确的比例。在多类别分类中,准确率定义如下:

在二分类中,准确率定义为:

一种函数(例如 ReLU 或 S 型函数),用于对上一层的所有输入求加权和,然后生成一个输出值(通常为非线性值),并将其传递给下一层。

一种先进的梯度下降法,用于重新调整每个参数的梯度,以便有效地为每个参数指定独立的学习速率。如需查看完整的解释,请参阅这篇论文。

一种会考虑所有可能分类阈值的评估指标。

ROC 曲线下面积是,对于随机选择的正类别样本确实为正类别,以及随机选择的负类别样本为正类别,分类器更确信前者的概率。

在神经网络上执行梯度下降法的主要算法。该算法会先按前向传播方式计算(并缓存)每个节点的输出值,然后再按反向传播遍历图的方式计算损失函数值相对于每个参数的偏导数。

一种简单的模型或启发法,用作比较模型效果时的参考点。基准有助于模型开发者针对特定问题量化最低预期效果。

模型训练的一次迭代(即一次梯度更新)中使用的样本集。

一个批次中的样本数。例如,SGD 的批次大小为 1,而小批次的大小通常介于 10 到 1000 之间。批次大小在训练和推断期间通常是固定的;不过,TensorFlow 允许使用动态批次大小。

距离原点的截距或偏移。偏差(也称为偏差项)在机器学习模型中用 b 或 w0 表示。例如,在下面的公式中,偏差为 b:

一种分类任务,可输出两种互斥类别之一。例如,对电子邮件进行评估并输出“垃圾邮件”或“非垃圾邮件”的机器学习模型就是一个二元分类器。

将一个特征(通常是连续特征)转换成多个二元特征(称为桶或箱),通常根据值区间进行转换。例如,您可以将温度区间分割为离散分箱,而不是将温度表示成单个连续的浮点特征。假设温度数据可精确到小数点后一位,则可以将介于 0.0 到 15.0 度之间的所有温度都归入一个分箱,将介于 15.1 到 30.0 度之间的所有温度归入第二个分箱,并将介于 30.1 到 50.0 度之间的所有温度归入第三个分箱。

一种预测后调整,通常是为了降低预测偏差的影响。调整后的预测和概率应与观察到的标签集的分布一致。

一种训练时进行的优化,会使用某种函数(例如 softmax)针对所有正类别标签计算概率,但对于负类别标签,则仅针对其随机样本计算概率。例如,如果某个样本的标签为“小猎犬”和“狗”,则候选采样将针对“小猎犬”和“狗”类别输出以及其他类别(猫、棒棒糖、栅栏)的随机子集计算预测概率和相应的损失项。这种采样基于的想法是,只要正类别始终得到适当的正增强,负类别就可以从频率较低的负增强中进行学习,这确实是在实际中观察到的情况。候选采样的目的是,通过不针对所有负类别计算预测结果来提高计算效率。

一种特征,拥有一组离散的可能值。以某个名为 house style 的分类特征为例,该特征拥有一组离散的可能值(共三个),即 Tudor, ranch, colonial。通过将 house style 表示成分类数据,相应模型可以学习 Tudor、ranch 和 colonial 分别对房价的影响。

有时,离散集中的值是互斥的,只能将其中一个值应用于指定样本。例如,car maker 分类特征可能只允许一个样本有一个值 (Toyota)。在其他情况下,则可以应用多个值。一辆车可能会被喷涂多种不同的颜色,因此,car color 分类特征可能会允许单个样本具有多个值(例如 red 和 white)。

分类特征有时称为离散特征。

一种数据,用于捕获模型变量在特定时间的状态。借助检查点,可以导出模型权重,跨多个会话执行训练,以及使训练在发生错误之后得以继续(例如作业抢占)。请注意,图本身不包含在检查点中。

为标签枚举的一组目标值中的一个。例如,在检测垃圾邮件的二元分类模型中,两种类别分别是“垃圾邮件”和“非垃圾邮件”。在识别狗品种的多类别分类模型中,类别可以是“贵宾犬”、“小猎犬”、“哈巴犬”等等。

一种二元分类问题,在此类问题中,两种类别的标签在出现频率方面具有很大的差距。例如,在某个疾病数据集中,0.0001 的样本具有正类别标签,0.9999 的样本具有负类别标签,这就属于分类不平衡问题;但在某个足球比赛预测器中,0.51 的样本的标签为其中一个球队赢,0.49 的样本的标签为另一个球队赢,这就不属于分类不平衡问题。

一种机器学习模型,用于区分两种或多种离散类别。例如,某个自然语言处理分类模型可以确定输入的句子是法语、西班牙语还是意大利语。请与回归模型进行比较。

一种标量值条件,应用于模型预测的得分,旨在将正类别与负类别区分开。将逻辑回归结果映射到二元分类时使用。以某个逻辑回归模型为例,该模型用于确定指定电子邮件是垃圾邮件的概率。如果分类阈值为 0.9,那么逻辑回归值高于 0.9 的电子邮件将被归类为“垃圾邮件”,低于 0.9 的则被归类为“非垃圾邮件”。

将关联的样本分成一组,一般用于非监督式学习。在所有样本均分组完毕后,相关人员便可选择性地为每个聚类赋予含义。

聚类算法有很多。例如,k-means 算法会基于样本与形心的接近程度聚类样本,如下图所示:

之后,研究人员便可查看这些聚类并进行其他操作,例如,将聚类 1 标记为“矮型树”,将聚类 2 标记为“全尺寸树”。

再举一个例子,例如基于样本与中心点距离的聚类算法,如下所示:

根据很多其他用户的兴趣来预测某位用户的兴趣。协同过滤通常用在推荐系统中。

一种 NxN 表格,用于总结分类模型的预测效果;即标签和模型预测的分类之间的关联。在混淆矩阵中,一个轴表示模型预测的标签,另一个轴表示实际标签。N 表示类别个数。在二元分类问题中,N=2。例如,下面显示了一个二元分类问题的混淆矩阵示例:

上面的混淆矩阵显示,在 19 个实际有肿瘤的样本中,该模型正确地将 18 个归类为有肿瘤(18 个正例),错误地将 1 个归类为没有肿瘤(1 个假负例)。同样,在 458 个实际没有肿瘤的样本中,模型归类正确的有 452 个(452 个负例),归类错误的有 6 个(6 个假正例)。

多类别分类问题的混淆矩阵有助于确定出错模式。例如,某个混淆矩阵可以揭示,某个经过训练以识别手写数字的模型往往会将 4 错误地预测为 9,将 7 错误地预测为 1。

混淆矩阵包含计算各种效果指标(包括精确率和召回率)所需的充足信息。

一种浮点特征,可能值的区间不受限制。与离散特征相对。

通俗来说,收敛通常是指在训练期间达到的一种状态,即经过一定次数的迭代之后,训练损失和验证损失在每次迭代中的变化都非常小或根本没有变化。也就是说,如果采用当前数据进行额外的训练将无法改进模型,模型即达到收敛状态。在深度学习中,损失值有时会在最终下降之前的多次迭代中保持不变或几乎保持不变,暂时形成收敛的假象。

一种函数,函数图像以上的区域为凸集。典型凸函数的形状类似于字母 U。例如,以下都是凸函数:

典型凸函数的形状类似于字母 U。

相反,以下函数则不是凸函数。请注意图像上方的区域如何不是凸集:

严格凸函数只有一个局部最低点,该点也是全局最低点。经典的 U 形函数都是严格凸函数。不过,有些凸函数(例如直线)则不是这样。

很多常见的损失函数(包括下列函数)都是凸函数:

  • L2 正则化 梯度下降法的很多变体都一定能找到一个接近严格凸函数最小值的点。同样,随机梯度下降法的很多变体都有很高的可能性能够找到接近严格凸函数最小值的点(但并非一定能找到)。

两个凸函数的和(例如 L2 损失函数 + L1 正则化)也是凸函数。

深度模型绝不会是凸函数。值得注意的是,专门针对凸优化设计的算法往往总能在深度网络上找到非常好的解决方案,虽然这些解决方案并不一定对应于全局最小值。

使用数学方法(例如梯度下降法)寻找凸函数最小值的过程。机器学习方面的大量研究都是专注于如何通过公式将各种问题表示成凸优化问题,以及如何更高效地解决这些问题。

欧几里得空间的一个子集,其中任意两点之间的连线仍完全落在该子集内。例如,下面的两个图形都是凸集:

矩形和半椭圆形都是凸集。

相反,下面的两个图形都不是凸集:

缺少一块的饼图以及烟花图都是非凸集。

简单来说,卷积在数学中指两个函数的组合。在机器学习中,卷积结合使用卷积过滤器和输入矩阵来训练权重。

机器学习中的“卷积”一词通常是卷积运算或卷积层的简称。

如果没有卷积,机器学习算法就需要学习大张量中每个单元格各自的权重。例如,用 2K x 2K 图像训练的机器学习算法将被迫找出 400 万个单独的权重。而使用卷积,机器学习算法只需在卷积过滤器中找出每个单元格的权重,大大减少了训练模型所需的内存。在应用卷积过滤器后,它只需跨单元格进行复制,每个单元格都会与过滤器相乘。

卷积运算中的两个参与方之一。(另一个参与方是输入矩阵切片。)卷积过滤器是一种矩阵,其等级与输入矩阵相同,但形状小一些。以 28×28 的输入矩阵为例,过滤器可以是小于 28×28 的任何二维矩阵。

在图形操作中,卷积过滤器中的所有单元格通常按照固定模式设置为 1 和 0。在机器学习中,卷积过滤器通常先选择随机数字,然后由网络训练出理想值。

深度神经网络的一个层,卷积过滤器会在其中传递输入矩阵。以下面的 3x3 卷积过滤器为例:

下面的动画显示了一个由 9 个卷积运算(涉及 5x5 输入矩阵)组成的卷积层。请注意,每个卷积运算都涉及一个不同的 3x3 输入矩阵切片。由此产生的 3×3 矩阵(右侧)就包含 9 个卷积运算的结果:

一种神经网络,其中至少有一层为卷积层。典型的卷积神经网络包含以下几层的组合:

卷积神经网络在解决某些类型的问题(如图像识别)上取得了巨大成功。

如下所示的两步数学运算:

对卷积过滤器和输入矩阵切片执行元素级乘法。(输入矩阵切片与卷积过滤器具有相同的等级和大小。) 对生成的积矩阵中的所有值求和。 以下面的 5x5 输入矩阵为例:

现在,以下面这个 2x2 卷积过滤器为例:

每个卷积运算都涉及一个 2x2 输入矩阵切片。例如,假设我们使用输入矩阵左上角的 2x2 切片。这样一来,对此切片进行卷积运算将如下所示:

卷积层由一系列卷积运算组成,每个卷积运算都针对不同的输入矩阵切片。

对数损失函数向多类别分类问题的一种泛化。交叉熵可以量化两种概率分布之间的差异。另请参阅困惑度。

您按照这些说明自行编写的 Estimator。

根据样本、测量结果和可视化内容来理解数据。数据分析在首次收到数据集、构建第一个模型之前特别有用。此外,数据分析在理解实验和调试系统问题方面也至关重要。

DataFrame 一种热门的数据类型,用于表示 Pandas 中的数据集。DataFrame 类似于表格。DataFrame 的每一列都有一个名称(标题),每一行都由一个数字标识。

一种高级别的 TensorFlow API,用于读取数据并将其转换为机器学习算法所需的格式。tf.data.Dataset 对象表示一系列元素,其中每个元素都包含一个或多个张量。tf.data.Iterator 对象可获取 Dataset 中的元素。

如需详细了解 Dataset API,请参阅《TensorFlow 编程人员指南》中的导入数据。

在二元分类或多类别分类问题中,模型学到的类别之间的分界线。例如,在以下表示某个二元分类问题的图片中,决策边界是橙色类别和蓝色类别之间的分界线:

两种类别之间明确定义的边界。

与全连接层的含义相同。

一种神经网络,其中包含多个隐藏层。深度模型依赖于可训练的非线性关系。

一种大部分值是非零值的特征,通常是浮点值张量。与稀疏特征相对。

一种特征,包含有限个可能值。例如,某个值只能是“动物”、“蔬菜”或“矿物”的特征便是一个离散特征(或分类特征)。与连续特征相对。

正则化的一种形式,在训练神经网络方面非常有用。丢弃正则化的运作机制是,在一个梯度步长中移除从神经网络层中随机选择的固定数量的单元。丢弃的单元越多,正则化效果就越强。这类似于训练神经网络以模拟较小网络的指数级规模集成学习。如需完整的详细信息,请参阅 Dropout: A Simple Way to Prevent Neural Networks from Overfitting(《丢弃:一种防止神经网络过拟合的简单方法》)。

一种模型,以持续更新的方式在线接受训练。也就是说,数据会源源不断地进入这种模型。

一种正则化方法,是指在训练损失仍可以继续降低之前结束模型训练。使用早停法时,您会在验证数据集的损失开始增大(也就是泛化效果变差)时结束模型训练。

一种分类特征,以连续值特征表示。通常,嵌套是指将高维度向量映射到低维度的空间。例如,您可以采用以下两种方式之一来表示英文句子中的单词:

表示成包含百万个元素(高维度)的稀疏向量,其中所有元素都是整数。向量中的每个单元格都表示一个单独的英文单词,单元格中的值表示相应单词在句子中出现的次数。由于单个英文句子包含的单词不太可能超过 50 个,因此向量中几乎每个单元格都包含 0。少数非 0 的单元格中将包含一个非常小的整数(通常为 1),该整数表示相应单词在句子中出现的次数。 表示成包含数百个元素(低维度)的密集向量,其中每个元素都存储一个介于 0 到 1 之间的浮点值。这就是一种嵌套。 在 TensorFlow 中,会按反向传播损失训练嵌套,和训练神经网络中的任何其他参数一样。

经验风险最小化 (ERM, empirical risk minimization) 用于选择可以将基于训练集的损失降至最低的函数。与结构风险最小化相对。

多个模型的预测结果的并集。您可以通过以下一项或多项来创建集成学习:

深度模型和宽度模型属于一种集成学习。

在训练时,整个数据集的一次完整遍历,以便不漏掉任何一个样本。因此,一个周期表示(N/批次大小)次训练迭代,其中 N 是样本总数。

数据集的一行。一个样本包含一个或多个特征,此外还可能包含一个标签。另请参阅有标签样本和无标签样本。

被模型错误地预测为负类别的样本。例如,模型推断出某封电子邮件不是垃圾邮件(负类别),但该电子邮件其实是垃圾邮件。

被模型错误地预测为正类别的样本。例如,模型推断出某封电子邮件是垃圾邮件(正类别),但该电子邮件其实不是垃圾邮件。

ROC 曲线中的 x 轴。FP 率的定义如下:

在进行预测时使用的输入变量。

指定模型应该如何解读特定特征的一种函数。此类函数的输出结果是所有 Estimators 构造函数的必需参数。

借助 tf.feature_column 函数,模型可对输入特征的不同表示法轻松进行实验。有关详情,请参阅《TensorFlow 编程人员指南》中的特征列一章。

“特征列”是 Google 专用的术语。特征列在 Yahoo/Microsoft 使用的 VW 系统中称为“命名空间”,也称为场。

通过将单独的特征进行组合(求笛卡尔积)而形成的合成特征。特征组合有助于表达非线性关系。

指以下过程:确定哪些特征可能在训练模型方面非常有用,然后将日志文件及其他来源的原始数据转换为所需的特征。在 TensorFlow 中,特征工程通常是指将原始日志文件条目转换为 tf.Example 协议缓冲区。另请参阅 tf.Transform。

特征工程有时称为特征提取。

训练机器学习模型时采用的一组特征。例如,对于某个用于预测房价的模型,邮政编码、房屋面积以及房屋状况可以组成一个简单的特征集。

用于描述如何从 tf.Example 协议缓冲区提取特征数据。由于 tf.Example 协议缓冲区只是一个数据容器,因此您必须指定以下内容:

  • 要提取的数据(即特征的键)

一种机器学习方法(通常用于对象分类),旨在仅通过少量训练样本学习有效的分类器。

请参阅 softmax。与候选采样相对。

一种隐藏层,其中的每个节点均与下一个隐藏层中的每个节点相连。

全连接层又称为密集层。

指的是模型依据训练时采用的数据,针对以前未见过的新数据做出正确预测的能力。

最小二乘回归模型(基于高斯噪声)向其他类型的模型(基于其他类型的噪声,例如泊松噪声或分类噪声)进行的一种泛化。广义线性模型的示例包括:

可以通过凸优化找到广义线性模型的参数。

广义线性模型具有以下特性:

  • 最优的最小二乘回归模型的平均预测结果等于训练数据的平均标签。
  • 最优的逻辑回归模型预测的平均概率等于训练数据的平均标签。

广义线性模型的功能受其特征的限制。与深度模型不同,广义线性模型无法“学习新特征”。

偏导数相对于所有自变量的向量。在机器学习中,梯度是模型函数偏导数的向量。梯度指向最高速上升的方向。

在应用梯度值之前先设置其上限。梯度裁剪有助于确保数值稳定性以及防止梯度爆炸。

一种通过计算并且减小梯度将损失降至最低的技术,它以训练数据为条件,来计算损失相对于模型参数的梯度。通俗来说,梯度下降法以迭代方式调整参数,逐渐找到权重和偏差的最佳组合,从而将损失降至最低。

TensorFlow 中的一种计算规范。图中的节点表示操作。边缘具有方向,表示将某项操作的结果(一个张量)作为一个操作数传递给另一项操作。可以使用 TensorBoard 直观呈现图。

一种非最优但实用的问题解决方案,足以用于进行改进或从中学习。

神经网络中的合成层,介于输入层(即特征)和输出层(即预测)之间。神经网络包含一个或多个隐藏层。

一系列用于分类的损失函数,旨在找到距离每个训练样本都尽可能远的决策边界,从而使样本和边界之间的裕度最大化。 KSVM 使用合页损失函数(或相关函数,例如平方合页损失函数)。对于二元分类,合页损失函数的定义如下:

其中“y'”表示分类器模型的原始输出:

“y”表示真标签,值为 -1 或 +1。

因此,合页损失与 (y * y') 的关系图如下所示:

训练期间故意不使用(“维持”)的样本。验证数据集和测试数据集都属于维持数据。维持数据有助于评估模型向训练时所用数据之外的数据进行泛化的能力。与基于训练数据集的损失相比,基于维持数据集的损失有助于更好地估算基于未见过的数据集的损失。

在模型训练的连续过程中,您调节的“旋钮”。例如,学习速率就是一种超参数。

将一个空间划分为两个子空间的边界。例如,在二维空间中,直线就是一个超平面,在三维空间中,平面则是一个超平面。在机器学习中更典型的是:超平面是分隔高维度空间的边界。核支持向量机利用超平面将正类别和负类别区分开来(通常是在极高维度空间中)。

从不会改变的分布中提取的数据,其中提取的每个值都不依赖于之前提取的值。i.i.d. 是机器学习的理想气体 - 一种实用的数学结构,但在现实世界中几乎从未发现过。例如,某个网页的访问者在短时间内的分布可能为 i.i.d.,即分布在该短时间内没有变化,且一位用户的访问行为通常与另一位用户的访问行为无关。不过,如果将时间窗口扩大,网页访问者的分布可能呈现出季节性变化。

在机器学习中,推断通常指以下过程:通过将训练过的模型应用于无标签样本来做出预测。在统计学中,推断是指在某些观测数据条件下拟合分布参数的过程。(请参阅维基百科中有关统计学推断的文章。)

在 TensorFlow 中,用于将输入数据返回到 Estimator 的训练、评估或预测方法的函数。例如,训练输入函数会返回训练集中的一批特征和标签。

神经网络中的第一层(接收输入数据的层)。

模型的预测可解释的难易程度。深度模型通常不可解释,也就是说,很难对深度模型的不同层进行解释。相比之下,线性回归模型和宽度模型的可解释性通常要好得多。

一种衡量指标,用于衡量在执行某项任务时评分者达成一致的频率。如果评分者未达成一致,则可能需要改进任务说明。有时也称为注释者间一致性信度或评分者间可靠性信度。另请参阅 Cohen's kappa(最热门的评分者间一致性信度衡量指标之一)。

模型的权重在训练期间的一次更新。迭代包含计算参数在单批次数据上的梯度损失。

一种热门的聚类算法,用于对非监督式学习中的样本进行分组。k-means 算法基本上会执行以下操作:

  • 以迭代方式确定最佳的 k 中心点(称为形心)。
  • 将每个样本分配到最近的形心。与同一个形心距离最近的样本属于同一个组。

k-means 算法会挑选形心位置,以最大限度地减小每个样本与其最接近形心之间的距离的累积平方。

以下面的小狗高度与小狗宽度的关系图为例:

如果 k=3,则 k-means 算法会确定三个形心。每个样本都被分配到与其最接近的形心,最终产生三个组:

假设制造商想要确定小、中和大号狗毛衣的理想尺寸。在该聚类中,三个形心用于标识每只狗的平均高度和平均宽度。因此,制造商可能应该根据这三个形心确定毛衣尺寸。请注意,聚类的形心通常不是聚类中的样本。

上图显示了 k-means 应用于仅具有两个特征(高度和宽度)的样本。请注意,k-means 可以跨多个特征为样本分组。

与 k-means 紧密相关的聚类算法。两者的实际区别如下:

  • 对于 k-means,确定形心的方法是,最大限度地减小候选形心与它的每个样本之间的距离平方和。
  • 对于 k-median,确定形心的方法是,最大限度地减小候选形心与它的每个样本之间的距离总和。

请注意,距离的定义也有所不同:

  • k-means 采用从形心到样本的欧几里得距离。(在二维空间中,欧几里得距离即使用勾股定理来计算斜边。)例如,(2,2) 与 (5,-2) 之间的 k-means 距离为:
  • k-median 采用从形心到样本的曼哈顿距离。这个距离是每个维度中绝对差异值的总和。例如,(2,2) 与 (5,-2) 之间的 k-median 距离为:

一种分类算法,旨在通过将输入数据向量映射到更高维度的空间,来最大化正类别和负类别之间的裕度。以某个输入数据集包含一百个特征的分类问题为例。为了最大化正类别和负类别之间的裕度,KSVM 可以在内部将这些特征映射到百万维度的空间。KSVM 使用合页损失函数。

一种损失函数,基于模型预测的值与标签的实际值之差的绝对值。与 L2 损失函数相比,L1 损失函数对离群值的敏感性弱一些。

一种正则化,根据权重的绝对值的总和来惩罚权重。在依赖稀疏特征的模型中,L1 正则化有助于使不相关或几乎不相关的特征的权重正好为 0,从而将这些特征从模型中移除。与 L2 正则化相对。

一种正则化,根据权重的平方和来惩罚权重。L2 正则化有助于使离群值(具有较大正值或较小负值)权重接近于 0,但又不正好为 0。(与 L1 正则化相对。)在线性模型中,L2 正则化始终可以改进泛化。

在监督式学习中,标签指样本的“答案”或“结果”部分。有标签数据集中的每个样本都包含一个或多个特征以及一个标签。例如,在房屋数据集中,特征可能包括卧室数、卫生间数以及房龄,而标签则可能是房价。在垃圾邮件检测数据集中,特征可能包括主题行、发件人以及电子邮件本身,而标签则可能是“垃圾邮件”或“非垃圾邮件”。

包含特征和标签的样本。在监督式训练中,模型从有标签样本中学习规律。

与正则化率的含义相同。

(多含义术语,我们在此关注的是该术语在正则化中的定义。)

神经网络中的一组神经元,负责处理一组输入特征,或一组神经元的输出。

此外还指 TensorFlow 中的抽象层。层是 Python 函数,以张量和配置选项作为输入,然后生成其他张量作为输出。当必要的张量组合起来后,用户便可以通过模型函数将结果转换为 Estimator。

一种 TensorFlow API,用于以层组合的方式构建深度神经网络。通过 Layers API,您可以构建不同类型的层,例如:

在编写自定义 Estimator 时,您可以编写“层”对象来定义所有隐藏层的特征。

在训练模型时用于梯度下降的一个标量。在每次迭代期间,梯度下降法都会将学习速率与梯度相乘。得出的乘积称为梯度步长。

学习速率是一个重要的超参数。

一种通过最小化 L2 损失训练出的线性回归模型。

一种回归模型,通过将输入特征进行线性组合输出连续值。

一种模型,通过将 S 型函数应用于线性预测,生成分类问题中每个可能的离散标签值的概率。虽然逻辑回归经常用于二元分类问题,但也可用于多类别分类问题(其叫法变为多类别逻辑回归或多项回归)。

分类模型生成的原始(非标准化)预测向量,通常会传递给标准化函数。如果模型要解决多类别分类问题,则对数通常变成 softmax 函数的输入。之后,softmax 函数会生成一个(标准化)概率向量,对应于每个可能的类别。

二元逻辑回归中使用的损失函数。

如果事件涉及二元概率,则几率指的是成功概率 (p) 与失败概率 (1-p) 之比。例如,假设某个给定事件的成功概率为 90%,失败概率为 10%。在这种情况下,几率的计算公式如下:

简单来说,对数几率即几率的对数。按照惯例,“对数”指自然对数,但对数的基数其实可以是任何大于 1 的数。若遵循惯例,上述示例的对数几率应为:

对数几率是 S 型函数的反函数。

一种衡量指标,用于衡量模型的预测偏离其标签的程度。或者更悲观地说是衡量模型有多差。要确定此值,模型必须定义损失函数。例如,线性回归模型通常将均方误差用作损失函数,而逻辑回归模型则使用对数损失函数。

一种程序或系统,用于根据输入数据构建(训练)预测模型。这种系统会利用学到的模型根据从分布(训练该模型时使用的同一分布)中提取的新数据(以前从未见过的数据)进行实用的预测。机器学习还指与这些程序或系统相关的研究领域。

每个样本的平均平方损失。MSE 的计算方法是平方损失除以样本数。TensorFlow Playground 显示的“训练损失”值和“测试损失”值都是 MSE。

您关心的一个数值。可能可以也可能不可以直接在机器学习系统中得到优化。您的系统尝试优化的指标称为目标。

从整批样本内随机选择并在训练或推断过程的一次迭代中一起运行的一小部分样本。小批次的批次大小通常介于 10 到 1000 之间。与基于完整的训练数据计算损失相比,基于小批次数据计算损失要高效得多。

一种采用小批次样本的梯度下降法。也就是说,小批次 SGD 会根据一小部分训练数据来估算梯度。Vanilla SGD 使用的小批次的大小为 1。

机器学习系统从训练数据学到的内容的表示形式。多含义术语,可以理解为下列两种相关含义之一:

  • 一种 TensorFlow 图,用于表示预测的计算结构。
  • 该 TensorFlow 图的特定权重和偏差,通过训练决定。

Estimator 中的函数,用于实现机器学习训练、评估和推断。例如,模型函数的训练部分可以处理以下任务:定义深度神经网络的拓扑并确定其优化器函数。如果使用预创建的 Estimator,则有人已为您编写了模型函数。如果使用自定义 Estimator,则必须自行编写模型函数。

有关编写模型函数的详细信息,请参阅创建自定义 Estimator。

一种先进的梯度下降法,其中学习步长不仅取决于当前步长的导数,还取决于之前一步或多步的步长的导数。动量涉及计算梯度随时间而变化的指数级加权移动平均值,与物理学中的动量类似。动量有时可以防止学习过程被卡在局部最小的情况。

区分两种以上类别的分类问题。例如,枫树大约有 128 种,因此,确定枫树种类的模型就属于多类别模型。反之,仅将电子邮件分为两类(“垃圾邮件”和“非垃圾邮件”)的模型属于二元分类模型。

与多类别分类的含义相同。

模型中的一个数字在训练期间变成 NaN,这会导致模型中的很多或所有其他数字最终也会变成 NaN。

NaN 是“非数字”的缩写。

在二元分类中,一种类别称为正类别,另一种类别称为负类别。正类别是我们要寻找的类别,负类别则是另一种可能性。例如,在医学检查中,负类别可以是“非肿瘤”。在电子邮件分类器中,负类别可以是“非垃圾邮件”。另请参阅正类别。

一种模型,灵感来源于脑部结构,由多个层构成(至少有一个是隐藏层),每个层都包含简单相连的单元或神经元(具有非线性关系)。

神经网络中的节点,通常会接收多个输入值并生成一个输出值。神经元通过将激活函数(非线性转换)应用于输入值的加权和来计算输出值。

多含义术语,可以理解为下列两种含义之一:

将实际的值区间转换为标准的值区间(通常为 -1 到 +1 或 0 到 1)的过程。例如,假设某个特征的自然区间是 800 到 6000。通过减法和除法运算,您可以将这些值标准化为位于 -1 到 +1 区间内。

用整数或实数表示的特征。例如,在房地产模型中,您可能会用数值数据表示房子大小(以平方英尺或平方米为单位)。如果用数值数据表示特征,则可以表明特征的值相互之间具有数学关系,并且与标签可能也有数学关系。例如,如果用数值数据表示房子大小,则可以表明面积为 200 平方米的房子是面积为 100 平方米的房子的两倍。此外,房子面积的平方米数可能与房价存在一定的数学关系。

并非所有整数数据都应表示成数值数据。例如,世界上某些地区的邮政编码是整数,但在模型中,不应将整数邮政编码表示成数值数据。这是因为邮政编码 20000 在效力上并不是邮政编码 10000 的两倍(或一半)。此外,虽然不同的邮政编码确实与不同的房地产价值有关,但我们也不能假设邮政编码为 20000 的房地产在价值上是邮政编码为 10000 的房地产的两倍。邮政编码应表示成分类数据。

数值特征有时称为连续特征。

一个开放源代码数学库,在 Python 中提供高效的数组操作。Pandas 建立在 Numpy 之上。

生成一组预测,存储这些预测,然后根据需求检索这些预测。与在线推断相对。

  • 所有其他元素均设为 0。

独热编码常用于表示拥有有限个可能值的字符串或标识符。例如,假设某个指定的植物学数据集记录了 15000 个不同的物种,其中每个物种都用独一无二的字符串标识符来表示。在特征工程过程中,您可能需要将这些字符串标识符编码为独热向量,向量的大小为 15000。

一种机器学习方法,通常用于对象分类,旨在通过单个训练样本学习有效的分类器。

另请参阅少量样本学习。

假设某个分类问题有 N 种可能的解决方案,一对多解决方案将包含 N 个单独的二元分类器 - 一个二元分类器对应一种可能的结果。例如,假设某个模型用于区分样本属于动物、蔬菜还是矿物,一对多解决方案将提供下列三个单独的二元分类器:

根据需求生成预测。与离线推断相对。

TensorFlow 图中的节点。在 TensorFlow 中,任何创建、操纵或销毁张量的过程都属于操作。例如,矩阵相乘就是一种操作,该操作以两个张量作为输入,并生成一个张量作为输出。

梯度下降法的一种具体实现。TensorFlow 的优化器基类是 tf.train.Optimizer。不同的优化器可能会利用以下一个或多个概念来增强梯度下降法在指定训练集中的效果:

  • 更复杂的数学方法(Proximal,等等)

甚至还包括 NN 驱动的优化器。

与大多数其他值差别很大的值。在机器学习中,下列所有值都是离群值。

  • 与实际值相差很大的预测值。
  • 值比平均值高大约 3 个标准偏差的输入数据。

离群值常常会导致模型训练出现问题。

神经网络的“最后”一层,也是包含答案的层。

创建的模型与训练数据过于匹配,以致于模型无法根据新数据做出正确的预测。

面向列的数据分析 API。很多机器学习框架(包括 TensorFlow)都支持将 Pandas 数据结构作为输入。请参阅 Pandas 文档。

机器学习系统自行训练的模型的变量。例如,权重就是一种参数,它们的值是机器学习系统通过连续的训练迭代逐渐学习到的。与超参数相对。

一种作业,负责在分布式设置中跟踪模型参数。

在训练期间(通常是在梯度下降法的单次迭代中)调整模型参数的操作。

一种导数,除一个变量之外的所有变量都被视为常量。例如,f(x, y) 对 x 的偏导数就是 f(x) 的导数(即,使 y 保持恒定)。f 对 x 的偏导数仅关注 x 如何变化,而忽略公式中的所有其他变量。

在参数服务器间分割变量的算法。

多含义术语,具有以下含义:

  • 在软件工程中的传统含义。即:相应软件的运行速度有多快(或有多高效)?
  • 在机器学习中的含义。在机器学习领域,性能旨在回答以下问题:相应模型的准确度有多高?即模型在预测方面的表现有多好?

一种衡量指标,用于衡量模型能够多好地完成任务。例如,假设任务是读取用户使用智能手机键盘输入字词时输入的前几个字母,然后列出一组可能的完整字词。此任务的困惑度 (P) 是:为了使列出的字词中包含用户尝试输入的实际字词,您需要提供的猜测项的个数。

困惑度与交叉熵的关系如下:

机器学习算法的基础架构。流水线包括收集数据、将数据放入训练数据文件、训练一个或多个模型,以及将模型导出到生产环境。

将一个或多个由前趋的卷积层创建的矩阵压缩为较小的矩阵。池化通常是取整个池化区域的最大值或平均值。以下面的 3x3 矩阵为例:

池化运算与卷积运算类似:将矩阵分割为多个切片,然后按步长逐个运行卷积运算。例如,假设池化运算按 1x1 步长将卷积矩阵分割为 2x2 个切片。如下图所示,进行了四个池化运算。假设每个池化运算都选择该切片中四个值的最大值:

池化有助于在输入矩阵中实现平移不变性。

对于视觉应用来说,池化的更正式名称为空间池化。时间序列应用通常将池化称为时序池化。按照不太正式的说法,池化通常称为下采样或降采样。

在二元分类中,两种可能的类别分别被标记为正类别和负类别。正类别结果是我们要测试的对象。(不可否认的是,我们会同时测试这两种结果,但只关注正类别结果。)例如,在医学检查中,正类别可以是“肿瘤”。在电子邮件分类器中,正类别可以是“垃圾邮件”。

一种分类模型指标。精确率指模型正确预测正类别的频率,即:

模型在收到输入样本后的输出。

一种值,用于表明预测平均值与数据集中标签的平均值相差有多大。

已经过训练的模型或模型组件(例如嵌套)。有时,您需要将预训练的嵌套馈送到神经网络。在其他时候,您的模型将自行训练嵌套,而不依赖于预训练的嵌套。

在开始采用相应数据进行训练之前,您对这些数据抱有的信念。例如,L2 正则化依赖的先验信念是权重应该很小且应以 0 为中心呈正态分布。

一种 TensorFlow 操作,用于实现队列数据结构。通常用于 I/O 中。

机器学习中的一个多含义术语,可以理解为下列含义之一:

  • 张量中的维数。例如,标量等级为 0,向量等级为 1,矩阵等级为 2。
  • 在将类别从最高到最低进行排序的机器学习问题中,类别的顺序位置。例如,行为排序系统可以将狗狗的奖励从最高(牛排)到最低(枯萎的羽衣甘蓝)进行排序。

为样本提供标签的人。有时称为“注释者”。

一种分类模型指标,用于回答以下问题:在所有可能的正类别标签中,模型正确地识别出了多少个?即:

一种激活函数,其规则如下:

  • 如果输入为负数或 0,则输出 0。
  • 如果输入为正数,则输出等于输入。

一种模型,能够输出连续的值(通常为浮点值)。请与分类模型进行比较,分类模型会输出离散值,例如“黄花菜”或“虎皮百合”。

对模型复杂度的惩罚。正则化有助于防止出现过拟合,包含以下类型:

  • 早停法(这不是正式的正则化方法,但可以有效限制过拟合)

一种标量值,以 lambda 表示,用于指定正则化函数的相对重要性。从下面简化的损失公式中可以看出正则化率的影响:

提高正则化率可以减少过拟合,但可能会使模型的准确率降低。

将数据映射到实用特征的过程。

不同分类阈值下的正例率和假正例率构成的曲线。另请参阅曲线下面积。

您指定的目录,用于托管多个模型的 TensorFlow 检查点和事件文件的子目录。

在图像分类问题中,即使图像的方向发生变化,算法也能成功地对图像进行分类。例如,无论网球拍朝上、侧向还是朝下放置,该算法仍然可以识别它。请注意,并非总是希望旋转不变;例如,倒置的“9”不应分类为“9”。

另请参阅平移不变性和大小不变性。

保存和恢复 TensorFlow 模型时建议使用的格式。SavedModel 是一种独立于语言且可恢复的序列化格式,使较高级别的系统和工具可以创建、使用和转换 TensorFlow 模型。

如需完整的详细信息,请参阅《TensorFlow 编程人员指南》中的保存和恢复。

一种 TensorFlow 对象,负责保存模型检查点。

特征工程中的一种常用做法,是指对某个特征的值区间进行调整,使之与数据集中其他特征的值区间一致。例如,假设您希望数据集中所有浮点特征的值都位于 0 到 1 区间内,如果某个特征的值位于 0 到 500 区间内,您就可以通过将每个值除以 500 来缩放该特征。

训练模型时采用的数据中,某些训练样本有标签,而其他样本则没有标签。半监督式学习采用的一种技术是推断无标签样本的标签,然后使用推断出的标签进行训练,以创建新模型。如果获得有标签样本需要高昂的成本,而无标签样本则有很多,那么半监督式学习将非常有用。

一种模型,其输入具有序列依赖性。例如,根据之前观看过的一系列视频对观看的下一个视频进行预测。

一种函数,可将逻辑回归输出或多项回归输出(对数几率)映射到概率,以返回介于 0 到 1 之间的值。S 型函数的公式如下:

在逻辑回归问题中, 非常简单:

换句话说,S 型函数可将 转换为介于 0 到 1 之间的概率。

在某些神经网络中,S 型函数可作为激活函数使用。

在图像分类问题中,即使图像的大小发生变化,算法也能成功地对图像进行分类。例如,无论一只猫以 200 万像素还是 20 万像素呈现,该算法仍然可以识别它。请注意,即使是最好的图像分类算法,在大小不变性方面仍然会存在切实的限制。例如,对于仅以 20 像素呈现的猫图像,算法(或人)不可能正确对其进行分类。

另请参阅平移不变性和旋转不变性。

一种函数,可提供多类别分类模型中每个可能类别的概率。这些概率的总和正好为 1.0。例如,softmax 可能会得出某个图像是狗、猫和马的概率分别是 0.9、0.08 和 0.02。(也称为完整 softmax。)

一种特征向量,其中的大多数值都为 0 或为空。例如,某个向量包含一个为 1 的值和一百万个为 0 的值,则该向量就属于稀疏向量。再举一个例子,搜索查询中的单词也可能属于稀疏特征 - 在某种指定语言中有很多可能的单词,但在某个指定的查询中仅包含其中几个。

一种张量表示法,仅存储非零元素。

例如,英语中包含约一百万个单词。表示一个英语句子中所用单词的数量,考虑以下两种方式:

  • 要采用密集表示法来表示此句子,则必须为所有一百万个单元格设置一个整数,然后在大部分单元格中放入 0,在少数单元格中放入一个非常小的整数。
  • 要采用稀疏表示法来表示此句子,则仅存储象征句子中实际存在的单词的单元格。因此,如果句子只包含 20 个独一无二的单词,那么该句子的稀疏表示法将仅在 20 个单元格中存储一个整数。

例如,假设以两种方式来表示句子“Dogs wag tails.”。如下表所示,密集表示法将使用约一百万个单元格;稀疏表示法则只使用 3 个单元格:

向量或矩阵中设置为 0(或空)的元素数除以该向量或矩阵中的条目总数。以一个 10x10 矩阵(其中 98 个单元格都包含 0)为例。稀疏性的计算方法如下:

特征稀疏性是指特征向量的稀疏性;模型稀疏性是指模型权重的稀疏性。

合页损失函数的平方。与常规合页损失函数相比,平方合页损失函数对离群值的惩罚更严厉。

在线性回归中使用的损失函数(也称为 L2 损失函数)。该函数可计算模型为有标签样本预测的值和标签的实际值之差的平方。由于取平方值,因此该损失函数会放大不佳预测的影响。也就是说,与 L1 损失函数相比,平方损失函数对离群值的反应更强烈。

数据集中数据的一种属性,表示数据分布在一个或多个维度保持不变。这种维度最常见的是时间,即表明平稳性的数据不随时间而变化。例如,从 9 月到 12 月,表明平稳性的数据没有发生变化。

对一个批次的向前和向后评估。

与学习速率的含义相同。

批次大小为 1 的一种梯度下降法。换句话说,SGD 依赖于从数据集中随机均匀选择的单个样本来计算每步的梯度估算值。

一种算法,用于平衡以下两个目标:

  • 期望构建最具预测性的模型(例如损失最低)。
  • 期望使模型尽可能简单(例如强大的正则化)。

例如,旨在将基于训练集的损失和正则化降至最低的函数就是一种结构风险最小化算法。

如需更多信息,请参阅 

与经验风险最小化相对。

在卷积运算或池化中,下一个系列的输入切片的每个维度中的增量。例如,下面的动画演示了卷积运算过程中的一个 (1,1) 步长。因此,下一个输入切片是从上一个输入切片向右移动一个步长的位置开始。当运算到达右侧边缘时,下一个切片将回到最左边,但是下移一个位置。

前面的示例演示了一个二维步长。如果输入矩阵为三维,那么步长也将是三维。

在 TensorFlow 中的某一步计算出的一个值或一组值,通常用于在训练期间跟踪模型指标。

根据输入数据及其对应的标签来训练模型。监督式机器学习类似于学生通过研究一系列问题及其对应的答案来学习某个主题。在掌握了问题和答案之间的对应关系后,学生便可以回答关于同一主题的新问题(以前从未见过的问题)。请与非监督式机器学习进行比较。

一种特征,不在输入特征之列,而是从一个或多个输入特征衍生而来。合成特征包括以下类型:

  • 对连续特征进行分桶,以分为多个区间分箱。
  • 将一个特征值与其他特征值或其本身相乘(或相除)。

仅通过标准化或缩放创建的特征不属于合成特征。

在不同时间点记录的数据。例如,记录的一年中每一天的冬外套销量就属于时态数据。

TensorFlow 程序中的主要数据结构。张量是 N 维(其中 N 可能非常大)数据结构,最常见的是标量、向量或矩阵。张量的元素可以包含整数值、浮点值或字符串值。

一种 ASIC(应用专用集成电路),用于优化 TensorFlow 程序的性能。

张量在各种维度中包含的元素数。例如,张量 [5, 10] 在一个维度中的形状为 5,在另一个维度中的形状为 10。

张量包含的标量总数。例如,张量 [5, 10] 的大小为 50。

一个信息中心,用于显示在执行一个或多个 TensorFlow 程序期间保存的摘要信息。

一个大型的分布式机器学习平台。该术语还指 TensorFlow 堆栈中的基本 API 层,该层支持对数据流图进行一般计算。

虽然 TensorFlow 主要应用于机器学习领域,但也可用于需要使用数据流图进行数值计算的非机器学习任务。

一款用于直观呈现不同的超参数对模型(主要是神经网络)训练的影响的程序。要试用 TensorFlow Playground,请前往 

一个平台,用于将训练过的模型部署到生产环境。

数据集的子集,用于在模型经由验证集的初步验证之后测试模型。

与训练集和验证集相对。

一种标准协议缓冲区,旨在描述用于机器学习模型训练或推断的输入数据。

机器学习和统计学的一个子领域,旨在分析时态数据。很多类型的机器学习问题都需要时间序列分析,其中包括分类、聚类、预测和异常检测。例如,您可以利用时间序列分析根据历史销量数据预测未来每月的冬外套销量。

确定构成模型的理想参数的过程。

数据集的子集,用于训练模型。

与验证集和测试集相对。

将信息从一个机器学习任务迁移到另一个机器学习任务。例如,在多任务学习中,一个模型可以完成多项任务,例如针对不同任务具有不同输出节点的深度模型。迁移学习可能涉及将知识从较简单任务的解决方案迁移到较复杂的任务,或者将知识从数据较多的任务迁移到数据较少的任务。

大多数机器学习系统都只能完成一项任务。迁移学习是迈向人工智能的一小步;在人工智能中,单个程序可以完成多项任务。

在图像分类问题中,即使图像中对象的位置发生变化,算法也能成功对图像进行分类。例如,无论一只狗位于画面正中央还是画面左侧,该算法仍然可以识别它。

另请参阅大小不变性和旋转不变性。

被模型正确地预测为负类别的样本。例如,模型推断出某封电子邮件不是垃圾邮件,而该电子邮件确实不是垃圾邮件。

被模型正确地预测为正类别的样本。例如,模型推断出某封电子邮件是垃圾邮件,而该电子邮件确实是垃圾邮件。

与召回率的含义相同,即:

正例率是 ROC 曲线的 y 轴。

包含特征但没有标签的样本。无标签样本是用于进行推断的输入内容。在半监督式和非监督式学习中,在训练期间会使用无标签样本。

训练模型,以找出数据集(通常是无标签数据集)中的规律。

非监督式机器学习最常见的用途是将数据分为不同的聚类,使相似的样本位于同一组中。例如,非监督式机器学习算法可以根据音乐的各种属性将歌曲分为不同的聚类。所得聚类可以作为其他机器学习算法(例如音乐推荐服务)的输入。在很难获取真标签的领域,聚类可能会非常有用。例如,在反滥用和反欺诈等领域,聚类有助于人们更好地了解相关数据。

非监督式机器学习的另一个例子是主成分分析 (PCA)。例如,通过对包含数百万购物车中物品的数据集进行主成分分析,可能会发现有柠檬的购物车中往往也有抗酸药。

请与监督式机器学习进行比较。

数据集的一个子集,从训练集分离而来,用于调整超参数。

与训练集和测试集相对。

线性模型中特征的系数,或深度网络中的边。训练线性模型的目标是确定每个特征的理想权重。如果权重为 0,则相应的特征对模型来说没有任何贡献。

一种线性模型,通常有很多稀疏输入特征。我们之所以称之为“宽度模型”,是因为这是一种特殊类型的神经网络,其大量输入均直接与输出节点相连。与深度模型相比,宽度模型通常更易于调试和检查。虽然宽度模型无法通过隐藏层来表示非线性关系,但可以利用特征组合、分桶等转换以不同的方式为非线性关系建模。

}

其他答主并没有正面回答你的问题。

线性回归是对已有数据进行学习,学习到一种模式,这样就可以对其他数据做预测了。

使用上式对数据建模时,线性是指,y和x之间是线性的关系,即y和x组成了一条直线,用这个直线来描述数据集中的数据。在线性回归建模的过程,其实是寻找一个最优的直线,来拟合所有数据。

在对收入数据集进行建模时,我们可以对参数β0和β1取不同值来构建不同的直线,这样就形成了一个参数家族。参数家族中有一个最佳组合,可以在统计上以最优的方式描述数据集。那么监督学习的过程就可以被定义为:给定N个数据对,寻找最佳参数β0和β1,使模型可以更好地拟合这些数据。

上图以及你问题中的图,出现了不同的直线,到底哪条直线是最佳的呢?如何衡量模型是否以最优的方式拟合数据呢?机器学习用损失函数(loss function)的来衡量这个问题。损失函数又称成为代价函数(cost function),它计算了模型预测值y和真实值y之间的差异程度。从名字也可以看出,这个函数计算的是模型犯错的损失或代价,损失函数越大,模型越差,越不能拟合数据。统计学家通常使用'L'来表示损失函数。

线性回归的损失函数是误差平方的求和。

对于给定数据集,x和y的值是已知的,参数β0和β1是需要求解的。线性回归其实就是要求解使损失函数最小的β0和β1。

那到底什么时候可以使用线性回归呢?统计学家安斯库姆给出了四个数据集,被称为安斯库姆四重奏,从这四个数据集的分布可以看出,并不是所有的数据集都可以用一元线性回归来建模。现实世界中的问题往往更复杂,变量几乎不可能非常理想化地符合线性模型的要求。因此使用线性回归,需要遵守下面几个假设:

  • 线性回归是一个回归问题(regression)。

  • 要预测的变量与自变量的关系是线性的。

  • 各项误差服从正太分布,均值为0,与同方差。

  • 变量 的分布要有变异性。

  • 多元线性回归中不同特征之间应该相互独立,避免线性相关。

与回归相对的是分类问题(classification),分类问题要预测的变量输出集合是有限的,预测值只能是有限集合内的一个。当要预测的变量y输出集合是无限且连续,我们称之为回归。比如,天气预报预测明天是否下雨,是一个二分类问题;预测明天的降雨量多少,就是一个回归问题。

线性通常是指变量之间保持等比例的关系,从图形上来看,变量之间的形状为直线,斜率是常数。这是一个非常强的假设,数据点的分布呈现复杂的曲线,则不能使用线性回归来建模。可以看出,四重奏右上角的数据就不太适合用线性回归的方式进行建模。

前面最小二乘法求解过程已经提到了误差的概念,误差可以表示为“实际值-真实值”。

可以这样理解这个假设:线性回归允许预测值与真实值之间存在误差,随着数据量的增多,这些数据的误差平均值为0;从图形上来看,各个真实值可能在直线上方,也可能在直线下方,当数据足够多时,各个数据上上下下相互抵消。如果误差不服从均值为零的正太分布,那么很有可能是出现了一些异常值,数据的分布很可能是安斯库姆四重奏右下角的情况。

这也是一个非常强的假设,如果要使用线性回归模型,那么必须假设数据的误差均值为零的正太分布。

线性回归对变量x也有要求,要有一定变化,不能像安斯库姆四重奏右下角的数据那样,绝大多数数据都分布在一条竖线上。

如果不同特征不是相互独立,那么可能导致特征间产生共线性,进而导致模型不准确。举一个比较极端的例子,预测房价时使用多个特征:房间数量,房间数量 * 2,房间数量* 0.5等,特征之间是线性相关的,如果模型只有这些特征,缺少其他有效特征,虽然可以训练出一个模型,但是模型不准确,预测性差。

}

伊犁哈萨克自治州,各州、市、县(市)人民政府,各行政公署,自治区人民政府各部门、各直属机构:

为深入贯彻落实习近平新时代中国特色社会主义思想,全面贯彻落实党的十九大和十九届历次全会精神,贯彻落实第三次中央新疆工作座谈会精神,完整准确贯彻新时代党的治疆方略,牢牢扭住社会稳定和长治久安总目标,深入实施创新驱动发展战略,全面推进创新型新疆建设,根据《自治区科学技术进步奖励办法》(自治区人民政府令第145号),自治区人民政府决定,对为我区科学技术进步、经济社会发展作出突出贡献的科学技术人员和组织给予奖励。

经自治区科学技术奖评审委员会评审,自治区人民政府批准,决定授予肖文交、田立文自治区科学技术奖特等奖;授予基于氟化硼氧基元的新型深紫外非线性光学材料设计及性能研究2项成果自治区自然科学奖一等奖,授予多媒体特征跨域表示与学习理论方法研究3项成果自治区自然科学奖二等奖,授予新疆棉区土壤微生物生态与资源利用2项成果自治区自然科学奖三等奖;授予多孔硅生物传感器的创制2项成果自治区技术发明奖一等奖,授予塔河油田改善复杂油气藏开发效果智能完井技术及推广应用成果自治区技术发明奖二等奖,授予稠油热采带压修井作业技术的研究与应用2项成果自治区技术发明奖三等奖;授予高性能煤基压块活性炭规模化生产成套技术开发及工程应用31项成果自治区科技进步奖一等奖,授予特高压换流站直流金具关键技术与工程应用55项成果自治区科技进步奖二等奖,授予新疆特色苗木开发利用及优良树种引进繁育关键技术集成与示范29项成果自治区科技进步奖三等奖。

希望获奖单位和个人珍惜荣誉,再接再厉,开拓进取,不断创造新的业绩。全区广大科技工作者要以获奖者为榜样,继续发扬求真务实、勇于创新的科学精神,拼搏奉献、勇攀高峰,踔厉奋发、笃行不怠,深入实施创新驱动发展战略,切实加快创新型新疆建设,为实现新疆社会稳定和长治久安,建设新时代中国特色社会主义新疆作出更大贡献。

附件:2021年度自治区科学技术奖获奖名单

新疆维吾尔自治区人民政府

2021年度自治区科学技术奖获奖名单

一、自治区科学技术奖特等奖(2人)

1.肖文交中国科学院院士中国科学院新疆生态与地理研究所研究员

2.田立文新疆农业科学院经济作物研究所研究员

1.基于氟化硼氧基元的新型深紫外非线性光学材料设计及性能研究

主要完成人:潘世烈(中国科学院新疆理化技术研究所)、杨志华(中国科学院新疆理化技术研究所)、张敏(中国科学院新疆理化技术研究所)、龙西法(中国科学院新疆理化技术研究所)、李俊杰(中国科学院新疆理化技术研究所)

2.新型催化材料的合成方法、可控制备及性能研究

主要完成人:王吉德(新疆大学)、杨超(新疆大学)、郭长艳(新疆大学)、宿新泰(华南理工大学)、鹿毅(新疆维吾尔自治区质量监督检验研究院)

1.多媒体特征跨域表示与学习理论方法研究

主要完成人:汪烈军(新疆大学)、李凡(西安交通大学)、赖惠成(新疆大学)、钱学明(西安交通大学)、程述立(新疆大学)

2.锰基锂离子电池正极材料的合成及电化学性能研究

主要完成人:粟智(新疆师范大学)、阿孜古丽·木尔赛力木(新疆师范大学)、田华玲(新疆师范大学)、姚翔(新疆师范大学)、张艳慧(新疆师范大学)

3.功能型微纳纤维的结构调控机理与应用研究

主要完成人:夏鑫(新疆大学)、周惠敏(新疆大学)、吕鹏飞(江南大学)、魏取福(江南大学)

1.新疆棉区土壤微生物生态与资源利用

主要完成人:张伟(新疆师范大学)、阮志勇(中国农业科学院农业资源与农业区划研究所)、张瑞(新疆师范大学)、朱艳蕾(新疆师范大学)、江旭(中国农业科学院农业资源与农业区划研究所)

2.多旋回叠合盆地成矿流体输导体系建模理论及有效性评价技术研究

主要完成人:郭文建(中国石油天然气股份有限公司新疆油田分公司)、吴孔友(中国石油大学〔华东〕)、何登发(中国地质大学〔北京〕)、蒋文龙(中国石油天然气股份有限公司新疆油田分公司)、王韬(中国石油天然气股份有限公司新疆油田分公司)

1.多孔硅生物传感器的创制

主要完成人:贾振红(新疆大学)、吕小毅(新疆大学)、王佳佳(新疆大学)、张红燕(新疆大学)、李弘毅(新疆大学)、李鹏(新疆大学)

2.深部碳酸盐岩地层精细控压钻井技术及应用

主要完成人:李军(中国石油大学〔北京〕克拉玛依校区)、刘伟(中国石油集团工程技术研究院有限公司)、张辉(中国石油大学〔北京〕)、杨宏伟(中国石油大学〔北京〕)、陈军(中国石油天然气股份有限公司塔里木油田分公司)、连威(中国石油大学〔北京〕克拉玛依校区)

1.塔河油田改善复杂油气藏开发效果智能完井技术及推广应用

主要完成人:李渭亮(中国石油化工股份有限公司西北油田分公司)、赵旭(中国石油化工股份有限公司石油工程技术研究院)、姚志良(中国石油化工股份有限公司石油工程技术研究院)、马国锐(中国石油化工股份有限公司西北油田分公司)、万小勇(中国石油化工股份有限公司西北油田分公司)、黄亮(中国石油化工股份有限公司西北油田分公司)

1.稠油热采带压修井作业技术的研究与应用

主要完成人:吕俊锋(克拉玛依胜利高原机械有限公司)、吕向升(克拉玛依胜利高原机械有限公司)、张益民(克拉玛依胜利高原机械有限公司)、冯廷德(克拉玛依胜利高原机械有限公司)

2.高纯含铍反萃液及其制备方法、氟铍酸氨、氟化铍和金属铍的制备方法

主要完成人:翁鸿蒙(新疆有色金属研究所)、王晨雪(新疆有色金属研究所)、夏国定(新疆有色金属研究所)、何艳君(新疆有色金属研究所)、王守明(新疆有色金属研究所)、那维克然·塞力木(新疆有色金属研究所)

1.高性能煤基压块活性炭规模化生产成套技术开发及工程应用

完成单位:国家能源集团新疆能源有限责任公司、清华大学

主要完成人:陆晓东、赵龙、孙文俊、赵振疆、韩晓林、罗富、王成、麻荣福、路则栋、庄巍、陈仲贇、闫志富

2.新疆宫颈癌的综合防治研究

完成单位:新疆医科大学附属肿瘤医院

主要完成人:古扎丽努尔·阿不力孜、张媛媛、袁敏、唐努尔·阿不力米提、古扎努尔·阿不都西库尔、古力米热·乃扎尔、古丽仙·吐尔逊、古里给娜·阿布都热西提、李小文、董志红、王新玲

3.干旱区陆表特征参量遥感反演技术创新与应用

完成单位:中国科学院新疆生态与地理研究所、电子科技大学

主要完成人:包安明、李均力、古丽·加帕尔、刘铁、钟瑞森、郑国雄、黄粤、刘海隆、白洁、常存、刘英、郭浩

4.新疆特色瓜果贮运加工关键技术创制与集成应用

完成单位:新疆农业科学院农产品贮藏加工研究所、中国农业科学院农产品加工研究所、中国科学院理化技术研究所、新疆果业集团有限公司、国家农产品保鲜工程技术研究中心(天津)、新疆农业大学、新疆西圣果业有限责任公司

主要完成人:张谦、张婷、毕金峰、潘俨、于晋泽、魏娟、孟伊娜、李学文、邹淑萍、马燕、郑素慧、许铭强

5.煤矿冲击地压物理分解与分源防控关键技术

完成单位:国家能源集团新疆能源有限责任公司、天地科技股份有限公司、西安科技大学

主要完成人:潘俊锋、杨贵儒、杜涛涛、崔峰、张传玖、张晨阳、李康、夏永学、李浩荡、闫瑞兵、王书文、李红平

6.伊犁谷地地质灾害成灾模式及综合防治关键技术

完成单位:新疆大学、新疆华光地质勘察有限公司、新疆维吾尔自治区地质环境监测院

主要完成人:弓小平、张紫昭、顾新鲁、李清海、王占和、韩琼、陈凯、陆成新、陈川、常志勇、魏贤程、姜越

7.新疆地区复杂地质条件下土石坝渗流控制关键技术研究与应用

完成单位:新疆农业大学、水利部新疆维吾尔自治区水利水电勘测设计研究院、河海大学、中国水电基础局有限公司

主要完成人:丰土根、李文新、徐力群、刘亮、张箭、张风臣、张福海、李晓庆、江志安、何勤、沈振中、陈亮

8.新疆战略区极端环境医学军民融合平台建设及应用

完成单位:中国人民解放军新疆军区总医院、首都医科大学、西安富康空气净化设备工程有限公司

主要完成人:刘江伟、王广军、吉训明、康生、许永华、康燕、是文辉、朱小丽、李书红、张东辉、刘毅、刘林林

9.新疆高沥青心墙坝建设关键技术研究与实践

完成单位:新疆维吾尔自治区寒旱区水资源与生态水利工程研究中心、新疆农业大学、新疆水利水电规划设计管理局、西安理工大学、水利部新疆维吾尔自治区水利水电勘测设计研究院、中国水利水电科学研究院、中国水电建设集团十五工程局有限公司

主要完成人:李江、何建新、柳莹、李炎隆、杨海华、徐燕、杨伟、王晓强、冯涛、杨玉生、吴俊杰、杨武

10.大型公共建筑钢混结构体系关键技术及工程应用

完成单位:中建三局集团有限公司新疆分公司、西安建筑科技大学、新疆大学

主要完成人:白国良、骆发江、刘超、韩风霞、黄安平、李兵生、吴军、刘汇东、秦朝刚、韩学标、杜宁军、马财龙

11.南疆煤与煤层气勘探开发关键技术创新及应用

完成单位:新疆维吾尔自治区煤田地质局一六一煤田地质勘探队、新疆维吾尔自治区煤田地质局煤层气研究开发中心、新疆大学、中国科学院大学、中国地质大学(北京)、中国矿业大学

主要完成人:杨曙光、吴斌、琚宜文、李鑫、安庆、王刚、李松、鞠玮、黄涛、韩长城、李全、张娜

12.新疆消化道癌早诊体系的建立及关键诊疗技术规范和应用推广

完成单位:新疆维吾尔自治区人民医院

主要完成人:高峰、冯燕、石虹、卢加杰、刘欢、王曼、史甜、黄晓玲、何晓勇、张玫、艾合买江·库尔班江、李月娴

13.70MPa制氮注氮成套装备关键技术研究及应用

完成单位:中国石油化工股份有限公司西北油田分公司、新疆大学、山东恒业石油新技术应用有限公司、新疆工程学院

主要完成人:何龙、王世洁、孙文磊、王玉军、赵海洋、任波、丁保东、黄勇、王建海、焦保雷、马清杰、冯一波

14.IgA肾病诊疗体系创建与应用推广

完成单位:新疆医科大学第一附属医院、新疆维吾尔自治区人民医院、中日友好医院、四川省人民医院、贵州省人民医院、兰州大学第一医院

主要完成人:陆晨、姜鸿、杨爱萍、张雪琴、晁鹏、武雨、杨淑芬、李素华、李文歌、李贵森、查艳、刘天喜

15.新疆草原蝗虫暴发机理及监测预警技术研发与推广应用

完成单位:新疆师范大学、新疆维吾尔自治区蝗虫鼠害预测预报防治中心站、中国农业科学院植物保护研究所、塔城地区蝗鼠测报防治站、无锡立洋电子科技有限公司、全国畜牧总站

主要完成人:季荣、王晗、林峻、陈吉军、杜桂林、叶小芳、吴建国、何岚、扈鸿霞、涂雄兵、刘程才、张鹿平

16.中医药防治动脉粥样硬化性心血管病秽浊痰阻证的作用机制一体化研究

完成单位:新疆医科大学

主要完成人:安冬青、孙龙飞、张华、赵明芬、谢晓柳、张选明、刘宏炳、汪建萍、古丽加玛力·尼亚孜、谢阳、王思静、马文慧

17.智能电网故障识别及主动预防应对关键技术研究与应用

完成单位:国网新疆电力有限公司乌鲁木齐供电公司、湖南大学、华乘电气科技股份有限公司、长沙理工大学、保定天威新域科技发展有限公司

主要完成人:汪沨、郑斌、陈疆、黄成军、钟理鹏、袁文海、李大立、李泽文、刘彪、董小顺、徐雅新、何平

18.含油污泥高效处理与利用成套技术及工业化应用

完成单位:中国石油天然气股份有限公司新疆油田分公司、克拉玛依顺通环保科技有限责任公司、中国石油集团安全环保技术研究院有限公司

主要完成人:李慧敏、仝坤、王新和、霍进、吴宝成、罗双涵、王国斌、刘光全、郭强、袁东明、单朝晖、谢加才

19.民族药标准体系构建及关键技术的产业化示范

完成单位:中国科学院新疆理化技术研究所、新疆银朵兰药业股份有限公司、新疆维吾尔药业有限责任公司

主要完成人:阿吉艾克拜尔·艾萨、信学雷、李俊、尹强、阿不拉江·图拉克、李俊、热依木古丽·阿布都拉、穆丹丹、吴涛、陈菊、买吾兰江·买提努尔、赵江瑜

20.汉维大数据语义智能分析关键技术及应用

完成单位:新疆大学、北京理工大学、国家计算网络与信息安全管理中心、人民网股份有限公司、人民网科技(北京)有限公司、灵玖中科软件(北京)有限公司

主要完成人:吾守尔·斯拉木、张华平、云晓春、吐尔地·托合提、努尔麦麦提·尤鲁瓦斯、商建云、张宝华、刘玮、刘鹏、郭筱凤、柯尊旺、杨耀飞

21.超深层提速关键技术研究与规模化应用

完成单位:中国石油天然气股份有限公司塔里木油田分公司、中国石油化工集团有限公司江钻石油机械有限公司、上海大学

主要完成人:李宁、刘洪涛、张权、周波、冯少波、叶道辉、陈龙、狄勤丰、文涛、张德彪、赵力、陈凯枫

22.新能源领域用铝电解电容器阳极箔绿色产业链关键技术开发与应用

完成单位:新疆众和股份有限公司

主要完成人:马冰、左宏、杨文峰、喇国栋、陈长科、何新光、边明勇、李新芳、吴斌、孙健、杨辉、林颖

23.胃食管反流病及食管裂孔疝外科诊疗研究及全国推广

完成单位:新疆维吾尔自治区人民医院

主要完成人:克力木·阿不都热依木、阿力木江·麦斯依提、王志、艾克拜尔·艾力、王俭、皮尔地瓦斯·麦麦提玉素甫、李赞林、于文庆、多力坤·牙生、李慧灵、阿里木·买买提、热衣拉·克尤木

24.农村信息化及智慧农业关键技术研发与应用

完成单位:新疆农业大学、上海华测导航技术股份有限公司、乌鲁木齐润物兴农信息技术有限公司、南京天辰礼达电子科技有限公司

主要完成人:蒋平安、何伟、白涛、靳晟、李永可、孙飞、王磊、张伦宁、董峦、达新民、蒲智、陈燕红

25.毛绒质量控制技术开发和地方畜种绒毛种质资源挖掘与创新利用

完成单位:新疆畜牧科学院畜牧业质量标准研究所(新疆维吾尔自治区种羊与羊毛羊绒质量安全监督检验中心)、全国畜牧总站、中国纤维质量监测中心、清华大学、克拉玛依市白碱滩区林牧生态研究院

主要完成人:郑文新、张敏、赵小丽、高维明、刘辛军、宫平、杜树莹、王乐、陶卫东、乌兰、周卫东、曹克涛

26.面向新疆特殊环境的超特高压气体绝缘设备性能提升及运维关键技术与工程实践

完成单位:国网新疆电力有限公司检修公司、国网电力科学研究院武汉南瑞有限责任公司、武汉大学、河南平高电气股份有限公司、国网黑龙江省电力有限公司电力科学研究院

主要完成人:程林、姜东飞、蔡炜、李洪渊、黄勤清、潘成、江翼、马众、唐炬、卢鹏、黄志强、卢金宝

27.新疆树上干杏产业化关键技术集成与应用(基层项目)

完成单位:伊犁哈萨克自治州林业科学研究院

主要完成人:丛桂芝、陈淑英、刘君、王瑾、陶俊、石游、秦德明、秦丽、卢磊、吴松梅、刁永强、周晶

1.特高压换流站直流金具关键技术与工程应用

完成单位:国网新疆电力有限公司电力科学研究院、中国电力科学研究院有限公司、特变电工股份有限公司新疆变压器厂、中国电建集团四平线路器材有限公司、江苏双汇电力发展股份有限公司

主要完成人:李青、周立宪、摆志俊、司佳钧、王海菠、孙开宁、李冬青、刘鹏、朱子民

2.高粱品种选育及综合利用关键技术研究与示范

完成单位:新疆农业科学院生物质能源研究所、山西农业大学高粱研究所、农业部沼气科学研究所

主要完成人:涂振东、再吐尼古丽·库尔班、何明雄、牛皓、山其米克、王卉、岳丽、茆军、朱敏

3.白内障发病机制研究及防盲技术推广应用

完成单位:新疆维吾尔自治区人民医院、中山大学中山眼科中心

主要完成人:丁琳、林浩添、秦艳莉、王慧琴、甫拉提·阿布都热衣木、谢小东、黄圣松、王珣、徐晓燕

4.膜上自动移栽关键技术与装备研发及应用

完成单位:新疆农业大学、江苏大学、巴州良佳农机制造有限公司、德州福瑞特农业机械制造有限公司

主要完成人:韩长杰、毛罕平、梁佳、徐阳、袁盼盼、李洪雷、张静、尤佳、李光新

5.提升省级农业科技期刊质量及影响力数字化创新模式的研究与实践

完成单位:新疆农业科学院农业经济与科技信息研究所

主要完成人:张琼、郭文超、王芳、马吉宏、岳荣强、李朝晖、郭君、蒋国伟、苏武峥

6.新疆地区儿童口腔健康调查及龋病病因和防治研究

完成单位:新疆医科大学第一附属医院

主要完成人:赵今、张婉婷、吴泽钰、于倩、连冰洁、刘媛、马丽、侯鑫山、从兆霞

7.巴旦木采后初加工成套设备及工艺的研究与应用

完成单位:新疆农业科学院农业机械化研究所、新疆农业科学院农业工程公司、莎车县农业农村局

主要完成人:王学农、吐鲁洪·吐尔迪、牛长河、杨会民、郭兆峰、石鑫、张丽、乔园园、高小宝

8.高含硫油气安全环保集输处理关键技术

完成单位:中国石油化工股份有限公司西北油田分公司、华东理工大学、中国石油化工股份有限公司大连石油化工研究院、新疆大学

主要完成人:赵德银、孙辉、姚彬、赵毅、陈建兵、马凤云、张英、张倩、蔡奇峰

9.宫颈癌联合治疗策略研究

完成单位:新疆大学、新疆师范大学、新疆维吾尔自治区人民医院、新疆鼎聚生物科技有限公司

主要完成人:李金耀、李江伟、张爱莲、李金玉、夏丽洁、李轶杰、王为兰、马春华、纪勇

10.原发性醛固酮增多症诊断与治疗的关键技术研究

完成单位:新疆维吾尔自治区人民医院

主要完成人:骆秦、王国亮、胡君丽、王梦卉、李南方、周克明、张德莲、洪静、彩丽

11.新疆特色经济作物资源安全保存与发掘利用

完成单位:新疆农业科学院农作物品种资源研究所、中国农业科学院作物科学研究所、伊犁哈萨克自治州农业科学研究所

主要完成人:徐麟、卢新雄、王莉、辛霞、张龑、张正、崔宏亮、任海龙、尹广鹍

12.慢性淋巴细胞白血病分子遗传学机制研究及精准预后分层技术推广应用

完成单位:新疆维吾尔自治区人民医院

主要完成人:李燕、刘虹、王增胜、木合拜尔·阿布都尔、古再丽努尔·吾甫尔、聂玉玲、黄琴、王晓敏、毛敏

13.基于包虫宿主界面微环境的新型生物标记物的发现、免疫机制及其临床意义

完成单位:新疆医科大学第一附属医院

主要完成人:吐尔洪江·吐逊、赵晋明、沙地克·阿帕尔、温浩、何翼彪、李涛、白磊、姚刚、吴警

14.寒区输变电基础工程冻融灾变机理与防治关键技术

完成单位:新疆农业大学、西安建筑科技大学、中国电力工程顾问集团西北电力设计院有限公司、西安理工大学

主要完成人:张远芳、许健、袁俊、张凌凯、侍克斌、王松鹤、胡长明、王学明、慈军

15.新疆棉花品种指纹图谱构建及种子性状分子鉴定关键技术创新与应用

完成单位:新疆农业科学院经济作物研究所

主要完成人:李雪源、艾先涛、郑巨云、王俊铎、白岩、梁亚军、龚照龙、孙国清、郑志鸿

16.新疆特色保肝药用资源物质基础与开发应用研究

完成单位:新疆医科大学第一附属医院

主要完成人:杨建华、胡君萍、尹海龙、谯明、居博伟、朱丹丹、孙黎、董雨微、姜湘英

17.新疆制干葡萄产业关键技术研究与应用

完成单位:新疆农业科学院园艺作物研究所、吐鲁番市林果业技术推广服务中心、华南理工大学、新疆维吾尔自治区葡萄瓜果研究所

主要完成人:谢辉、张雯、刘丽媛、郭新波、周慧、白世践、韩守安、王敏、潘明启

18.露天矿山精准爆破智能化装备与技术应用

完成单位:保利民爆哈密有限公司、保利新联爆破工程集团有限公司、中国葛洲坝集团易普力股份有限公司、保利联合化工控股集团股份有限公司、哈密市和翔工贸有限责任公司

主要完成人:张光雄、赵明生、周桂松、余红兵、陈辉峻、李志鹏、冷振东、周建敏、李杰

19.新疆地区神经内镜技术在颅脑疾病中的临床基础研究及应用推广

完成单位:新疆维吾尔自治区人民医院、中日友好医院

主要完成人:吴永刚、刘江、张诚、麦麦提依明·托合提、杨小朋、王继超、吴红星、董军、张谦

20.基于深度语义理解的知识学习系统关键技术研究与应用

完成单位:新疆航天信息有限公司、航天信息股份有限公司、新疆大学、北京邮电大学、哈尔滨工业大学

主要完成人:林文辉、张剑奇、禹龙、乔媛媛、梁大鹏、于游、刘军、高晓文、陈玉轩

21.新疆棉田耕地土壤质量提升一减(肥)两控(水、盐)关键技术产品研究应用

完成单位:阿克苏地区农业技术推广中心、新疆农业科学院土壤肥料与农业节水研究所、国家棉花工程技术研究中心、新疆农业大学、石河子大学

主要完成人:杨涛、汤秋香、闵伟、张明、陈宝燕、吴湘琳、李磐、张永霞、龙朝宇

22.西准噶尔盆地植被建设关键技术研发集成与示范推广

完成单位:新疆林业科学院、南京信息工程大学、中国林业科学研究院荒漠化研究所

主要完成人:宁虎森、王让会、罗青红、朱雅娟、吉小敏、赵福生、李琪、雷春英、陈启民

23.调节胆碱能免疫炎症通路对心血管疾病的影响和机制研究

完成单位:新疆医科大学第一附属医院

主要完成人:芦颜美、祖克拉·吐尔洪、王莹、张玲、迪拉热·太外库力、加依娜·加尔肯、刘佳琦、樊永强、吕华胜

24.低渗储层压裂井带压排采技术

完成单位:中国石油集团西部钻探工程有限公司、中国石油天然气股份有限公司新疆油田分公司

主要完成人:封猛、苏建华、胡广文、陈超峰、唐青隽、丁心鲁、李国亮、徐伟红、张晓文

25.XZMPDII型全过程精细控压钻井系统研制

完成单位:中国石油集团西部钻探工程有限公司、中国石油天然气股份有限公司新疆油田分公司

主要完成人:伊明、黄鸿、戴勇、王战卫、辛飞、王维周、姚延许、张茂林、李易兴

26.新疆白喉乌头炮制减毒及药用价值研究

完成单位:新疆医科大学附属中医医院

主要完成人:聂继红、赵翡翠、汪芳、李茜、李伟、张刚、卢军、杨俊玲、王伟

27.新疆绿色纺织原料及制品品质管控关键技术研究与应用

完成单位:新疆维吾尔自治区纤维质量监测中心、南京海关工业产品检测中心、石家庄海关技术中心、成都海关技术中心、新疆维吾尔自治区分析测试研究院

主要完成人:阿不都热西提·买买提、丁友超、董绍伟、杜卫东、连素梅、蒋小葵、朱选志、景建平、郑健琨

28.复杂地质地形区城市快速路建设技术及工程应用

完成单位:新疆交投建设管理有限责任公司、中交第二航务工程局有限公司、中交一公局集团有限公司、长安大学

主要完成人:李杰、哈米提、王立鹤、包卫星、李陆军、贾龙海、梁邦伟、车承文、徐遵江

29.特高硫特高盐特殊工况油田防腐涂层体系关键技术与应用

完成单位:中国石油化工股份有限公司西北油田分公司、中国石油集团工程技术研究有限公司、新疆腐蚀与防护协会

主要完成人:肖雯雯、崔灿灿、杨兰田、王献昉、曾文广、刘青山、许艳艳、张志宏、王磊

30.强非均质性砾岩油藏稳油控水关键技术研究与应用

完成单位:中国石油天然气股份有限公司新疆油田分公司、新疆砾岩油藏实验室、西南石油大学

主要完成人:唐可、刘锐、白雷、罗强、李凯、杜代军、韩力、孙鹏超、李婷

31.准噶尔盆地砾岩油藏化学复合驱大幅度提高采收率关键技术研究与应用

完成单位:中国石油天然气股份有限公司新疆油田分公司、新疆砾岩油藏实验室

主要完成人:栾和鑫、王延杰、徐崇军、王晓光、万青山、王辉、聂小斌、李织宏、陈权生

32.中深层稠油注水高效开发关键技术及应用

完成单位:中国石油天然气股份有限公司新疆油田分公司

主要完成人:褚艳杰、谢建勇、梁成钢、李文波、叶俊华、徐田录、李建财、吐尔逊江·巴拉提、王伟

33.准噶尔盆地油基钻井液关键技术及工业化应用

完成单位:中国石油天然气股份有限公司新疆油田分公司、中国石油大学(北京)、克拉玛依金鑫油田环保工程有限公司

主要完成人:石建刚、刘可成、蒋官澄、聂明虎、戎克生、王茂仁、徐新纽、徐生江、姚旭洋

34.玛湖砾岩油藏体积压裂水平井提高井筒质量关键技术及规模化应用

完成单位:中国石油天然气股份有限公司新疆油田分公司、中国石油大学(北京)、中国石油大学(华东)

主要完成人:吴继伟、宋琳、关志刚、王朝飞、杨洪、席传明、刘伟、许玉强、林志伟

35.几个优质葡萄新品种的选育及关键栽培技术研究与应用

完成单位:新疆维吾尔自治区葡萄瓜果研究所

主要完成人:骆强伟、孙锋、伍国红、李玉玲、王勇、蔡军社、苏来曼·艾则孜、郭平峰、马小才

36.深层稠油高效举升工艺技术与应用

完成单位:中国石油化工股份有限公司西北油田分公司、西南石油大学、重庆科技学院

主要完成人:邹国君、刘玉国、彭振华、杨祖国、李子甲、杨映达、刘永辉、刘竟成、靳永红

37.适用于新型配电网的多端口电能路由器关键技术研究及产业化应用

完成单位:特变电工新疆新能源股份有限公司、西安交通大学、特变电工西安电气科技有限公司、特变电工西安柔性输配电有限公司

主要完成人:郝翔、黄浪、裴云庆、李直、刘韬、胡亮、于向恩、吴霆霆、段飞跃

38.中亚低涡影响新疆强降水预报预警关键技术及业务应用

完成单位:中国气象局乌鲁木齐沙漠气象研究所、新疆维吾尔自治区气象台、中国科学院大气物理研究所

主要完成人:杨莲梅、张云惠、周玉淑、李建刚、曾勇、刘晶、卢新玉、冉令坤、黄艳

39.风机传动齿轮箱专用油研发与示范

完成单位:新疆金雪驰科技股份有限公司、新疆工程学院、新疆金风科技股份有限公司、电子科技大学

主要完成人:田晓如、张乐涛、王殿平、刘河、张亚刚、徐芹龙、张贵栋、张志训、李祺

40.乌鲁木齐地铁工程施工风险预警与控制理论及其应用

完成单位:新疆大学、乌鲁木齐城市轨道集团有限公司、青岛理工大学、中铁隆工程集团有限公司

主要完成人:秦拥军、张壮、于广明、孙礼超、资斌全、谢良甫、赵树林、孟宪国、马佳

41.新疆寒旱区水工混凝土抗硫酸盐侵蚀关键技术研究与应用

完成单位:新疆农业大学、河海大学

主要完成人:储洪强、李双喜、熊传胜、宫经伟、蒋林华、陈亮亮、唐新军、蒋俣、高强

42.顺托地区克拉通内走滑断裂解析方法、技术及应用

完成单位:中国石油化工股份有限公司西北油田分公司、中国石油化工股份有限公司石油勘探开发研究院

主要完成人:邓尚、黄诚、朱秀香、林会喜、张继标、吴鲜、刘雨晴、林波、宋海明

43.低功耗环锭纺纱智能工厂关键技术及产业化

完成单位:新疆利泰丝路投资有限公司、东华大学、卓郎(江苏)纺织机械有限公司、上海交通大学

主要完成人:张洁、汪俊亮、朱开玉、吴云峰、吕佑龙、徐楚桥、关欣、郑小虎、李瑞

44.腺病毒36型对肥胖人群糖脂代谢的调节及分子机制研究

完成单位:新疆医科大学

主要完成人:关亚群、焦谊、梁小弟、努尔比耶·努尔麦麦提、孟轩羽、谷昊、蒋升、赵阳、张亚成

45.极近距离煤层重复采动围岩结构失稳机制及控制技术研究

完成单位:新疆维吾尔自治区煤炭科学研究所、西安科技大学、河南工程学院、新疆焦煤(集团)有限责任公司

主要完成人:李晓疆、娄芳、王震、严敏、卢前明、赵伟、金士魁、白杨、卓日升

46.企业核心业务云化关键技术研究与应用

完成单位:国网新疆电力有限公司信息通信公司、东北大学、四川中电启明星信息技术有限公司

主要完成人:李凯、郭军、胡美慧、杨恒翔、常春雷、张捷、郭晶、张斌、杨大伟

47.特高压±1100kV直流复合绝缘子研制关键技术及应用

完成单位:国网新疆电力有限公司电力科学研究院、襄阳国网合成绝缘子有限责任公司、国网电力科学研究院武汉南瑞有限责任公司、福州大学、湖北大学

主要完成人:杨红军、王建、龚浩、黄浩、舒胜文、田正波、杨定乾、罗文华、邓鹤鸣

48.瓦斯抽采钻孔动态封堵关键技术及成套装备研发与应用

完成单位:新疆工程学院、河南理工大学、中国矿业大学、新疆焦煤(集团)有限责任公司、新疆龙煤能源有限责任公司

主要完成人:程健维、陆卫东、魏国营、陈建杰、李强、王钰、闫江伟、李明文

49.基于多元用能与风险预警的智慧电力服务平台的构建

完成单位:国网新疆电力有限公司信息通信公司、福建亿榕信息技术有限公司、中国科学院沈阳计算技术研究所有限公司、北京中电普华信息技术有限公司

主要完成人:杨柳、郭江涛、王平、王秋琳、于波、马倩、黎红、贾俊强、沈佳

50.大温差环境下GIS壳体故障防治关键技术及应用

完成单位:国网新疆电力有限公司电力科学研究院、国网青海省电力公司电力科学研究院、国网浙江省电力有限公司电力科学研究院、国网山东省电力公司电力科学研究院、国网新疆电力有限公司检修公司

主要完成人:王欣欣、王志惠、赵洲峰、杜宝帅、郑义、罗宏建、陈莲君、王帅、张忠文

51.和田夜市经济产业群体发展标准体系建设及其应用(基层项目)

完成单位:和田地区市场监督管理局(地区知识产权局)、和田市市场监督管理局、和田地区美食文化协会

主要完成人:李永胜、何亮舟、曹卫军、宋伟云、屠俊红、屠海燕、廖少权、沈磊、樊枫

52.伊犁河谷红花新品种选育及推广应用(基层项目)

完成单位:伊犁哈萨克自治州农业科学研究所、新疆禾旺农业科技有限公司

主要完成人:彭云承、曹禹、加力肯·马地亚尔、阿勒合斯·加尔得木拉提、周大伟、李杜娟、关丽菊、陈建伟、王新

53.EKM控压钻井系统研发及应用(基层项目)

完成单位:新疆格瑞迪斯石油技术股份有限公司

主要完成人:贺志刚、李雪刚、王其军、李前贵、李金崇、吴华强、后建武、燕华、汤卫华

1.新疆特色苗木开发利用及优良树种引进繁育关键技术集成与示范

完成单位:新疆农业科学院综合试验场、新疆农业大学、乌鲁木齐市新市区林源苗圃

主要完成人:蔺国仓、黄俊华、任向荣、孙美乐、刘恒德、张鲁男、宁成博

2.新疆成年人心房颤动流行现况及发病机制研究

完成单位:新疆维吾尔自治区人民医院

主要完成人:姚娟、方舒、高洁、燕建锋、丁娟、黄城、宋迁甲

3.高产耐密多抗玉米商业化育种技术研究与示范

完成单位:新疆华西种业有限公司、新疆农业科学院粮食作物研究所、九圣禾种业股份有限公司

主要完成人:李晓梅、阿布来提·阿布拉、杨惠、舍强、乔新林、王爱华、王国强

4.高侵袭性B细胞淋巴瘤中相关基因表达谱及靶向治疗的研究

完成单位:新疆医科大学第一附属医院

主要完成人:崔文丽、庞雪莲、马明福、马遇庆、郑树涛、赵艳、马佳佳

5.适度规模化三黄鸡的健康养殖技术的集成与示范推广

完成单位:新疆农业职业技术学院、新疆泰昆集团有限责任公司、石河子大学

主要完成人:邓双义、柳旭伟、曾军、张莉、孙雪梅、陈开旭、葛文霞

6.多模态超声对乳腺癌早诊、新辅助化疗疗效及侵袭性评价的研究及深度学习平台的推广应用

完成单位:新疆医科大学附属肿瘤医院

主要完成人:冷晓玲、李鸿涛、黄国福、马富成、贾志莺、张海见、吴洁

7.弥漫大B细胞淋巴瘤肿瘤微环境中耐药相关分子机制研究

完成单位:新疆医科大学第一附属医院

主要完成人:李新霞、马志萍、高海霞、闫淑芳、马佳佳、杨美虹、杨柳青

8.间歇性低压低氧预处理对SD大鼠放射性肝损伤保护作用及机制研究

完成单位:中国人民解放军新疆军区总医院

主要完成人:袁芳、李文哲、徐丽、寇斌、美丽姑·买买提、李文军、张萌

9.口服等渗甘露醇螺旋CT小肠造影的临床应用

完成单位:新疆维吾尔自治区人民医院

主要完成人:李辉、刘焱、王艳、王佳、牛俊巧、夏迎洪、王俊

10.StanfordA型主动脉夹层外科治疗及关键技术的临床应用

完成单位:新疆维吾尔自治区人民医院

主要完成人:买买提艾力·艾则孜、张总刚、刘筠、买买提·依斯热依力、郭永忠、邵劲杰、叶尔买克·唐沙哈尔

11.深部难钻地层系列提速工具研制及应用

完成单位:中国石油集团西部钻探工程有限公司

主要完成人:张昕、宋朝晖、赵继斌、乔东宇、王伟罡、姜朝民、石义

12.中医魄不安于肺所致不寐大鼠模型睡眠相关因子研究

完成单位:新疆医科大学附属中医医院

主要完成人:张星平、邓宁、梁政亭、陈俊逾、任小娟、安艳丽、肖春霞

13.儿童小脑肿瘤术后认知功能障碍的fMRI研究

完成单位:新疆医科大学第一附属医院

主要完成人:汪永新、吉文玉、范国锋、王增亮、图柯拜·吐尔托合提、刘东、秦虎

14.骆驼刺调节肠易激综合征及抗肿瘤活性物质基础研究

完成单位:新疆维吾尔自治区中药民族药研究所、新疆维吾尔自治区市场监督审核评价中心

主要完成人:马晓玲、贾月梅、宋海龙、魏鸿雁、石磊岭、夏提古丽·阿不利孜、徐晓琴

15.新疆特色豆类鹰嘴豆和奶花芸豆的研究利用

完成单位:新疆维吾尔自治区分析测试研究院、托里天山小哥农业科技有限公司、新疆维吾尔自治区农药检定所、新疆维吾尔自治区生态环境监测总站

主要完成人:王苗苗、李伟、阿依古丽·塔什波拉提、马锦陆、陈静、严欢、田合

16.医学科技创新人才全周期个性化培养体系的建立与实践

完成单位:新疆医科大学第一附属医院

主要完成人:俞婧、马瑾、武云、木胡牙提、李玉革、唐月红、姚华

17.原发免疫性血小板减少症的免疫机制及干预研究

完成单位:新疆医科大学第一附属医院

主要完成人:郭新红、王秀娟、孙明玲、李芹芝、王蕾、王新有、刘颖

18.慢性淋巴细胞白血病患者Th17/Treg细胞的作用特点和临床意义

完成单位:新疆医科大学第一附属医院

主要完成人:曲建华、张瑞、谢仁古丽·阿力木、江明、陈刚、沙巴艾提·吐达洪、玛丽娅·木哈什

19.食品中污染物及非法添加物关键检测技术研究及应用

完成单位:新疆维吾尔自治区分析测试研究院、成都海关技术中心

主要完成人:曹雪琴、胡江涛、刘苏锐、李永丽、王文文、何会珍、范蕊

20.准噶尔盆地非常规储层敏感性动静态实验方法研究与应用

完成单位:中国石油天然气股份有限公司新疆油田分公司

主要完成人:魏云、寇根、李琼、刘赛、王蓓、王子强、吕道平

21.环准噶尔盆地储油罐安全与环保关键技术研究与应用

完成单位:中国石油天然气股份有限公司新疆油田分公司

主要完成人:李洪福、刘延昌、李媛媛、罗小武、王建平、刘明川、李妍

22.新疆东部富油煤资源聚集理论与高效探明

完成单位:新疆维吾尔自治区煤田地质局一六一煤田地质勘探队、新疆大学

主要完成人:赵正威、李万军、冯烁、张相、秦大鹏、来鹏、高文博

23.双高电力系统多能互补网源协调技术与应用

完成单位:国网新疆电力有限公司电力科学研究院、中国电力科学研究院有限公司、华北电力大学、国网重庆市电力公司电力科学研究院

主要完成人:冯长有、霍承祥、孙英云、焦春雷、克帕依吐·吐尔逊、李明、李志强

24.新疆地区肝脏重大疾病微创治疗关键技术研发及推广应用

完成单位:新疆维吾尔自治区人民医院

主要完成人:陈雄、孟塬、马志刚、李玉鹏、田广磊、巴合提·卡力甫、依马木·阿不拉

25.变电站1035kV设备弧光接地及铁磁谐振过电压主动抑制系统研制与应用

完成单位:国网新疆电力有限公司昌吉供电公司、国网新疆电力有限公司电力科学研究院、国网新疆电力有限公司经济技术研究院、安徽正广电电力技术有限公司、安徽一天电气技术股份有限公司

主要完成人:何龙、赵普志、杨振、孙帆、朱咏明、杜龙基、马金财

26.基于高敏感负荷区的配电系统典型供电模式与协调运行控制关键技术研究与应用

完成单位:国网新疆电力有限公司乌鲁木齐供电公司、国网经济技术研究院有限公司、中国电力科学研究院有限公司、四川大学、中国农业大学

主要完成人:李冰、张瑜、许立雄、苏娟、孙充勃、张竹青、居来提·阿不力孜

27.阿克苏地区机采棉配套栽培技术研究与示范推广(基层项目)

完成单位:新疆维吾尔自治区阿克苏地区农业技术推广中心、阿克苏地区种业发展中心

主要完成人:戴路、马辉、席育贤、李星星、阿布都艾尼·阿布都维力、欧欢、袁新琳

28.红枣三品一标提升工程关键技术研究与推广(基层项目)

完成单位:巴州林业科学技术推广中心、且末县林业科技推广中心

主要完成人:王雨、李占林、艾尼瓦尔·艾拜、胡文军、斯琴、江振斌、哈力旦木·吐尔迪

29.哈密市现代养殖技术应用与推广(基层项目)

完成单位:哈密市科技促进服务中心、哈密市畜牧工作站

主要完成人:罗生金、吴红梅、储伟、任晓鹏、哈力·胡麻力

}

我要回帖

更多关于 线性相关与秩的关系 的文章

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信