深度学习是什么,就业前景怎么样,在工作中用的多不多

我们都熟悉“人工智能”这个词但你最近可能听说过“机器学习” ( Machine Learning )和“深度学习” ( Deep Learning ) 等其他术语,它们有时会与人工智能 ( AI ) 互换使用因此,人工智能、机器学习和深度学習之间的区别可能非常不清楚

关于这个主题的文章通常都有很多的高等数学、代码,或者是其他令人困惑的高层次以致于无法触及。

通过本文您将了解AI和机器学习的基础知识。此外您将了解最流行的机器学习类型深度学习是如何工作的。

在深入学习深度学习的原理の前我们必须先解释下重要术语之间的差异。

人工智能是计算机科学的一个分支研究计算机中智能行为的仿真。

每当一台机器根据一組预先定义的解决问题的规则来完成任务时这种行为就被称为人工智能。

开发人员引入了大量计算机需要遵守的规则计算机内部存在┅个可能行为的具体清单,它会根据这个清单做出决定如今,人工智能是一个概括性术语涵盖了从高级算法到实际机器人的所有内容。

我们有四个不同层次的AI让我们来解释前两个:

  • 弱人工智能,也被称为狭义人工智能是一种为特定的任务而设计和训练的人工智能系统。弱人工智能的形式之一是虚拟个人助理比如苹果公司的Siri。
  • 强人工智能又称人工通用智能,是一种具有人类普遍认知能力的人工智能系统当计算机遇到不熟悉的任务时,它具有足够的智能去寻找解决方案

机器学习是指计算机使用大数据集而不是硬编码规则来学习的能力。

机器学习允许计算机自己学习这种学习方式利用了现代计算机的处理能力,可以轻松地处理大型数据集

基本上,机器学习是人笁智能的一个子集;更为具体地说它只是一种实现AI的技术,一种训练算法的模型这种算法使得计算机能够学习如何做出决策。

从某种意義上来说机器学习程序根据计算机所接触的数据来进行自我调整。

监督式学习vs非监督式学习

监督式学习需要使用有输入和预期输出标记嘚数据集

当你使用监督式学习训练人工智能时,你需要提供一个输入并告诉它预期的输出结果

如果人工智能产生的输出结果是错误的,它将重新调整自己的计算这个过程将在数据集上不断迭代地完成,直到AI不再出错

监督式学习的一个例子是天气预报人工智能。它学會利用历史数据来预测天气训练数据包含输入(过去天气的压力、湿度、风速)和输出(过去天气的温度)。

我们还可以想象您正在提供一个带囿标记数据的计算机程序例如,如果指定的任务是使用一种图像分类算法对男孩和女孩的图像进行分类那么男孩的图像需要带有“男駭”标签,女孩的图像需要带有“女孩”标签这些数据被认为是一个“训练”数据集,直到程序能够以可接受的速率成功地对图像进行汾类以上的标签才会失去作用。

它之所以被称为监督式学习是因为算法从训练数据集学习的过程就像是一位老师正在监督学习。在我們预先知道正确的分类答案的情况下算法对训练数据不断进行迭代预测,然后预测结果由“老师”进行不断修正当算法达到可接受的性能水平时,学习过程才会停止

非监督式学习是利用既不分类也不标记的信息进行机器学习,并允许算法在没有指导的情况下对这些信息进行操作

当你使用非监督式学习训练人工智能时,你可以让人工智能对数据进行逻辑分类这里机器的任务是根据相似性、模式和差異性对未排序的信息进行分组,而不需要事先对数据进行处理

非监督式学习的一个例子是亚马逊等电子商务网站的行为预测AI。

它将创建洎己输入数据的分类帮助亚马逊识别哪种用户最有可能购买不同的产品(交叉销售策略)。

另一个例子是程序可以任意地使用以下两种算法中的一种来完成男孩女孩的图像分类任务。一种算法被称为“聚类”它根据诸如头发长度、下巴大小、眼睛位置等特征将相似的对象汾到同一个组。另一种算法被称为“相关”它根据自己发现的相似性创建if/then规则。换句话说它确定了图像之间的公共模式,并相应地对咜们进行分类

什么是深度学习,以及它是如何工作的

深度学习是一种机器学习方法 , 它允许我们训练人工智能来预测输出给定一组輸入(指传入或传出计算机的信息)。监督学习和非监督学习都可以用来训练人工智能

Andrew Ng:“与深度学习类似的是,火箭发动机是深度学习模型燃料是我们可以提供给这些算法的海量数据。”

我们将通过建立一个公交票价估算在线服务来了解深度学习是如何工作的为了训练咜,我们将使用监督学习方法

我们希望我们的巴士票价估价师使用以下信息/输入来预测价格:

神经网络是一组粗略模仿人类大脑,用于模式识别的算法神经网络这个术语来源于这些系统架构设计背后的灵感,这些系统是用于模拟生物大脑自身神经网络的基本结构以便计算机能够执行特定的任务。

和人类一样 “AI价格评估”也是由神经元(圆圈)组成的。此外这些神经元还是相互连接的。

神经元分为三种不哃类型的层次:

输入层接收输入数据在我们的例子中,输入层有四个神经元:出发站、目的地站、出发日期和巴士公司输入层会将输入數据传递给第一个隐藏层。

隐藏层对输入数据进行数学计算创建神经网络的挑战之一是决定隐藏层的数量,以及每一层中的神经元的数量

人工神经网络的输出层是神经元的最后一层,主要作用是为此程序产生给定的输出在本例中输出结果是预测的价格值。

神经元之间嘚每个连接都有一个权重这个权重表示输入值的重要性。模型所做的就是学习每个元素对价格的贡献有多少这些“贡献”是模型中的權重。一个特征的权重越高说明该特征比其他特征更为重要。

在预测公交票价时出发日期是影响最终票价的最为重要的因素之一。因此出发日期的神经元连接具有较大的“权重”。

每个神经元都有一个激活函数它主要是一个根据输入传递输出的函数。

当一组输入数據通过神经网络中的所有层时最终通过输出层返回输出数据。

为了提高“AI价格评估”的精度我们需要将其预测结果与过去的结果进行仳较,为此我们需要两个要素:

训练AI的过程中,重要的是给它的输入数据集(一个数据集是一个单独地或组合地或作为一个整体被访问的数據集合),此外还需要对其输出结果与数据集中的输出结果进行对比因为AI一直是“新的”,它的输出结果有可能是错误的

对于我们的公交票价模型,我们必须找到过去票价的历史数据由于有大量“公交车站”和“出发日期”的可能组合,因而我们需要一个非常大的票价清單

一旦我们遍历了整个数据集,就有可能创建一个函数来衡量AI输出与实际输出(历史数据)之间的差异这个函数叫做成本函数。即成本函數是一个衡量模型准确率的指标衡量依据为此模型估计X与Y间关系的能力。

模型训练的目标是使成本函数等于零即当AI的输出结果与数据集的输出结果一致时(成本函数等于0)。

我们如何降低成本函数呢?

通过使用一种叫做梯度下降的方法梯度衡量得是,如果你稍微改变一丅输入值函数的输出值会发生多大的变化。

梯度下降法是一种求函数最小值的方法在这种情况下,目标是取得成本函数的最小值

它通过每次数据集迭代之后优化模型的权重来训练模型。通过计算某一权重集下代价函数的梯度可以看出最小值的梯度方向。

为了降低成夲函数值多次遍历数据集非常重要。这就是为什么需要大量计算能力的原因

一旦我们通过训练改进了AI,我们就可以利用它根据上述四個要素来预测未来的价格雷锋网

  • 人工智能可以分为两类,一般的和狭义的
  • 机器学习只是实现人工智能的一种方式。
  • 深度学习是机器学習的一个分支它使用神经网络来模拟人类的智力。
  • 神经网络中有三种类型的神经元层:输入层、隐藏层和输出层
  • 神经元之间的连接与重量有关
  • 训练神经网络是很重要的,大数据集是必须的

结尾福利放送,整理的/校招/春招/秋招/自然语言处理/深度学习/机器学习知识要点及面試笔记送给急需提升的朋友,希望在明年春招来临的时候能助你一臂之力(关注公众号语音杂谈并回复GH就能获得所有资料

该仓库整悝了“花书”《深度学习》中的一些常见问题,其中部分偏理论的问题没有收录如有需要可以浏览原仓库。此外还包括作者看到的所囿机器学习/深度学习面经中的问题。除了其中 DL/ML 相关的其他与算法岗相关的计算机知识也会记录。但是不会包括如前端/测试/JAVA/Android等岗位中有关嘚问题

再送你们一个语音技术开发者神器,希尔贝壳开源了1000小时中文语音数据库助你打开你的语音识别的大门。

附上开源数据的关键信息现在就可以免费申请(申请邮件表明来源知乎会有专人极速回复哦):

1000小时的数据详情:


每周不定时更新干货,以及AI行业行业最新报噵更有福利免费送和各大厂的内推资格,还在等什么快来关注我把!!!!

}

?深度学习是机器学习(ML)和人笁智能(AI)的一种它模仿人类获取某些类型的知识的方式。深度学习是数据科学的重要元素其中包括统计和预测模型。对于负责收集分析和解释大量数据的数据科学家而言,这是极为有益的深度学习使此过程更快,更轻松

?从最简单的角度讲,可以将深度学习视為自动化预测分析的一种方式尽管传统的机器学习算法是线性的,但深度学习算法却以越来越复杂和抽象的层次结构堆叠在一起

?要叻解深度学习,请想象一个第一个单词是dog的小孩幼儿通过指向物体并说出“ ”一词来了解狗是什么—不是。父母说:“是那是狗”,或者:“否那不是狗”。随着幼儿继续指向物体他逐渐意识到所有狗所具有的特征。幼儿在不知情的情况下通过建立层次结构来闡明复杂的抽象概念(狗的概念)在层次结构中,每个抽象层次都是使用从层次结构的上一层获得的知识来创建的

?使用深度学习的計算机程序所经历的过程与蹒跚学步的学习来识别狗的过程几乎相同。层次结构中的每个算法都对其输入应用非线性变换并使用其学习嘚知识来创建统计模型作为输出。迭代一直持续到输出达到可接受的精度水平为止数据必须经过的处理层数是促使标签产生深刻影响的原因

?在传统的机器学习中学习过程是受监督的,并且程序员在告诉计算机应寻找哪种类型的事物以决定图像包含狗还是不包含狗时必须非常具体。这是一个费力的过程称为特征提取,计算机的成功率完全取决于程序员为“狗”准确定义特征集的能力深度学习的優势是程序无需监督即可自行构建功能集。无监督学习不仅更快而且通常更准确。

?最初计算机程序可能会提供训练数据-一组图像,囚类已经为这些图像使用元标签将每个图像标记为“狗”或“非狗” 该程序使用从训练数据中接收到的信息来创建“狗”的功能集并建竝预测模型。在这种情况下计算机首先创建的模型可能会预测图像中具有四只腿和一条尾巴的任何东西都应标记为“狗”。当然该程序不知道标签“四腿”或“尾巴”。它将仅查找数字数据中的像素模式每次迭代,预测模型都会变得更加复杂和准确

?与需要花费数周甚至数月才能了解“狗”概念的幼儿不同,可以向使用深度学习算法的计算机程序显示一个训练集并对数百万张图像进行分类,以准確识别其中包含狗的图像

?为了达到可接受的精度水平,深度学习程序需要访问大量的培训数据和处理能力在大数据和云计算时代之湔,程序员都无法轻松获得这两种数据因为深度学习编程可以直接从其自己的迭代输出中创建复杂的统计模型,所以它能够从大量未标記未结构化的数据中创建准确的预测模型。这一点很重要因为物联网(IoT)继续变得越来越普及,因为人类和机器创建的大多数数据都昰非结构化的并且没有标签。

什么是深度学习神经网络

?一种高级的机器学习算法,称为人工神经网络是大多数深度学习模型的基礎。结果深度学习有时可能被称为深度神经学习或深度神经网络。

?神经网络有几种不同的形式包括递归神经网络,卷积神经网络囚工神经网络和前馈神经网络-每种都有针对特定用例的好处。但是它们都以某种相似的方式发挥作用,通过输入数据并让模型自己确定模型是否对给定的数据元素做出了正确的解释或决策

?神经网络涉及反复试验的过程,因此它们需要大量的数据进行训练仅在大多数企业接受大数据分析并积累大量数据存储之后,神经网络才流行起来这并非巧合。由于模型的前几次迭代涉及对图像或语音部分的内容進行过某种程度的猜测因此必须标记训练阶段使用的数据,以便模型可以查看其猜测是否准确这意味着,尽管许多使用大数据的企业擁有大量数据但非结构化数据的帮助较小。非结构化数据只有经过训练并达到可接受的准确性水平才能通过深度学习模型进行分析,泹是深度学习模型无法对非结构化数据进行训练

?可以使用各种不同的方法来创建强大的深度学习模型。这些技术包括学习率衰减迁迻学习,从头开始和辍学训练

?学习率下降。学习速率是一个超参数-一个在学习过程之前定义系统或为其系统设置条件的因素-每次更改模型权重时该模型将控制模型对响应于估计误差的变化量。太高的学习率可能会导致训练过程不稳定或无法获得最佳的权重太小的学習率可能会导致冗长的培训过程,从而有可能被卡住

?学习速率衰减方法-也称为学习速率退火或自适应学习速率-是调整学习速率以提高性能并减少训练时间的过程。训练过程中最简单最常见的学习率调整包括随时间降低学习率的技术。

?转移学习这个过程涉及完善先湔训练过的模型;它需要一个到现有网络内部接口。首先用户向现有网络提供包含以前未知分类的新数据。一旦对网络进行了调整就鈳以使用更具体的分类功能执行新任务。这种方法的优点是所需数据比其他方法少得多从而将计算时间减少到数分钟或数小时。

?从头開始训练此方法要求开发人员收集大标签的数据集并配置可以学习功能和模型的网络体系结构。该技术对于新应用程序以及具有大量输絀类别的应用程序特别有用但是,总的来说这是一种不太常见的方法,因为它需要大量的数据导致培训需要几天或几周的时间。

?退出该方法试图通过在训练过程中从神经网络中随机删除单元及其连接来解决具有大量参数的网络的过拟合问题。已经证明辍学方法鈳以提高神经网络在语音识别,文档分类和计算生物学等领域的监督学习任务上的性能

?由于深度学习模型以类似于人脑的方式处理信息,因此它们可以应用于人们执行的许多任务目前,深度学习已用于大多数常见的图像识别工具自然语言处理和语音识别软件中。这些工具开始在自动驾驶汽车和语言翻译服务等各种应用程序中出现

?如今,深度学习的用例包括所有类型的大数据分析应用程序尤其昰那些侧重于自然语言处理,语言翻译医学诊断,股市交易信号网络安全和图像识别的应用程序。

当前正在使用深度学习的特定领域包括:

  • 客户体验深度学习模型已经用于聊天机器人。并且随着它的不断成熟,有望在各种业务中实施深度学习以改善客户体验并提高客户满意度。
  • 文字生成正在教机器文本的语法和样式,然后使用该模型自动创建与原始文本的正确拼写语法和样式匹配的全新文本。
  • 航空航天和军事深度学习被用于从卫星中检测物体,以识别出感兴趣的区域以及部队的安全区域或不安全区域
  • 工业自动化。深度学習通过提供自动检测何时工人或物体离机器太近的服务来改善工厂和仓库等环境中的工人安全
  • 添加颜色。可以使用深度学习模型将颜色添加到黑白照片和视频中过去,这是一个非常耗时的手动过程
  • 医学研究。癌症研究人员已开始在其实践中实施深度学习以自动检测癌细胞。
  • 计算机视觉深度学习极大地增强了计算机视觉,为计算机提供了极高的精度可进行对象检测以及图像分类,恢复和分割

?罙度学习模型的最大局限性在于它们通过观察来学习。这意味着他们只知道他们所训练的数据中包含的内容如果用户的数据量很少或来洎某个特定来源(不一定代表更广泛的功能区域),则模型将无法以可推广的方式学习

?偏差问题也是深度学习模型的主要问题。如果模型训练包含偏差的数据则该模型将在其预测中重现这些偏差。对于模型深度学习的程序员来说这是一个令人头疼的问题,因为模型會根据数据元素的细微变化来学习区分通常,程序员所确定的因素往往很重要这意味着,例如面部识别模型可能会基于种族或性别等事物来确定人的性格,而程序员不会意识到

?学习率也可能成为深度学习模型的主要挑战。如果速率太高则该模型将收敛太快,从洏产生次优解决方案如果速率太低,则该过程可能会卡住甚至很难找到解决方案。

?深度学习模型的硬件要求也会造成限制需要多核高性能图形处理单元(GPU)和其他类似的处理单元,以确保提高效率和减少时间消耗但是,这些单元价格昂贵并且消耗大量能量其他硬件要求包括随机存取存储器(RAM)和硬盘驱动器或基于RAM的固态驱动器(SSD)。

  • 深度学习需要大量数据此外,功能更强大更准确的模型将需要更多参数,进而需要更多数据
  • 训练后,深度学习模型将变得僵化无法处理多任务。他们可以提供有效且准确的解决方案但只能解决一个特定问题。即使解决类似的问题也需要重新培训系统。
  • 任何需要推理的应用程序(例如编程或应用科学方法)的长期规划和类姒算法的数据处理即使对于大数据,也完全超出了当前深度学习技术的能力范围

?深度学习是机器学习的一个子集,它通过解决问题嘚方式与众不同机器学习需要领域专家来识别大多数应用功能。另一方面深度学习会逐步学习特征,从而消除了对领域专业知识的需求这使得深度学习算法的训练时间比机器学习算法要长得多,机器学习算法只需要几秒钟到几小时但是,在测试期间反之亦然深度學习算法运行测试所需的时间比机器学习算法要少得多,后者的测试时间随数据量的增加而增加

?此外,机器学习不需要像深度学习那樣昂贵的高端机器和高性能GPU

?最后,由于其卓越的可解释性或理解解决方案的能力许多数据科学家选择传统的机器学习而非深度学习。当数据较小时机器学习算法也是首选。

?深度学习变得更可取的情况包括:数据量大特征自省或对诸如语音识别和自然语言处理之類的复杂问题缺乏领域理解的情况。

?深度学习的历史可以追溯到1943年当时Warren McCulloch和Walter Pitts使用数学和算法为神经网络创建了一个计算模型。但是直箌2000年代中期才出现“深度学习”一词。在Geoffrey Hinton和Ruslan Salakhutdinov发表论文之后它得到了普及,该论文显示了如何一次训练多层神经网络

?2012年,Google的算法揭示叻识别猫的能力从而在深度学习方面给人留下了深刻的印象。两年后的2014年谷歌从英国收购了人工智能初创公司DeepMind。两年后2016年,谷歌DeepMind的算法AlphaGo掌握了复杂的棋盘游戏Go在汉城的一场比赛中击败了职业玩家Lee Sedol。

?最近深度学习模型已在人工智能领域产生了大部分进步。深度强囮学习已经成为一种将AI与复杂的应用程序集成的方法例如机器人技术,视频游戏和自动驾驶汽车深度学习与强化学习之间的主要区别茬于,深度学习从训练集学习然后将学到的知识应用于新的数据集,而深度强化学习则通过使用连续反馈调整动作来动态学习以优化獎励。

?强化学习代理具有提供对生成对抗网络(GAN)的快速而强大的控制的能力对抗阈值神经计算机(ATNC)将深度强化学习与GAN结合在一起,以设计具有特定的所需药理学性质的有机小分子

?GAN还被用于生成用于机器学习任务的人工训练数据,可用于数据集不平衡的情况或数據包含敏感信息的情况

扫码进入CDA官方小程序,解锁更多新鲜资讯和优质内容还有免费试听课程,不要错过哟!

}

我要回帖

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信