无人机上有摄像头但没有存储卡怎么传输文件呢?

在遥控终端上控制摄像头旋转

  • 激进时政或意识形态话题

}

本实用新型涉及一种视频回传系统,具体涉及一种使用在无人机 上的航拍视频实时高速回传系统,属于无人机图像传输技术领域。

无人驾驶飞机简称“无人机”,是利用无线电遥控设备和自备的程 序控制装置操纵的不载人飞机。无人机广泛应用于警用、城市管理、 农业、地质、气象、电力、抢险救灾、视频拍摄等行业。从助力现代 乡村到给力智慧城市,凡是需要空中解决方案的地方,都将有无人机 的一席之地。随着无人机应用范围越来越广,作业区域越来越复杂, 如何能够使无人机工作自主能力更高更强,使用更加便捷,是无人机 技术发展的方向。

图像传输:按传输速率和带宽可分为静止和活动两类。

静止的图像传输有:可视图文、传真、静止图像等,此类信息量 小,可在话路或低速数据等窄带信道中传输,一般需要数秒或数十秒 的时间。

活动的图像传输有:可视电话、会议电视、电视等,此类信息量 大(带宽1~6MHz和30MHz以上),在电缆、微波、光纤和卫星等 宽带信道中传输。

目前,无人机采用的图像传输系统大部分为模拟信号传输系统。 然而,模拟信号传输图像有以下缺点:传输距离短,传输数据量小, 传输过程易受干扰,因此无法满足工业级无人机传输需要。

也有一些无人机通过通信运营商所建立起的网络进行高速图像传 输,但是仍存在以下问题:费用高昂,在人烟稀少信号差的地方不能 保证正常工作。

因此,对无人机而言,创建一套费用合理、能将航拍视频实时高 速回传的系统是有重要意义的。

本实用新型的目的在于提供一种使用在无人机上的航拍视频实时 高速回传系统,其不仅费用合理,而且能够实现无人机航拍视频的高 速回传、地面站端航拍高清显示以及航拍视频文件的实时地面站端存 储。

为了实现上述目标,本实用新型采用如下的技术方案:

一种使用在无人机上的航拍视频实时高速回传系统,分为无人机 端和地面站端,其特征在于,

前述无人机端包括:图像采集设备、编码和调制设备以及发射天 线,其中,前述图像采集设备搭载在无人机上,用于采集视频信号, 输出高清的数字信号,前述编码和调制设备用于对图像采集设备输出 的数字信号进行压缩,并频谱搬移到高频处,使数字信号变为高频率 的电磁信号,前述发射天线用于将经前述编码和调制设备处理后的电 磁信号发送给地面站端;

前述地面站端包括:接收天线、解调和译码设备、地面站显示器 以及内存设备,其中,前述接收天线用于接收无人机端发送来的电磁 信号,前述解调和译码设备用于对前述接收天线接收到的电磁信号进 行变频、滤波和解调,得到高清的图像信息,前述地面站显示器和内 存设备用于将经前述解调和译码设备处理后的高清图像信息分别进 行显示和存储。

2、根据权利要求1前述的使用在无人机上的航拍视频实时高速回 传系统,其特征在于,前述高频率的电磁信号的频率为2.4GHZ。

本实用新型的有益之处在于:采用数字信号传输,使得无人机地 面站端收到的信号为数字信号,经过变频、滤波和解调后,得到高清 的图像信息,并可以将飞行信息直接整合并显示在地面站显示器上, 大大方便了地面站人员的操作;我们还可以对飞行信息进行存储操 作,并进行分析和处理,大大的提高了作业效率。

图1是本实用新型的航拍视频实时高速回传系统的组成示意图。

以下结合附图和具体实施例对本实用新型作具体的介绍。

参照图1,本实用新型的航拍视频实时高速回传系统,其使用在 无人机上,分为无人机端和地面站端。

下面分别介绍无人机端和地面站端的组成。

无人机端包括:图像采集设备、编码和调制设备以及发射天线。

图像采集设备(例如相机)搭载在无人机上,用于采集视频信号, 输出高清的数字信号。

图像采集设备输出的高清数字信号不能直接被传输,故采用编码 和调制设备对图像采集设备输出的数字信号进行压缩,并频谱搬移到 高频处,使数字信号变为高频率的电磁信号,该高频率的电磁信号的 频率为2.4GHZ。

发射天线用于将经编码和调制设备处理后的电磁信号发送给地面 站端。

为了加快数字信号传输的速度,我们采取了数字信号压缩技术, 大大的降低了信号传输的数据量。

在无人机端,本实用新型的回传系统将其图像采集设备输出的高 清数字信号压缩并频谱搬移到高频处再在信道中传输,这样的高频信 号失真率小,具有较强的可恢复性,且抗干扰性极强,不容易受到地 面和空中的一些杂波的干扰,所以本实用新型的回传系统可以获得高 清传输的效果。

地面站端包括:接收天线、解调和译码设备、地面站显示器以及 内存设备。

接收天线用于接收无人机端发送来的电磁信号。

解调和译码设备用于对接收天线接收到的电磁信号进行变频、滤 波和解调,得到高清的图像信息。

地面站显示器用于将经解调和译码设备处理后的高清图像信息进 行显示。

内存设备用于将经解调和译码设备处理后的高清图像信息进行存 储。

为了更好的显示回传回来的图像,我们可以在地面站端加装滤波 装置(未图示)。

传统的地面站端显示的图像都是模拟信号传回的经过调制后的信 号,为了保证接收信号有一定的幅度,需要将传输信号进行放大,但 与此同时叠加于信号上的噪声也被放大了,由于模拟信号的幅度值是 连续的,所以很难将信号与噪声分开。随着传输距离的增大,噪声积 累就越来越大,导致传输质量严重的恶化。加之模拟信号不便于加密 和存储,给无人机的使用带来了很大的安全隐患和不便。

本实用新型的回传系统,其采用数字信号传输,使得无人机地面 站端收到的信号为数字信号,经过变频、滤波和解调后,得到高清的 图像信息,并可以将飞行信息直接整合并显示在地面站显示器上,大 大方便了地面站人员的操作。

传统的图像信息是存留在无人机上的相机内存储,地面站操作人 员观察到的只是模拟的信号图像,并不能直接存储在地面站上,只得 等无人机返航后,才能取下相机进行分析和处理,此时往往错过了一 些问题的处理时机。本实用新型的回传系统,其很好的解决了这个问 题,由于回传回来的就是高清图像的数字信息,对其进行解调后得到 的直接就是高清的数字图像,此时我们可以对其进行存储操作,并进 行分析和处理,大大的提高了作业效率。

需要说明的是,上述实施例不以任何形式限制本实用新型,凡采 用等同替换或等效变换的方式所获得的技术方案,均落在本实用新型 的保护范围内。

}

2017年7月,我发布了一个关于人工智能、机器学习和深度学习的入门视频。从那以后,我一直痴迷于阅读关于机器学习的报道。

一般来说,你会在媒体的头版上看到两类报道。一类报道的标题是“机器人来抢你的工作”,这预示着,我们的社会将无情地走向大规模失业。甚至像麦肯锡这样“清醒的”组织似乎也在预测,到2030年,三分之一的工人会因为自动化而遭到失业的厄运。

如果这还不够吓人的话,这里是另外一类报道的标题:“天网,正在为你的孩子而来。”换句话说,人工智能将在任何事情上都比人类聪明,而我们最终将成为地球上失败的物种。

但是,如果你翻到报纸的最后几页,或者阅读更多的期刊,你会发现另外一些故事,比如科技公司向首次借款的人提供贷款,为病人提供血液和疫苗,以及在战场和海上拯救生命。

因此,通过仔细、深思熟虑、移情设计,我们可以让自己活得更长、更安全。

我们可以创造就业机会,在那里我们可以做更多创造性的工作。我们可以更好地了解对方。但是在我谈到今天已经发生的许多例子之前,让我更广泛地分享一下人工智能生态系统中正在发生的事情。

人工智能生态系统中发生了什么

人工智能生态系统正在蓬勃发展,从大学到企业,再到世界各地的政府大厅。这里有三个轶事可以说明这个生态系统是有多活跃。

首先,这里有一个来自人工智能学术研究领域的有趣事实。

研究人员最大的学术会议是一个名为神经信息处理系统(NeurIPS)的会议。会议始于1987年,在过去一年(2018年) ,会议门票在11分38秒内销售一空。

好吧,这还比不上碧昂斯(Beyonce),她那体育场大小的演唱会的门票能在22秒内销售一空,但我们正在接近这一目标。

其次,各行各业的企业似乎都在投资人工智能。这是埃森哲首席技术官保罗·多尔蒂(Paul Daugherty)的观点,他已经在公司工作了30多年。

最近,保罗做客A16Z播客时,他分享道:

我已经在我的公司工作了32年,在这个行业工作了一段时间,并且参与了从我们的互联网业务到我们的云-移动物联网业务等所有这些业务的增长过程,没有什么能像人工智能现在这样,在整个组织中快速发展。

从实际支出、员工人数来看,没有哪种趋势增长得如此之快,无论你采用何种衡量标准。就企业影响而言,人工智能是我们所见过的增长最快的趋势。这也是所有这些跨行业、跨部门的多样化趋势中的第一个。

第三,随着学术界发表更多论文,企业实施更多项目,政治家们自然而然地试图将自己的国家或地区,定位为地球上最适合建立人工智能驱动的创业公司或进行机器学习研究的地方。

许多国家都宣布了培育人工智能生态系统的计划,没有哪个国家比中国更重视这个问题。中国希望,到2030年成为人工智能领域领导者。甚至发布了一些信息图表:

现在,是我们所有人共同利用这巨大的能量造福全人类的时候了。

通过深思熟虑、谨慎和富有同情心的设计,我们真的可以让自己更有创造力,成为更好的决策者,活得更长,在现实世界中获得超能力,甚至更好地理解彼此。

让我分享一些来自真实世界的例子,说明人工智能是如何在这些方面帮助我们的。

自动化程序使我们更有创造力

莎士比亚(Shakespeare)让哈姆雷特(Hamlet)这样评价人性:

人类是一件多么了不起的杰作!多么高贵的理性!多么伟大的力量!多么优美的仪表!多么文雅的举动!在行为上多么像一个天使!在智慧上多么像一个天神!

虽然我们有逻辑和理性,但我们也有惊人的创造力(“无限的能力”)。

当机器自动完成日常任务时,我们将有更多的时间、精力和注意力用于机器目前不擅长的所谓“右脑”思维,如整体思维、移情、创造力和音乐感。

我们越来越依赖亚马逊Prime及其全球同类的产品,它们提供当天或两天的免费送达服务。为了满足我们的需求,亚马逊一直在离我们家越来越近的地方建立配送中心,并部署了成千上万的 Kiva 机器人将25磅重的黄箱子从一个地方搬到另一个地方。

除了这些机器人,亚马逊还雇佣了成千上万的人类工人来辅助Kiva 机器人,并解决机器人卡住的问题。

上图所示的尼萨·斯科特(Nissa Scott)在《纽约时报》的一篇文章中谈到她的工作时说:“对我来说,这是我们这里最具挑战性的事情。这不是简单的重复。”

当机器接管简单重复的任务时,人类就可以自由地做他们最擅长的事情:跳出条条框框思考,用创造性的方式解决复杂的问题。

许多销售和营销人员,花了几个小时将数据繁琐地输入到他们的客户关系管理( CRM )系统中。但是尽管销售管理部门尽了最大努力,这些系统也经常丢失数据,更糟糕的是,经常会填错信息。

我们的投资组合公司People.ai,使用机器学习将数据自动填充到CRM中。

有了完整的、最新的客户关系管理系统,销售和市场营销人员,最终可以根据他们希望从客户关系管理系统中获得的洞察力来行动。

比如,知道我们应该在周五下午给我们的潜在客户艾莉森(Alison)打电话,因为这是她真正想了解新系统如何帮助她处理日常事务的时候。

通过帮销售人员将数据键入CRM的日常任务中解放出来,他们可以专注于理解他人的问题,并利用他们的同情心和创造力来帮助解决这些问题。还有什么地方可以让我们的日常工作自动化呢?为审判做准备怎么样?为审判做准备的第一步是收集证据。

传统上,出庭律师在准备为案件辩护时,会筛选成千上万的文件、照片、视频、电子邮件和其他证据。他们必须弄清楚哪些文件与案件有关,它们是关于什么的,以及它们是如何联系在一起的。没有软件,律师助手梳理每一个文件或图片可能需要几百或几千个小时。

我们投资的一家公司 Everlaw 简化了这个过程,它使用机器学习快速处理、分类和标记与案件相关的文件,并以容易访问的方式存储它们。

因此,处理该案件的律师能够利用自己的才能,从事更具创造性的工作,将各个点连接起来,提出一个引人注目的大故事,让陪审团能够更清楚的了解案件。所谓的自然语言处理( NLP )系统,能够理解语言的软件,也在其他应用程序中找到了自己的路。

Dialpad是一种基于网络的电话和会议服务,可以转录你的谈话录音。转录后,Dialpad会使用一种叫做情绪分析的机器学习技术,来分析文本中是否有愤怒或沮丧的迹象。

如果系统检测到人们感到沮丧,它可以帮助人们利用自己的创造力、同情心和智商让谈话回到正轨。

我们也可以把这些技术带到医生的办公室。

上次我拜访我的初级保健医生时,他和我在一起呆了大约35分钟,在那段时间里,他和他的笔记本电脑互动,而不是和我互动,努力让我的电子健康记录保持最新。

Suki是一家创业公司,致力于通过聆听病人和医生之间的对话,自动更新病人的医疗记录,重新将医生和病人连接起来。

通过自动化常规任务,医生可以专注于病人护理的创造性、移情性和情感性部分。

当这些技术(以及帮助诊断问题的系统)进入大多数医生的办公室时,我相信我们会根据谁的临床方式最好来选择我们的医生,因为诊断和保持系统的最新大多都会是自动化的。

机器学习给了我们现实世界中的超能力

我们的人类感知系统是惊人的。你的眼睛可以以非常细致的分辨率分辨1000万种不同的颜色。但是我们的感知系统也有众所周知的局限性。这就是为什么我们有炸弹嗅探犬,而不是炸弹嗅探人。

我们的记忆也比我们许多人想承认的要糟糕。我们的大脑被设计成为了有充分的理由忘记你所看到和听到的很多东西。

如果我们能够围绕人类感知系统的局限性进行设计,并在现实世界中赋予自己超能力,会怎么样?机器学习正在帮助我们做到这一点。例如,Pindrop 赋予银行、零售商和政府组织超级听力的力量。

Pindrop的服务有助于防止语音欺诈,这是黑客窃取身份和金钱的越来越常用的方式。

通过分析近1400种声学属性,这个系统可以帮助组织在你打电话的时候确定你是否真的是你,这仍然是我们与商家,政府机构和银行打电话过程中互动的78%。

它通过倾听我们的声音(随着年龄的增长,声音会加深到中年,然后音调会升高),以及我们的电话和电话网络在线路上引入的噪音,来做到这一点。

使用专有的机器学习算法,Pindrop可以利用线路上的噪音,来预测你是在家中用iPhone打电话,还是在爱沙尼亚用 Skype 打电话。这种超级听力能力,有助于组织大幅减少成功欺诈企图的数量。

在Ox和Bowery Farms等公司运营的室内农场中,机器学习也给我们提供了越来越多的超能力。

作为人类,我们很难观察事物生长缓慢的过程,并随着时间的推移进行比较:我们的感知系统,被设计用来注意快速移动的捕食者,而不是生长缓慢的菠菜。

另一方面,机器视觉系统可以被训练,能够准确地知道一棵健康的生菜在它生命的第36天应该是什么样子。

对于不能茁壮成长的莴苣,农场可以自动调节温度、光照条件、水位、营养成分、湿度和其他因素,以帮助它达到最佳的健康状态。

这些室内农场的作物,产量可高达每平方英尺15磅,而高效温室和田间种植作物的产量分别为每平方英尺7磅和每平方英尺1磅。

而且,在不使用杀虫剂和减少95%的水的情况下,这些作物的产量也可以达到这些增长效率。超级视觉的力量使我们成为更有效率的农民。

超级视觉也可以在工厂内部使用。

尽管世界范围内对机器人技术进行了大量投资,但大约90%的工厂工作仍由人手完成。挑战在于,工厂里面指出了大量的成本,很难让工人继续做这些工作。美国一家经营非常好的工厂可能每年有30%的营收,用来支付昂贵的再招聘和再培训费用。

在中国,每天有2%的工人流失率并不罕见,这意味着几个月后,你就会有一个全新的劳动力队伍。鉴于成本如此之高,工厂将培训每位新员工的成本降至最低是至关重要的。

Drishti正在给这些工厂带来超级视觉能力。

通过在工人组装产品时捕捉和分析视频,系统可以为每项工作提供个性化的行动建议,帮助他们跟上进度。使用Drishti的工厂劳动生产率提高了25 %,错误率降低了50%。

当我们给建筑工地带来超视视觉能力时,我们可以帮助全体员工保持安全、预算和进度。Doxel每天下班后都使用激光雷达(与自动驾驶汽车上使用的激光雷达相同)和摄像头从地面机器人和无人机上收集数据。

通过构建精确的3D地图(精确度高达2mm ),Doxel 知道已经建成了什么(“是什么”),并将其与建筑平面图(“应该是什么”)进行比较。然后它可以预测建筑的主要部分何时完工。

这种每天进行地循环任务,有助于保持合适的工人在合适的时间、用合适的材料和工具到达现场。这也有助于防止你在自己的房屋改造项目中可能遇到的错误,比如在水管工或电工修完墙后的管道或电缆之前,就先把墙修好。

使用Doxel的这个系统,Kaiser Permanente帮助建筑工人提高了38%的生产率,并在建造Viewridge 医疗办公室时,节省了11%的预算。

当然,谈到人工智能的超能力,我们不能不谈论自动驾驶汽车。先进的驾驶员辅助系统会导致二级效应之一,是我们将在事故现场有可靠的目击者。

不管一辆自动驾驶汽车走到哪里,我们都会有十几台摄像头、几台激光雷达、多台雷达和超声波传感器等的传感器数据。

想想这对法院和保险公司意味着什么。不用再依赖目击证人的证词,甚至在周围没有人的情况下,我们可以重现事故现场发生的情况。

2018年9月,特斯拉向2017年8月后生产的汽车发布了9.0版辅助驾驶软件。有了这个软件版本,用户可以将汽车的摄像头数据存储到一个 USB 闪存驱动器中,许多司机也开始这样做。

去年12月26日,在北卡罗来纳州的希科里,一群皮卡司机用他们的卡车堵住了通往一个特斯拉超级充电站的路,并大声辱骂特斯拉,直到他们被赶出该充电站。特斯拉车主和Reddit用户莱斯纳(Leicina)在附近的超级充电站停下来充电,但所有的充电桩都被3辆大卡车堵住了。

幸运的是,事故中没有人受伤,但是仪表盘上的录像片段表明,在没有目击者的情况下,有摄像头是多么有用。本田司机显然非法操纵,如果没有录像片段,这种情况可能会演变成一场僵局,两个司机都会坚称他们没有责任。

下面是我在这一部分的最后一个例子,说明机器学习系统是如何在现实世界中给予我们超能力的。

一家名为 OrCam 的以色列公司生产了一种名为“MyEye 2”的产品,它可以夹在一副眼镜上,帮助有视力问题(如失明、视力障碍、阅读障碍)的人们在世界上导航。

这个产品用于拍摄周围的环境,并描述视频中的内容。

它可以阅读一本书中的文字、当人们靠近时说出他们的名字(这是一个我很喜欢的功能,尽管我的视力很正常!) 、区分5美元和50美元的钞票,区分食品杂货店的产品等等。

帮助我们做出更好的决定

机器学习算法,可以帮助我们做出更好的决策,通过将人类的偏见最小化,使用更完整的数据集,或者弥补我们决策软件中已知的缺陷。

虽然古老的计算机科学公理“垃圾输入,垃圾输出”仍然适用,但精心设计的具有完全代表性数据集的系统,可以帮助我们做出更明智的决策。

考虑一下招聘场景。Textio开发了一种软件产品,帮助人们写工作描述,这种描述最有可能吸引有资格、有能力做特定工作的人。这家公司由一个微软 Office 老员工团队创办,在你写内容时在屏幕上提供指导。

例如,当你在某个特定的时间点,使用某个性别比另一个性别更有吸引力的词语时,Textio 会提醒你。

诸如详尽、强制、无畏之类的词汇已经被统计学证明,会让你的人才库偏向男性。

Textio还指出了地区差异。

例如,如果你用“好的职业道德”来描述你的理想候选人,这可能会吸引圣何塞的工人,但会阻止华盛顿地区的工人。如果你的目标是埃弗雷特的候选人,最好不要说这句话。

鉴于Textio可以访问广泛的数据集,比如现有的职位描述、应用统计数据和工作表现数据等等,可以帮助你消除招聘过程中的盲点。

机器学习还可以帮助你,找出是什么让你最优秀的员工如此高效,并帮助你在第一天就把新手变成专家。Cresta.ai观察最有效的销售人员在聊天时如何与潜在客户互动:弄清楚潜在客户需要什么,推荐产品,回答问题。

这个系统提取最佳实践方案,并将其转化为实时建议,供经验不足或效率较低的销售人员在与潜在客户互动时使用。

在 Intuit 这样的客户部署中,销售团队的转化率上升了20% ,培训时间节省了66%。换句话说,与没有使用这个系统相比,销售代表在培训较少的情况下完成了更多的业务。

这个系统对销售人员和客户都有好处。

正如一位 Intuit 代表所描述的,“我担心使用这个系统会破坏与客户的个人关系或对话,但是将这个人工智能作为工作助手,有助于展开个性化对话。”机器学习也有助于提高非常熟练的专业人员的决策能力,例如寻找特定矿物的地质学家。

锂离子电池(如手机、笔记本电脑或电动汽车中的电池)内部可能含有一种叫做钴的矿物质,这种矿物质可以帮助电池在多次充放电循环后依旧保持性能。随着特斯拉的Gigafactory等电池工厂生产更多的锂离子电池,钴的需求正在迅速增长。

不幸的是,世界已知钴储量的65%在刚果民主共和国,这个国家政治不稳定,据报道可能有多达40000名儿童在开采钴矿。

如果我们在刚果民主共和国政府中有一个可靠的政治伙伴,我们可能会努力改善所有矿工的工作条件,但是我们也应该寻找新的钴来源。

通过查看许多不同的数据源,如地形数据、在某一地区生长的植物、磁和电磁模式、水和天气模式、岩石类型等等,在我们派遣非常昂贵的探险队开采之前,这个系统可以帮助地质学家找到钴的可能存在的位置。

另一个很好的例子是金融技术。

向首次借款人发放贷款是有风险的,尤其是在第三世界国家,如肯尼亚、坦桑尼亚或尼日利亚。在这些国家,信用机构要么不存在,要么无法接触到所有人,致使很多人无法获得传统贷款。

我们的投资组合公司Branch,一直致力于在这些领域为首次借款人提供贷款。

在没有信用机构的情况下,Branch试图根据借款人的移动应用程序使用情况和通过其移动应用程序收集的行为来确定借款人的资格。使用机器学习,Branch分析了数据,并确定了几个行为指标,这些指标已经被证明,可以预测贷款偿还的可能性。

以下是一些令人惊讶的因素或行为,使得Branch的借款人更有可能偿还贷款的特征:

使用三星或HTC等品牌的手机

在手机上运行赌博应用程序

除了最后一个指标,列表上的大多数指标都不太令人惊讶。数据发现,如果一个人是赌徒,并且手机上有赌博应用,他们更有可能偿还贷款。

如果你觉得这有点违反直觉,你并不孤单。这只是证明了一个人类决策者是多么的不靠谱,这是由于个人偏见和过去的经验造成的。

这是否意味着算法在所有决策方面都比人类好?还没有。

从组织样本中比较癌症诊断性能的研究显示,例如哈佛医学院2016年6月发表的这一项研究和谷歌AI Health研究员2018年10月发表的另一项研究,当人类与算法竞争时,始终提供最准确诊断的是人类+算法,它们的表现优于单独的算法和单独的人类。

为了让你了解医生用来诊断癌症的方法,这里有两张并排的图片。左边的一张显示了已经染色的组织切片。右边的图显示了计算机视觉算法叠加“热图”的结果,热图显示了它认为更多(红色)或更少(蓝色)含有癌组织的区域。

为什么人类使用的算法比单独的算法和单独的人表现更好?一种可能性是,这些算法改进决策的方式,与语法和拼写检查有助于提高我们的写作水平的方式相似。

一般来说,这些检查器能很好地发现我们的打字错误和语法错误(真正的优点)。但是偶尔,检查器会标记出错误(假阳性)或者给出一个你不同意的语法暗示。

在这些情况下,你最终将重写检查器。这种过程最终的结果是,写出的东西比任何一方自己写出的东西都要好。

将危险的工作和任务自动化使我们更加安全

有些工作显然是危险的,例如海上救援、向偏远地区运送血液和疫苗,以及冲进大楼看看里面是否有敌对士兵。创业公司和非营利组织正在帮助实现这些工作的自动化。

一个叫“Little Ripper”的组织正驾驶无人机在海洋上空搜集视频画面。他们计划建立一个识别水中鲨鱼的机器学习模型,作为冲浪者和游泳者的早期预警系统。

在一次收集录像的训练任务中,一个真实的求救电话打了进来。

在70秒内,无人机操作员就飞到了遇难游泳者身边,把救生背心扔给他们,营救他们,所有这一切都不需要派一队救生员进入危险的海浪中。

Zipline,我们的投资组合公司之一,正在努力为卢旺达全国人民提供救命的血液和疫苗。他们以无人机为基础的输送系统非常普遍,以至于现在卢旺达输血所用血液的25% 都是他们提供的。大多数快递都在半小时内完成。

这家公司现在正在将他们的配送系统扩展到加纳,并已开始在美国进行试飞。

最后,我们的投资组合公司Shield.ai正在制造一种无人驾驶飞机,以增强美国军队今天执行最危险的行动中的人类士兵的能力。

这被称为“清理”,它涉及派遣武装的人类士兵进入他们从未见过的建筑。这家公司的Nova无人驾驶飞机,在清除存在未知敌人的建筑物时,对士兵来说是一种无价的帮助。

它能够探索并传送建筑物通道的详细地图,同时使用机器学习算法将建筑物内的居住者标记为朋友或敌人。

海上救援,快速向偏远地区运送血液,清除可能存在潜在对手的对建筑:这些工作中的每一项,显然都很危险。令人惊讶的是,根据美国劳工统计局的数据,美国最危险的工作之一是长途卡车运输。

这个职业的死亡人数比其他职业都要多,而且这个已经令人痛心的数字还没有考虑到长途货运对健康的负面影响。

长途卡车司机的肥胖率是普通人群的两倍多,而且风险还不止于此。肥胖会增加一个人患糖尿病、癌症和中风的风险,而且由于工作本身的压力,卡车司机更有可能通过饮酒和吸烟来缩短寿命。

我们必须尽快让这些卡车司机下车,这需要我们能建立起比人类司机更安全的自动驾驶系统。驾驶客车也非常危险。世界卫生组织估计每年有120万人死于道路交通事故。

这是15至29岁年轻人死亡的主要原因,世界卫生组织认为,从致命的交通事故中恢复过来消耗了世界GDP的3%。

一旦自动驾驶系统足够安全,可以控制方向盘,我们就必须让人类驾驶员下车,我们有一组投资组合公司在这个生态系统中积极开发产品和服务。

DeepMap正在构建精美详细的3D地图,这些算法可以用来安全地为我们在道路上导航。

Applied Intuition创建了模拟系统,帮助工程师测试和重新测试他们的算法,以确保他们创建的算法在暴露于各种条件下时,行为完全符合预期。

Voyage在退休社区内提供自动化出租车服务,这样即使我们失去了驾驶能力,我们也可以保持自己独立行动的能力。Cyngn 正在开发一整套自动驾驶软件,这些软件可以在各种各样的车辆中使用。

机器学习将帮助我们更好地理解彼此

你可能认为人类最有能力理解彼此。毕竟,谈话的另一方是另一个人类。

但事实证明,精心设计的软件实际上可以帮助我们更好地了解彼此。想想被诊断患有自闭症的人。

总部位于剑桥的两家公司 Affectiva 和 Brain Power 已经开发了应用程序,通过使用简化的表情符号,帮助自闭症患者认识到周围人的情绪状态,以便他们能够适当地调整自己的行为。

他们的系统通过谷歌眼镜分析视频,并将适当的表情叠加在一个人的脸上,帮助佩戴者最准确地理解与他们交流的人的情绪状态。

这是一个正在运行中的系统:人工智能研究的最初目标之一就是机器翻译,也就是把一种人类语言翻译成另一种语言。

这个领域最困难的挑战是同步实时翻译:当一个人用一种语言说话时,系统会自动及时输出另一种语言的翻译,这样两个人就可以进行自然的对话。

这种类型的翻译非常具有挑战性,就算是专业的联合国翻译人员一次只能工作20分钟,然后他们就会被一个队友接替。

2018年10月,百度发布了同步翻译系统 STACL (即带有预期和可控延迟的同步翻译系统) 。鉴于技术挑战是如此之大,人工智能社区朝着这个目标正在取得坚实的进展,这令人印象深刻。

为了跟上说话者的步伐,机器学习系统实际上会生成多个预测,预测说话者开始说话时每个句子将如何结束。这有点像谷歌在你的浏览器的搜索栏中的自动完成功能。

系统需要为一个句子创建和翻译不同的可能结尾,因为如果不这样做,它就会落后于说话者。

想象一下,在我们走进的每个会议室或打开的每个浏览器窗口的每次网络呼叫中嵌入实时翻译,我们可以更好地理解每个呼叫。下面是最后一个例子,说明如何更好地理解对方,这可能是我在整个演讲中最喜欢的例子。

有一个叫做Crisis Text Line的非营利组织,它通过短信向处于危机中的人们提供咨询。

上一代人在面临危机时可能会拨打热线电话,而现在这一代人则更喜欢发短信。

当Crisis Text Line启动时,他们要求训练有素的顾问列出50个触发词,这些词可以用来预测高风险短信发送者。

他们生成的单词通常和你想象的一样: 比如“死”、“割”、“自杀”和“杀”。在这项服务运行了一段时间之后,这家公司应用机器学习技术,看看是否还有其他单词可以从列表中添加或删除,结果非常令人惊讶。

你知道布洛芬这个单词预测自杀的可能性,是自杀这个词的14倍吗?哭丧的表情是是自杀这个词的11倍吗?斯坦福大学的研究人员,接着提取了最有效的咨询师的的最佳实践。

他们发现有效的技术之一是创造力:成功的咨询师以创造性的方式回应,而不是使用过于笼统或“模板化”的回应。

在危机咨询的极端情况下,机器学习帮助我们更好地了解彼此。

虽然机器学习软件,在使我们成为更好的人类方面有很大的潜力,但是如果我们没有故意的、深思熟虑的和同情心的话,我们就不可能达到这个目的。

“垃圾输入,垃圾输出”的说法仍然成立,而且随着我们越来越信任基于人工智能的系统,这种说法可能更具潜在危险性。

话虽如此,对于如何最大限度地提高人类的繁荣,我有三个建议。

为了打击“垃圾输入,垃圾输出”,我们必须用高质量、包容性的数据来训练我们的机器学习系统。Ai4all、 OpenAI 和Partnership for AI等组织正在发布最佳实践(关于包容性和安全性) ,供研究人员和产品团队在设计系统时使用。

我们必须学会使用像埃森哲、谷歌和微软这样的组织提供的数据质量工具和概念框架。

随着公司和组织朝着一个包容、安全的机器学习系统的未来发展,组织规模不断扩大,他们经常发现自己需要雇佣一名全职思考这些问题的高管。

这是硅谷最热门的新职位之一:人工智能伦理和政策总监。

第二,我们不要把这变成核军备竞赛的重演,一场零和竞赛。

与20世纪80年代开始的专有数据库时代相比,随着开源代码库(如谷歌的TensorFlow、Databricks的mlflow、无处不在的Keras和scikit-learn )和共享数据存储库(来自Kaggle、UCI、Data.gov等组织)的激增,我们在机器学习社区已经有了更好的开端。

但是我们还有很长的路要走。

虽然来自各个国家的专家,可能想把这变成一个零和游戏,一个国家以另一个国家为代价取得成功。

但我们可以、而且应该共同努力,实现机器学习支持的软件对所有人的承诺,而不管其国籍如何。

虽然预测就业的未来超出了这个报告的范围,但是我注意到像 Gartner 这样的组织,最近的研究预测,在未来几十年里会有新的工作机会,而之前的研究,则预测未来几十年会有大规模的失业。

我喜欢我的朋友李开复在他的《人工智能超级大国: 中国、硅谷和世界新秩序》一书中提出的框架。

想象两个坐标轴:在 x 轴上,我们有一系列更常规的工作,而不是需要创造力和策略的工作。在 y 轴上,我们有需要同情心才能做好的工作。

李开复认为,机器学习将首先取代的工作是左下角的工作:不需要太多同情心的常规工作。但即使这些工作消失了,我们仍然有3个象限的工作:那些需要同情心的工作在图表的上半部分,以及需要大量创造力的工作。

这些工作是目前的机器学习技术还没有发展到可以取代的地步。

在思考如何让子孙后代为这些工作做好准备时,我想起了我成长过程中流行的一本书。

这本书的作者是一位名叫罗伯特·福尔甘(Robert Fulghum)的牧师,书名叫《我在幼儿园学到的所有我需要学习的东西》。在书中,他认为我们应该在孩子身上培养人类的价值观:同理心、公平竞争、学会如何与他人相处、说声抱歉、想象力等等。

虽然我知道我们需要在这个基础上增加一套实用的技术诀窍,但我同意他的观点,即一个富有情商、同情心、想象力和创造力的基础,是让人们为机器学习的未来做好准备的绝佳跳板。

在这个未来,人类和算法会更好地结合在一起。

}

我要回帖

更多关于 无人机没有sd卡能拍吗 的文章

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信