你了解如何建立数据嘛?

今日份知识你摄入了么?

数据科学(Data Science)一直在不断发展。过去十年,在运营以客户为中心的服务和业务领域中,数据科学已经逐渐从“加分项”转变为“必备技能”。

与其他领域一样,数据科学的适用领域正在不断扩大,技能得到不断重塑,有关“数据科学家”的概念也不断受到挑战。 毫不疑问,企业们已开始进行内部重组,以充分利用这一变革型资产。

与此同时,新的职位出现了——应用数据科学家 (Applied Data Scientist) 但是这个职位真的是刚出现的吗?可以说,这个职位本身已经存在了一段时间,经历过一些列命名的变化,依然要求行业中最有影响力和最必需的技能。

过去,我们常见的职位有“ 数据分析师(Data Analysts)”,现在有“ 数据科学家(Data Scientists) ”,而某些公司中,出现了“ 应用数据科学家(Applied Data

简单地说,应用数据科学家是研究数据 (即数据科学)的人,其目标是通过将理论概念框架和算法应用于基础数据,为业务问题提供可行的解决方案。

应用数据科学家处理、分析、建模和解释各类数据,产生有意义的见解,并帮助解决业务问题 (很多时候,应用数据科学家可以发现更多的问题!)

应用数据科学家利用基础数据,运用合适的技术或逻辑概念,为业务问题提供有用的解决方案。

擅长“应用数据科学”的人

想要成为优秀的应用数据科学家,首先需要成为一名优秀的数据科学家。当然,你还需要充分了解正在处理的数据。而且,这通常意味着:

  • 你需要深入了解数据科学算法,包括简单的基本分析以及高级机器学习模型。深入了解这些工作原理是加分项,但并非必备技能的。与其他领域一样,帕累托原理 (Pareto’s Principle) 也适用于数据科学,20% 的算法或方法可用于解决 80% 的业务问题。

了解这些算法以及这些算法在行业内的应用非常重要。

  • 牢牢掌握实现这些应用所需的平台 (或工具/软件) 。如果你不知道如何在基础数据中使用这些算法,那么理解数据科学算法就没有多大用处。你可以通过有机器学习/统计包的编程平台,以及可以帮助进行解释和分析的可视化工具来实现。

知道如何读取、处理、清理、操作、可视化和建模数据非常重要。

你需要掌握方法的技术知识,具备实施这些方法能力,这些都是必备技能。

你需要牢牢掌握专业知识

专业知识和行业知识是应用数据科学家的关键。在分析项目期间,经常会出现需要从另一角度进行分析的情况,这时,行业知识可以帮助你将业务背景/逻辑应用其中,从而进行分析。应用数据科学家需要充分了解自己领域内的知识。

在分析过程中,专业知识可以帮助你做出决策,有没有这些知识的区别还是很大的。

采取的措施中要带有自己的见解

如果要说应用数据科学家和其他职位有什么不同,那就是,在将数据科学技术应用于基础数据后,应用数据科学家能够针对业务问题提出可行建议。

在处理数据、在其基础上使用专业知识、并进行情境化后,应用数据科学家可以讲故事的方式,将分析投入现实。该故事的结尾,是基于对基础数据的见解所提出的建议,利益相关者可以根据这些建议采取措施。

例如,在零售业中创建客户细分,就需要复杂的数据科学工作。然而,为了让业务利益相关者了解这一点,正确描绘出这些细分市场代表的客户类型非常有用。你可以解决这些客户是什么样的人、主要属于什么人群、如何购物、买什么等问题,这些问题可以帮助企业了解客户、将客户可视化并将分析投入现实。

如果数据科学家可以掌握专业知识,描述企业可以实施的策略,激活客户群体,那么这些技能就可以成为加分项了。

是什么-为什么-怎么做框架通常用于将分析投入现实,并可以帮助你根据见解决定采取哪些关键措施。

此外,应用数据科学家与客户 (或业务利益相关者)的合作非常密切,这也是他们牢牢掌握专业知识并能够将业务原理应用于数据科学问题的原因之一。与业务 (或客户)合作伙伴建立牢固的关系,也意味着他们能够知道哪些分析结果可以采取措施,以及如何采取措施。

与客户合作伙伴发展和培养牢固的关系,是不断为客户创造巨大价值的重要因素。

让复杂的事情变得简单起来

对外行来说,有些数据科学算法非常复杂,其中涉及的数学知识难度也很大,如果这个人没有数据科学背景,难度也就会更大。

通常情况下,数据科学项目中的重要利益相关者是决策者,而这些人很可能没有数据科学背景。因此,数据科学家的工作难度也就会变得很大,因为,为了可以让分析指导决策过程,使其不仅仅停留在“值得学习的知识”,获得利益相关者的支持非常重要。

这需要用简单的外行术语,向重要利益相关者解释复杂数据科学的能力,让这些利益相关者相信你的分析,从而相信你的发现。这种对复杂数学数据框架/模型的“简单外行”描述可能会根据利益相关者对数据科学知识或理解这些知识的意向而有所不同。

将复杂数据科学项目简单化,才能确保广泛的应用范围。

必备知识 - 好的分析 vs. 更好的分析

应用数据科学家所进行的项目有短 (2-3 天)有长 (数周),并且需要经常处理不同周期的项目。 这种时间跨越意味着,利益相关者有时会临时进行询问或提出要求,而回答或处理时间就显得非常重要。

为了解决这些问题,应用数据科学家需要全面了解企业现有产品/定制的解决方案;并且能够依靠这些利益相关者根据不同情况快速提供解决方案。你需要定期与其他垂直领域 (如产品团队、数据工程团队、商业团队等)进行交互,并密切关注这些领域之技安工作的相互联系。

项目多半不会从零开始,而是要运用你的知识和技术去处理数据。

此外,要注重回答或处理时间的项目,就需要了解什么是好的分析,什么是更好的分析?知道何时使用最佳科学算法深入分析,vs.何时使用更简单的框架,并及时完成分析可以帮助应用数据科学家做出决策。

如果业务结果取决于分析时,长期以制定优秀解决方案为目标,同时及时交付优秀的解决方案是不错的想法。

这个职位也许不是刚刚才出现的,但却与之前不同。

在数据科学领域,该职位当然不是第一次出现。然而,该职位还是存在不同之处,与一般的数据科学家相比,应用数据科学家的定义更加精确,也更好区分。

应用数据科学家的优势:

  • 最显而易见的就是学习——应用数据科学家可以学习数据科学、技术的应用、重要工具,并逐渐积累扎实的专业知识。
  • 定义明确的职位——身处该职位的人更清楚公司想要的是什么,并且能够设定明确的目标,实现这些目标。
  • 由于应用数据科学家与客户密切合作,他们经常可以看到在分析背后做出的决策,并且清楚地看到他们的工作带来的影响。
  • 跨项目与多个利益相关者合作,这通常意味着应用数据科学家拥有跨多个垂直领域地强大网络。
  • 应用数据科学家通常可以根据他们掌握的众多技能为自己开辟不同的职业道路 (他们强大地人脉显然非常有用)

应用数据科学家vs.研究型数据科学家

某些公司拥有唯一的“数据科学家”岗位,而有些公司有两个数据科学家岗——应用数据科学家和研究型数据科学家 (请注意,其中任何一个都可以被称为“数据科学家”)

应用数据科学家和研究型数据科学家有区别吗?

这是非常重要的问题。在我看来,这两个职位所需的技能集之间没有太大区别,并且两者可以在需要时互换。然而,由于工作方式的本质或公司想要的结果不同,有时两者之间有时存在细微差别。

让我们看看这些细微区别,以便更好理解两者:

两个岗位中,所需的数据科学技能没有什么不同。公司希望研究数据科学家深入研究问题 (垂直深度重要),而应用科学家则希望全面了解更广泛的数据科学问题和解决方案 (即横向覆盖更重要)

  • 根据两者工作性质不同,应用数据科学家可能不太了解所有数据科学算法,而研究型数据科学家会或多或少了解一些。
  • 应用数据科学家会更擅长广泛应用其中 20% 的概念,这可以帮助他们解决 80% 的数据科学问题。
  • 两者都可以处理复杂的高级分析、机器学习、Python问题等;然而,应用数据科学家始终会考虑到实际的适用性,而研究型数据科学家更侧重深入研究问题。

同样,两者没有很大不同。这两个职位都需要详细了解业务问题,才能将其转化为数据科学问题,提供数据支持的解决方案。然而,由于工作性质不同,应用数据科学家将更接近利益相关者,因此将获得更广泛或更深入的商业目标,帮助他们从分析中获得可行结果。

在我看来,拥有两个独立的岗位更好,公司可以根据员工个人意愿,提供深入或广泛的选择。而公司的认知更清晰,对公司和员工都非常有帮助。

每当我想到当今世界的应用数据科学,这些词就会浮现在我的脑海中——有趣、动态和高回报。

应用数据科学 | (图片由作者提供)

应用数据科学家似乎在适用的技术专长和业务知识之间取得了完美的平衡,让自己的工作变得更有影响力。

感谢你的阅读!你听说过这个职位吗?有什么自己的看法?欢迎在文章下方留言!

机器学习VS深度学习:有什么区别?

DS vs DE:数据科学家与数据工程师的薪资对比

新兴报表工具FineReport——商业分析师需要知道的三种报表

数字营销是怎样通过数据分析赚钱的?

点「在看」的人都变好看了哦

}

  产业勃兴,数据标注员成为新兴职业。目前国内至少有大小近千家标注公司,共20余万名数据标注员。

  在上海徐家汇一家广告公司做文案的索琳,从未想过自己也能参与打磨人工智能的应用。她最近接到任务,教一位只存在于手机应用程序里的“老爷爷”与用户对话。比如,当用户问“世界上谁最美”,他就会回答“当然是你最美”。一问一答均由索琳事先写好,再由一家擅长语音识别的人工智能(AI)公司植入。索琳编写了近3000条问答,一心想把“老爷爷”培养得更风趣、睿智。不过,实际上她只是提供了最基础的数据。

  一千多公里之外的贵州惠水县百鸟河数字小镇,一家提供数据服务的公司,22岁的吴潘威正对着电脑用鼠标“贴标签”:将一张普通道路交通图中的机动车、行人、非机动车逐一框中……和索琳教机器对话一样,吴潘威贴标签的目的是教人工智能看图识物,他们被叫作“数据标注员”。

  当前,以互联网、大数据、人工智能为代表的新一代信息技术日新月异。人工智能在去年、今年两度被写入政府工作报告;而大数据,已经成为世界认识贵州的新名片。在脱贫攻坚主战场的贵州,大数据的经济增速已连续7年位居全国前列。

  在百鸟河数字小镇,仅吴潘威所在的梦动科技有限公司就有400多名标注员。他们是踩着信息技术浪潮的流水线工人。

  “教机器认识这个世界”

  这是一张微笑的普通女性的脸,她的鼻子、嘴巴、眼睛、眉毛和脸部轮廓布满了点,一共有149个,它们被叫做“人脸关键点”。

  在百鸟河数字小镇,吴潘威与同事们坐在电脑前,将图片放大,用鼠标移动这些小点,使它们落在合适的位置。吴潘威浏览了成千上万张人脸图片,在他的眼中,这些人脸没有肤色、性别、老少之分,只有清晰与模糊的区别,一张像是从监控摄像里截取的模糊图片会让他多花几倍时间。

  人工智能本身不会识别物体,而要依靠海量训练。当人脸关键点被一一标注之后,计算机才能建立起对人脸的认知。而人脸关键点的数目并不固定,不同数目的背后连接的是不同的算法。“吴潘威们”只需按照人工智能工程师们设定的数目规范来标注。换言之,这些数据标注员并不需要了解算法之复杂,他们所做的,更像在工厂流水线重复作业。

  百度无人驾驶汽车,是梦动科技接手的第一个项目。公司人工智能服务部总监曾芸说:“刚接到无人车项目时,我们所有人都是蒙的,觉得这个事情不大靠谱,毕竟无人驾驶在我们眼里是高精尖的科技。”

  2016年5月,百度派技术人员来开讲座,开诚布公——“你们就是在训导机器,教机器认识这个世界。”那时,所有人都不知道有“数据标注员”这个职业,吴潘威和一起实习的小伙伴们互相称呼“画框的”。

  可不就是“画框的”?几十个人坐在电脑前按动鼠标画框,机动车分成大型车、小型车,非机动车分成自行车、摩托车、三轮车,还有行人、交通信号灯,都要一一框起来。

  “标注员都是‘滚雪球’带教带出来的,那时一个人一天要画几百个框,以至于后来走在路上看什么东西都想画个框把它框住。”曾芸回忆说。

  “后来,看到无人驾驶汽车在美国的硅谷跑,在乌镇的世界互联网大会跑,说实话还是蛮振奋的。”吴潘威腼腆地笑着说,不管科技有多先进,至少无人车里出现的路况扫描图像他是熟悉的,“也许那就是我之前标注过的。”

  那种感觉,就像一不小心踩到了时代潮流的浪尖上。

  吴潘威是贵州盛华职业学院新近毕业的大学生,2016年初到梦动科技当实习生。在这里,一间办公室大约能容纳60名数据标注员,每张办公桌后面都藏着一张稚嫩的脸,几乎每个人都戴着耳机听音乐,同时不停地切换图片、移动鼠标,在屏幕上打点或者画框。

  他们大多是像吴潘威一样年轻的大学生。除了盛华职业学院,还有来自黔南民族医学高等专科学校等4所学校的实习生。

  但最早,这项工作并不是由实习生来做,而是那些年薪百万的人工智能工程师。

  31岁的杜霖是倍赛(北京深度搜索科技有限公司)的首席执行官,公司在北京、山西、山东、河南、四川、贵州、福建等地建设数据标注工厂,有近3000人的数据标注员团队。“对AI和数据的研究,我们很早就开始了。”毕业自上海交通大学的杜霖告知,他的创始团队均来自上海交大。

  最早在2014年,杜霖注意到,随着人工智能在商业场景的应用逐渐落地,原来由工程师在实验室完成的数据标注呈“指数级增长”,工程师们应接不暇,专业的数据加工服务公司应运而生。

  国务院发布的《新一代人工智能发展规划》显示,到2020年,我国人工智能核心产业规模超过1500亿元,带动相关产业规模超过1万亿元。杜霖判断,未来人工智能领域一定会出现巨大缺口——对于由人标注的数据的需求。“因为现在的人工智能还只是两三岁的孩子,需要我们不断地教它认识杯子、水果、玩具和汽车。”

  作为人工智能产业的下游端,“吴潘威们”对行业勃兴的感知或许是最敏感的。

  “从去年起,一个个项目接踵而至。”曾芸说,“目前梦动所承接的项目几乎囊括所有人工智能领域:图片、文本信息、语音、视频、在线审核等,其中图片是最大的一块。”

  吴潘威已经记不清标注过多少项目,“五花八门,难以想象”。无人售货超市里,商品种类数以万计,光背包就有十几种;甚至有美甲店要求训练能识别指甲区域的机器人,那样就不会把指甲油涂到指甲外……

  6月29日,在梦动科技,记者看到办公室的柜子上摆放着几十种可口可乐饮料。项目组长蒋纯洁介绍,标注员需要先记住所有产品的类别、口味、容积,同一款产品要仔细看包装颜色和图案细微的不同之处,“否则标注的时候再去看就太慢了”。

  “最奇怪的是给猫脸和狗脸打点。”项目主管贾如松说。两个多月前,他们花了整整两个星期给一万多张猫和狗的图片打点,每张脸上要打34个点,“想来想去也没想明白这到底是用来干啥的”。

  “大学生为什么要来做这个”

  吴潘威是最早一批来梦动科技的实习生之一。做数据标注员两年多,当初和他一起实习的同学大多都离开了;而在他实习期间,数不清的实习生来来往往。他们抱怨工作枯燥乏味,没什么前途。

  “大学生为什么要来做这个事情?”吴潘威也不止一次问过自己。

  出生于1999年的陆森霖是贵州盛华职业学院计算机专业的大一学生,实习近3个月了。学校离公司只有1公里左右,这是学校在产教融合方面的部署。

  陆森霖正在做的项目是语音识别,每天的基本任务是将约1800秒的语音输出成文字,将重叠在一起的几个音色分开,这会花费他五六个小时;最麻烦的是专业术语,不懂的名词要上网查;做完之后由质检员核对,如果有错误就会被打回来重新修改。

  “我完全不知道意义在哪里。”陆森霖说,“你看我开着音乐,听几百秒就切过来放首歌放松,否则一直听会受不了。”

  标注工作单调重复。“再难的项目3天之内就能随便耍了。”标注员梁红说,他是记者碰到的少有的对人工智能感兴趣才来实习的学生。

  数据标注行业有一套明确流程:上游的人工智能公司将项目交给中游的数据加工公司或众包平台,后者自行加工或分包给下游的小公司、小作坊,有的小作坊还会分发给“散兵游勇”,比如学生或二三线城市的兼职人员。

  而到了下游,项目经过层层转包,利润已经低得吓人。“这与我们一线标注员的付出是不对等的。”曾芸说,早期梦动科技只能从中游的众包平台获取项目,现在则尽量直接对接上游客户。

  如今,上游的人工智能公司仍保留少量数据标注员。“我们的全职标注团队主要是处理隐私性高和有特殊要求的数据,比如处理医疗领域的数据就需要有一定专业背景。”云从科技研究院副院长周翔介绍,“其余的数据处理便交给下游几十家数据标注团队。”在被称作“国内首档人工智能挑战类节目”的央视热门节目《机智过人》中,曾与模拟画像专家林宇辉在同一舞台竞技的,就是云从科技所打造的人工智能“御眼重明”。

  对一般的数据标注员而言,职业生涯是一眼望得见头的:从一线标注员做起,然后是质培专员(相当于质检)、项目组长、项目主管、项目经理,最后是部门总监。

  “简而言之,就像上世纪80年代的来料加工,大工厂可以,家庭作坊也可以。”梦动科技联合创始人农政说,“甚至有人把数据标注员比作流水线上的工人,几个学生、几个零散人员都可以接单。”

  农政并不否认目前数据标注确实是一个需要大量劳动力的行业,但他强调,应该看到行业发展的未来,“不能现在看到他们在画框,就判断未来十年他们还在画框。”

  今年7月,吴潘威终于作为正式员工与公司签约,成为一名商务助理。实际上,他从未想过自己能留下来。当初一起实习的有近百人,和他一样最终成为正式职工的仅有11人。他们不再做标注员,而是走上项目组长等管理岗位。

  “也许这是我们接触最前沿科技唯一的机会。”吴潘威说,他的大多数同学毕业后都去从事销售、中介等工作,而在梦动,他能与最先进的科技公司对接,感受信息技术带来的震撼。

  “不如我们发明标注机器人来解放自己”

  每天早上9时,吴潘威准时到公司。一旦进入工作角色,每个人都是紧张而严肃的,相互之间很少交流,若遇到紧急项目,他们还需要加班加点完成。

  短短两年间,从小小的鼠标一端,吴潘威便感受到了另一端世界前沿科技进步的速度,“以前无人驾驶汽车框出基本轮廓就可以了,现在不只是从2D平面进化到3D立体,还要标注车头的方向。”

  在梦动科技,“大数据,让一切变得更智慧”等标语随处可见。医疗、金融等人工智能近年来踏进的领域,都在日新月异地改变,而起点就在小镇年轻人的手指尖。百鸟河数字小镇聚集了大数据、教育文化、健康养老、文化旅游等众多公司,是当地着力发展大数据产业所建的新型园区。一幢幢彩色尖顶的欧式小楼,令小镇充满异域风情。

  实际上,数据标注本身也是一个要用人工智能来改造的行业,标注工具也正在迭代升级。比如,人脸识别最早均由人工标注关键点,但眼下吴潘威接到的项目里,机器已经打好点,标注员要做的只是最后的校正。

  在杜霖看来,其实不必把数据标注看得过于神秘,“说到底人工智能数据标注只是商业外包行业一个非常细的分类,几十年前这种数据外包业务就已存在,比如替银行处理电子表格的公司,但因为人工智能,数据标注才变成了一个独立的行业”。

  在数据标注领域,更大的潜在威胁可能并非同行竞争,而是来自机器——当算法足够先进时,少量的数据就能达到效果,到那时,还需要这么多的数据标注员吗?

  “也许有一天人工智能会全面取代人类,但数据标注员一定是最后被取代的那批人。”杜霖对此保持乐观态度,“最高明的算法也需要基础的数据学习,而数据标注员,一定是坚持到最后一班岗才把数据交付给机器模型的。”

  梦动科技人工智能服务部助理总监龚芳芳也说:“想象把人工智能当作婴儿,而我们可以把他训练成天才。”

  人们似乎乐意见到“机器天才”与人类的竞争。根据百度搜索指数,公众对人工智能的关注从2016年起呈显著上升趋势,当年3月的围棋人机大战——AlphaGo击败围棋世界冠军李世石,第一次将人工智能带入大众视野。

  人工智能是否会替代人类?

  对吴潘威来说,这并不是个沉重的话题。“标注员之间还常常开玩笑,不如我们自己发明一个标注机器人来解放我们自己。”他笑着说,“毕竟,人都是懒惰的。”

  而在通往未来无限可能性的路上,数据标注员们最大的挑战依旧是克服乏味与寂寞。

  一名年轻的标注员说,以前他与一位小伙伴会在一起比,谁今天画的框多,“他框了300个我框了400个,第二天他就不跟我说话,一直框。但是现在,他走了,我才觉得这个工作真是无趣”。

扫描左侧二维码下载内蒙古客户端,关注更多内蒙古更全、更新的新闻资讯。扫描右侧二维码或搜索内蒙古日报(或直接输入neimengguribao)关注内蒙古日报官方微信。

}

在多通道多路复用数据采集系统中,增加每个 ADC 的通道数量可改善系统的整体成本、面积和效率。现代 SAR ADC 具有高吞吐量和高能效,使得系统设计人员能够实现比以往更高的通道密度。

今天我们将说明多路复用器输入端的建立瞬变(由多路复用器输出端的大尺度开关瞬变引起)导致需要较长采集时间,使得多通道数据采集系统的整体吞吐量显著降低。然后,文中将着重阐述使输入建立时间最小化以及提高数据吞吐量和系统效率所需的设计权衡。

什么是多通道 DAQ?

如何衡量多通道 DAQ 的性能?

多通道数据采集 (DAQ) 系统是一个与多路输入(通常是传感器)接口的完整信号链子系统,其主要功能是将输入端的模拟信号转换为处理单元可以理解的数字数据。多通道 DAQ 系统的主要组成部分有模拟前端子系统(缓冲器、开关元件和信号调理模块)、ADC 及数字接口。对于高速精密转换器,开关元件(通常是多路复用器)放置在 ADC 驱动器和转换器本身之前,以利用现代 ADC 的先进性能。SAR ADC 兼具高速度和高精度性能,是这些应用最常用的 ADC 类型。

图1. 典型的基于SAR ADC的多路复用数据采集系统框图

用于工业和医疗应用的高通道密度精密DAQ系统致力于将最多的通道压缩到尽可能小的区域中。通过如下手段,多路复用 DAQ 系统一般可以实现高密度、高吞吐量和良好的能效:

  • 每个通道使用最低采样速率

  • 最大程度提高 SAR ADC 转换器利用率

n 为通道数。对每个转换器而言,多通道数据采集系统的总吞吐量由下式给出:

这表明多通道 DAQ 系统的总吞吐量不仅取决于 SAR ADC 的速度和分辨率,还取决于此转换器的利用情况。

在有建立延迟的情况下,ADC 的实际采样和转换周期会增加一项 td,导致转换器的实际最大采样速率由下式给出:

其中 TADC 是 ADC 每个样本的采样周期(大多数 ADC 数据手册通常都会提供,更常见的形式是 SAR ADC 采样速率的倒数,以"秒/样本"为单位)。对于非零延迟 td,多通道 DAQ 系统的实际最大采样速率总是小于转换器采样速率,导致转换器利用率始终低于 100%。由此可以明白,采样和转换周期上增加的任何延迟都会降低转换器的利用率。当与前面关于总吞吐量的表达式联系起来时,多通道 DAQ 可以容纳的最大通道数量就会减少。总之,任何建立延迟都会降低多通道DAQ系统的通道密度和/或总吞吐量。

当多路复用器从一路输入切换到另一路输入时,输出仍然有前一输入通道的记忆,其表现形式为多路复用器的输出负载电容和寄生漏极电容中存储的电荷。这对于高容性负载(例如 ADC 驱动器和 ADC 本身)更为明显,因为这些存储的电荷没有低阻抗路径可以走。甚至可以说这些电荷被困住了,原因是输出为容性,并且现代多路复用器采用先开后合 (BBM) 机制,故多路复用器具有高阻抗。只有切换到下一路输入,这些电荷才能被释放电。

图2. 切换前状态(左),切换后,发生电荷共享,迅速引起电压下降ΔV(右)

COUT 之间发生电荷共享。对于超高带宽多路复用器,电荷共享几乎立即发生,导致多路复用器输入端出现高频毛刺。此毛刺的幅度 ΔV 由下式给出:

其中 ΔV是切换之前电容电压的差值。多路复用器输入侧发生的瞬态毛刺现象就是通常所说的反冲,其对于具有高容性负载(例如 ADC、容性 DAC 和采样电路等)的开关应用更为普遍。转换器要产生有效数据,毛刺必须稳定在输出的1 LSB以内,而输入稳定在 1 LSB 以内(并保持在该范围内!)所需的时间就是输入建立时间(tS)。tS 是前面描述的延迟td的组成部分,它对此项的贡献可能是最大的。

当 ADC 不像现在这样快时,这些毛刺及相应的输入建立时间微不足道,可以忽略不计。但是,随着 ADC 速度的提高,转换器采样周期变得越来越短,接近输入建立时间的量级。如前所述,当 ADC 周期 TADC 等于输入建立时间 tS(事实上是 td)时,转换器利用率大大降低至50%。这意味着我们只使用了转换器的一半能力!需要重申输入建立时间的重要性,它应与精密转换器的当前技术同步发展,为提高多通道 DAQ 系统的性能铺平道路。

为使开关毛刺最小化,通常在缓冲放大器和多路复用器之间使用一个 R滤波器,称之为缓冲器网络。图3显示了一个双通道多路复用模拟前端子系统的信号链子系统及其相应的开关时序图。

图3. 多通道 DAQ 系统的双通道多路复用模拟前端子系统及相应的时序图

缓冲器RC作为主导极点,假设多路复用器相对于放大器和缓冲器 RC 具有非常高的带宽,那么输入毛刺和建立瞬变可近似为具有一阶(指数)响应。为了进一步分析输入毛刺,图 4 详细显示了输入毛刺瞬态响应。

图4. 分析切换期间的多路复用器输入毛刺:时序定义和设计目标

对于一阶假设,误差 VERROR 的表达式是一个关于时间的递减指数函数。VERROR 的初始值(切换时的值)为毛刺幅度 ΔV,其将以缓冲器RC值决定的速率衰减。VERROR 稳定在 1 LSB 以内所需的时间被定义为输入建立时间。

另一方面,转换器以周期 tACQ 采样(也称为采集时间)。在 tACQ 过去后的 ADC 转换阶段,转换器将量化任何可用的采样数据。如果VERROR衰减速度过慢,导致其未稳定在某一值(1 LSB 到几个 LSB )以内,就会产生问题。这将导致当前样本被前一模拟输入破坏,引起 ADC 通道之间的串扰。考虑到输入建立时间,必须确保输入建立时间小于转换器采集时间,以使误差最小。而且,进一步减小 tS 还为使用更快转换器以提高系统总吞吐量和密度提供了机会。

利用我们的数学技能,当 ΔV为满量程输入范围且 VERROR 达到至少 1LSB(多路复用器输出在目标电平的 1 LSB 以内)时,可以推出最差情况下的最快输入建立时间表达式。多通道 DAQ 系统设计人员将拥有两个设计抓手:缓冲器时间常数和 CA/COUT 比率,从而得出输入建立时间的表达式:

这里可以看出,输入建立时间是缓冲器时间常数 τ 和 VERROR 稳定在 1LSB 以内所需的时间常数数量 η 的线性函数。减少输入建立时间的最直接方法是使用时间常数较小的缓冲器网络,这很有意义,因为较快的(高带宽)缓冲器网络会降低时间常数。然而,这种方法将带来一组不同的涉及噪声和负载的权衡。另一方面,η 项最小化也可以达成类似的结果。

η 是缓冲器电容 (CA) 与输出电容 (COUT) 之比的函数。如果 1 LSB 等于满量程输入范围除以 2 的 N-1 次方(N为位数),并且最差情况下 ΔV等于满量程输入范围,则该表达式可以进一步简化。

公式 6 可能不那么直观,很难可视化,所以仅利用 10 位、14 位、18 位和 20 位分辨率的半对数图来说明可能更好,如图 5 所示。

图5. 建立至1 LSB所需时间常数的图形

可以看出,CA/COUT 值越高,则建立时间越短;电容比非常高时,建立时间甚至接近 0。COUT 实质上是多路复用器的漏极电容和后续各级的输入电容,因此只有 C保持比较灵活的自由度。对于 10 位分辨率,要使建立时间为

总之,输入建立时间最小化可以通过两种方法实现:

  • 对缓冲器网络使用高带宽;

  • 相对于COUT,使用较高的CA值。

高带宽和大缓冲器电容可最大限度地减少输入建立时间,所以使用最高带宽和最大电容就行了?

非也!必须考虑 R负载效应和放大器的驱动能力!为了研究缓冲器网络对缓冲放大器的负载影响,应在频域分析模拟前端子系统。

由于我们将输入毛刺建立在一阶响应的思想上,所以缓冲器网络极点应该就是最主要的贡献者。换句话说,缓冲器带宽应该小于缓冲放大器和多路复用器的带宽,以避免多极点交互,确保一阶近似成立。

图6. 缓冲和缓冲器等效电路(左)与放大器和缓冲器网络的等效阻抗(右)

典型缓冲架构由缓冲(G = 1)配置的精密放大器与缓冲器网络级联组成。在频域中分析,此子系统的输出取决于缓冲器输入阻抗与缓冲器输入阻抗和放大器闭环输出阻抗之和的比率。检查可知,为避免负载效应,缓冲器输入阻抗应该大于放大器闭环阻抗,如公式7所示。

也就是说,为避免缓冲器网络成为缓冲放大器的负载,我们应该:

  • 增大缓冲器时间常数 RACA,以有效降低带宽

  • 使用较小缓冲器电容 CA

  • 选择闭环输出阻抗非常低的放大器

前两个选项使我们清楚地了解到负载效应和输入建立时间之间的取舍。这限制了我们可以使用的缓冲器带宽和电容的大小。第三个选项引入了一个性能参数,选择适当的精密放大器时应予以考虑。还应考虑稳定性和驱动能力。

图7显示,对于具有足够带宽的精密放大器(例如 -3 dB 闭环带宽约为 970 kHz 的 ADA4096-2,结果与目前进行的分析一致,但少数波形除外。对于10 kHz 的缓冲器带宽,最大 C产生最快的输入建立时间。而对于 200 kHz 的缓冲器带宽,增大 C仍然会加快建立时间,直至发生负载效应。从结果中看到的欠阻尼响应具有极小的毛刺幅度,但建立时间比较小 CA 所产生的响应要长,尽管后者的毛刺幅度较高。这凸显了仔细研究缓冲器如何加载放大器的重要性,在为系统选择器件时务必考虑这一点。

图7. 针对10 kHz(上方)和200 kHz(下方)缓冲器带宽的多路复用器输入,ADA4096-2放大器模型

如前所述,需要注意的一个放大器参数是闭环输出阻抗。运算放大器的闭环阻抗通常与其开环增益AV成反比。我们还希望缓冲器网络具有高带宽以使建立时间最短,因此要求放大器的-3 dB带宽甚至大于缓冲器带宽。除了较低的噪声、失调和失调漂移外,最适合用于多路复用 DAQ 系统以实现最小输入建立时间的精密放大器还有两个优先特性:1)具有高带宽,2)具有非常低的闭环阻抗。然而,这些优势的得来并非没有代价,而代价的表现形式就是功耗。例如,我们可以查看图 8 所示的 ADA4096-2 和 ADA4522-2 的闭环阻抗。

考虑数据手册中的闭环输出阻抗图,以及 ADA4522-2 的 -3 dB 闭环带宽为 6 MHz(标称值),显然可知它是更适合该应用的驱动器。但当功耗优先时,ADA4096-2 的每个放大器的电源电流为 60 μA(典型值),比 ADA4522-2 的每放大器 830 μA(典型值)更具吸引力。尽管如此,这两款精密放大器都可以使用,最终取决于应用真正需要达成的目标。

  • 为了最大限度地提高多通道 DAQ 系统的密度和吞吐量,输入建立时间应小于或等于 ADC 采集时间,任何额外的延迟都会降低多通道 DAQ 系统的性能;

  • 为使输入建立时间最小化,需要提高缓冲器网络的带宽和电容,不过选择元件值时必须小心,避免频域中发生负载效应;

  • 选择最合适的精密放大器需要权衡功耗、闭环输出阻抗和 -3 dB 带宽,按照应用的真正需求确定其优先地位。

}

我要回帖

更多关于 大数据分析 的文章

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信