随科AI是什么样广州AI人工智能的公司有哪些?公司地址在哪?

近期,国内外掀起一股AI绘画的热潮,关于AI绘画将如何改变人类艺术、艺术品市场和行业生态环境,以及绘画行业从业者等问题,引发广泛的关注、讨论和争议。风浪缘起于海外AI绘画工具Disco Diffusion、MidJourney等AI绘画软件被用来进行艺术创作。今年8月美国科罗拉多州举办的艺术博览会上,一幅名为《太空歌剧院》的画作最终获得数字艺术类别冠军。该作品先由AI制图工具Midjourney生成,再经Photoshop润色而来。据CNN报道,不少艺术家为画家Allen使用AI作画并获奖感到愤怒。《太空歌剧院》由AI制图工具Midjourney生成在国内,AI绘画同样也逐步成为前沿科技和文化浪潮的封口,也有了诸如百度文心一格、TIAMAT等这类适用于中文描述语输入、更能理解中国文化审美的AI艺术和创意辅助平台诞生。甚至已经有一些素人则利用这些工具,发展出了自己的斜杆事业,例如在抖音上做壁纸号,在闲鱼上卖描述语,或者将自己的作品卖给了包装厂或数字藏品业者等。Midjourney上手难度很低,有强的商业价值,近期《经济学人》杂志也用Midjourney 生成的图片做了封面。前期AI 绘画生成,后期通过PS 调整,作画效率将会大大提升。通过《太空歌剧院》获奖这一事件,AI 绘画的大规模应用可能已到黎明期。但整体而言,这仍是非常新兴的行业,圈子也比较小众。那么,AI绘画工具能够取代传统艺术家吗?未来绘画艺术品的消费场景是什么样的?绘画从业者应该如何应对?首先,技术上看,AI 绘图属于AIGC 技术场景中的分支,文字到图像已基本成熟。AIGC 全称AI-Generated Content,是基于生成对抗网络GAN、大型预训练模型等人工智能技术,通过已有数据寻找规律,并通过适当的泛化能力生成相关内容的技术,AI 绘图属于AIGC 技术场景中的分支。AI 绘画初代实现形式为GAN(Generative Adversarial Nets,生成式对抗网络),最初是图像到图像的生成过程,用户无法通过文本影响生成结果。随着扩散模型Diffusion model 的快速崛起,极大降低了行业的进入门槛,且实现了纯文字到图像的转化,获得了大批AI绘画爱好者的追捧和使用。例1:在Imagen AI 输入“一只非常快乐的毛茸熊猫打扮成了在厨房里做面团的厨师的高对比度画像,他身后的墙上还有一副画了鲜花的画”的文字后生成的图像例2:在Imagen AI 输入“带着宇航员头盔,在深夜眺望窗外的浣熊”的文字后生成的图第二,从行业发展看,国外龙头公司已布局好赛道,国内也奋起直追。从AIGC 的参与者来看,目前国外大厂及细分赛道龙头公司已位居世界前列,国内部分公司也在奋起直追。例如NVIDIA、Google、Amazon等公司通过自研或收购的方式已走在技术前沿。国内的AIGC产业链也颇具雏形,布局最多的赛道是AI 写作和语音合成,图像、视频等领域的初创公司不断增加。第三,具体到产品,市场已形成三大主流产品,在国内Disco Diffusion用的最多。国内市场上,Disco Diffusion 、Stable Diffusion 、Midjourney 位列前三。Disco Diffusion 作为成熟的AI 绘画应用,用户基础最好。Stable Diffusion 于2022 年8 月下旬发布,技术门槛和储备显卡成本均进一步下探,且有更多的风格化,更简易的训练框架,迅速成为AI 绘画热门应用。Midjourney 依靠AI 绘画作品获得人类美术比赛一等奖而名声大噪。第四,从应用场景和目的看,目前AI绘画主要是以创作作品的自我欣赏为主要应用场景,且绝大多数只是为了娱乐和社交。据6Open调研,绝大部分用户(92%)没有通过AI绘画产生收入,也就是“单纯娱乐使用”。绝大部分的用户表示,使用AI生成绘画作品,仅仅是自己欣赏,同时表示会分享给朋友的占 56%,6%的用户表示会自己加工之后在工作中使用,低于2%的用户会将生成图片直接商业使用,此外还有23%的用户表示,会发布在社交网络媒体以增加粉丝关注。第五,从AI绘画发展趋势看,目前最受关注的问题包括版权问题、从业者替代问题和商业应用问题。版权问题目前是最受争议的问题,但目前国内外均无统一标准和配套法律规范。2022年8月,美国科罗拉多州博览会的得奖作品《太空歌剧院》,就引发了画师群体的激烈讨论——人工智能生成内容能否构成著作权法意义上的作品?如果构成作品,谁是著作权人?今年8月底至9月初,大量日本画师在社交媒体上抵制AI作画,他们觉得,AI模仿他们的风格创作的画,会让画师本人形象受损,并纷纷在个人声明中说,请不要在这种AI自动制作的服务中使用我的作品。10月份,微博上也展开了一场大论战。知名插画师老累表示并不反对AI绘画,认为这只会取代“低端”画师,引发多位画师不满。随后,MMMMM_禾野、画画的花噎菜、乌合麒麟等画师也加入论战。当下AI作画作品的版权归属,各个平台并没有统一规定。国外midjourney平台显示,付费用户生成的作品可以商用,非付费用户仅能非商业性复制。百度文心一格相关负责人称,文心平台支持具有独创性的绘画作品依法享有版权,并鼓励AIGC平台持续投入智力资源投入,提升内容质量,并保障各方公平合法权益。关于从业者替代方面,很多人担忧未来AI绘画很可能取代传统绘画,带来大量画师的失业。例如,今年8月,美国《大西洋月刊》没有使用图库网站付费插图,而是使用了一张AI生成的免费图片为文章配图。这张插图也引起了画师不满。其实,我们可以用很多技术进步对行业结构产生影响的例子来对比分析。例如,19世纪照相机诞生后,当年的画家们也通常产生担忧。当年体现画作水平的一个方面是,风景画或人物画像的惟妙惟肖。但照相机面世后,绘画的写实性和逼真性已经无法赶超照相机了,结果带来的是艺术的分流,也就是纯绘画艺术和摄影艺术的分化,两者的艺术价值、应用场景也截然不同,但都同时存在至今。但值得注意的是,技术进步的一个重要结果是,艺术品的使用门槛大大降低了,使得绘画从原来少数富裕人群才能消费的奢侈品,演变为普通人也能消费的大众艺术品。画家依然存在,但职能和角色也发生了变化,更多的是服务于大众,或者与技术平台协作更高效的“生产”艺术消费品。此外,艺术流派也出现分流,传统绘画或AI难以取代的需要个性化创作的作品,还是由画家主导,其他大众化、潮流炫酷、且需要投入长时间、精细化创作迭代的作品,可能需要AI和画师共同完成。商业应用方面,AI作画到底有没有消费者愿意购买?也就是AI绘画的变现途径是什么?目前有部分变现的途径,但整体规模较小,尚未形成主流。据媒体调研,某电商网站客服表示:“现在代售AI绘画都是2元一次,会按你的描述批量出图,筛选3张比较好的,由你任选其一。如果后续需要美化细节,每张再加收5-8元。”记者在某二手拍卖平台看到,有人拍卖自己的AI画作,售价从88元至288元不等。其中一幅售价88元的《世界末日的色彩》,显示围观人数达5531次,销量为23件。此外,除了卖作品,也有人直接卖用来生成作品的描述关键词。这是因为,比起国内平台简单用中文词语描述即可生成图片,国外很多平台还需要用户在关键词基础上添加英语高级参数、注释代码等,这就提供了一个关键词翻译的衍生市场。目前,市场形成的基本共识是,整个行业今天都还在萌芽阶段,但同时伴随技术的飞速迭代更新,行业也发展极为迅猛。如果按原来的周期理论计算,可能需要3年或5年才能有现在这些规模,但目前来看这些变化一两年就能实现。美剧《西部世界》里有个场景,游戏制作人一边说话,一边做游戏剧情并完成游戏整个场景的搭建,包括他需要一个什么样的皇宫,什么样的城堡,需要游戏主人公以什么角色出现。随着这只是科幻剧情,按照当前AIGC发展速度,很有可能很快成为现实。AI绘画行业发展如此迅速的原因,主要是现在已经出现了比较成熟的、做底层技术的公司、做应用层的公司,那么随着应用场景丰富起来,整个行业就会变得更丰富,产业链会变长,分工更明确,商业模式更清晰。}
前言:为邀请100位行业领军人才加入百图生科,百图生科开启了“百万领军”人才招募计划。“百万领军之声”,则旨在记录百图生科领军人才的心路历程,以共勉所有的生命科学同行者们。宋乐博士自2008年起在卡内基梅隆大学和佐治亚理工学院从事生物计算相关研究。近年国内外都出现了明显的AI大牛从产业界“回归”学术界的潮流,他却做出了不同的选择:加入百图生科任首席AI科学家,后兼任公司CTO。 此时,包括生物计算在内,生命科学研究已经与15年前大为不同。对于百图生科而言,这里的“大”,又多了一层意味,那就是预训练大模型。大模型+生命科学=?最近,由宋乐博士领衔的百图生科跨学科团队,给出了一个特别的答案:AIGP(AI Generated Protein)。“现在大家都知道ChatGPT,好像它是突然出现的,但实际上,它是AI领域持续研究慢慢进步的结果。 ChatGPT代表了一种新的范式,这种范式转换其实在其他领域都在发生,比如在自然语言、图像领域都有大规模预训练模型,然后把这些模型再微调应用到下游任务中”。 最近,在和澎湃科技的交流中,宋乐解释了这一次ChatGPT风暴背后所代表的趋势所在。而他所提到的范式转移,也正发生在生命科学中:2年前,他加入刚刚成立不久百图生科,负责开发面向生命科学的预训练大模型xTrimo。这也是全球第一个生命科学大模型。2年时间不长不短,足够当年GPT系列从2018年1.0版本的1亿参数发展到2020年3.0版本的千亿参数,也足够xTrimo从零成长为千亿规模参数的大模型,以至于我们可以把xTrimo想象成一颗浓缩了大量生命进化知识的“时间胶囊”。近日,随着百图生科基于xTrimo的AIGP平台开始邀请行业伙伴参与测试和应用,宋乐也期待,生命科学领域将迎来“ChatGPT时刻”(详见《百图生科AIGP平台发布:提供多种蛋白质生成能力,加速前沿生命科学研究》)。图:宋乐博士在AIGP发布会上进行分享当一名AI学者被生命科学深深吸引作为机器学习和人工智能领域的顶尖学者,宋乐有着数十年的AI研究经验,2022年还入选斯坦福大学“全球前2%顶尖科学家榜单”(World's Top 2% Scientists ),这样的履历放在内卷成风的AI界也是相当显眼的: 他在悉尼大学和 NICTA 获得机器学习博士学位,后进入卡内基梅隆大学机器学习系进行博士后研究,并任谷歌的研究科学家,后来在佐治亚理工任教至终身教授,主要研究方向是机器学习,并在利用机器学习技术对靶点挖掘、药物设计上取得了一系列突破性成果。 他还斩获过 NSF CAREER Award'14 、 NIPS'17 材料科学研讨会最佳论文奖、Recsys'16 深度学习研讨会最佳论文奖、AISTATS'16 最佳学生论文奖、IPDPS '15 最佳论文奖、 NIPS'13 优秀论文奖和 ICML'10 最佳论文奖。来源:ICML虽然常年深耕在机器学习领域,但对宋乐来说,生命科学始终对他具有极大吸引力。医生家庭背景的宋乐,在从小耳濡目染的环境下对医学及生物学一直保持着浓厚兴趣,尤其是科普读物中各类有趣的生物学现象。这也让他在本科阶段就萌生出用计算模型探索生命科学问题的想法。 这种兴趣一直牵引着他去系统地学习两个领域交叉的知识,例如研究用计算的方法建模神经系统、利用医学生物有关的数据来进行模型分析等等。 在CMU博士后期间,他更加完整地学习了生物相关的知识,包括基因表达、基因调控网络、根据简单的基因测序去做预测问题,以及和制药更相关的药物性质预测、优化、合成等等。众所周知,深度学习的前身是神经网络,在自然语言、计算机视觉等方向上很早就有所应用,但是它在产业界大规模落地验证,也是最近几年的事情。 在生物计算这个跨学科的交叉领域更是如此。宋乐回忆道:“过去几年最大变化是数据的爆炸。 2008年我在CMU做研究的时候,比较大的基因测序数据集是几百个数据点,而且是bulk sequencing数据,但就现在的单细胞测序来看,数据量已经可以达到亿级。 此外,还有很多其他类型的生物数据,也达到了亿级或十亿级以上的规模。就蛋白质而言,我们已经有了越来越多的方式可以获得蛋白质之间相互作用紧密程度的数据。这种数据量不管从形态上还是量级上都大幅增加。 十几年前我们做研究,很多情况下做了一个很复杂的模型,往往苦于数据很小,很难说明这个模型的效果有多明显。但现在随着数据量增加以及数据复杂度增加,模型的效果会很明显地体现出来。此时,我们需要思考的是,究竟怎样的方法能够更好地把如此复杂的数据集成在一个模型中,进一步让模型把各种方面的信息都能够抽取出来,进而做更好的预测。”图:ImageNet挑战赛成就了深度学习浪潮的标志性事件之一;来源:ImageNet以2020年开始在全球大流行的新冠疫情为分水岭,生命科学领域与 AI 的融合也进一步加速。 这一年,宋乐敏锐地察觉到,伴随着大量数据的积累、算力的提升、AI模型的精进,如果能让AI和湿实验闭环,前沿AI技术将会有更大的用武之地。 具体而言,借助进行生物医学研究的湿实验+基于AI的干实验,一些传统医学方法、生物学方法无法解答的问题,将会变得柳暗花明。尤其是在药物研发上。药物研发是生命科学领域中的一项复杂而漫长的过程,而生命科学大模型,必然将加速这个过程。正如ChatGPT在与全世界用户多轮对话、不断迭代后能生成越来越优质的回答一样,AI应用到新药研发等生命科学问题的解决上,也需要通过高通量多轮湿实验的闭环验证和数据补充进行持续升级,才能发挥最关键的价值,换句话说,才能有能力去解决制药行业最核心的挑战——“反摩尔定律”。打造大模型和AIGP平台,与百图生科的一拍即合“10亿(资金)、10-12年(研发周期)、14%(成功率低)”。作为一名资深AI学者,宋乐在过去两年时间里的公开演讲中常常引用的,反而是几个生命科学尤其是生物医药从业者习以为常的数字。 这几个数字代表着目前传统制药行业面临的困境,就是传统药物研发的“反摩尔定律”,和AI、芯片领域常谈的摩尔定律异曲同工,但却残酷得多。摩尔定律和反摩尔定律,分别支配两个不同的“星系”——人工智能和生命科学。在职业生涯上同时深度涉及这两个定律的科学家不算多,能够推动这两个星系进行融合的就更少了,宋乐便是其中一位。在宋乐的学术生涯中,不乏一系列利用AI解决生命科学问题的突破性研究。不过,要说真正系统地将基于预训练的大模型推动到产业落地层面,还始于与百图生科的结缘。加入百图生科之前,宋乐一直关注着这个方向的发展,其间也常有国内外产业界伸出橄榄枝。那时,选择和谁同行去推动这件事情,成为了他需要考虑的问题。直到2020年年底与百图生科团队接触,他才确定了这段新冒险之旅的同行者。图:宋乐博士拍摄于北京郊外“首先,我们在愿景上非常契合;其次,在决定之前,我和百图生科团队线下交流了很多次,已经非常具体地谈到怎么去构建干湿闭环大体系的问题,虽然只是想法层面的交流,但是我们在一个非常宏观战略的角度上达成了共识,这一点非常关键。另一个层面上说,CEO刘维和我的专业非常互补,他熟悉资本的运作、医药市场对新技术的需求、公司的战略和管理,我则对AI有着比较多积累,之前也有工业的经验。除此之外,还有像蒋昭实、赵正琦等在靶点发现和抗体工程方面的专家。在有着相同愿景这个非常重要的基础之上,团队能力上也十分互补,这意味着公司可以快速地成长。所以,我很快就决定加入百图生科。这是最契合我的一个机会。”图:宋乐博士的Google Scholar主页(https://scholar.google.co.uk/citations?user=Xl4E0CsAAAAJ&hl=en)不过,前沿技术在学校实验室阶段和在行业内做到商业化落地,从来就不是同等难度的事情,更多意味着节奏和侧重点的不同。在一次交流活动中,百图生科CEO刘维还曾笑称,宋乐博士是2022 ICML的主席,他在加入公司之前每年都发表大量的顶会论文,加入之后则是潜心工作,大大减缓了发论文的速度。通过 “百万领军”计划加入百图生科以来,宋乐已经切换到新的角色和状态之中:作为CTO及首席AI科学家,推进xTrimo和AIGP平台的规划和技术相关战略工作,将湿实验团队和AI团队形成一个闭环系统,使得AIGP平台不但可以将百图生科药物研发驶入快车道,也能助力行业伙伴的前沿生命科学研究。目前,百图生科AIGP平台设置了3类功能模块,根据不同模块的输入和要求,AIGP平台可在较短时间内设计和生成具有特定性质的蛋白质。图: AIGP3大功能模块+12项核心能力示意图这些能力的背后,固然不乏种种技术和工程上的挑战,但宋乐认为,百图生科有足够的优势来突破其中瓶颈:“首先需要很多数据,包括非监督和弱相关的数据,需要从很多不同的公开库中抓取,还需要通过工程的方式去统一整理,形成一个大的数据库。传统大药企往往没有这样的能力,他们或许不缺数据,但是数据散落在不同的角落,很难将数据合力起来去推动一个大模型。而百图生科团队,具备数据和互联网工程思维的有力结合。第二,把生命科学大模型跑起来,需要大量的计算资源。在计算资源上,我们和百度有紧密合作,这也是百图生科的优势,传统药企或者小的AI公司,可能就没有这种计算资源去做生命科学大模型,从而支撑AIGP平台的稳定运行。 第三,百图生科有自己上万平米的实验室,可以针对我们感兴趣的疾病和靶点有针对性地产生高质量数据。这些数据,在我们的实验室中也是高通量产生的,这意味着有大量真实数据帮助算法进化得更加精准,这同样是一个无法比拟的优势。很多biotech公司无法兼具这些优势去提升蛋白质生成能力。”这些优势,也已有了“回响”:团队所开发的xTrimoABFold++,实现了原子级精确度的抗体结构预测,较 AlphaFold2 提高 30%。除了预测精度大幅度提高以外,xTrimoABFold++ 的推理速度较 AlphaFold2 快了 540 倍。这项研究于近日被顶级癌症研究会议AACR大会所接收。AI+生命科学的机会是无限的事实上,加入百图生科之后,宋乐肩上还有一个特别的任务——帮助公司AI团队“扩容”,继续寻找着前往AI+生命科学深水区的同行者们,尤其是培养AI背景的青年跨界人才。在国内外AI学术顶会或者行业会议的各个场合上,宋乐一直不厌其烦地介绍AI造药这个方向的进展,甚至会直接到一些老师的实验室中直接交流。图:宋乐博士在WAIC发表演讲;来源:WAIC从宋乐的感受来看,过去两年到现在,确实有很多做AI的同学关注到了AI+生命科学这个方向,或者是对这个方向更加感兴趣了。“之前,对于加入AI制药行业,很多AI背景的同学不知道自己能做什么。在交流过程中,我们就会向他们展示AI最前沿的技术是可以应用在制药中具体的问题上的,无论是预训练模型还是深度学习。当他们理解其中的逻辑之后,自然就可以发现很多在自然语言处理、计算机视觉分析中的模型和经验可以迁移过来。比如现在我们校招或者是面试的队伍中,越来越多来自清华或者北大原先做计算机视觉等领域的同学。团队里有越来越多有互联网和AI背景的同事,他们也是在接触这个方向之后选择加入百图生科。当然,我也会建议他们以不断保持好奇心的方式去学习其他领域的知识。特别是生物制药领域的知识,对数据的理解会帮助建立更合适的模型,以及把数据的效果更好发挥出来。所以,我希望我的团队成员既以一个AI expert的角色去成长,也能成为制药方面的专家。而在百图生科,我们已经有了这样的土壤和机制,去推动AI侧和生物侧两边不同的专业人才实现更好的交互和协同。包括我在内部经常会分享AI侧的规划,以及还有更基础的‘摩天轮计划’,面向AI和工程同事介绍生物计算、制药方面最基本生物知识和工具等等。简而言之,相比其他一些被外界认为内卷的行业方向,AI+生命科学的机会是无限的,AI背景的人才,可以在这里做出很多实际和有价值的成果,不但可以非常具有AI前沿性,对各类前沿生命科学研究的加速,也将真正地造福全人类。”附:寄语百图生科我们要推动生命科学研究的新范式,生命科学大模型和AIGP平台会全面支撑这个目标。借助AIGP平台,百图生科和合作伙伴,针对某类疾病、某些生命科学问题,我们就能够很快地发现相关的蛋白质生成解决方案,比如针对靶点来优化相关药物。以新药研发为例,短期内,希望我们能有一部分疾病或者靶点发现实验和生命科学大模型闭环,至少在实验室层面或者动物实验层面证明AI发现的靶点有效或者药物有效;更加长期的,借助AIGP平台,可以针对免疫治疗实现靶点发现和药物设计的自动化。今天我依然觉得我们所做的一切,都和最初的vision保持一致。蒋昭实:跨国药企激荡20年后,我为何加入百图生科James Rong:30年海外“猎药人”,一朝归国勇闯AI制药深水区关于百图生科百图生科(BioMap)是一家AI大模型驱动的生命科学研发平台,由百度创始人李彦宏于2020年创立。 公司致力于结合前沿AI和生物技术,构建高通量干湿闭环的生物计算引擎,建模蛋白质/免疫细胞/免疫系统的复杂规律,通过生成全新的蛋白质与生命体对话的方式,实现特定的生物学功能,并解决生命科学行业的痛点问题,比如靶点发现、药物设计、酶的从头设计和优化等,从而改善人类健康、实现可持续发展。}
“搜狗公司的使命是让表达和获取信息更简单,而信息表达和获取的核心载体是语言,我们在AI上也是围绕语言这个核心去展开”。搜狗AI交互事业部总经理王砚峰向艾瑞网介绍了搜狗对于人工智能的定位。作为一家起家于搜索业务的互联网公司,在原有核心业务保持快速增长的同时,搜狗公司AI技术也在不断突破:语音识别技术升级,搜狗目前可支持识别英日韩法西俄等十余种外语和粤语、四川话等多种方言识别,语音识别准确率达到98%,准确率和响应速度均为行业领头者,在语音输入与语音转写、会场同传、语音采访等多个场景可取得良好的落地效果;多模态识别技术领跑业内,通过对用户唇形、语音、表情的多维输入视频即可将视频内的语音更准确地转写为文字,极大地提升了噪声环境下语音识别效果;语音合成技术持续加码,基于多目标学习、表现力迁移的AI分身、用户“变声”、个性化TTS等都在业界具有先发优势,表现抢眼。谈到未来搜狗对AI交互的发展规划,王砚峰认为,语音输入法还是要做好,巩固输入法产品的地位;会围绕AI交互这个赛道,推出更多自有品牌的智能硬件,而在终端赋能方面,要让硬件与搜狗输入法、C端数据打通,让搜狗走出提供技术来提供服务。王砚峰,搜狗AI交互事业部总经理。负责搜狗语音、视觉、NLP等技术的研发及应用,以及基于AI技术的产品创新和行业服务。从输入法进军智能语音艾瑞网:首先请您介绍一下,搜狗AI交互的起点是什么产品?王砚峰:搜狗的AI交互起源于输入法,语音输入是输入法的一个核心功能,搜狗智能语音发展也受益于输入法的大量用户数据与行为数据。搜狗输入法语音输入功能于11年开始研发,12年面世,13年上线了深度神经网络。谈及搜狗输入法“刷新”AI交互技能的原因,核心有三点:(1)语音输入提升了用户传递信息的效率,相比打字输入体验更好、更快捷;(2)语音转化场景如翻译场景下,智能语音为用户提供了一个提供方便的入口,当用户说完一条语音信息,相应的译文就已经准备好可以直接发送了,减少了反复的手动操作,搜狗现在已经做到了中英日韩四种对话语音随心译;(3)语言除了是传递信息的工具,也是人们表达自我的一种手段,AI能够帮助输入法产品去做用户个性化的表达。搜狗输入法作为头部的输入法产品,在这三个方向上都跑得很快。语音输入,传统上是非个性、面向所有用户都一样的语音转文字,2019年我们上线了跟用户词库和语音识别引擎打通的“个性化语音识别”,使用户常用语识别错误率相对下降近40%,比如用户工作场景相关的内容识别率会更高,免去了手动修改的麻烦,这个功能的使用频率很高,甚至使我们搜狗输入法产品的账户登录比例提高10%以上。在语言个性化表达方面,我们2019年推出了变声功能,能够将用户的声音转换成特定人的声音,语速、停顿、情感等说话习惯均可被转换为超高逼真度的指定角色声音;而除了语音类的个性化表达,AI助手“智能汪仔”能够在各种聊天场景中理解用户输入的文字信息,从而为用户推荐丰富多样的表情包和回复的“妙语替换”。搜狗输入法个性化语音识别艾瑞网:AI交互是否已经成为了输入法用户的常用功能?AI本身,又能够为输入法产品的商业化提供什么样的想象呢?王砚峰:没错,用户的使用已经非常高频。截至2019年9月底,搜狗输入法日均语音请求较一年前增长67%,峰值达8.3亿次。目前输入法都是免费产品,未来会做一些增值服务,例如可能在变声上结合大IP来进行增值服务收费。智能语音的赛道里,不做终端设备是很难出头的艾瑞网:现阶段智能语音相关的生态当中,有设备、开发平台、标准化的SaaS服务平台、音频内容等等,您怎样看待智能语音的开放性开发平台,这会是一种在技术落地应用和商业变现上能够跑通的模式吗?王砚峰:搜狗也很早就布局了开放平台,2015年至2016年的时候我们开始通过平台向外输出AI能力,也积累了很多很多的开发者和合作伙伴。不过,对于开放平台而言,找商业模式其实是一个重点。当时,搜狗合作了小米、创维、魅族等头部厂商,但没有基于“开放”探索出好的商业模式。而目前看开放平台只是会相对更容易的降低和行业合作的门槛,更容易的把行业用户引过来,但是建立好的商业模式,还是需要进一步针对行业深耕,尤其是针对传统行业,不仅需要领先的技术,同时也需要针对这个行业下客户的痛点,推出他们更需要的SaaS产品或解决方案,做到更好的服务行业客户,才能形成好的商业落地。艾瑞网:搜狗目前定位在哪类智能设备?从互联网企业开始投入做硬件,有什么基础,攻坚了哪些问题?王砚峰:自有品牌的硬件大体上是选便携、随身的品类。目前,我们已经发布了翻译机、录音笔等,未来会做耳机,以解决人在商务生活方面的一些问题。在这些产品上搜狗主打AI能力,帮用户通过AI能力做之前自己无法做到的事情或者需要耗费大量精力的事情。2019年我们的搜狗AI录音笔C1上市,首发当日销量就突破了2万台,说明这件事情是有价值、有市场的,未来人人都会需要一个录音笔,用AI能力做信息的记录。通过搜狗自己的硬件,用户的反馈可以被深度优化打磨,这也为我们在录音转文字这个方向下,沉淀出了行业最领先的核心技术和服务。过去搜狗研发的糖猫儿童手表为搜狗的AI硬件积累了一些硬件研发、供应链和产品设计的基础,而我们为了现在的翻译机、录音笔在实际场景中的应用,又打磨了从声学信号处理到识别算法的一系列技术。2019年,搜狗自研的Smart Voice麦克风阵列算法更进一步,可对噪声和混响进行多重深度优化,确保人声的高保真还原;我们还把语音转写中切分说话人的技术做进产品,这在业内是首家,双人识别已有90%准确率;同时我们通过研发和数据解决了远场语音转写中声源远近、连读、发音模糊等问题,使录音笔离线转写效果明显高于竞品,在真实场景中达到了可用。通过这些针对场景的技术打磨,你会发现搜狗目前在录音笔行业上,无论是核心的语音转文字能力,还是围绕语音本身的功能创新,都是行业中最领先的。近期,我们还将通过深度学习跨越过去通过阵列技术+传感器优化的方式进一步做好降噪,即上线AI去背景声、人耳听感优化,这会使录音笔在高频场景——采访中的使用效果更好。听写服务中台化,增值服务模式相对跑通艾瑞网:对于互联网公司和AI公司来说,终端硬件的销售都不是最终的目的。但我们关注到,类似于智能音箱等聊天交互设备还没能跑通增值服务这件事,在搜狗扎根的便携式功能性设备上,是否有所不同?王砚峰:搜狗目前基于语音转写在构建C端增值服务能力,录音笔产品+增值服务这种模式已经相对跑通。2019年8月,基于在录音笔产品背后构建的AI服务体系,我们推出了搜狗听写服务,并已经与索尼、爱国者合作,探索 “技术输出-终端产品-用户增值服务付费”这种打法。在这种模式中,合作伙伴只需要做硬件,不需要考虑软件和用户体系,搜狗会面向最终使用者提供完整服务,搜狗开放的不光是背后的AI技术,而是完整的服务,用户是搜狗和设备商共有的。例如爱国者的录音笔用户安装的是搜狗录音助手的App,如果用户在App中进行增值服务付费,合作伙伴也能得到收益分成。现在搜狗录音笔的转写服务可以免费提供,但例如转写速度加快、存储增容等等都可能变成增值服务变现的方式,现在也已经有用户会付费。To B的开拓一定要充分结合搜狗在行业上的技术优势艾瑞网:目前搜狗的AI业务矩阵是否覆盖了G端、B端的传统行业?王砚峰:对于搜狗来说,我们在非消费级市场希望着眼的领域也是搜狗有充分的竞争能力能搞定痛点、有充分技术优势的行业。比如我们当前在非消费级市场推出的搜狗分身和搜狗同传服务。在AI虚拟人这个领域,搜狗通过推出“搜狗分身”技术,有很大的先发优势。拿广电行业来说,广电的本质是做内容的生产,通过AI分身,新闻稿件可以直接生成语音,由虚拟的合成主播进行播报。我们和新华社合作的AI合成主播目前已播报新闻6500余条,累积时长超过15000分钟,可以24小时不间断的待命,以应对突发的新闻需求,这就可以节省很多人力。搜狗AI合成主播是2018年发布的,2019年已经升级到第四次迭代,基于AI分身技术的突破能够实现站播,姿态和动作都更自然。AI分身还可以应用于金融领域,成为虚拟柜员;应用于司法领域,成为引导用户完成线上司法诉求的虚拟法官,既权威又形象;还可用于峰会主持、培训讲座等等……搜狗公司与新华社新媒体中心联合发布的全球首个站立式AI合成主播搜狗的AI同传服务始于2016年第三届世界互联网大会,当时第一次把已有的语音技术和基于神经网络的实时机器翻译技术结合在一起,进行现场AI同传,至今AI同传已服务数百场会议。艾瑞网:非消费级领域的业务,会以行业解决方案形式还是以SaaS形式提供服务?王砚峰:在提供服务的方式上,我们会提供标准化SaaS形式提供AI分身等应用,中小客户,能直接利用搜狗的SaaS平台获取服务。而面向行业中的大客户,我们也会提供整套行业解决方案。自2012年AI语音功能登录输入法至今,搜狗的AI交互已经走过了八年,形成了主打语言AI的鲜明特色。从自身最熟悉的互联网领域,到以产品+模式创新者姿态加入的硬件终端,和以引领者身份领路前行的AI分身,持续的自我刷新也使科技真正成为了搜狗企业活力延伸拓展、生生不息的导体。免责声明:该文章系我网转载,旨在为读者提供更多新闻资讯。所涉内容不构成投资、消费建议,仅供读者参考。【责任编辑:钟经文】}

我要回帖

更多关于 人工智能ai公司 的文章

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信