如何评价阿里天池阿里大数据比赛赛

阿里巴巴天池大数据竞赛选手谢春阳-高清观看-腾讯视频当前位置: >
> >参加天池大数据竞赛是怎样一种体验?
参加天池大数据竞赛是怎样一种体验?
来 源:网络
中科院计算所 硕士研究生 岑武斌因为机缘巧合,我参加了去年的天池大赛系列的微博互动预测大赛。当时是两位前舍友拉我入伙,我说另请高明吧,我也实在不是谦虚,我一个搞分布式系统的,怎么就能参加机器学习类的竞赛呢?后来一听说奖金丰厚,赶紧抱紧了两位前舍友的大腿,再续孽缘……& ==============正经点说================最直接的来说,天池奖金以及激励机制比较大,有奖金、数据科学家排行以及其他阶段赛事激励。冠军的含金量非常高,在国内的互联网公司中,天池大赛的优胜者会优先录用。理论到实践的豁然 &&& 我的专业方向不是机器学习,所以也不敢谈论太多这方面的话题,但根据参赛过程中遇到的一些问题,理论和实际之间确实存在不小的差距,如果仅仅停留在了解原理的层面而没有真正将算法应用到实际数据上,很难有所体会。某大神队友就因为经验主义而被坑了很久,而一旦意识到了这一点,成绩一下就上升了很多。通过比赛增加的实战经验能更好的帮助自己去理解算法,虽然并不一定非得参加比赛,但至少这是一个非常好的机会,尤其是比赛中提供的真实数据,很有价值,也算是提前为自己进入工业界做准备吧。   非相关方向的人参赛,其实也有收获,比如说我,已经精通各类机器学习算法单词缩写的拼写,没事也能走两步了。天池在线数据量非常大,对业界这些都是宝贵的科研资源。选手除了使用数据资源(当然经过脱敏处理过的数据)外,还能可以在阿里云平台上做数据开发和算法开发。这个过程相当于说,你不仅可以给大家做出一桌好饭菜,还可以给大伙分享,你是用什么工具、什么佐料做出这桌好饭菜的。&团队协作的快乐   通过比赛,可以找到志同道合的朋友,能够体验到团队作战的那种快乐。我一直很享受和厉害的人合作(实际上是抱他们大腿),这是一个交流的好机会。我们三个人方向各异,有研究P等不等于NP的(已经成为机器学习大师),有研究NLP的,也有搞CAP的,我们在一起就是3P吧……   微博的赛题涉及了社交关系和文本分析,刚好是两位大师各自最擅长的,而写代码提特征,map reduce处理数据,长年搬砖的我也可以发挥一点余热。比赛期间常常是他们以自己的专业视角提出了各种想法,让我眼界大开,我偶尔为了装逼也开开脑洞咨询咨询他们的意见,工程方面我可以提供一些经验,提高我们三人的开发效率。彼此之间学到了很多东西。   在遇到困难的时候,有一个团队会给人很大的安全感,一起熬夜奋斗,一起解决问题,而不是孤单一人在那里死磕。更关键的时,对队友的那种绝对信任,你知道他们很强,你相信他们一定有能力解决,所以你也会更严格的要求自己,你知道你们必胜,无论多难。无论结果如何,这个过程我是享受的,同甘苦,共进退。平淡的生活里总得有点热血的事情,虽然一般我们一起熬夜奋斗的时候我们总在讲笑话……&追求目标的坚定   参赛前夕,我们确定目标:冠军。大家互相鼓励,雄心勃勃,念了两句诗,“黄沙百战穿金甲,不破楼兰终不还”,然后开始了各自的国庆假期……此处省略字两位大师去把妹的经过……国庆一结束,紧急集合,开始做题,离比赛结束还剩20天……   因为落下其他队伍比较多,一开始追的非常艰难,加之我们白天还要去工地上搬砖,情况不容乐观。过了很久之后才第一次进了前十,期间有一段时间用尽各种办法无法提升成绩,做梦都是梦见那个数字。真是为伊消得人憔悴。   没了假期,没了充足的睡眠,丝毫提升不上去的成绩,当然想过放弃,但真是不服啊,说好的目标,就一定要去达到,怎么能退缩?   后来我们在最后一个夜晚通宵完成绝杀,线上成绩第一……   事情已经过去很久了,结果也没那么重要了,但是过程中的这种坚定还是很历练人的心智的,习惯了遇到逆境而退缩放弃,如果真的有一次狠下心来坚持一回,发现其实也不是那么困难,而且,坚持可能真的能带来胜利。  坚持到底,达到目标,这种快乐真的很难形容,未来还有无数次机会可以体验这种感觉。遭遇逆转的反思  决赛答辩,在我们以为稳操胜券的情况下,最后被逆转。我们好像是唯一一个线上成绩第一被逆转的队,也算是一个记录了……   那天夜晚我们和评委理论到了12点,我们并不是质疑他们的公正性,但是心里是真的不服的。  评委也给出了我们最后失败的理由,我觉得他们也说的很有道理,我们的解决方案比起另一队确实更加复杂,虽然效果要好,而工业界考虑一套解决方案时,不会只从结果去考虑,成本也是一个重要因素。当然如果我们能更加深入下去,在结果上提升更多的话,可能也就没有这次的尴尬了。这个教训还是值得我们反思的,当然,我们并没有因此而服气,也不认可评委对我们的一些评价,反思归反思,不服归不服,两码事。   那天夜里,我们情绪低落,聊了一个通宵,不过即便如此,我们还是能像往常一样互相调侃讲笑话,笑完以后吐槽一句这次的结果,本来都决定拿了钱去吃金钱豹了,现在看来只能吃沙县小吃了……  结果已经不重要了,我们会带着这次的反思去做好未来的事情,不只是比赛而已。也算是一次不小的收获。
================写在最后============比赛很累,但坚持很值 结果很重要,但过程能让你有很多体会,结果只是顺其自然的事情而已 如果学习生活中找不到目标,参加这些比赛,能让生活变得饱满 参加比赛不在于数量,应该挑选合适的比赛,也要多关注自身的积累 选择参加比赛,就竭尽全力的去打,才能真正知道自己的潜力有多少(某大神队友正是因为参加了某次天池大赛发现了自己惊奇而正式转型成为了机器学习大师,不然也许现在他已经证明了P=NP拿到了图灵奖吧) 涉嫌做一次广告:不管参不参加天池比赛,我觉得关注一下赛题还是可以的,至少了解下应用场景,你会发现很多趣味性,比如:在网购时候,怎么搭配更合口味?怎样的算法可以让你提前知道前方路口会不会堵车?再比如追星一族,告诉你哪个艺人未来会火等等。&Ok,只写了点微小的体验,谢谢打赏!&&
[编辑:admin]
免责声明:
本网转载稿件均不代表本网的观点,不保证内容的准确性、可靠性或完整性。如涉及版权等问题,请速来电或来函联系。
客服电话:010-
传真:010-
投稿邮箱:
微信公众平台
手机触屏版
中国新闻网
中国经济网
北方网教育频道
中国网教育
新浪教育频道
河南法制在线网教育频道
主管部门实名审批:中华教育网&&&& 备案号:京ICP备号-1&
中教嘉润国际教育咨询(北京)有限公司版权所有
法律顾问:北京信诚律师事务所
地址:北京市朝阳区建国路93号万达4号楼1502中国领先的IT技术网站
51CTO旗下网站
阿里巴巴为何要做天池大数据竞赛?
阿里巴巴副总裁涂子沛表示,阿里巴巴在做天池大数据的初衷,就是推动大数据的生态系统形成,推动数据新生代人才的培养和产生,让全世界认识到大数据时代不是空话,是实实在在可以产出有效益的事情。
作者:鸢玮来源:51cto| 16:20
天池大数据竞赛近日在杭州举行决赛答辩,看到选手们一个个都还很稚嫩时,不得不承认,青年的创造力和实力不是我们能想象的到的。
在移动推荐算法赛题中,选手们需要根据用户在移动端的行为,预测用户对某些商品可能的购买情况。最终,来自南京理工大学钱肃驰、彭甫槠、李翔组成的&SecRWeaPon&团队获得了冠军。
在对余额宝资金流入流出的预测中,赛题提供了部分余额宝用户在过去13个月的申购赎回数据,要求参赛选手预测未来1个月每天的申购赎回量。来自哈尔滨工业大学蔡鹏、浙江大学的刘勋、南京大学刘伙玉组成的&三只熊&获得了资金流入流出算法比赛冠军。
让我们先来看看这次天池大数据竞赛的一系列数字吧!
1、覆盖了全球36个国家和地区
2、有14054支队伍报名参赛
3、报名人数达21553人
4、覆盖680所大陆及港澳台高校
5、覆盖367所海外学校
6、最高奖金达30万
7、开放了58亿条数据,创下中国商业机构迄今为止单次开放数据的记录
阿里巴巴副总裁涂子沛表示,阿里巴巴在做天池大数据的初衷,就是推动大数据的生态系统形成,推动数据新生代人才的培养和产生,让全世界认识到大数据时代不是空话,是实实在在可以产出有效益的事情。
竞赛的四大亮点
在IT业界,无论是传统厂商还是互联网厂商,都在举办着各种大赛、竞赛,吸引不同的人群关注、参与。而阿里巴巴的天池大数据竞赛又有哪些不同呢?涂子沛认为,天池大数据竞赛有四大亮点。
1、天池大数据竞赛是万众创新的载体。如今是大众创业、万众创新的时代。阿里巴巴开展的天池大数据竞赛将数据开放,解决实际的业务问题,让不可能的事情变为可能。例如,上一届天池大数据竞赛的主题主要围绕贵州省交通方面,开发智能红绿灯系统。由于政府的资源有限,无法自己完成,因此和阿里巴巴合作,开放贵州省的交通数据,放在天池平台上,帮助政府解决交通问题。
2、开放数据和资源。大数据时代,不只是BAT三家公司的事情。阿里巴巴希望大数据真正的在中国落地,形成生态系统,不仅仅是商业机构的事情,而是大众的事情。因此,阿里巴巴提供天池大数据平台,将数据开放。
3、众智众包的平台。今天的阿里巴巴不仅是想改变中国,甚至是影响世界改变世界。此次天池大数据竞赛推出了国际版网站,让更多的全球高校师生可以参与,通过大赛来调动全世界的资源。涂子沛认为,天池大数据竞赛是开放式创新,阿里巴巴希望将天池大数据平台打造成众智众包的平台。
4、开放的不仅是数据,还有工具和能力。此次阿里巴巴举办的天池大数据竞赛不同于其他大赛,开放了多达58亿条商业机构的数据,并且进行了脱敏处理,还开放了很多免费的工具,毕竟没有工具是处理不了海量的数据。
开放式创新
在对涂子沛的采访中,他提到最多的就是开放式创新,此次天池大数据竞赛,阿里巴巴不仅是开放了自己的商业数据,还开放了大数据的工具和能力,让更多高校师生可以将理论变为实践。
涂子沛表示,我们将真实世界的问题拿出来,放到天池大数据平台中,允许外部的力量来挑战阿里巴巴内部,然后吸取最好的解决方案,这就是创新,阿里巴巴正是这样一家开放式的公司。
阿里巴巴的开放式创新,不仅是依靠自己公司的力量来解决实际业务问题,还依靠社会的力量来解决难题,充分发挥了互联网和云计算的力量。在去年的&天猫推荐算法大赛&中,6名90后大学生研发的个性化推荐算法,在&双11&当天的实战效果超过天猫原有算法的16.9%。
涂子沛表示,&我们不仅仅是影响中国,我们要影响世界改变世界,这是今天我们天池平台的一个雄心,这就是我们走向国际化的原因。&
构建大数据生态系统
除了开放式创新,阿里巴巴举办天池大数据竞赛的目的,还希望推动大数据生态的形成,推动数据新生代人才的培养和产生,让全世界认识到今天的大数据时代不是一个空话,是实实在在可以有产出有效益的事情。
涂子沛认为,一个好的生态,应该是整个社会的每一个部分都要参与其中的,包括个人、组织、商业机构以及政府。阿里巴巴作为商业机构,将自己的能动性发挥到最大,通过大数据竞赛推动大家的意识,一方面推动人才的培养,同时普及数据的意识,也提高了大众的隐私意识。
开放数据是全世界的浪潮,不仅是公关部门,还有商业部门,并且需要有人引领。涂子沛认为,在金融大时代,未来社会数据将成为每个人的权利,数据的使用、编辑、开放、挖掘都表现为数据的权利,数据在个人、政府以及商业机构之间的流动、管理,是需要有一个健全的机制来规范的,而这个引领者可以是任何人。
如今,我们的社会充满了各种类型的数据,并且分散在不同的政府公共机构以及商业公司中,然而,这些数据如何打通,真正为民生和社会服务,是需要引领者的。但是,数据的开放、打通不是一件简单的事情,需要商业机构的开放,需要政府的立法,从而保证我们的数据隐私,并且还可以通过数据来提供更精准的服务。真正全社会的大数据分析,需要各方的力量来共同完成!
【责任编辑: TEL:(010)】
大家都在看猜你喜欢
头条头条头条头条原创
24H热文一周话题本月最赞
讲师:64人学习过
讲师:11人学习过
讲师:4人学习过
精选博文论坛热帖下载排行
本书从基础知识入手,详细讨论了Oracle数据库的创建、OEM及iSQL*Plus等工具的使用、Oracle的字符集知识、用户的创建与管理、表空间和数据文...
订阅51CTO邮刊背景:天池比赛今年应该是第三届了,作为14级的硕士,14年的天猫推荐算法大赛百万奖金还是非常吸引人。不过重点倒不是这个,主要是从决赛答辩PPT里看到里面确实有不少非常优秀的人花了很多心思和精力在上面。作为一个新手,虽然之前补了一些机器学习的课程,但由于实验室的主要精力并不是做数据挖掘的,所以自己想做数据挖掘的话,觉得在没有项目和老师带的情况下,自学是一个比较艰难的过程。参加比赛的初衷还是希望能认识更多的人,有更多的经历。实验室有几个师兄刚好在14年的比赛中拿到了TOP50,也还是希望自己能拿到一个名次。最终和队友参加了15年天池比赛的三场,两场TOP50,一场TOP5,算是圆了15年比赛过程中的一个心愿。关于赛题和数据:先说赛题吧,从14年的推荐到15年的移动推荐,资金流预测,穿衣搭配,新浪微博来看,赛题确实丰富了不少,不过赛题的目标都差不多,都是预测模型。不过预测模型能用到的算法非常多,具体问题具体分析吧,资金流里是典型的时序数据分析,数据样本小,常见的机器学习算法在那个比赛里用的比较少,特征多反而容易过拟合,而经济学里的arima模型就比较适用。然后关于数据,阿里线上给的数据很良心,数据量真的是大,移动推荐至少有200多个G吧,这些数据如果自己爬还是要爬很久的。不过有些比赛里数据是经过清洗的,先练习数据清洗的可能这里不是重点。穿衣搭配里有300万张图片,不过比较可惜的是这些数据都不能下下来,不过后面听天渡说,如果要发论文是可以申请使用这些数据的。关于线上平台:在实验室搭hadoop环境的缘故,对mapreduce还算有点认识,但到了线上赛还是非常感慨企业做出来的产品确实不一样。ODPS的功能非常强大和全面,上面跑sql,跑pai任务都非常方便,给的计算节点也不少,穿衣搭配主办方一开始没限资源,一条sql最多可以起40000个节点跑,后面由于大家用的太随意了,所以加了限制,每次虽然能起4000个节点,但同时运行的只有800个节点,其他的在任务队列里。从这点看,一次线上赛一个月,给选手的计算资源真心良心。xlab算法平台上的算子也非常丰富(我们实验室自己用Azkaban和spark搭过一套类似的作业流系统,但是功能和健壮性比起阿里的xlab真心弱爆了)。从最基本的数据预处理到常用的机器学习算子,到现在流行的图计算算子都在里面,R语言的支持也在资金流中开放给选手了。不得不说阿里云给的平台是国内所有企业中做的最完善的。唯一要注意的是,必经ODPS服务于所有用户,所以比赛的时候尽早做,不要拖到后面,因为后面可能会遇上ODPS升级和选手抢占资源的事情,结果会非常蛋疼(新浪微博的时候,常常看到由于平台升级中的bug导致大家晚上两三点了还在想办法绕过bug提交计算任务)。从这点看,比赛做的越早,做的越认真,后面拿到TOP的机遇越大,毕竟特征规律是一个一个挖出来,坑是一个一个自己填满的。关于比赛和选手:首先必须承认,天池比赛的影响力确实不如kaggle,而且由于后期是线上赛的原因,很多方法会受限,比如自定义的算法以及算法的语言等等。但是不可否认,参与到这项比赛中确实有很多认真有想法的同学,排行榜首页的争夺确实不易,需要花很多心思,并且与自己这方面的水平呈正比。这方面可以从答辩PPT上也可以看出来~ 很多看似简单的东西背后是平时不断的积累和思考的成果。认认真真花心思参加一场,参加首页的争夺战对自己来说还是非常有意义,而且到了首页,内心一定会驱动自己去拿TOP,这种经历一定会成为你的一种重要经历。所以对于数据新手,参加天池比起参加kaggle来说能学到东西可能会更多,毕竟这里会让你用到现代数据处理平台。当然有更高追求的人也可以参加天池和IJCAI联合举办的比赛,那样拿到名次的话不仅可以拿到丰厚的奖金,还可以在IJCAI发篇论文。关于找工作的影响:对于找数据岗的同学而言,参加一次这样的比赛,拿一个比较好的名次对找工作和实习是非常有帮助,尤其是对于进阿里。不得不说上上周被答辩群里的同学的offer秀了一脸,(⊙﹏⊙)。关于对于行业的认识:在比赛之前,我对云计算和数据行业的认识只有一个初浅的认识,但比赛后还是对阿里云的产品印象深刻,摆脱hadoop,完全自己实现一套这样的平台和产品,并且性能和稳定性能达到商用级别还是非常不容易。阿里云确实在做了很多事情。P.S: 那些年踩过的坑:1. 认真分析题目,防止思维定势: 这点刚开始的时候,表现的非常明显,看到题目里有推荐就想用协同过滤,╮(╯▽╰)╭2. 数据采样:
采样很重要。上采样、下采样和采样比可以按照数据的具体分布来做3. 数据倾斜: 写mapreduce抽特征的时候注意下先看下数据的分布,不然数据倾斜严重的话,很容易单节点运行太久导致任务失败。4. 多看paper,多思考,复用前人的成果。 这点队友魁神做很好,每次我们建模和做特征的时候,魁神都会建议先把国外相关课题的论文先过一遍,抽出不少非常有用的特征和处理方法。
&p&&b&1. &/b&&b&比赛初体验&/b&&/p&&p&去年作为一名毫无实战经验菜鸟参加了天池穿衣搭配,最终意外地取得不错成绩Top3(其实我们前期一直是第一啦~~,关键还是看最后,除了多拿了点周星星奖品外,所以不要骄傲前期取得的优势),谁说菜鸟不能取得好成绩,只要你努力,一切皆有可能! 或许对于新手来说前期会比较艰辛,熬过去坚持下来必有所收获,有时你也需要给力队友。&/p&&p&穿衣搭配比赛也是我全身心投入的第一场比赛,有过与小伙伴奋斗通宵,每天10点坐等排行榜更新,刷排行榜都快把键盘F5擦没了。有时会因为线下成绩提升兴奋地睡不着,然而第二天线上评测下降而蛋疼,重新定位错误改算法。这里必须提到一点是,数据挖掘类比赛搭建有效一致的线下评测尤为关键。&/p&&br&&p&&b&2. &/b&&b&能学到什么&/b&&/p&&p&如果你了解过这次比赛,你会发现这次天池比赛的趣味性与挑战性挺大,涉及到自然语言处理,图像深度学习以及排序优化等搜索技术相关内容。为了做好这次比赛,需要自学相关内容,比如简单的TF-IDF向量化文本,通过cos计算相似来评价商品相关性,目前自然语言处理来评价文本搜索相关性在kaggle有个非常值得推荐的一个比赛&a href=&///?target=https%3A///c/crowdflower-search-relevance& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&Crowdflower Search Results Relevance&i class=&icon-external&&&/i&&/a&,github有冠军源码。由于题目提供图像数据 ,需要图像深度学习知识,比如卷积神经网络降维提取图像特征做以图搜图技术,线下可以用VGG-net和caffe等工具,后来发现python的Keras也挺好用的。为了做好排序会去研究Learning to Rank算法,比如目前排序场景中效果很好的Listwise方法LambdaMART,不过由于题目数据特征所限,最终我们只能采用简单而有效的Pointwise方式的分类器GDBT预测方案,线下学到的高大上方法在比赛中效果有时并不好,需要坚持也需要Plan B。但高大上知识在找工作面试中特别有用,会让你优秀地让面试官无法直视。天池比赛有时需要模型算法,更重要的是注重业务,根据业务知识提取特征,特别是统计特征,可能没参加比赛前很难理解&b&特征决定上限&/b&的这个真理。天池复赛是真正意义上的大数据,提供海量数据和免费使用天池ODPS机会,可以采用MapReduce或者ODPS的Hive自定义函数进行分布式机器学习任务,在特征提取采用MapReduce非常方便,能同时调用几千个节点甚至几万个节点,这真的非常cool & 过瘾,期间也会遇到数据倾斜问题,如何解决非常有挑战性。如果能进入比赛答辩还有进一步提升机会,赛后交流能了解更多大神思路,比如多模型融合Ensemble技术,之前我们只用单模型,羞愧ing~~,Ensemble真是数据挖掘类比赛的惯用套路,教程: &a href=&///?target=http%3A///kaggle-ensembling-guide/& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&Kaggle Ensembling Guide&i class=&icon-external&&&/i&&/a&&/p&&br&&p&&b&3. &/b&&b&潜在福利&/b&&/p&&p&貌似天池比赛只区分第一与非第一(奖金而言),其实没拿到第一,钱不是那么重要, Top5能参加官方高格的答辩会,最最最重要的是能认识大神!认识大神!认识大神!(重要3遍),拓展朋友圈,比如阿里星(数据江)、天音大神(积分榜Top3)等等。再说比赛的好处吧,比赛成绩好对工作面试极有好处(而且阿里对天池比赛也很认可,Top10具备校招直接终面资格),根据实习面试反馈,面试很注重项目和实战经验,天池比赛无疑非常贴近实际业务场景,而且玩过天池复赛自动get相关分布式处理技能,个人感觉影响力而言Kaggle & 天池 & 国内其他数据比赛平台,而且随着天池宣传与普及,天池参赛人员越来越多,含金量会越来越重。&/p&&br&&p&&b&4. &/b&&b&可能是不痛不痒的建议&/b&&/p&&p&对于新手入门建议(老鸟请忽略)&/p&&p&1. 李航的《统计学习方法》(讲真,看3遍没错),Ng机器学习教程&/p&&p&2. 可以去Github上学习Kaggle冠军代码,说实话冠军代码质量高得没得说,可能方法有套路,但是特征提取确实值得学习研究,必须好评&/p&&p&3. 掌握相关分布式技术Hadoop、MapReduce,Hive等技术和原理&/p&&p&4. 参加天池等大数据比赛,实践出真知,打比赛最好的时间是研一,其次是现在(本人目前研二)。&/p&
1. 比赛初体验去年作为一名毫无实战经验菜鸟参加了天池穿衣搭配,最终意外地取得不错成绩Top3(其实我们前期一直是第一啦~~,关键还是看最后,除了多拿了点周星星奖品外,所以不要骄傲前期取得的优势),谁说菜鸟不能取得好成绩,只要你努力,一切皆有可能!…
谢邀&br&因为机缘巧合,我参加了去年的天池大赛系列的微博互动预测大赛。当时是两位前舍友拉我入伙,我说另请高明吧,我也实在不是谦虚,我一个搞分布式系统的,怎么就能参加机器学习类的竞赛呢?后来一听说奖金丰厚,赶紧抱紧了两位前舍友的大腿,再续孽缘……&br&================还是正经一点答吧=================&br&&b&1. 理论到实践的豁然&/b&&br&我的专业方向不是机器学习,所以也不敢谈论太多这方面的话题,但根据参赛过程中遇到的一些问题,理论和实际之间确实存在不小的差距,如果仅仅停留在了解原理的层面而没有真正将算法应用到实际数据上,很难有所体会。某大神队友就因为经验主义而被坑了很久,而一旦意识到了这一点,成绩一下就上升了很多。通过比赛增加的实战经验能更好的帮助自己去理解算法,虽然并不一定非得参加比赛,但至少这是一个非常好的机会,尤其是比赛中提供的真实数据,很有价值,也算是提前为自己进入工业界做准备吧。&br&非相关方向的人参赛,其实也有收获,比如说我,已经精通各类机器学习算法单词缩写的拼写,没事也能走两步了。&br&&b&2. 团队协作的快乐&/b&&br&通过比赛,可以找到志同道合的朋友,能够体验到团队作战的那种快乐。我一直很享受和厉害的人合作(实际上是抱他们大腿),这是一个交流的好机会。我们三个人方向各异,有研究P等不等于NP的(已经成为机器学习大师),有研究NLP的,也有搞CAP的,我们在一起就是3P吧……&br&微博的赛题涉及了社交关系和文本分析,刚好是两位大师各自最擅长的,而写代码提特征,map reduce处理数据,长年搬砖的我也可以发挥一点余热。比赛期间常常是他们以自己的专业视角提出了各种想法,让我眼界大开,我偶尔为了装逼也开开脑洞咨询咨询他们的意见,工程方面我可以提供一些经验,提高我们三人的开发效率。彼此之间学到了很多东西。&br&在遇到困难的时候,有一个团队会给人很大的安全感,一起熬夜奋斗,一起解决问题,而不是孤单一人在那里死磕。更关键的时,对队友的那种绝对信任,你知道他们很强,你相信他们一定有能力解决,所以你也会更严格的要求自己,你知道你们必胜,无论多难。无论结果如何,这个过程我是享受的,同甘苦,共进退。平淡的生活里总得有点热血的事情,虽然一般我们一起熬夜奋斗的时候我们总在讲笑话……&br&&b&3. 追求目标的坚定&/b&&br&参赛前夕,我们确定目标:冠军。大家互相鼓励,雄心勃勃,念了两句诗,“黄沙百战穿金甲,不破楼兰终不还”,然后开始了各自的国庆假期……此处省略字两位大师去把妹的经过……国庆一结束,紧急集合,开始做题,离比赛结束还剩20天……&br&因为落下其他队伍比较多,一开始追的非常艰难,加之我们白天还要去工地上搬砖,情况不容乐观。过了很久之后才第一次进了前十,期间有一段时间用尽各种办法无法提升成绩,做梦都是梦见那个数字。真是为伊消得人憔悴。&br&没了假期,没了充足的睡眠,丝毫提升不上去的成绩,当然想过放弃,但真是不服啊,说好的目标,就一定要去达到,怎么能退缩?&br&后来我们在最后一个夜晚通宵完成绝杀,线上成绩第一……&br&事情已经过去很久了,结果也没那么重要了,但是过程中的这种坚定还是很历练人的心智的,习惯了遇到逆境而退缩放弃,如果真的有一次狠下心来坚持一回,发现其实也不是那么困难,而且,坚持可能真的能带来胜利。&br&坚持到底,达到目标,这种快乐真的很难形容,未来还有无数次机会可以体验这种感觉&br&&b&4. 遭遇逆转的反思&/b&&br&决赛答辩,在我们以为稳操胜券的情况下,最后被逆转。我们好像是唯一一个线上成绩第一被逆转的队,也算是一个记录了……&br&那天夜晚我们和评委理论到了12点,我们并不是质疑他们的公正性,但是心里是真的不服的。&br&评委也给出了我们最后失败的理由,我觉得他们也说的很有道理,我们的解决方案比起另一队确实更加复杂,虽然效果要好,而工业界考虑一套解决方案时,不会只从结果去考虑,成本也是一个重要因素。当然如果我们能更加深入下去,在结果上提升更多的话,可能也就没有这次的尴尬了。这个教训还是值得我们反思的,当然,我们并没有因此而服气,也不认可评委对我们的一些评价,反思归反思,不服归不服,两码事。&br&那天夜里,我们情绪低落,聊了一个通宵,不过即便如此,我们还是能像往常一样互相调侃讲笑话,笑完以后吐槽一句这次的结果,本来都决定拿了钱去吃金钱豹了,现在看来只能吃沙县小吃了……&br&结果已经不重要了,我们会带着这次的反思去做好未来的事情,不只是比赛而已。也算是一次不小的收获。&br&================写在最后=================&br&比赛很累,但坚持很值&br&结果很重要,但过程能让你有很多体会,结果只是顺其自然的事情而已&br&如果学习生活中找不到目标,参加这些比赛,能让生活变得饱满&br&参加比赛不在于数量,应该挑选合适的比赛,也要多关注自身的积累&br&选择参加比赛,就竭尽全力的去打,才能真正知道自己的潜力有多少(某大神队友正是因为参加了某次天池大赛发现了自己骨骼惊奇而正式转型成为了机器学习大师,不然也许现在他已经证明了P=NP拿到了图灵奖吧)&br&涉嫌做一次广告:不管参不参加天池比赛,我觉得关注一下赛题还是可以的,至少了解下应用场景&br&&br&只写了点微小的体验,谢谢大家!
谢邀 因为机缘巧合,我参加了去年的天池大赛系列的微博互动预测大赛。当时是两位前舍友拉我入伙,我说另请高明吧,我也实在不是谦虚,我一个搞分布式系统的,怎么就能参加机器学习类的竞赛呢?后来一听说奖金丰厚,赶紧抱紧了两位前舍友的大腿,再续孽缘……
已有帐号?
无法登录?
社交帐号登录}

我要回帖

更多关于 阿里天池大数据 的文章

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信