应届毕业生参加校招,想去百度试试,先网申(即填简历),后上机测试,还有性格测试,技术面,boss面。
问的问题基本都是算法的,本来就是抱着想试一试的想法,结果发现自己还是太嫩了,没能被录取。只能转投自己能力所在的公司了
1、你的项目经历,以及在项目中担任的角色?
2、你做过最自豪的事情是什么?
你是通过何种渠道获得这次面试机会的?
整个面试花费了多长时间?(从接到面试消息到得到结果)
答:电话面试 1对1面试 IQ测试
你觉得这次面试的难度如何?
你对这次面试的整体感觉怎么样?
答:面试成功但没有去报到
记录下渣硕的秋招经历,粗略估算大约海投了59家,真正面了9家左右吧,笔试大概也做了几十家吧,目前的情况是拿到了苏宁(准备拒)、好未来(已拒)、百度、腾讯的offer,另外饿了么面了二面,美图面了一面,迅雷10月有面试(已拒),以上
开始求职的第一次面试,视频面试,原定的3点45到下午4点30多开始面,一面中规中矩,面试小哥没有为难我,主要是先自我介绍,然后问了一个Java语言的问题(抽象类与接口的区别、用过Map吗,说一下HashMap和TreeMap的底层实现的区别),接着手写了道快排,讲解了一下就开始让我介绍参加过的京东的比赛(要求按照一定的框架讲,比如做了什么,觉得自己做的好的有说什么,有什么做的不够好的),在介绍的过程中针对性的提了一些问题,可以说都是一些常考的问题,记录如下:
这一面倒是没有撕算法也没有问一些基础的问题,都是偏向实际应用的略开放的问题,记录如下:
总体来说虽然第二面挂了,不过受益颇多,确实只是懂得一些基础知识恐怕还是不足以胜任公司的要求吧,顶多撑过一面,一来简历存在问题,二来实际应用中模型的区别掌握的不够,这刺激了我后面阅读算法库的文档并分析了gbdt的不同实现的真实区别
是否了解决策树,讲一下你的理解
三种决策树是如何处理缺失值的
在xgboost里,在每个结点上都会将对应变量是缺失值的数据往左右分支各导流一次,然后计算两种导流方案对Objective的影响,最后认为对Objective降低更明显的方向(左或者右)就是缺失数据应该流向的方向,在预测时在这个结点上将同样变量有缺失值的数据都导向训练出来的方向。
例如,某个结点上的判断条件是 A>0 ,有些数据是A0,有些数据的A是缺失值。那么算法首先忽略带缺失值的数据,像正常情况下一样:
RandomForest包里有两种补全缺失值的方法:
方法一(na.roughfix)简单粗暴,对于训练集,同一个class下的数据,如果是分类变量缺失,用众数补上,如果是连续型变量缺失,用中位数补。
方法二(rfImpute)这个方法计算量大,至于比方法一好坏?不好判断。先用na.roughfix补上缺失值,然后构建森林并计算proximity matrix,再回头看缺失值,如果是分类变量,则用没有缺失的观测实例的proximity中的权重进行投票。如果是连续型变量,则用proximity矩阵进行加权平均的方法补缺失值。然后迭代4-6次,这个补缺失值的思想和KNN有些类似。
补充【proximity matrix】:Proximity 用来衡量两个样本之间的相似性。原理就是如果两个样本落在树的同一个叶子节点的次数越多,则这两个样本的相似度越高。当一棵树生成后,让数据集通过这棵树,落在同一个叶子节点的”样本对(xi,敏感词roximity 值 P(i,j)加 1。所有的树生成之后,利用树的数量来归一化proximity matrix。
样本类别不平衡会带来怎样的影响
讲一下auc 以及你们比赛中最后模型的auc得分
随机森林里使用的决策树是哪一种? sklearn里实现的是CART的一种变体
你担任副班长,职业有哪些,和班长有哪些不同
担任班干部让你学到了什么
你的意向填的是上海,说明下原因
据说是算法的负责人之类的来面
介绍了自己部门的主营业务以及接下来可能的面试流程安排
说实话美团挂的有点蹊跷,当然也可能是我想多了,因为面试官面完说感觉你答得不错,而且做的东西和部门研究也相符,后续可能会安排现场面,然后我就挂了(欢声笑语打GG?),可能是投的广告部门hc满了或者有更适合的人了吧。
大数据 分布式,工业界的做法,比较前沿的技术是怎么做的,知识比较欠缺,当前从书籍,论文了解的较为陈旧
两个100亿数据集进行join 操作 考察开放思维能力,学习能力
为什么比赛中xgboost 表现比rf要好,从数据的角度分析
仅使用pandas库进行分析是否有什么性能上的问题
是否了解java 并发
远景的话大概是需要能直接干活的人吧,上来我讲完项目就说感觉你比较熟悉,但和我们技术栈不太符合,然后就尬聊大数据
两道算法题 矩阵乘法,转制&字符串中最长的数字字符串
自我介绍,说常用开发工具
讲讲svm ,假设分离超平面系数非常大怎么办
L1正则和l2正则区别
说说hashmap 底层实现,为什么查询快?
为什么你这个得分还不错,使用了什么trick
京东赛官方评价标准的解析以及是否采取对应措施
面完二面说本来有3面boss面,然后boss出差了,后续可能给你安排电面,估计是被婉拒了吧
实验室的研究方向是什么
用Python 写一个对文本文件的词频统计
先序遍历二叉树,非递归
链表的第一个公共节点,优化
选一个最熟悉的算法,模型讲一下
讲一下项目--针对细节提问
基本情况了解,包括技术栈、意向城市
对百度的部门是否了解--开始介绍部门--需要记录意向部门
百度的话应该是我运气好吧,问的不难,我也基本都答上来了,要说亮点的话可能是在二面让讲一个项目,吸取了滴滴的教训,我把gbdt从集成方法的区别到adaboost vs gbdt再到sk-learn的gbdt vs XGBoost vs. LightGBM都给他撸了一遍,从原始论文的区别到具体实现的区别,所以这里可能算是面试的一个关键点吧
自己负责那一块,讲一下
模型实际应用中的比较,为什么一个比另一个好
Rf 调参是怎么做的,这里指出树的棵树,层数可以通过样本数,特征数预估,而不是拍脑袋决定
京东表现不是很好,为什么,有没有想过原因
简历的缺陷:实验室的研究没有写出,面试官看重你研究生阶段独立完整地研究了什么东西
熟悉哪些算法,分类的和回归的
是否了解深度学习,是否了解卷积神经网络
讲下l1,l2区别及原理细节
被批概率论基础不行,很多东西只记结论,过程有所跳跃,机器学习过分依赖工具,原理理解不透彻,比赛过于使用套路,缺乏自己的思考和创新
实验室项目介绍 具体怎么做的,节点多少,数据量多少,进度如何等
构造了哪些特征,不同阶段
比赛得分不是很高,是否尝试过其他方法
是否考虑过用深度学习来做
banana 找最长子串,要求非后缀子串,但是内容与后缀子串一样
最近看了什么书--计算广告--讲的是什么?--广告方面怎么做比较好
是否有其他同学来参加腾讯面试,或者说与你同样进了hr面试的同学(前提是他们本科好)比,你的优势在哪
参加的XX比赛是做什么的
目前有哪些offer,面过哪些公司
百度和腾讯都给你offer的话你选哪个,为什么
有没有谈过女朋友--为什么没有谈过?
除了互联网公司还有其他公司比较有意愿
腾讯应该也是比较好运气吧,一面被招聘人员指了个错方向迟到一二十分钟被面试官压着问,后面每一面都感觉自己应该是挂了,结果反而一直被吊打到完成面试,相比较同实验室的阿里大佬来说,他是一路开挂,我是一路被吊打。
类别不平衡会带来哪些影响
美图8月内推的吧,过了一个月才面,而且是在被百度腾讯吊打一周后,已经快油尽灯枯了,感觉面的不好,估计是挂了吧
说下Java的重写和重载的区别
是否了解Java虚拟机
常见排序算法时间复杂度为O(nlogn)的有哪些,最佳、最差时间复杂度分别是多少?
智力题,8个球,一个比其他的轻,用天平称出该球最少用几次,怎么称
手写数组旋转,要求不使用额外空间
简单聊下个人意向,手头offer、面试情况
手写计算树的深度,要求不使用递归
手写算法,在旋转数组里寻找某个给定的元素,要求时间复杂度O(n)以下
说实话,好未来是我面试状态最差的一场,一个没睡午睡,另一个就是在美图面试下午,就是已经油尽灯枯了,一面快排一开始写错,旋转数组没反应过来,好在后面一道算法写对了,但是也让我过了,运气使然吧。
小结一下我的一些个人的想法
以上大概是我秋招的一些记录了,最后运气很好拿到了比较满意的offer,开始也是看着实验室各种大佬早早结束秋招,一路走来,十分感谢实验室各位大佬还有师弟们的扶持,也感谢同寝室同班的小伙伴的相互鼓励,还有老爸、老姐的关怀,最后也感谢自己,在比较艰难的时候也没有放弃,希望每一个看到这里的小伙伴都能坚持到最后一刻,拿到心仪的offer~
版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。