当前位置 博文首页 > 大数据manor的博客 :字节跳动 面经

    大数据manor的博客 :字节跳动 面经

    作者:[db:作者] 时间:2021-09-13 09:58

    作者:好运来好运来offer来来来
    链接:https://www.nowcoder.com/discuss/718280?type=post&order=time&pos=&page=1&ncTraceId=&channel=-1&source_id=search_post_nctrack
    来源:牛客网

    一面(8.11一小时)
    一面过后忘记整理问题了,不过基本都是常规八股问题,内容涉及操作系统、集合、spark基于yarn的工作流程(典中典)、hdfs读写流程 (典中典)、MySQL索引、innodb引擎等
    算法题 LC976三角形最大周长,奇升偶降排序链表,字节典中典题目

    二面(8.17一小时二十分钟)
    1、项目
    1)如何对项目做一些优化?除了性能上的
    2) 遇到的困难
    项目问的时间很长,大概四十分钟,细节基本都问到了,有的细节的地方记不清了,犹豫了一下,面试官还问为什么犹豫
    2、MySQL
    1)数据库引擎:innodb和myisam的差别

    2)索引:主索引和辅助索引的差别

    3)什么是回表查询,什么是覆盖索引

    4)索引最左匹配相关题

    A表 索引(a,b,c)

    select * from A where a = ? and b > ? and c = ?

    select * from A where a > ? and b > ? and c = ?

    select * from A where a < ? and c < ?;
    a,b,c能否走索引,怎么执行查询计划
    3、代码
    表log(user_id,log_date)
    1)选出登陆次数超过三次的用户

    2)选出连续登录天数超过三天的用户,用sql实现

    用日期和排序相关窗口函数实现这个SQL
    3)2)中的SQL改用算法实现
    哈希map分组+滑动窗口+边界处理
    注意边界,例如闰年、闰月,一三五七八十腊等等特殊的边界

    3、三面(8.23三十分钟)
    1、项目(十分钟)面试官对我的项目不感兴趣,草草问了问就结束了,
    2、八股:
    1)kafka如何做到消息消费时不丢失不重复,你有没有遇到过这种场景
    2)spark streaming如何解决数据积压
    3)spark数据倾斜如何解决
    3、两道代码
    1)第一道两个单向链表求第一个交点,太简单了以至于我说了思路就让我过了
    2)参考微信抢红包,输入一个金额money,人数num,返回一个数组,设计一个抢红包功能;
    思路:①先只考虑了整数红包的情况,每人至少抢1元,循环+random
    ②考虑实际抢红包,粒度精确到分
    4、SQL行转列

    hr面(8.24六分钟)
    就主要问了问手上有没有别的offer,如果有会选择来字节吗

    总结:三面的体验挺不错的,面试官都很耐心,hr说一周会给结果,到了周五忍不住催催,就很快发了意向

    cs
    下一篇:没有了