当前位置 博文首页 > 文章内容

    面试遗漏知识点:Yasin的博客

    作者:shunshunshun18 栏目:未分类 时间:2021-10-27 20:23:47

    本站于2023年9月4日。收到“大连君*****咨询有限公司”通知
    说我们IIS7站长博客,有一篇博文用了他们的图片。
    要求我们给他们一张图片6000元。要不然法院告我们

    为避免不必要的麻烦,IIS7站长博客,全站内容图片下架、并积极应诉
    博文内容全部不再显示,请需要相关资讯的站长朋友到必应搜索。谢谢!

    另祝:版权碰瓷诈骗团伙,早日弃暗投明。

    相关新闻:借版权之名、行诈骗之实,周某因犯诈骗罪被判处有期徒刑十一年六个月

    叹!百花齐放的时代,渐行渐远!



    推荐 IIS7批量FTP管理工具 IIS7批量FTP管理
    IIS7批量FTP管理功能说明:
    1、可批量导入,导出FTP信息
    2、其他ftp工具有的功能,我们也有
    3、特色功能:可以定时上传下载
    4、数据信息列表化、一眼就能知道那个是那个
    5、批量连接 标签页式切换 方便快捷
    6、7大连接模式 更多好的兼容
    7、内嵌编辑器 有效解决普通txt记事本乱码
    8、锁屏功能 当程序有规定时间内没人操作,则自动锁程序。输入密码才可以正常操作

    本产品适用于:懒得记录FTP信息和有批量定时备份,上传下载的运维或站长。

    图:


    IIS7批量FTP管理

    1. 机器学习算法理论:LR、SVM、树模型、FM/FFM、EM、LDA、word2vec、推荐算法等等,都会被问到,需要懂得算法的推导、适用场景、使用的Trick、分布式实现。

    7. 海量数据处理:经常问的就是海量数据排序,推荐博客:http://blog.csdn.net/v_july_v/article/details/6279498/,弄懂这块就基本没问题。

     

    推荐相关

    你了解的CTR预估模型有哪些?GBDT+LR、FM、FFM、wide & deep、DeepFM、 FFM的优化(百度) FM推导

    deepfm模型与wide & deep相比,优点在哪里?

    Deepfm的原理,DeepFM是一个模型还是代表了一类模型,DeepFM对FM做了什么样的改进,FM的公式如何化简并求解梯度

    wide & deep是怎么训练的,两部分用的优化器是一样的么?
    说一下fm和lr的区别,fm相对于lr有什么优点

    LR和FM的区别?FM需要进行交叉特征的选择么?如果在LR选了一部分特征做交叉之后,取得了比FM更好的效果,这是为什么?如果FM变成DeepFM之后,效果超过了LR,这又是为什么?

    神经网络embedding层和w2v中的embedding的实现区别

    LR和FM的区别?FM需要进行交叉特征的选择么?如果在LR选了一部分特征做交叉之后,取得了比FM更好的效果,这是为什么?如果FM变成DeepFM之后,效果超过了LR,这又是为什么?
    为什么说LR模型是可解释的?如果一个离散特征有成千个维度,那么结果如何解释。

    做过广告点击率预估没?LR+GBDT和GBDT+FM怎么结合的知道不?
    给你一个视频推荐的任务,你如何考虑采取的算法,该系统中最重要的点是什么

    数据有没有不平衡,怎么处理的;数据倾斜一般怎么处理?

    在CTR预估问题中,假设训练数据的正负样本数为1:4,测试数据中的正负样本数也为1:4,那么此时模型对测试集,学到的平均点击率为1/(1+4),假设此时采取了欠采样策略,使正负样本数为1:1,对同样的测试集进行预测,平均点击率应该是多少?(样本量很大,初始总样本数为10亿)

    完整介绍一下推荐系统

    Abtest是怎么做的

    了解learning to rank哪些算法

    KD树介绍 KNN相关优化算法

    场景:有用户feed流和点击信息,如何做推荐

    user-cf、item-cf公式,原理区别与基于内容的推荐的区别

    user-cf中计算近邻用户的距离度量方法有哪些,如何选择 

    怎么把用户id之类的特征融合到xgboost模型中

    你们做转化率的时候没有去重吗

    推荐系统中你认为最重要的环节是什么?我答的探索与利用。

    给你一些用户每天的相对位置信息,怎么区分他们的职业

    文本内容推荐中有哪些内容可以应用到商品团购推荐当中去

    多臂老虎机中,有许多方法,比如e-greedy,timponson采样,UCB,这些方法都有哪些适用场景?

    5. 推荐系统的大概步骤,解决冷启动。。

    关联推荐与协同过滤

    gbdt+lr模型更新的先后顺序?频率呢?

    LDA的原理       如何评价LDA模型的好坏

    SVD   SVD三个矩阵是怎么样的     SVD和特征值的关系(卒)    PCA和SVD的区别和联系

     

    机器学习

    特征选择方法(重点)

    特征选择是模型预处理的重要部分。方法很多:方差、相关系数、卡方检验、互信息、递归特征消除、基于惩罚的方法、树模型方法、单特征AUC、IV。

    数据预处理问的比较细,

    如果你想往模型中加入一个特征,如何判定这个特征是否有效?

    xgboost如何判断特征的重要性,其它的算法可以做么(随机森林)EM、LDA、

    能不能用朴素贝叶斯某个特征在某一类的概率来选特征(只衡量一个特征在一个类里出现的概率大小并不能用来筛选特征,个人感觉可以参考互信息法来回答)

    贝叶斯是什么?

    卡法校验

    特征与模型的相关性如何计算与表示;

     

    各种最优化方法比较 拟牛顿法和牛顿法区别,哪个收敛快?为什么? 牛顿法优缺点?拟牛顿法原理?lbfgs?

    梯度下降法,牛顿法,拟牛顿法区别(阿里)
    https://www.cnblogs.com/shixiangwan/p/7532830.html

     

    7 采样方法

    主要有过采样和欠采样。

    过采样:Smote方法及各种变种

    欠采样:ensemble、nearMiss、Tomeklink、ENN

    还有复杂分布的采样会用到MCMC。

    8 聚类方法

    k-means、k-means++、meanshift、DBSCAN、EM聚类、层次聚类。

    9 评估指标(重点)

    精准率、召回率、ACC、AUC、F1、KS、熵系列、信息增益、CTR、CVR、MSE系列。其中AUC是重点中的重点,细节,包括本质意义、计算方法等等,注意AUC是有两种计算方法的,这里有介绍。

    11 batch normalization

    这个问题下的回答很有价值 ,BN问的还挺多的。

    15 各种网络结构&模型(重点)

    这个就太多了,CNN RNN就一堆,推荐的也是一堆,基本的DNN CNN RNN的forward和backprob都要熟悉,然后lstm、gru、attention也要会,还有各种encoder-decoder结构,这个就看积累了。 推荐部分有自己的一些模型,比如FM系列,lookalike、协同过滤之类的非深度学习模型,后面的W&D为首的融合模型也是搭积木

     

    朴素贝叶斯,先验概率,后验概率,调整因子

    伯努利分布和多项式分布,二项分布

    极大似然的原理,极大似然函数和极大后验函数是啥?

    线性回归的共线性,如何解决,为什么深度学习不强调

    对VC维的理解

    3.k个独立高斯同分布随机变量的结果是?

     

    深度学习

    9. 深度学习的优化方法有哪些? sgd、adam、adgrad区别? adagrad详细说一下?为什么adagrad适合处理稀疏梯度?

    具体解释adam,二阶矩是什么?为什么要用二阶矩?

    神经网络中的优化器有哪些?常用的优化器你是如何进行选择的?介绍下Adam优化器  sgd, momentum, rmsprop, adam的区别和联系

    各种优化算法的计算过程及其是怎么起作用的  https://www.jianshu.com/p/70e04c02985c

     

    解释BN(头条,百度)
    https://blog.csdn.net/malefactor/article/details/51476961

    bn为什么能加快收敛速度。bn解决了什么问题?bn是怎么计算的?基于什么计算的?训练和测试的时候有什么不同?测试时候的均值和方差是怎么来的?

    BN层的具体计算过程(训练、预测)

     

    手推softmax loss公式  

    推导softmax的梯度,和tanh的梯度(求导~)
    神经网络最少需要几个隐藏层单元才能解决线性不可分的问题(可以理解成解决异或问题)
    深度学习中,L2和dropout有哪些区别?https://blog.csdn.net/stdcoutzyx/article/details/49022443

    定义class mlp多层感知机(头条)

    深度学习建模过程,关键步骤(特征提取),调参找到最佳模型

    TensorFlow的优缺点,loss函数

    深度学习特征的hash搜索算法时间复杂度;

    一文搞懂DNN反向传播!https://www.jianshu.com/p/ee08ed75844b

     

    NLP

    TF-IDF的计算方式

    Seq2Seq模型介绍一下

    BPTT的推导
    TextCNN原理以及和CNN的区别

    怎么构造的向量,文本怎么做的预处理,怎么训练的词向量等。

    有一篇英文文章,统计出出现次数最多的100个词

    如何提取文本关键字怎么提取的,TF-IDF有改进么,怎么改进的  

    3.命名实体怎么得到的,原理了解  

    4.LDA的原理是什么,使用了哪个框架  

    非结构化文本处理方法(阿里)

    9、命名实体识别与关系抽取的任务是在干什么?目前常用的模型是哪些?自己项目中怎么用的。

    5. LSTM原理,与GRU区别

    TF-TDF的含义及其变形,tf使用log进行平滑处理,降低出现词频特别高的词语的权重,如“the”、“a”等;
    • 文本分类的效果

    为什么使用预训练词向量;
    • attention权重的更新特点

    cnn for NLP

    有什么作用LSTM的改进版有什么给一个业务场景(特征重要程度打分)

    CV

    CNN做卷积运算的复杂度。如果一个CNN网络的输入channel数目和卷积核数目都减半,总的计算量变为原来的多少?

    说一下你理解的卷积核, 1x1的卷积核有什么作用?应用场景?跟3x3区别在哪?

    用过Focal Loss吗?讲一下

    讲一下AlexNet的具体结构,每层的作用

    卷积的计算过程

    解释RESNET(百度,阿里)
    https://zhuanlan.zhihu.com/p/31852747

    旷世face++算法研究员面经

    CNN为什么比DNN在图像识别上更好

    8. 针对第二个项目进行提问,介绍一下Inception V3 和ResNet50

    9. (第二个项目) Inception V3基于之前的Inception系列最大的改进是啥?(楼主答非对称卷积

    10. (第二个项目) ResNet的特点有哪些?(楼主答跳跃连接和瓶颈层)

    12. 介绍一下瓶颈层?为什么要用瓶颈层?

    13. Inception V3的1*1卷积 和ResNet50的1*1卷积有什么不同?

    卷积层个数计算方式  卷积计算复杂度

    3.5 池化层的作用?池化层反向传播的时候是怎么计算的?

    InceptionV3这个结构和V2有什么区别

    L1和L2损失在目标检测中的应用知道吗?


    项目

    1、介绍项目(项目的背景/如何评估/实现过程/算法更新/用户体验)

    2. 你这个项目中间哪些地方提升,中间过程分别提升了多少CTR?

    3. 如何解决数据一致性?

    数据预处理方法

    3)缺失值处理方法

    特征设计思路,为什么这么设计

    4)特征工程怎么做的,为什么选这些特征。如何解决不同备件之间特征不一样但可以用同一套系统去预测的?

    5)选用的什么模型,各个模型的效果,以及为什么?

    6)xgb、lgbm调参方法

    7)模型融合方法,融合的技巧有哪些?比赛中采用了哪种手段,效果为何有提升?3、为什么要模型融合,模型融合的几种方法,模型融合的优点 (bagging,boosting,stacking

    实习项目(讲细节,网络为啥这么改进,用了多少服务器,什么型号的GPU,训练多久,数据集多大,为什么选择这个岗位,怎么看待深度学习和机器学习的关系,深度学习工程师和我们这个岗位有啥区别,面试官很认真的讲了他的看法)

    拉普拉斯平滑

    如何解决样本不平衡问题有一个分类任务有几千个类,应该怎么去训练模型

    选择自己觉得做的最好的项目从需求、样本、特征工程、模型选择等介绍

    简单介绍自己的项目;这个项目碰到了什么问题,怎么解决的;这个项目还有什么可以改进的地方;


    1.3 针对大数据量,有什么处理方法,具体怎么做。

    1.4 业界开源的分布式训练框架。

    1.5 给出一个集群框架,每一个集群包括CPU,存储,时序等等变量,运用什么算法或者策略使得总的效率最高。

    1.6  对于某一个地区中的车辆和乘客怎样合理安排司机-乘客使得滴滴总的收益最大(主要考虑距离)。

    1.7  滴滴的拼车功能的拼车价怎么定,使用什么策略或者算法。

    9、项目中LR有没有使用正则化?参数设置的多少?

    Python

    1.可变元素、不可变元素
    2.深拷贝与浅拷贝
    4.lambda用法

    python如何进行异常处理

    Python的try except finally

    4、list和tuple的区别

    闭包

    有了解过python的内存管理机制的吗

    介绍下lambda

    介绍下filter

    python写一个单例模式

    python里面线程与进程

    进程如何共享内存

    GIL介绍一下,GIL的影响是什么

    用python实现一个读文件,同时对每一列特征进行最大-最小值标准化,再将数据写回文件

    3.3 Python基础(常见数据结构用法,类继承,内存管理)。

    python里面list的[]重载的是哪个函数

     

    C++
    纯虚函数 虚基类 虚析构函数。

    虚函数,虚函数表内存分布,虚函数中虚基类和派生类的关系

    C++ 纯虚函数,抽象类能不能被实例化

    虚函数与纯虚函数的区别在于

    为什么继承时基类的析构一般声明为虚函数?为什么构造函数不能够使虚函数
     


    C++可不可以在两个函数里定义两个名字相同的静态变量
    void func1() {static int a = 10;}
    void func2() {static int b = 10;}
    函数不可重入的问题

    7.float32数在机器中二进制的表示方法

    大数据

    Hadoop与Spark的区别

    11、Spark基于图计算的优势

    Spark作业运行机制以及Spark各组件运行机制。

    8、MapReduce中map和reduce各自负责什么内容,两个阶段如何衔接。

    3. 用mapreduce实现10亿级以上数据的kmeans4.

    4. 会分布式么,hadoop,spark会么,说说hadoop的灾难处理机制

    5. hadoop一个节点数据量太大拖垮reduce,怎么办,Hadoop本身的处理机制是怎么样的,手工的话可以怎么调

    6. hadoop数据倾斜问题如何解决

    如何从200亿数字中,找到最大的100个

    mapreduce思想(腾讯)

    spark任务运行中,发生了数据倾斜,这种情况下你一般如何处理

    hadoop数据倾斜问题如何解决

     

    开放性问题

    开放性问题从一名合格的程序员的角度去解决问题,最好的回答方式是首先你可以首先对数据做一些前期的调研,然后基于业务目标大胆想象出A、B两种解决方案(这是面试官会认为你思维敏捷),之后你要分别根据自己的方案来说出相应的缺点,也就是为什么会存在两种方案,然后基于不同方案的结果在回溯你在方案构建与算法选择存在的问题,去纠正你的问题解决思路。其实这种描述方式跟神经网络的反向传播很像。如果你不是大佬,那么面试技巧的提升,真的很靠数量。

    3、如果逻辑回归的所有样本的都是正样本, 那么它学出来的超平面是怎样的?

    4、哪些场景下的分类问题不适用于交叉熵损失函数?

    5、推荐系统中你认为最重要的环节是什么?

    6、多臂老虎机中,有许多方法,比如e-greedy,timponson采样,UCB,这些方法都有哪些适用场景?

    7、如何预测一家店分品类的销量

    8、信息流采样,有n份数据,但是n的长度并不知道,设计一个采样算法,使得每份被选择的概率是相同的。

    9、模型在线下评估和线上使用时,往往出现线上实际效果不如线下效果的情况,请分析可能的原因。

    现在给你一个问题,筛选垃圾邮件,从数据获取到最后输出整个说一下,

    数据怎么拿,最开始的训练数据怎么拿,怎么扩大训练集,怎么选取特征,怎么把文本编程标准训练输入,怎么评价模型,怎么训练,模型不好了怎么办等等,整个流程走一遍。

     

    4.1 淘宝有1亿总量的商品数量,你作为一个用户通过什么办法得到京东的商品总量。

    4.2  连续递增的数据,拿出两个,打乱顺序,求拿出的两个。

    4.3  n个人围城一圈握手问题,不能交叉,不能落单,求一共有多少种握手数目(卡特兰数推导)。

    4.4  54张扑克,抽去大小王,均分给4个人,问红桃A和黑桃A在同一个人手中的概率。

    4.5  对于一个query,”时效性” query的判断,运用什么算法。

    腾讯 推荐系统

    1. 推荐系统你是怎么理解的
    2. 推荐系统的数据流和业务流是什么样子的,数据由哪里产生,做怎样的处理,又流到哪里去
    3. 怎么获取用户的历史记录
    4. 说得太笼统了,就是怎么获取历史信息,这里面又有哪些信息
    5. 怎么去做特征工程,数据有哪种类型,每种类型怎么去做特征工程
    6. 用户年龄怎么去做特征工程             某个年龄段数据比较少,或者某个业务在这个年龄段里用户比较少,那该怎么办
    7. 性别怎么做特征                     职业怎么做特征,比如说老师,工程师,公务员                怎么做统计特征
    8. 推荐算法有哪些?可以用于推荐的
    9. 就是怎么应用的,你举一个模型讲解一下嘛(这里暴露了一个问题,就是我回答的时候总是问一个说一点,不会扩充,说得太少了)
    10. 怎么预估,得到一个概率吗
    11. 树模型怎么做
    12. 你刚提到的树模型+lr,具体方法是什么
    13. 还有没有什么别的方法可以结合
    14. 推荐这一块还有没有别的算法吗
    15. 比如说冷启动的话有什么算法
    16. 挑一个项目讲解一下(这里是不是讲图网络的比较好?)
    17. 商家在某一个时间段会开始搞活动的,这个时候怎么处理
    18. 你这里写了个上下文特征是什么特征

     

    SQL刷了sqlzoo的题目看了面经还有http://www.dscademy.com/languages/sql/ 上面有梳理了一些

    统计和机器学习复习了Andrew Ng的coursera,之前提到的网站上也有总结http://www.dscademy.com/supervised-learning/linear-regression/

    概率论http://www.dscademy.com/probability-theory/problems/ 上有一些题目,还挺全面的,基本我面试中遇到的都在上面看到过,另外刷了一下introduction to quant finance

    概率论面经汇总 

    https://www.nowcoder.com/discuss/95737

    SQL面经汇总

    https://www.nowcoder.com/discuss/95812

    数据结构与算法

    大数相乘(整型大数相乘,浮点数大数相乘描述思路,若干大数连乘(结果可能是大数,每个数不是大数,要求能表示出结果就行,可以不那么精确))

    排序算法以及复杂度分析

    圆上三个点组成锐角三角形的概率

    电梯调度的问题

    翻转字符串
    翻转句子

    算法题:实现atoi,面试官有一些新的要求
    算法题:3-sum去重

    算法题:找两个排序数组的交集
    算法题:10进制转8进制

    概率题 X是一个以p的概率产生1,1-p的概率产生0的随机变量,利用X等概率生成1-n的数

    topk问题(两种方式,partition和最大最小堆)

    排序算法介绍,它们的复杂度

    6.一枚不均匀的硬币,我抛了100次,有70次朝上,那么第101次朝上的概率是多少          这个概率怎么样,公示是如何推导出来的

    7.给你个字符串,字符串是个数字,怎么转换为int型,不用库函数的话

    8.4个海盗,100个金币,每个人轮流提方案,如果你的方案有半数以上通过,那么久可以,否则就会被杀掉,如果你是第一个人,那么你怎么提方案比较好

    有10个排好序的数据库,那么我要找整个的中位数,怎么找

    构造堆的时间复杂度

    6. 算法题:翻转中间由各种符号隔开的字符串

     算法题:2sum,3sum

    7. 算法题: 从右边看被遮挡的二叉树,求露出的node

    8. 概率题,抽蓝球红球,蓝结束红放回继续,平均结束游戏抽取次数

    . 算法题,单链表判断是否有环 (leetcode easy),以及判断环入口,这题卡壳了没想出来

    4. 算法题,给前序和中序,求出二叉树

    算法题: topK给出3种解法

    算法题,反转链表

    3. 算法题,trim二叉搜索树

    • 二叉搜索树转单链表
    • 二叉搜索树转双向链表
    5.TopK的解法有哪些及其最优和最差时间复杂度的推导;
    6.原地删除字符串中的重复空格,要求时间复杂度为O(n)。

    .一上来手写快排和最长公共子序列长度(最好是c++,表示考官对c++的好感度更高);
    .算法题
    • N(N很大)个数,求小于等于k个数的和的集合
    • N个大文件,每个文件存储一堆数字,每个文件内的数字是有序的,如何将这些文件合并成一个大文件,保证大文件的所有数字是有序的
    • 把数组里的0挪到最后


    给定一个节点数组,每个节点有4个属性:id(编码)、left、right、father,其中left、right、father的值为id,当不存在时id=-1。求树高。
    来写个算法题,有2,3,5角硬币,给定金额输出最少的硬币组合个数

    手撕代码:硬币2元,3元,5元,给定金额,输出最少需要多少硬币

    手撕代码,矩阵左上走到右下最短路径多少种,如果中间有路障呢

    代码题:求二位矩阵中连通1的最大区域

    链表的倒数第k个结点(双指针)

    10,ax=b,求x的方法。(求逆矩阵,如果不可逆怎么办。什么情况下可逆。)

    代码:判断一个二叉树是否为二叉搜索树。优化空间

     

    抛一个不均匀的硬币,设计策略能得到1/2的概率(抛两次)如果要求得到1/3和2/3呢?设计策略(抛四次,我想着抛6次,小哥哥提醒了)

    给出一个0到n的随机数生成器,设计策略,让不得到x的条件下,得到其他数的均匀分布(只能生成一次)(hash映射,但是我找不到合适的映射函数,小哥哥提醒了)扩展:不得到两个数呢?m个数呢?(一样)

    房子500万,每年涨10%,程序员工资100万,不涨,问多少年能全款买房(几秒钟估算了一下,永远买不起…)(总觉得小哥哥在暗示我什么)

    堆介绍,插入元素时调整的时间复杂度(变成二叉树,递归定义)堆排序、其他排序方法介绍和特点(按时间复杂度分了三种去介绍),最常用哪种

    哪个排序是稳定排序

    求赫夫曼树的带权路径长度

    判断一个图有环的最佳方法(拓扑排序)

    1.给定一个长度为N的无序数组,在log(N)时间内找出数组中的最大值和最小值

    5. 算法题,单调函数求零点 (简单的二分法)

    编程题(链表反转,二叉树中序遍历递归+非递归)

    3、3种颜色砖块,单位长宽,铺满单位宽,长m的地板有多少种铺法?

    地图中找出大陆的个数(一道BFS题)

    二叉树输出给定节点到目标节点的路径

    寻找两个字符串中只有首尾字符相同的所有子串,例如 ABCDE 和 ADCAE中包含(ABC--ADC)以及(CDE--CAE)

    4.求两个数的汉明距离。

    5.给一个二叉搜索树,和一个区间,删掉不在区间内的节点。

    在一个圆上有任意三个点,组成锐角三角形概率。答案说对了,1/4,从极限角点推出来的,让我用积分公式算,gg....

    算法题:链表翻转、判断平衡二叉树、最长公共子序列、海量数据topk问题、蓄水池抽样算法

    1、K个有序数组,找一个长度最小的区间,在这个区间里至少包含每个数组各一个数

    2、n个[0,n)的数,求每个数的出现次数(不能开辟额外空间)

    3、数组的全排列(空间复杂度O(1))

    4、一堆钞票,尽可能均分(利用背包问题的思想)

    5、无向无环图中,最短路径的最大值(Floyd算法)

    7、字符串的最长公共子序列(动态规划)

    8、树的前序遍历和zigzag遍历(非递归)

    9、一个数组,所有数组都出现了两次,只有一个数出现了一次,返回这个数(位运算)

    10、一个数组,一个数出现了超过一半次数,返回这个数

    11、将除法的结果用字符串返回,如果能够除尽,则返回相除的结果,如果不能除尽,则无限循环部分用[]标记。

    12、数组排序,假设数组排序后的位次和排序前的位次绝对值差值小于K,有什么比快排好的算法?

    13、树中两个节点的第一个的公共祖先。

    14、判断是否是回文链表

    15、判断两个链表中是否有相同节点

    编程题:两个链表做加法(要考虑大数);

    编程题:写一个class实现固定大小内存空间的读写删除;

    1、01背包问题

    判断一棵二叉树是不是二叉搜索树
    8、将一棵二叉搜索树转换成双向链表(用递归写)
    https://blog.csdn.net/zengzhen_csdn/article/details/51198530

    6. 算法题:翻转中间由各种符号隔开的字符串

     算法题:2sum,3sum

    7. 算法题: 从右边看被遮挡的二叉树,求露出的node

    8. 概率题,抽蓝球红球,蓝结束红放回继续,平均结束游戏抽取次数

    4. 算法题,给前序和中序,求出二叉树

    算法题,10亿个32位正整数,求不同值,只给1GB内存。。。我只答出来4GB的情况,时间负责度还不是最优的,所以稳稳凉了,如果有人知道怎么解1GB,求回复,感谢

    算法题: topK给出3种解法

     

    1. 两个有序数组求中位数(leetcode)

    3. 最长上升子序列(lintcode)

    4. 二叉树转双向链表(剑指offer)

    5. LRU cache实现(leetcode)

    6. House Robber(leetcode)

     

    一面:1、一个数组中只有两个数字只出现了一次,其他都是两次,找出这两个数字(异或方法)。2、二叉树中找出两个结点的最近公共祖先。3、画出LSTM网络结构,写出GBDT过程。

    一面:非递归后续遍历二叉树。

    二面:1、判断一个网页所属的类别。2、找到数组中出现次数超过一半的数字,低于o(n)的时间复杂度。

    一面:1、求翻转数组中某个数的位置,该数组翻转前是递增数组。2、某无序数组找到一个分界点使得分界点左右两边数组的方差和最小,时间复杂度O(n)。3、手推LR。

    一面:1、给定一个数组和一个target,找到数组中两数的差等于该target的所有数组对,T:O(n)。2、梯度下降法都有哪些变形,这些变形优势是什么。

    二面:1、完全k叉树的两个结点的最近公共祖先。(多种方法)。2、证明k-means会收敛

    一面:广度优先遍历二叉树

    二面:广度优先遍历二叉树逆序输出

    三面:为什么二分查找复杂度是o(logn),求方程的根有哪些方法。

    一面:荷兰国旗问题

    二面:一个本身按数字绝对值大小排序的链表,输出按实际值大小排序的链表,T:O(n),S:O(1)

    三面:删除链表中等于某个值的所有结点。

    一面:输入一个表达式字符串,输出该表达式的值(递归方法)。

    二面:反转字符串,用c++做。

    一面:1、组合,一个数组中有重复元素,输出包含k个元素的所有组合,时间复杂度要低。2、找一个无序数组的中位数,时间复杂度尽可能优化。

    一面:1、找到n以内的素数,优化时间复杂度。2、将某十进制的数转化成k进制(k>10)的数。

    二面:二叉树中两个结点的最近公共祖先。

    一面:每隔k步反转链表。

    二面:找出n以内的所有质数,优化时间复杂度。

    三面:1、两个字符串的最长公共子序列(动态规划)。2、求一棵二叉树的宽度(宽度即为该二叉树中结点最多的某层的结点个数)(队列实现)。

    一面:逆时针打印一棵完全二叉树的边界结点(等腰三角形)。

    二面:1、对链表中重复的结点去重。2、给定一个方法将些许个小字符串可以唯一地合成一个大字符串,又可将这个大字符串拆解出原来的些许个小字符串,除了字符串不能用其他数据结构。

    三面:任意给定一个凸多边形,用一条连续的线段将这个凸多边形分成面积相等的两部分(这两部分也是连续的两部分),只能用尺规作图,即只能画线段、取中点、画平行线等操作。

    电话面:一个数组的最长递增子序列的长度。

    一面:合并区间:一个数组里存的元素都是区间,各个区间可能有重合的,合并这些重合的区间返回一个新的数组,里面的元素是互相不重合的区间。(排序区间左端点,每一个右端点和前一个右端点比较)。

    二面:1、一个数组分成k份,每份中元素个数相同,返回k-1个分界点以及给一个数值返回其属于哪一类,不断优化时间复杂度,低于o(nlogn)。

    二面:合并集合:一个大集合,其中的元素是小集合,这些小集合的元素是整形数值,合并这些小集合使得这些小集合间没有重复的元素,返回合并的结果。

    计算机基础

    CS基础:进程线程区别,多线程实现方式,线程冲突是什么、怎么解决,TCP三次握手细节,海量数据排序(分治)

    一道SQL题,count(1),count(*),count(列名) 这三个有什么区别

    Linux中查找符合一定规则的文件名怎么查找,或者用脚本也行

    CS基础:进程线程区别,多线程实现方式,线程冲突是什么、怎么解决,TCP三次握手细节,海量数据排序(分治)给一个字符串,如果字符串中有连续空格,将多个空格替换成一个
    指数运算通常比较耗时,但有的时候又是不可避免的,如何提高效率


    进程与线程
    Linux内存管理机制
    知道的Linux命令有哪些

    原帖链接:
    https://www.nowcoder.com/discuss/97549?type=0&order=0&pos=6&page=2

    进程中的内存分段是怎样的

    5.每个线程有哪些东西是自己独享的

    11.一个路口,一个小时通过一个车的概率是0.9,那么20分钟内通过车的概率是多少

    12.我有一个32位的id是唯一的,那么我想压缩一下,让他还唯一,怎么压缩

    求一个数的二进制表示有多少个1(这个是看我C/C++用得太少了考我基础)

    1、c语言实现strcpy 

    将数组元素划分成两部分,两部分和的差最小,数组顺序可变;

    智力题,在一个圆环上随机添加3个点,三个点组成一个锐角三角形的概率

    3.1 SQL查询相关业务题目。

    .4 Linux处理文本日志相关常见命令。

    3.5 给定n,螺旋打印矩阵。

    3.9 在一个一维坐标轴中,给定 n 个线段起止点(ai,bi) (ai、bi 的取值在 double 范围内), 如何计算所有线段覆盖的总长度,请编程实现。

    3.10 .一个数组A[1,...,n](n≥3),满足A[1]≥A[2], A[n] ≥ A[n-1](第一个数比第二个数大,最后一个数比倒数第二个数大,其他位置不保证大小关系)。用最快的办法找到一个i, 满足A[i-1]≥A[i] ≤ A[i+1],并给复杂度。

    3.11 输入:两个等长的数组a,b (a、b元素都不小于0),每次可对a数组做如下两种改动中的一种
    1)选取a数组中任意一个元素,将其值增加1;
    2)将a数组中任取若干个元素,将其值都乘以2;
    输出:最少需要操作次数,将a数组转化成和b数组完全一样;如果做不到,输出-1,请编程实现。

    3.12 数组里面连续值的和为S的区间,给出边界。

    讲一讲拥塞机制 和流量机制

    5.  计算机网络,操作系统

    5.1 TCP三次握手,四次挥手等细节。

    5.2  5层,7层网络相关问题。

    多线程了解么
    线程通信的方式有哪些(共享内存)
    进程通信的方式有哪些

    6.linux中,假设昨天有许多数据,今天加入许多数据,用什么命令查出来

    cs