划重点!这80道算法题,想拿大厂Offer的你别漏了
筆者自從2015年擔任算法組leader,作為面試官面試了不少同學。前前后后面試了超過200名同學,其中有不少入職的同學后來發展都不錯,也堅定了自己對于選人標準的自信心。
今年2020年找工作尤其艱難,我把這些年作為面試官一些重要的面試題整理出來,一共80道,希望能夠幫助到大家。
為了方便大家,我做了一個歸類,一共分成了6大類,分別是:機器學習,特征工程,深度學習,NLP,CV,推薦系統。這些知識既是面試中的常見問題,也可以作為大家整理自己思路的參考資料。(需要的同學文末免費領取)
機器學習理論類:
1.? 寫出全概率公式&貝葉斯公式
2. ?模型訓練為什么要引入偏差(bias)和方差(variance)???證
3.? CRF/樸素貝葉斯/EM/最大熵模型/馬爾科夫隨機場/混合高斯模型
4. ?如何解決過擬合問題?
5. ?One-hot的作用是什么?為什么不直接使用數字作為表示
6. ?決策樹和隨機森林的區別是什么?
7. ?樸素貝葉斯為什么“樸素naive”?
8.? kmeans初始點除了隨機選取之外的方法
9.? LR明明是分類模型為什么叫回歸
10. 梯度下降如何并行化
11. LR中的L1/L2正則項是啥
12. 簡述決策樹構建過程
13. 解釋Gini系數
14. 決策樹的優缺點
15. 出現估計概率值為 0 怎么處理
16. 隨機森林的生成過程
17. 介紹一下Boosting的思想
18. gbdt的中的tree是什么tree?有什么特征
19. xgboost對比gbdt/boosting Tree有了哪些方向上的優化
20. 什么叫最優超平面
21. 什么是支持向量
22. SVM如何解決多分類問題
23. 核函數的作用是啥
特征工程類:
1. ?怎么去除DataFrame里的缺失值?
2.? 特征無量綱化的常見操作方法
3. ?如何對類別變量進行獨熱編碼?
4. ?如何把“年齡”字段按照我們的閾值分段?
5. ?如何根據變量相關性畫出熱力圖?
6. ?如何把分布修正為類正態分布?
7. ?怎么簡單使用PCA來劃分數據且可視化呢?
8. ?怎么簡單使用LDA來劃分數據且可視化呢?
深度學習類:
1.? 你覺得batch-normalization過程是什么樣的
2. ?激活函數有什么用?常見的激活函數的區別是什么?
3. ?Softmax的原理是什么?有什么作用?
CNN的平移不變性是什么?如何實現的?
4. ?VGG,GoogleNet,ResNet等網絡之間的區別是什么?
5.? 殘差網絡為什么能解決梯度消失的問題
6.? LSTM為什么能解決梯度消失/爆炸的問題
7.? Attention對比RNN和CNN,分別有哪點你覺得的優勢
8.? 寫出Attention的公式
9.? Attention機制,里面的q,k,v分別代表什么
10. 為什么self-attention可以替代seq2seq
自然語言處理(NLP)類:
1.? GolVe的損失函數
2.? 為什么GolVe會用的相對比W2V少
3.? 層次softmax流程
4.? 負采樣流程
5.? 怎么衡量學到的embedding的好壞
6.? 闡述CRF原理
7.? 詳述LDA原理
8.? LDA中的主題矩陣如何計算
9. ?LDA和Word2Vec區別?LDA和Doc2Vec區別
10. Bert的雙向體現在什么地方
11. Bert的是怎樣預訓練的
12. 在數據中隨機選擇 15% 的標記,其中80%被換位[mask],10%不變、10%隨機替換其他單詞,原因是什么
13. 為什么BERT有3個嵌入層,它們都是如何實現的
14. 手寫一個multi-head attention
推薦系統類:
1.? DNN與DeepFM之間的區別
2.? 你在使用deepFM的時候是如何處理欠擬合和過擬合問題的
3.? deepfm的embedding初始化有什么值得注意的地方嗎
4.? YoutubeNet 變長數據如何處理的
5.? YouTubeNet如何避免百萬量級的softmax問題的
6. ?推薦系統有哪些常見的評測指標?
7. ?MLR的原理是什么?做了哪些優化?
計算機視覺(CV)類:
1.? 常見的模型加速方法
2.? 目標檢測里如何有效解決常見的前景少背景多的問題
3.? 目標檢測里有什么情況是SSD、YOLOv3、Faster R-CNN等所不能解決的,假設網絡擬合能力無限強
4.? ROIPool和ROIAlign的區別
5.? 介紹常見的梯度下降優化方法
6.? Detection你覺的還有哪些可做的點
7.? mini-Batch SGD相對于GD有什么優點
8. ?人體姿態估計主流的兩個做法是啥?簡單介紹下
9.? 卷積的實現原理以及如何快速高效實現局部weight sharing的卷積操作方式
10. CycleGAN的生成效果為啥一般都是位置不變紋理變化,為啥不能產生不同位置的生成效果
這些問題的答案,我們給大家整理了一個資料包,大家掃碼添即可領取,祝大家求職順利~
?長按掃碼添加
本號只有100個名額
↓ ↓ ↓?
備注【面試題】添加????
注:期望資料請選擇【面試題】
與50位技術專家面對面20年技術見證,附贈技術全景圖總結
以上是生活随笔為你收集整理的划重点!这80道算法题,想拿大厂Offer的你别漏了的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 【机器学习基础】浅谈为什么L2正则化有效
- 下一篇: 学习TensorFlow、PyTorch