面试总结-百度(2)
生活随笔
收集整理的這篇文章主要介紹了
面试总结-百度(2)
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
百度數據挖掘部門
? ? ?跟一面隔了差不多一個星期,收到了二面的通知,這次不是去百度大廈,是去科技園。第一次來科技園,發現這里還是一片工地,有很多大的IT公司,看到漢王科技、IBM之類的。
? ? ?面試官是一個三十五歲左右的一個看似像是部門leader的人。拿著電腦,邊面試邊處理工作,氛圍比一面的時候輕松了許多。先是問了下基本情況,比較感興趣實驗室是做什么的。然后指出了我在一個項目中使用的機器學習的錯誤,一看就是行家。一直微笑著提各種尖銳的問題。了解大致情況后開始做題。
題目
(1)數據處理題目 ? ? ? ? ? ? ? ? 已知n個順序打散的用戶行文,ID(qq號),狀態(1表示上線,0下線),時間。已知0時刻再現人數是x個,求第1時刻的人數。答:這道題其實很簡單,建立一個數組,每兩個時刻區間內,上線就總數加一,下線就減一。
一開始我沒完全領會到意圖,采用的方法是求得每個用戶的上線時間區間,然后再找到1時刻上線的人。經過提示,想到的跟正確答案類似的結,但是因為我沒說是用數組存,我說用list,空間復雜度大了一些。
(2)推薦欄
? ? ? ?假設搜索的詞是“劉德華”,你該怎樣推薦邊欄的推薦人物。
答:以下是我的答案,判斷重名的可能性,找到是哪個“劉德華”,根據搜索頻率可以判斷出來。 (1)然后給用戶打標簽,“歌手”、“演員”等,推薦相關條目下的高熱度人物。 (2)接著遍歷相關時效性新聞,找到同時出現的關聯度高的人物。 (3)遍歷此人出現的網頁,找到關聯人物。(期間問了如何去噪,比如編輯小王這種,我的回答是可以找到網頁的第一段內容判斷,還有就是根據比例,盡可能多的遍歷網頁) (4)根據貼吧、微博信息,個人媒體 (5)根據其它也搜索“劉德華”的人的搜索結果,也就是一種針對用戶的協同過濾。(答上這個他很滿意) (6)這條是他加上的,我沒想到。根據用戶的點擊反饋,他搜完劉德華,又點了什么人,就推薦什么人。
經驗是,不要裝逼,踏實的想怎么實現需求,花哨的代碼沒用,主要是效率要高。另外就是,腦子要快,順著提示往上爬。
/********************************
* 本文來自博客 ?“李博Garvin“
* 轉載請標明出處:http://blog.csdn.net/buptgshengod
******************************************/
總結
以上是生活随笔為你收集整理的面试总结-百度(2)的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 【LeetCode从零单排】No121B
- 下一篇: 【LeetCode从零单排】No133.