M2 Planning Day3
今天中午的時(shí)候有和鄒欣老師的Lunch Discussion,討論了很多東西,有很多收獲。
首先確定的是page cluster之類(lèi)的事情是不需要做了,而之前相對(duì)比較糾結(jié)的就是這一點(diǎn),是否要做cluster,如何cluster是很蛋疼的問(wèn)題。討論的過(guò)程中我們注意到其實(shí)M2的重點(diǎn)也可以不是這里,雖然將網(wǎng)頁(yè)聚類(lèi)并產(chǎn)生新的keywords是非常激動(dòng)人心的事情,但我們畢竟不是在做research,對(duì)于grow search而言,更多的可能還是要考慮用戶(hù)可能會(huì)需要什么。
晚上的討論里我們又將中午的內(nèi)容稍微總結(jié)了一下,基本上清楚M2我們要做的東西:
1 對(duì)于長(zhǎng)得過(guò)于茂盛的樹(shù),我們決定將比較舊的結(jié)果周期性地聚為一個(gè)葉節(jié)點(diǎn),當(dāng)然這個(gè)葉節(jié)點(diǎn)不同于普通的葉節(jié)點(diǎn),當(dāng)在上面點(diǎn)擊的時(shí)候應(yīng)該可以得到被收入內(nèi)容的枝條。這樣做的好處是樹(shù)本身不會(huì)過(guò)于“繁茂”而且被收縮的節(jié)點(diǎn)會(huì)使得樹(shù)本身有著更深的層次,而非現(xiàn)在的a tree of depth 2。至于何時(shí)進(jìn)行收縮現(xiàn)在有集中想法:按照時(shí)間,譬如每一小時(shí)收縮一次;按照節(jié)點(diǎn)個(gè)數(shù),譬如每100個(gè)節(jié)點(diǎn)收縮一次。但無(wú)論如何將收縮功能實(shí)現(xiàn)和收縮的criteria無(wú)關(guān),但是對(duì)于如何“優(yōu)雅地”收縮枝條,大概是一個(gè)需要很多嘗試的有難度的事情。
2 應(yīng)當(dāng)允許用戶(hù)剪掉枝條。樹(shù)長(zhǎng)得過(guò)于茂盛的時(shí)候如果用戶(hù)可以修剪,好像修剪現(xiàn)實(shí)生活中的樹(shù)那樣的話(huà),應(yīng)該是很有趣的事情。至于修剪的方法當(dāng)然可以是像割繩子游戲里那樣用鼠標(biāo)劃一下就刷刷剪掉,不過(guò)我們暫時(shí)也還沒(méi)想要做到那樣,點(diǎn)擊枝條能刪除這樣的程度就可以了吧。
3 多棵樹(shù)。之前我們本來(lái)打算放棄多棵樹(shù)的,但是中午的時(shí)候聽(tīng)鄒老師提到了“花園”之類(lèi)的東西,又開(kāi)始覺(jué)得加入多棵樹(shù)的話(huà)也許也不錯(cuò),而且既然現(xiàn)在既然丟掉了網(wǎng)頁(yè)聚類(lèi)的設(shè)想,那么實(shí)際上一棵樹(shù)并非會(huì)變成一個(gè)knowledge graph,換句話(huà)講不會(huì)非常地占據(jù)空間,所以多棵樹(shù)還是有必要的,不然只有一棵樹(shù)未免單調(diào)。
4 關(guān)于數(shù)據(jù)來(lái)源,之前一直使用的是BingAPI獲取的數(shù)據(jù)進(jìn)行按時(shí)間的排序后再進(jìn)行顯示。但是這樣的問(wèn)題是按照時(shí)間排序后會(huì)丟失掉原本search engine對(duì)結(jié)果的排序,而對(duì)于搜索新聞的用戶(hù)而言想要的還是rank最高的排序。之后我們打算使用的數(shù)據(jù)是BingNews的RSS訂閱,今天驚喜地發(fā)現(xiàn)自己的關(guān)鍵詞也可以使用RSS訂閱了,但是因?yàn)樵谧钕旅嫠宰蛱鞗](méi)有發(fā)現(xiàn),以為只能按類(lèi)別去訂閱。使用RSS訂閱的好處是內(nèi)容會(huì)比較make sense。但愿。。。
雖然對(duì)于要做的東西有了一些初步的想法,但是仔細(xì)看看哪一個(gè)都絕非能夠輕易實(shí)現(xiàn)的東西,所以今天之后隊(duì)員們都去各自探索各自的內(nèi)容,看看需要做的東西我們能不能做到,看看我們能做到哪里,再確定具體的計(jì)劃。
以上。
轉(zhuǎn)載于:https://www.cnblogs.com/smart-code/archive/2012/10/31/2748713.html
總結(jié)
以上是生活随笔為你收集整理的M2 Planning Day3的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: AS 3.0小事件处理 八
- 下一篇: php多线程解决之stream_sock