论文 | 信息检索结果Ranking的评价指标《RankDCG: Rank-Ordering Evaluation Measure》
未經(jīng)允許,不得轉(zhuǎn)載,謝謝~~
一 文章簡(jiǎn)介
為什么要提出這個(gè)新的評(píng)價(jià)算法?
二 排序問(wèn)題描述
- A為一系列元素: A = [x1,x2,x3,...,xn];
- f(x)度量了元素x與query的相關(guān)性,f(x)屬于0-1;
- 通常我們能在A中的n個(gè)元素找到m個(gè)相關(guān)的元素,并按相關(guān)性由高到低進(jìn)行排序得到目標(biāo)結(jié)果B;
- B = [x|x ∈ A,f(x) > 0], 且 B = [ f(x1) > f(x2) > f(x3) > ... > f(xm) ];
- 在這里每個(gè)元素都是相關(guān)的;
- 待排序的都是離散值;
- 會(huì)出現(xiàn)多個(gè)元素具有相同等級(jí)的情況;
- 排序結(jié)果可能會(huì)出現(xiàn)只有非常少數(shù)的top result是相關(guān)的情況;
三 現(xiàn)有評(píng)價(jià)方法
信息檢索領(lǐng)域有多個(gè)方法來(lái)評(píng)價(jià)rank ordering的好壞,但是沒(méi)有一個(gè)對(duì)上面描述的這種問(wèn)題是完全適用的,接下來(lái)先看看目前常用的一些評(píng)價(jià)算法。
3.1 F-measure(F-score)
同時(shí)考慮了檢測(cè)精度p和召回率r;
3.2 Average Precision and Mean Average Precision
AP
- 其中:P(k) = precision@k , ?R(k) = |recall(k?1)?recall(k)|.
- 其實(shí)理論上的AP應(yīng)該等于綠色的precision-recall線的下方面積,而用近似計(jì)算就等于看成是一小塊的長(zhǎng)方形的面積之和,即為圖中紅色虛線的下方面積。
MAP
- 其中:Q 是query的集合,而q是單個(gè)的query,即對(duì)所有query的AP求平均。
3.3 Kendall’s τ
這個(gè)算法考慮了給定list和結(jié)果list之間元素對(duì)之間的匹配程度;
關(guān)于這個(gè)算法這里給出一個(gè)具體的例子:
3.4 Discounted Cumulative Gain (DCG)
本文也是自己與這個(gè)算法做的改進(jìn);
rel()指的是相關(guān)度度量函數(shù),i 表示元素所在的位置;
四 本文評(píng)價(jià)算法:RankDCG
下面兩張圖為standard DCG與別人改進(jìn)的DCG在各個(gè)元素上的cost圖:
具體步驟是:在L中有10個(gè)rank值,但是只有4個(gè)不同的rank,所以按照rank value對(duì)元素進(jìn)行分組,得到4,那個(gè)第一個(gè)sublist的rankvalue就改成4,后面的sublist依次遞減。
這樣可以得都到以下的結(jié)果圖,可以看到整個(gè)cost下降更均衡了。
文章做的第二個(gè)工作就是將基于位置的折損改成新的折損系統(tǒng),具體方法是對(duì)L‘的rank value做一個(gè)翻轉(zhuǎn),將值依次賦給各個(gè)sublist。最后得到:
這時(shí)候的cost圖為:
最后也模仿DCG->nDCG的過(guò)程,做了一次歸一化,即最終的RankDCG算法等于:
寫(xiě)在最后
寫(xiě)完了嘻嘻~~
簡(jiǎn)書(shū)不支持公式真的有點(diǎn)小小的不方便,所有的公式都來(lái)自論文presentation的截圖。
最后,不是做信息檢索的,這篇論文只是課程的一個(gè)報(bào)告,有理解不正確或者不到位之處歡迎大佬評(píng)論獲或者私信謝謝ヾ(?°?°?)ノ゙
</div>總結(jié)
以上是生活随笔為你收集整理的论文 | 信息检索结果Ranking的评价指标《RankDCG: Rank-Ordering Evaluation Measure》的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: Financial Report财务报表
- 下一篇: adc0809 c语言程序,ADC080