【论文阅读】A social recommender system using item asymmetric correlation
Abstract
推薦系統(tǒng)在近幾年極大突出的信息篩選技術(shù)之一,然而,有兩個(gè)主要的問題:
- 數(shù)據(jù)稀疏:數(shù)據(jù)太稀疏了,沒辦法操作
- 冷開始:一開始數(shù)據(jù)不多(或者),推薦效果不好或無法進(jìn)行
有一類系統(tǒng),叫做社會(huì)推薦系統(tǒng)被提出,可以有效地解決數(shù)據(jù)稀疏度和冷開始的問題。
給定一個(gè)社會(huì)關(guān)系并不是在每一個(gè)推薦系統(tǒng)都是可行的,這個(gè)隱含的在物品之間的關(guān)系算的上是一個(gè)代替限制的一個(gè)比較好的選擇。
在這篇paper中,作者發(fā)現(xiàn)了將隱含的物品之間的關(guān)系矩陣和用戶-物品矩陣結(jié)合起來,在提高推薦系統(tǒng)的精度上的比較好的效果。
- IAC(Item Asysmmetric Correlation)方法,通過考慮一個(gè)非對(duì)稱的關(guān)系矩陣,檢測(cè)在每對(duì)物品之間的隱含的關(guān)系。
- 兩個(gè)數(shù)據(jù)集類型,IAC的輸出和用戶-物品矩陣,被融入在協(xié)同過濾之中(通過Matrix Factorization MF技術(shù))。
這個(gè)技術(shù)在處理稀疏矩陣上表現(xiàn)不錯(cuò)。
Introduction
社會(huì)信息逐漸變多,讓用戶越來越難尋找到想要的東西,所以需要有推薦系統(tǒng)來提高用戶的滿意度并留住客戶。
推薦系統(tǒng)遇到了很多問題。隨著用戶數(shù)量的增加和越來越多的商品種類,使得存在有很多問題,例如:
- 數(shù)據(jù)稀疏
- 冷開始
- Cold start is the inability of the system to deal with new users or new items due to the lack of prior knowledge.
- 其實(shí)new-item的冷開始還好解決,畢竟商家都想賣出自己的商品,所以這個(gè)profile應(yīng)該是很好建立的。主要是用戶側(cè)的冷開始問題,其實(shí)用戶一般不是很愿意添麻煩在買商品前去填寫個(gè)人的profile。
Therefore, addresssing these issues is crucial for any recommender system to make accurate recommendations.
Introduction to matrix factorization
Matrix factorization 是一個(gè)線性代數(shù)方式,通過因子去分解矩陣,使得變成一個(gè)更低維度的矩陣。
Rn?mR_{n*m}Rn?m?是用戶產(chǎn)品矩陣。中間再添加一個(gè)新的維度。使得
Rn?m=Pf?nT?Qf?mR_{n*m} = P^{T}_{f*n} * Q _{f*m}Rn?m?=Pf?nT??Qf?m?
其中,fff比min(n,m)min(n,m)min(n,m)要小。
這個(gè)分解其實(shí)很容易理解。
- 就是說,每個(gè)人喜歡了這些東西,在本質(zhì)上映射到一個(gè)空間上,其實(shí)就是喜歡某些特征,這里假設(shè)為f。
- 然后,這里我們就直接量化每個(gè)人對(duì)于這些特征的喜好程度
- 同時(shí),我們考量每個(gè)物品在這些特征上具有的分布情況,即可完成。
The pu∈Pp_u \in Ppu?∈P measures the extent of user’s interest in items that are high on the corresponding factors.
問題是這個(gè)分解emmm
一般來說,我們完成這個(gè)分解,會(huì)需要考慮這樣的一個(gè)目標(biāo)函數(shù)
min?l(R,P,Q)=∑u=1n∑i=1m(rui?puTqi)2+λ(∣∣pu∣∣F2+∣∣qi∣∣F2)\min{l(R,P,Q)} = \sum_{u=1}^{n}{\sum_{i=1}^{m}{(r_{ui}-p^T_uq_i)^2+\lambda(||p_u||^2_F+||q_i||^2_F)}}minl(R,P,Q)=u=1∑n?i=1∑m?(rui??puT?qi?)2+λ(∣∣pu?∣∣F2?+∣∣qi?∣∣F2?)
The Frobenius norm, sometimes also called the Euclidean norm (a term unfortunately also used for the vector L^2-norm), is matrix norm of an m×n matrix A defined as the square root of the sum of the absolute squares of its elements1
其中這個(gè)矩陣范數(shù),用的是Frobenius norm
∣∣A∣∣F=∑u=1n∑i=1m(Aij)2||A||_F = \sqrt{\sum_{u=1}^{n}{\sum_{i=1}^{m}{(A_{ij})^2}}}∣∣A∣∣F?=u=1∑n?i=1∑m?(Aij?)2?
有兩個(gè)經(jīng)典辦法可以算出這個(gè)P和Q
- SGD
- ALS
SGD
ALS
- 很明顯,這個(gè)r在兩個(gè)不同的等式上對(duì)應(yīng)的維度不一樣。
- 第一個(gè) 對(duì)應(yīng)用戶
- 第二個(gè) 對(duì)應(yīng)商品
明顯SGD只需要O(f)O(f)O(f)的計(jì)算,ALS需要有O(f3)O(f^3)O(f3),但是SGD需要有更多的周期,才能達(dá)到ALS類似的效果。
The devised approach
- U 用戶集合
- I 商品集合
- R: U-I matrix。0或者正
Item asymmetric correlation IAC
- 很明顯,前半部分,就是CosSim(余弦相似度),后面乘的部分是對(duì)這個(gè)觀測(cè)的長(zhǎng)度的的考量。而這個(gè)部分,前一部分是非對(duì)稱的結(jié)構(gòu),后一部分任然屬于對(duì)稱的結(jié)構(gòu)。
- 后一部分的 對(duì)稱結(jié)構(gòu)的 部分,可以用于比較不同item組之間的相似度問題。
這里的IAC會(huì)構(gòu)建矩陣SSS,
這樣,就需要解決這個(gè)目標(biāo)函數(shù)就好了。
之后的結(jié)果跟傳統(tǒng)的是一樣的。
只需要在之后得到兩個(gè)向量之后,做一個(gè)乘積就知道了結(jié)果了。
http://mathworld.wolfram.com/FrobeniusNorm.html ??
總結(jié)
以上是生活随笔為你收集整理的【论文阅读】A social recommender system using item asymmetric correlation的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: LVQ模型Python实现
- 下一篇: 【论文阅读】Clustering by