【论文解读】多视图多示例多标签的协同矩阵分解
題目: Multi-View Multi-Instance Multi-Label Learning based on Collaborative Matrix Factorization
會議: AAAI 2019
論文: https://arxiv.org/pdf/1905.05061.pdf
1 Motivation
1、現有的M3L方法僅僅探索了部分實體(包,實例和標簽)之間的關系,而這些實體之間的關系可以給M3L方法提供豐富的上下文信息,因此,現有的M3L方法性能次優;
2、大部分的MIML算法僅關注單視圖數據,但是,在實際應用中,通常可以通過不同的視圖來表示多實例多標簽對象。
2 Related work
由于包之間以及實例之間存在多種類型的關系,與最近大量研究的MIML任務相比,從多視圖包中學習更加困難和挑戰。當前已有不少研究工作致力于解決這樣一種挑戰。如表1所示:
盡管這些方法在努力解決多視圖MIML學習問題,但是這些方法僅考慮了包之間和實例之間有限的關系類型。
3 Methodology
所提模型主要包括兩部分,一部分是異質網絡的構建,另一部分是協同關系矩陣分解。
3.1 Heterogeneous Network Construction
1、construct a subnetwork of instances for each feature view
利用高斯熱核為每個特征視圖中的實例構建子網,其中為第v個視圖中m個實例的平均歐氏距離。
2、construct a bag subnetwork for each feature view
利用豪斯多夫距離為每個試圖中的包構建子網
3、construct a subnetwork of labels
利用cosine相似度來量化標簽相關性,其中和為兩個標簽,是標簽c在所有包中的分布。
以上三部分便構建完了實例-實例,包-包,標簽-標簽的子網,另外,通過數據集的信息,作者繼續構建包-實例,包-標簽,實例-標簽之間的數據矩陣。
4、The bag-instance inter-relational data matrix .
5、The bag-label relational matrix .
6、The instance-label relational data matrix . 初始,實例-標簽的數據矩陣未知,設為0.
3.2 Collaborative Matrix Factorization
論文所提方法M3Lcmf的目標函數所下所示:
M3Lcmf有兩個預測項:實例-標簽的聯系和包-標簽的聯系。除了直接利用趨近,作者增加了一個整合項。這個整合項受多實例學習原理的驅動,即包的標簽取決于其實例的標簽。另外,此整合項可以反向指導和的學習。
由目標函數的前三項可以看出,M3Lcmf構建了包-實例,包-標簽,實例-標簽之間的關系。按照流行正則的思想,促使有著高相似性的數據點在低維空間內相似,構成MR(G),利用圖拉普拉斯矩陣來構建包-包,實例-實例,標簽-標簽之間的關系。
最后,可以利用優化好的和來獲取實例-標簽的相關性矩陣:,同樣,要將實例的標簽進一步映射到相應的包上,作者利用來趨近包-標簽相關性矩陣。因此,M3Lcmf既可以實現包級預測也可以實現實例級預測。
Experiments
Datasets
前五個數據集為包級的數據集,后四個為實例級的數據集。
Metric
1、Ranking Loss (RankLoss),
2、macro AUC (Area Under receiver operating Curve)
3、Average Recall (AvgRecall),
4、Average F1-score (AvgF1).
Results
1、Prediction Results at the Bag-Level
M3Lcmf優于MIMLmix和M2IL:M3Lcmf利用了更多對象之間的關系;
M3Lcmf優于MIML方法(MIMLNN, MIMLfast 和 MIMLSVM):MIML相比于M3Lcmf利用了更少的實體之間的關系;
MIMLRBF性能逼近M3Lcmf:盡管MIMLRBF利用了更少的實體關系,但是MIMLRBF利用神經網絡來獲取特征表示。
M3Lcmf性能最優,MIMLmix第二,MIMLfast第三是因為MIMLmix沒有利用包-包聯系和實例-實例之間的關系,MIMLfast在此基礎上,還沒有利用實例-標簽的關系。
3、Contribution of Different Types of Relations說明實體之間的各種關系都有助于M3L方法的學習。
參數敏感實驗詳情請見原論文。
參考文獻
[Nguyen, Zhan, and Zhou 2013] Nguyen, C. T.; Zhan, D. C.; and Zhou, Z. H. 2013. Multi-modal image annotation with multi-instance multi-label lda. In IJCAI, 1558–1564.
[Nguyen et al. 2014] Nguyen, C. T.; Wang, X.; Liu, J.; and Zhou, Z. H. 2014. Labeling complicated objects: multi-view multi-instance multi-label learning. In AAAI, 2013–2019.
[Yang et al. 2018] Yang, Y.; Wu, Y.-F.; Zhan, D.-C.; Liu, Z.- B.; and Jiang, Y. 2018. Complex object classification: A multi-modal multi-instance multi-label deep network with optimal transport. In KDD, 2594–2603.
[Li et al. 2017] Li, B.; Yuan, C.; Xiong, W.; Hu, W.; Peng, H.; Ding, X.; and Maybank, S. 2017. Multi-view multi-instance learning based on joint sparse representation and multi-view dictionary learning. TPAMI 39(12):2554–2560.
[Zhou et al. 2008] Zhou, Z. H.; Zhang, M. L.; Huang, S. J.; and Li, Y. F. 2008. Miml: A framework for learning with ambiguous objects. Corr Abs 2012.
[Huang, Gao, and Zhou 2018] Huang, S.-J.; Gao, W.; and Zhou, Z.-H. 2018. Fast multi-instance multi-label learning. TPAMI 99(1):1–14.
[Zhang and Wang 2009] Zhang, M. L., and Wang, Z. J. 2009. Mimlrbf: Rbf neural networks for multi-instance multi-label learning. Neurocomputing 72(16-18):3951–3956.
往期精彩回顧適合初學者入門人工智能的路線及資料下載機器學習及深度學習筆記等資料打印機器學習在線手冊深度學習筆記專輯《統計學習方法》的代碼復現專輯 AI基礎下載機器學習的數學基礎專輯溫州大學《機器學習課程》視頻 本站qq群851320808,加入微信群請掃碼:總結
以上是生活随笔為你收集整理的【论文解读】多视图多示例多标签的协同矩阵分解的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 小技巧来助阵 玩转Google Chro
- 下一篇: 【机器学习基础】一文看透多任务学习