轨迹相似性度量之基于Hausdorff与LCSS的理解
1. 對于Hausdorff距離的理解
Hausdorff距離:描述兩組點集之間相似程度的一種度量。
假設兩組集合A={a1,a2,.....ap},B={b1,b2.....bp},則這兩個點集之間的Hausdorff距離定義為:
H(A,B)=max(h(A,B),h(A,B))? ? ?(1)
其中,h(A,B)=max(a∈A) min(b∈B) ||a-b||? ? ? ? ? ? ? ? (2),
? ? ? ? ? h(B,A)=max(b∈B) min(a∈A) ||b-a||? ? ? ? ? ? ? ? ?(3),
||·|| 是A和B點集間的距離范式。
(1)式稱為雙向Hausdorff距離,它度量了兩個點集間的最大不匹配程度。
(2)、(3)式中的h(A,B)? 、h(B,A)分別稱為從A集合到B集合? 和從集合B到集合A 的單向Hausdorff距離。
即h(A,B)實際上首先對點集A中的每個點ai到距離此點ai最近的B集合中點bj之間的距離‖ai-bj‖進行排序,然后取該距離中的最大值作為h(A,B)的值。
?
圖例表示:
?
2.對于LCSS距離的理解
LCSS 最長公共子序列?
歐氏距離和動態時間規劃對軌跡的個別點差異性明顯。
如果兩個時間序列在大多數時間段具有相似的形態,僅僅在很短時間內具有一定的差異,則歐氏距離和DTW無法準確衡量這兩個時間序列的相似度。
而LCSS能處理這種問題。
原理:
假設有兩個長度分別為n和m的時間序列數據A和B ,那么最長公共子序列的長度為:
其中,γ為成員相似閾值,t=1,2,...n;i=1,2,...m?;谏鲜龉?#xff0c;最長公共子序列的相似度公式為:
LCSS算法可以計算兩個子序列之間的最長公共子序列。
結合具體實例理解:
3.改進LCSS算法
見https://blog.csdn.net/weixin_30745641/article/details/95504238
改進后LCSS算法
優點:結合時間、地理因素,提高相似度計算的準確性
缺點:需要抽取時間序列,構造用戶軌跡的頻繁序列,然后才能用改進的LCSS相似度算法計算用戶軌跡的相似度,
? ? ? ? ? 因此算法模型過程比較復雜。
參考:
https://www.cnblogs.com/yhlx125/p/5478147.html
https://www.jianshu.com/p/d7b8db280a01?utm_campaign=maleskine&utm_content=note&utm_medium=reader_share&utm_source=weixin
https://www.it610.com/article/1293141069264920576.htm
https://blog.csdn.net/weixin_30745641/article/details/95504238
?
?
總結
以上是生活随笔為你收集整理的轨迹相似性度量之基于Hausdorff与LCSS的理解的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 5.8 直方图统计
- 下一篇: 机器学习也可以在线做!