内容搜索排序表达式的最佳实践
某新聞資訊平臺,在內容搜索場景中需要滿足業務多樣化,個性化的需求,在query改寫配置好后,希望在排序階段進行優化,實現強大的相關性排序效果,提高用戶點擊率。今天會結合幾個典型場景該如何來思考和設計排序因子,和大家詳解特征性函數的應用
Query在開放搜索的執行流程
開放搜索排序表達式配置
接下來給大家分析幾個常見的排序優化需求:
場景1:查詢詞和召回字段匹配程度排序優化
案例:當用戶搜索“藥品公司”,分詞數量為2個:藥品,公司,在召回結果包含的查詢詞分詞個數相同情況下,如何把title“藥品公司”排在“藥品杭州分公司”的前面那?
開放搜索解決方案:應用排序相關性特征函數項field_match_ratio, 查詢詞的分詞個數與召回字段的總詞組字個數比值,比值越低,排序分越高.
詳細用法:https://help.aliyun.com/document_detail/51287.htmlspm=a2c4g.11186623.6.626.64786ab8OOs7hM
場景2: 標簽特征權重在“個性化”排序召回中的應用
案例: 當用戶搜索"吃雞",可能是游戲吃雞內容搜索,也可以能是新聞內容搜索,如何把用戶更感興趣的游戲內容排到前面那?
開放搜索解決方案:匹配文檔和請求中的標簽tag_match 函數,用于對查詢語句和文檔做標簽匹配,使用匹配結果對文檔進行算分加權;
? 通過長時間的積累能獲知每個用戶的興趣標簽,可以和內容/商品標簽對應,做到“個性化”排序
? 實現對用戶感興趣的帖子加權,把用戶更感興趣的內容/商品排到前面;
假設文檔內容共有如下10類型的標簽:
1-財經, 2-科技 ,3-體育 ,4-娛樂 ,5-時尚, 6-教育 ,7-旅游 ,8-游戲 ,9-科普 ,10-醫療
如果想將“8-游戲”標簽的文檔在前面展示,可設置tag_match函數
適用場景:此函數不僅試用于內容搜索場景,同樣適用商品搜索場景,滿足個性化商品排序
其他案例和用法:https://developer.aliyun.com/article/775488
場景3:根據查詢詞在title和body的緊密程度排序優化
案例:搜索"黑色幽默",意圖是搜索title“周杰倫《黑色幽默》的歌曲”,但在數據庫里有條文本body記錄為“下雨了,天空是灰黑色的,即便幽默的人此時也比較煩悶”,導致這條記錄也被召回,并且排序也比較靠前, 如何將title字段的緊密度在排序中起主導作用?
開放搜索解決方案:為了使這條不太相關的body記錄排序靠后,title字段排序靠前, 可以使用fieldterm_proximity函數獲取文檔緊密程度的得分來實現. 此函數用來表示關鍵詞分詞詞組在字段上的緊密程度,緊密度越高,排序分越高。精排公式寫為:fieldterm_proximity(title)*10 + fieldterm_proximity(body)
詳細用法:https://help.aliyun.com/document_detail/51281.html?spm=a2c4g.11186623.6.621.3c0938de1kdUfp
場景4:內容時效性
案例:用戶對時間的敏感度越高,那么越希望得到新的內容,內容的時效性和整體的滿意度直接相關,如何優化排序配置,滿足內容排序的時效性敏感度?
開放搜索解決方案:運用函數timeliness--時效分,用于衡量文檔的新舊程度, 值越大表示時效性越好
詳細用法:https://help.aliyun.com/document_detail/51270.html?spm=a2c4g.11174283.6.636.121f5a19EWuQQM
場景5:關鍵詞(分類、標題、作者)相關性排序優化
案例1:搜索“子女”,優化前排序結果“女裝靴子/褲子/葉子”排在“預測子女性別”的前面,如何運用排序表達式優化把"子女"最相關的內容排序靠前那?
案例2: 在精排中對title和body進行文本算分,權重比為3:1
開放搜索解決方案:在精排中進行文本算分,關鍵詞在字段上的文本匹配度-text_relevance函數,匹配度越高,分值越高,排序越靠前.
詳細用法:https://help.aliyun.com/document_detail/51280.html?spm=a2c4g.11186623.6.635.287e42c3whTeg9
以上就是阿里云開放搜索內容行業"排序表達式及特征函數”的應用案例,如果您對搜索與推薦相關技術感興趣,歡迎加入釘釘群內交流~
https://free.aliyun.com/product/opensearch-free-trial
原文鏈接:https://developer.aliyun.com/article/779309?
版權聲明:本文內容由阿里云實名注冊用戶自發貢獻,版權歸原作者所有,阿里云開發者社區不擁有其著作權,亦不承擔相應法律責任。具體規則請查看《阿里云開發者社區用戶服務協議》和《阿里云開發者社區知識產權保護指引》。如果您發現本社區中有涉嫌抄襲的內容,填寫侵權投訴表單進行舉報,一經查實,本社區將立刻刪除涉嫌侵權內容。總結
以上是生活随笔為你收集整理的内容搜索排序表达式的最佳实践的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 命令行工具开发:如何快速实现命令行提示?
- 下一篇: 揭秘 | 连续3年支撑双11,阿里云神龙