基于外卖评论的舆情风控
業(yè)務(wù)背景
目前許多商家都有線上留言或者評論反饋平臺(tái),消費(fèi)者可以在這些平臺(tái)上通過留言表達(dá)自己對于消費(fèi)商品的反饋。消費(fèi)者的反饋包括表揚(yáng)性的正向反饋,也有一些批評性質(zhì)的負(fù)向反饋。商家需要掌握消費(fèi)者對于產(chǎn)品的整體輿論取向來判斷自己的產(chǎn)品質(zhì)量是否符合消費(fèi)者需求,同時(shí)了解評論內(nèi)容可以方便商家分析輿論導(dǎo)向,指導(dǎo)下一步產(chǎn)品研發(fā)工作。
業(yè)務(wù)痛點(diǎn)
目前許多酒店、餐飲、零售的留言平臺(tái)每天都有大量的留言產(chǎn)生,傳統(tǒng)的輿論情緒收集方案是通過人工統(tǒng)計(jì)的方式,但是這種方式較為低效,很難針對大規(guī)模的輿論做出精確統(tǒng)計(jì)。需要自動(dòng)化的手段收集并判斷留言平臺(tái)的輿論走向。
解決方案
PAI平臺(tái)提供了一套基于文本向量化以及分類的算法,可以基于歷史標(biāo)記的正負(fù)留言內(nèi)容生成分類模型,自動(dòng)對平臺(tái)上的新增留言進(jìn)行預(yù)測。該服務(wù)的整體框架已經(jīng)基于PAI-Studio開發(fā)完成,基于真實(shí)的打標(biāo)后的11987條外賣平臺(tái)評論數(shù)據(jù),實(shí)現(xiàn)了自動(dòng)化的正反面輿論風(fēng)控,準(zhǔn)確性達(dá)到75%左右。
1.人力要求:需要具備基礎(chǔ)的NLP及分類算法知識用于模型調(diào)試
2.開發(fā)周期:1-2天
3.數(shù)據(jù)要求:最好有超過千條的打標(biāo)數(shù)據(jù),數(shù)據(jù)越多效果越好
數(shù)據(jù)說明
?
參數(shù)名稱參數(shù)描述label標(biāo)簽,1是正向評論,0為負(fù)面評論review實(shí)際評論數(shù)據(jù)
流程說明
進(jìn)入PAI-Studio產(chǎn)品:https://pai.data.aliyun.com/console
將數(shù)據(jù)導(dǎo)入,搭建如下算法架構(gòu):
?
1.數(shù)據(jù)源
上文提到的評論數(shù)據(jù)
2.停用詞
過濾一些助動(dòng)詞以及標(biāo)點(diǎn)符號,需要自己上傳停用詞表
?
3.文本向量化
利用Doc2vector算法把每個(gè)評論變成語意向量,每行是一個(gè)向量,每個(gè)向量代表一個(gè)評論的含義
?
4.生成分類模型
將向量化后的文本通過拆分算法拆分為訓(xùn)練集以及測試集,訓(xùn)練集通過邏輯回歸算法訓(xùn)練生成二分類模型,該模型可以實(shí)現(xiàn)對于評論是正向評論或者負(fù)向評論的判斷。
5.模型效果驗(yàn)證
通過混淆矩陣算法驗(yàn)證模型的實(shí)際效果,
?
總結(jié)
本文提到的基于留言評論的輿情風(fēng)控方案可以用PAI組件在1-2天時(shí)間內(nèi)非常快速的實(shí)現(xiàn),實(shí)現(xiàn)后可以批量的對于平臺(tái)上面的留言輿論進(jìn)行智能化分析,并且隨著數(shù)據(jù)的累計(jì),模型的準(zhǔn)確性會(huì)逐漸增強(qiáng)。該方案適用用各種基于文本場景的分析,比如垃圾郵件分類、新聞?wù)辞榫w分類等。
總結(jié)
以上是生活随笔為你收集整理的基于外卖评论的舆情风控的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: Graph Embedding方案之De
- 下一篇: 微软NNI-业内最亲民的AutoML工具