一维卷积神经网络_序列特征的处理方法之二:基于卷积神经网络方法
前言
上一篇文章介紹了基本的基于注意力機制方法對序列特征的處理,這篇主要介紹一下基本的基于卷積神經(jīng)網(wǎng)絡(luò)方法對序列特征的處理,也就是TextCNN方法。序列特征的介紹,背景以及應用可以參考上一篇的詳細介紹,這里簡單回顧一下定義,用戶在使用APP或網(wǎng)站的時候,用戶會產(chǎn)生一些針對物品的行為,比如點擊感興趣的物品,收藏或購買物品等,而這些行為往往代表著用戶對這些物品是感興趣的,而將這些交互過的物品放在時間軸來看,就形成了用戶感興趣的物品序列,我們要處理的數(shù)據(jù)對象類似如圖 1 所示具有時序關(guān)系的序列特征,這里拿用戶感興趣的物品序列為例作為處理對象。
▲ 圖1. 用戶感興趣的物品序列我們都知道用戶的歷史行為中可能存在著一些局部的連續(xù)行為,比如最近新型冠狀病毒疫情嚴重,可能用戶在過去幾天內(nèi)連續(xù)買了口罩和酒精這種消毒和防護用品,那么在推薦中可以根據(jù)這種局部信息來推薦一些跟防護和消毒相關(guān)的商品。而淺層的卷積神經(jīng)網(wǎng)絡(luò)由于其卷積感受野比較小,善于捕獲局部信息,因此可以利用淺層卷積神經(jīng)網(wǎng)絡(luò)來對序列特征中的局部行為模式進行建模。鑒于針對句子序列建模的卷積神經(jīng)網(wǎng)絡(luò)TextCNN也是針對embedding matrix做處理,因此選用TextCNN來對用戶感興趣的物品序列進行處理。
TextCNN原理
如圖 2 所示為TextCNN對句子序列建模并進行分類的示意圖:
▲ 圖 2. TextCNN示意圖[1]應用在序列特征上
我們主要借鑒的是上面介紹的TextCNN提取特征的方法,也就是上面介紹的如何把embedding matrix變?yōu)樽罱K的6維特征向量的方法。如圖 3 所示:
▲ 圖 3. TextCNN的序列特征處理一般在把TextCNN應用在序列特征的處理上時一維卷積的kernel_sizes設(shè)置為2或3,或者同時都用,每個kernel_sizes的卷積核個數(shù)一般都為1。一維卷積核大小分別設(shè)置為2和3時可以提取不同范圍大小的局部信息,保證了特征的多樣性。
除此之外,為了彌補有關(guān)全局信息提取的不足之處,還可以結(jié)合max/mean/sum pooling提取全局特征的方法,使得提取的特征既有全局信息又有局部信息[2],如圖 4 所示,其中全局pooling和textCNN共享序列特征的embedding matrix。
▲ 圖 4. 結(jié)合TextCNN和全局pooling的序列特征處理總結(jié)
卷積神經(jīng)網(wǎng)絡(luò)因其滑動卷積的計算方式對局部特征的提取有天然的優(yōu)勢,因此成為提取局部信息的首選建模方法。除此之外,還可以結(jié)合全局pooling的方法提取全局特征,彌補對全局特征提取的不足,提高特征的多樣性。與此同時,之前介紹過多值類別特征的處理方法,同樣可以采用textCNN進行局部特征的提取。
參考文獻
[1] Convolutional Neural Networks for Sentence Classification
[2] Convolutional Sequence Embedding Recommendation Model
總結(jié)
以上是生活随笔為你收集整理的一维卷积神经网络_序列特征的处理方法之二:基于卷积神经网络方法的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 科创板属于几级市场
- 下一篇: html文档加载,html加载