基于類別圖增強算法的融合異構(gòu)數(shù)據(jù)會話推薦分析
基金項目:河南省重點研發(fā)與推廣專項,項目編號202102210177
本文引用地址:http://www.ex-cimer.com/article/202308/449928.htm0 引言
從會話層面分析,在未掌握全面的用戶身份信息并且不知道會話序列包含的物品個數(shù)條件下,如果只根據(jù)物品參數(shù)來建立ID 標簽序列模型時,并無法準確捕獲用戶實際意圖,某些情況下還會出現(xiàn)關于用戶意圖的錯誤理解結(jié)果。首先,當會話序列較短的情況下,無法通過有限交互行為準確反饋出用戶實際意圖??紤]到大部分時候都無法得到用戶的身份信息,而且只有短時間中的用戶交互記錄才是有效的,這對大量處理方法造成了制約。
對人們?nèi)粘J褂玫母鞔筚徫锲脚_進行分析可知,拼多多、淘寶、京東等電子商務服務平臺為提升搜索效率,通常都會針對各物品設置相應的類別標簽。通過上述方式促使用戶更加快速準確找尋他們所需的商品,同時平臺還可通過推薦系統(tǒng)中顯示的用戶訪問信息推送同一類產(chǎn)品。綜合考慮物品與類別因素可以判斷出用戶的實際意圖。根據(jù)文獻[1]報道可以發(fā)現(xiàn),以圖神經(jīng)網(wǎng)絡構(gòu)建會話序列模型的時候,如果只針對單一物品結(jié)構(gòu)進行建模,即只根據(jù)物品ID 序號構(gòu)建模型時,將會造成部分概念層數(shù)據(jù)丟失的結(jié)果。當會話序列處于匿名狀態(tài)下時,無法包含所有用戶行為,如果只根據(jù)單一層面構(gòu)建模型時將會在用戶偏好方面產(chǎn)生較大偏差。本文對于上述分析結(jié)果,設計了一種通過類別圖來實現(xiàn)增強效果的推薦算法??梢岳么怂惴槲锲方㈩悇e序列,再通過圖神經(jīng)網(wǎng)絡為上述序列構(gòu)建仿真模型,從而實現(xiàn)2 個層面的物品屬性評價,對2 個層面的測試結(jié)果進行融合后確定會話用戶的偏好結(jié)果。
1 類別圖增強算法
在網(wǎng)絡中輸入各物品ID與類別序列再對其表征后,獲得每種序列下的各節(jié)點表征結(jié)果。由于類別屬于物品的特定屬性,可將其作為物品ID 標簽序列的補充數(shù)據(jù)。CaSe4SR-W 方法是利用加權(quán)融合的過程來判斷全局偏好:物品與類別序列都是按照相互獨立的方式完成輸入與表征過程,因此進行融合的時候先獨立處理2 個序列,之后測試融合所得的結(jié)果。上述融合模式是計算物品圖與類別圖的注意力加權(quán)數(shù)據(jù),之后再對其實施融合,結(jié)果見圖1。
圖1 加權(quán)融合全局偏好方法
以下給出了具體處理步驟:
首先通過注意力機制加權(quán)計算物品表征向量,從而實現(xiàn)物品全局表征的效果,具體見式(1)(2):
(1)
(2)
之后利用注意力機制加權(quán)計算類別表征向量,由此完成類別全局表征,構(gòu)建得到式(3)~(4):
(3)
(4)
最后一步是對以上獲得的物品與類別層面進行全局表征,融合物品與類別層面的信息后,可以更加全面描述物品特征,這使得各類ID 標簽的物品因為類別標簽一致,也表現(xiàn)出了一定程度的相似性。通過會話表示層拼接局部與全局表征,再利用線性轉(zhuǎn)換方法確定最終會話表征。
2 實驗
2.1 Cosmetics數(shù)據(jù)集及預處理
從Kaggle 平臺上采集測試參數(shù),選擇中等化妝品在線商店在線用戶行為進行分析。為確保數(shù)據(jù)處理過程更好地滿足一般性,將長度不在2~50 范圍的會話內(nèi)容去除,同時不考慮出現(xiàn)次數(shù)在5 次以內(nèi)的物品。表1 是統(tǒng)計得到的數(shù)據(jù)集參數(shù)。
表1 數(shù)據(jù)集統(tǒng)計
2.2 對比方法介紹及實驗設置
為了對算法進行可靠性驗證,以SR-GNN[36] 模型作為基準對比條件。
將模型設定為以下所示的控制參數(shù):采用TensorFlow框架對模型開展訓練。將數(shù)據(jù)集中的表征向量維度設置在100。同時將模型各參數(shù)矩陣均值都設置為0,標準差等于1,按照高斯分布形態(tài)實施初始化。通過minibatchAdam優(yōu)化器調(diào)整上述參數(shù),設定最初學習率等于0.001。控制訓練批次為100,L2 懲罰保持105 的恒定值。
2.3 實驗結(jié)果及分析
為驗證以類別圖增強方法構(gòu)建的模型滿足有效性,本次利用2 個數(shù)據(jù)集分別測試了CaSe4SR、SR-GNN模型與CaSe4SR 變體模型,得到表2參數(shù)。
表2 不同方法的結(jié)果對比
根據(jù)表格參數(shù)可知,設計得到的CaSe4SR 模型對各類數(shù)據(jù)集都表現(xiàn)出了最優(yōu)推薦性能。同時可以發(fā)現(xiàn),其他3 類包含類別信息數(shù)據(jù)的模型都獲得了比SRGNN模型更優(yōu)的性能,考慮到各模型具有自身獨特的建模過程,因此實際提升幅度也存在較大區(qū)別。Concat與CaSe4SR 雖然是以不同形式進行建模,但都在建模過程中融合了物品與類別信息,可以將物品類別與表征形成一一對應關系。CaSe4SR-W 則依次通過類別特征和物品實施建模,最后再對其實施融合。根據(jù)測試結(jié)果可知,CaSe4SR-W 模型表現(xiàn)出了比Concat 與CaSe4SR兩種模型更差的性能,由此可以推斷類別信息需結(jié)合物品信息共同建模,需根據(jù)物品參數(shù)才可以發(fā)揮信息補充功能。Concat 相對Case4SR 模型推薦性更弱,因此采用有向圖表示類別序列,同時引入門控圖神經(jīng)網(wǎng)絡建立模型的過程滿足可靠性要求。
3 結(jié)束語
本文開展基于類別圖增強算法的融合異構(gòu)數(shù)據(jù)會話推薦分析,得到如下有益結(jié)果:
1)設計了一種包含5 層結(jié)構(gòu)的CaSe4SR 仿真模型,在融合層內(nèi)融合物品與類別表征結(jié)果,確保物品表征中包含類別數(shù)據(jù);根據(jù)注意力機制建立全局表征,再通過局部表征建立最終表示;通過預測層計算各候選對象推薦參數(shù)。
2)設計得到的CaSe4SR 模型對各類數(shù)據(jù)集都表現(xiàn)出了最優(yōu)推薦性能,CaSe4SR-W 模型表現(xiàn)出了比Concat 與CaSe4SR 兩種模型更差的性能,推斷類別信息需結(jié)合物品信息共同建模,需根據(jù)物品參數(shù)才可以發(fā)揮信息補充功能。
參考文獻:
[1] 賈丹,孫靜宇.基于用戶會話的TF-Ranking推薦方法[J]. 應用科學學報,2021,39(3):495-507.
[2] 任俊偉,曾誠,肖絲雨,等.基于會話的多粒度圖神經(jīng)網(wǎng)絡推薦模型[J].計算機應用,2021,41(11): 3164-3170.
[3] 方軍,管業(yè)鵬.基于雙編碼器的會話型推薦模型[J].西安交通大學學報,2021,55(8):166-174.
[4] WU S, TANG Y, ZHU Y, et al. Session-based recommendation with graph neural networks[C]. Proceedings of the AAAI Conference on Artificial Intelligence, Hawaii, United States,2019,33(1):346-353.
[5] 閆昭,項欣光.基于整體序列建模的會話推薦模型[J]. 南京理工大學學報,2021,45(1):27-36.
[6] 張海通,黃增峰.基于影響力擴散的會話推薦模型[J].計算機應用研究,2021,38(7):1956-1962.
[7] 南寧,楊程屹,武志昊.基于多圖神經(jīng)網(wǎng)絡的會話感知推薦模型[J].計算機應用,2021,41(2):330-336.
[8] WANG M, REN P, MEI L,et al. A collaborative sessionbased recommendation approach with parallel memory modules[C]. Proceedings of the 42nd International ACM SIGIR Conference on Research and Development in Information Retrieval, Paris, France, 2019: 345-354.
[9] 曾義夫,牟其林,周樂,等.基于圖表示學習的會話感知推薦模型[J].計算機研究與發(fā)展,2020,57(3):590-603.
[10] 李晶皎,孫麗梅,王驕.提高會話推薦多樣性的SRL推薦系統(tǒng)模型[J].東北大學學報(自然科學版),2013,34(5): 650-653+662.
[11] 劉浩翰,呂鑫,李建伏.考慮用戶意圖和時間間隔的會話型深度學習推薦系統(tǒng)[J].計算機應用與軟件,2021,38(3): 190-195+223.
[12] 王鴻偉,過敏意.刻畫長短期用戶興趣的基于會話的推薦系統(tǒng)[J].中國科學:信息科學,2020,50(12):1867-1881.
(本文來源于《電子產(chǎn)品世界》雜志2023年8月期)
評論