本申請涉及一種破除信息繭房問題的冷啟動(dòng)個(gè)性化推薦方法及裝置,其中,方法包括:在目標(biāo)賬號的使用階段處于冷啟動(dòng)階段的情況下,確定與目標(biāo)賬號的用戶行為相似度達(dá)到第一閾值的對照賬號;利用對照賬號的對照興趣矩陣確定目標(biāo)賬號的目標(biāo)興趣矩陣;利用目標(biāo)興趣矩陣在預(yù)設(shè)內(nèi)容池中確定候選推薦集;利用量化因子對候選推薦集中的特征相關(guān)度進(jìn)行權(quán)重調(diào)整,得到各個(gè)候選推薦數(shù)據(jù)的推薦指數(shù);將推薦指數(shù)達(dá)到第二閾值的候選推薦數(shù)據(jù)確定為目標(biāo)推薦數(shù)據(jù),并將目標(biāo)推薦數(shù)據(jù)推送給目標(biāo)賬號。通過對照賬號來預(yù)測用戶賬號的興趣矩陣,然后用興趣矩陣選出候選推薦集,最后結(jié)合目標(biāo)賬號的瀏覽記錄確定推薦數(shù)據(jù),解決了為冷啟動(dòng)階段用戶推薦的內(nèi)容趨于同質(zhì)化的問題。內(nèi)容趨于同質(zhì)化的問題。內(nèi)容趨于同質(zhì)化的問題。
【技術(shù)實(shí)現(xiàn)步驟摘要】
一種破除信息繭房問題的冷啟動(dòng)個(gè)性化推薦方法及裝置
[0001]本申請涉及數(shù)據(jù)處理
,尤其涉及一種破除信息繭房問題的冷啟動(dòng)個(gè)性化推薦方法及裝置。
技術(shù)介紹
[0002]近年來,伴隨著信息技術(shù)的蓬勃發(fā)展,人工智能技術(shù)在互聯(lián)網(wǎng)應(yīng)用過程中逐漸走向成熟,其中個(gè)性化內(nèi)容推薦技術(shù)是一種基于用戶行為產(chǎn)生的數(shù)據(jù)(例如,用戶瀏覽記錄、購物記錄、關(guān)注信息、個(gè)人興趣點(diǎn)標(biāo)簽等數(shù)據(jù))構(gòu)建個(gè)性化用戶內(nèi)容推薦模型進(jìn)行用戶喜好內(nèi)容預(yù)測的智能技術(shù)。但是新注冊用戶在使用互聯(lián)網(wǎng)的初始階段產(chǎn)生的數(shù)據(jù)較少,系統(tǒng)推薦的內(nèi)容就會集中在較小范圍,這樣一來,為冷啟動(dòng)階段用戶推薦的內(nèi)容趨于同質(zhì)化,極易造成信息繭房現(xiàn)象。
[0003]針對上述的問題,目前尚未提出有效的解決方案。
技術(shù)實(shí)現(xiàn)思路
[0004]本申請?zhí)峁┝艘环N破除信息繭房問題的冷啟動(dòng)個(gè)性化推薦方法及裝置,以解決上述“為冷啟動(dòng)階段用戶推薦的內(nèi)容趨于同質(zhì)化”的技術(shù)問題。
[0005]根據(jù)本申請實(shí)施例的一個(gè)方面,本申請?zhí)峁┝艘环N破除信息繭房問題的冷啟動(dòng)個(gè)性化推薦方法,包括:在目標(biāo)賬號的使用階段處于冷啟動(dòng)階段的情況下,確定與目標(biāo)賬號的用戶行為相似度達(dá)到第一閾值的對照賬號;利用對照賬號的對照興趣矩陣確定目標(biāo)賬號的目標(biāo)興趣矩陣;利用目標(biāo)興趣矩陣在預(yù)設(shè)內(nèi)容池中確定候選推薦集,其中,候選推薦集包括候選推薦數(shù)據(jù)以及候選推薦數(shù)據(jù)與目標(biāo)興趣矩陣的特征相關(guān)度;利用量化因子對候選推薦集中的特征相關(guān)度進(jìn)行權(quán)重調(diào)整,得到各個(gè)候選推薦數(shù)據(jù)的推薦指數(shù);將推薦指數(shù)達(dá)到第二閾值的候選推薦數(shù)據(jù)確定為目標(biāo)推薦數(shù)據(jù),并將目標(biāo)推薦數(shù)據(jù)推送給目標(biāo)賬號。
[0006]可選地,確定與目標(biāo)賬號的用戶行為相似度達(dá)到第一閾值的對照賬號包括:獲取目標(biāo)賬號的第一興趣數(shù)據(jù),并從用戶數(shù)據(jù)庫中獲取多個(gè)用戶賬號以及用戶賬號的第二興趣數(shù)據(jù),其中,用戶數(shù)據(jù)庫用于存儲當(dāng)前不處于冷啟動(dòng)階段的用戶賬號在冷啟動(dòng)階段時(shí)的興趣數(shù)據(jù);利用第一興趣數(shù)據(jù)生成第一興趣矩陣,以及利用第二興趣數(shù)據(jù)生成第二興趣矩陣;確定第一興趣矩陣與各個(gè)第二興趣矩陣的矩陣相似度,以獲得目標(biāo)賬號與各個(gè)用戶賬號的用戶行為相似度;將用戶行為相似度達(dá)到第一閾值的用戶賬號確定為對照賬號。
[0007]可選地,利用對照賬號的對照興趣矩陣確定目標(biāo)賬號的目標(biāo)興趣矩陣包括:獲取對照賬號的當(dāng)前興趣數(shù)據(jù),并利用當(dāng)前興趣數(shù)據(jù)生成對照興趣矩陣;利用目標(biāo)賬號的第一興趣矩陣對對照興趣矩陣進(jìn)行矩陣擴(kuò)充,生成目標(biāo)興趣矩陣。
[0008]可選地,利用目標(biāo)興趣矩陣在預(yù)設(shè)內(nèi)容池中確定候選推薦集包括:獲取預(yù)設(shè)內(nèi)容池,其中,預(yù)設(shè)內(nèi)容池包括系統(tǒng)內(nèi)容池和正能量內(nèi)容池;利用目標(biāo)興趣矩陣分別從系統(tǒng)內(nèi)容池和正能量內(nèi)容池中提取系統(tǒng)候選集和正能量候選集;將系統(tǒng)候選集和正能量候選集確定為候選推薦集。
[0009]可選地,利用目標(biāo)興趣矩陣分別從系統(tǒng)內(nèi)容池和正能量內(nèi)容池中提取系統(tǒng)候選集和正能量候選集包括:利用目標(biāo)興趣矩陣從系統(tǒng)內(nèi)容池召回第一內(nèi)容池,以及利用目標(biāo)興趣矩陣從正能量內(nèi)容池召回第二內(nèi)容池;確定第一內(nèi)容池中的數(shù)據(jù)與目標(biāo)興趣矩陣的第一相關(guān)度,并確定第二內(nèi)容池中的數(shù)據(jù)與目標(biāo)興趣矩陣的第二相關(guān)度;提取第一內(nèi)容池中的第一相關(guān)度達(dá)到第三閾值的數(shù)據(jù),得到系統(tǒng)候選集,以及提取第二內(nèi)容池中的第二相關(guān)度達(dá)到第四閾值的數(shù)據(jù),得到正能量候選集。
[0010]可選地,利用量化因子對候選推薦集中的特征相關(guān)度進(jìn)行權(quán)重調(diào)整,得到各個(gè)候選推薦數(shù)據(jù)的推薦指數(shù)包括:利用目標(biāo)賬號的目標(biāo)瀏覽數(shù)據(jù)和目標(biāo)賬號所在平臺的全部賬號的總瀏覽數(shù)據(jù)確定賬號量化因子,其中,賬號量化因子用于表征目標(biāo)賬號的目標(biāo)瀏覽數(shù)據(jù)在總瀏覽數(shù)據(jù)中的占比,量化因子包括賬號量化因子和系統(tǒng)量化因子,賬號量化因子與系統(tǒng)量化因子之和為固定值;將賬號量化因子與系統(tǒng)候選集的第一相關(guān)度相乘,得到第一推薦指數(shù),以及將系統(tǒng)量化因子與正能量候選集的第二相關(guān)度相乘,得到第二推薦指數(shù),其中,特征相關(guān)度包括第一相關(guān)度和第二相關(guān)度,推薦指數(shù)包括第一推薦指數(shù)和第二推薦指數(shù)。
[0011]可選地,利用目標(biāo)賬號的目標(biāo)瀏覽數(shù)據(jù)和目標(biāo)賬號所在平臺的全部賬號的總瀏覽數(shù)據(jù)確定賬號量化因子包括:獲取目標(biāo)賬號的目標(biāo)瀏覽數(shù)據(jù),并利用目標(biāo)瀏覽數(shù)據(jù)確定第一瀏覽頻率以及第一類別數(shù)量;以及獲取全部賬號的總瀏覽數(shù)據(jù),并利用總瀏覽數(shù)據(jù)確定第二瀏覽頻率以及第二類別數(shù)量;確定第一瀏覽頻率與第二瀏覽頻率的第一比值,并確定第一類別數(shù)量與第二類別數(shù)量的第二比值;將第一比值與第二比值相乘,并將得到的乘積確定為賬號量化因子。
[0012]根據(jù)本申請實(shí)施例的另一方面,本申請?zhí)峁┝艘环N破除信息繭房問題的冷啟動(dòng)個(gè)性化推薦裝置,包括:賬號確定模塊,用于在目標(biāo)賬號的使用階段處于冷啟動(dòng)階段的情況下,確定與目標(biāo)賬號的用戶行為相似度達(dá)到第一閾值的對照賬號;矩陣確定模塊,用于利用對照賬號的對照興趣矩陣確定目標(biāo)賬號的目標(biāo)興趣矩陣;推薦集確定模塊,用于利用目標(biāo)興趣矩陣在預(yù)設(shè)內(nèi)容池中確定候選推薦集,其中,候選推薦集包括候選推薦數(shù)據(jù)以及候選推薦數(shù)據(jù)與目標(biāo)興趣矩陣的特征相關(guān)度;調(diào)整模塊,用于利用量化因子對候選推薦集中的特征相關(guān)度進(jìn)行權(quán)重調(diào)整,得到各個(gè)候選推薦數(shù)據(jù)的推薦指數(shù);數(shù)據(jù)確定模塊,用于將推薦指數(shù)達(dá)到第二閾值的候選推薦數(shù)據(jù)確定為目標(biāo)推薦數(shù)據(jù),并將目標(biāo)推薦數(shù)據(jù)推送給目標(biāo)賬號。
[0013]根據(jù)本申請實(shí)施例的另一方面,本申請?zhí)峁┝艘环N電子設(shè)備,包括存儲器、處理器、通信接口及通信總線,存儲器中存儲有可在處理器上運(yùn)行的計(jì)算機(jī)程序,存儲器、處理器通過通信總線和通信接口進(jìn)行通信,處理器執(zhí)行計(jì)算機(jī)程序時(shí)實(shí)現(xiàn)上述方法的步驟。
[0014]根據(jù)本申請實(shí)施例的另一方面,本申請還提供了一種具有處理器可執(zhí)行的非易失的程序代碼的計(jì)算機(jī)可讀介質(zhì),程序代碼使處理器執(zhí)行上述的方法。
[0015]本申請實(shí)施例提供的上述技術(shù)方案與相關(guān)技術(shù)相比具有如下優(yōu)點(diǎn):
[0016]本申請通過一種破除信息繭房問題的冷啟動(dòng)個(gè)性化推薦方法,包括:在目標(biāo)賬號的使用階段處于冷啟動(dòng)階段的情況下,確定與目標(biāo)賬號的用戶行為相似度達(dá)到第一閾值的對照賬號;利用對照賬號的對照興趣矩陣確定目標(biāo)賬號的目標(biāo)興趣矩陣;利用目標(biāo)興趣矩陣在預(yù)設(shè)內(nèi)容池中確定候選推薦集,其中,候選推薦集包括候選推薦數(shù)據(jù)以及候選推薦數(shù)
據(jù)與目標(biāo)興趣矩陣的特征相關(guān)度;利用量化因子對候選推薦集中的特征相關(guān)度進(jìn)行權(quán)重調(diào)整,得到各個(gè)候選推薦數(shù)據(jù)的推薦指數(shù);將推薦指數(shù)達(dá)到第二閾值的候選推薦數(shù)據(jù)確定為目標(biāo)推薦數(shù)據(jù),并將目標(biāo)推薦數(shù)據(jù)推送給目標(biāo)賬號。通過對照賬號來預(yù)測用戶賬號的興趣矩陣,然后用興趣矩陣召回候選推薦集,最后結(jié)合目標(biāo)賬號的瀏覽記錄來選出推薦數(shù)據(jù),解決了為冷啟動(dòng)階段用戶推薦的內(nèi)容趨于同質(zhì)化的問題。
附圖說明
[0017]此處的附圖被并入說明書中并構(gòu)成本說明書的一部分,示出了符合本申請的實(shí)施例,并與說明書一起用于解釋本申請的原理。
[0018]為了更清楚地說明本申請實(shí)施例或相關(guān)技術(shù)中的技術(shù)方案,下面將對實(shí)施例或相關(guān)技術(shù)描述中所需要使用的附圖作簡單地介紹,顯而易見地,對于本領(lǐng)域普通技術(shù)人員而言,在不付出創(chuàng)造性勞動(dòng)性的前提下,還可以根據(jù)這些附本文檔來自技高網(wǎng)...
【技術(shù)保護(hù)點(diǎn)】
【技術(shù)特征摘要】
1.一種破除信息繭房問題的冷啟動(dòng)個(gè)性化推薦方法,其特征在于,包括:在目標(biāo)賬號的使用階段處于冷啟動(dòng)階段的情況下,確定與所述目標(biāo)賬號的用戶行為相似度達(dá)到第一閾值的對照賬號;利用所述對照賬號的對照興趣矩陣確定所述目標(biāo)賬號的目標(biāo)興趣矩陣;利用所述目標(biāo)興趣矩陣在預(yù)設(shè)內(nèi)容池中確定候選推薦集,其中,所述候選推薦集包括候選推薦數(shù)據(jù)以及所述候選推薦數(shù)據(jù)與所述目標(biāo)興趣矩陣的特征相關(guān)度;利用量化因子對所述候選推薦集中的所述特征相關(guān)度進(jìn)行權(quán)重調(diào)整,得到各個(gè)所述候選推薦數(shù)據(jù)的推薦指數(shù);將所述推薦指數(shù)達(dá)到第二閾值的所述候選推薦數(shù)據(jù)確定為目標(biāo)推薦數(shù)據(jù),并將所述目標(biāo)推薦數(shù)據(jù)推送給所述目標(biāo)賬號。2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述確定與所述目標(biāo)賬號的用戶行為相似度達(dá)到第一閾值的對照賬號包括:獲取所述目標(biāo)賬號的第一興趣數(shù)據(jù),并從用戶數(shù)據(jù)庫中獲取多個(gè)用戶賬號以及所述用戶賬號的第二興趣數(shù)據(jù),其中,所述用戶數(shù)據(jù)庫用于存儲當(dāng)前不處于所述冷啟動(dòng)階段的所述用戶賬號在所述冷啟動(dòng)階段時(shí)的興趣數(shù)據(jù);利用所述第一興趣數(shù)據(jù)生成第一興趣矩陣,以及利用所述第二興趣數(shù)據(jù)生成第二興趣矩陣;確定所述第一興趣矩陣與各個(gè)所述第二興趣矩陣的矩陣相似度,以獲得所述目標(biāo)賬號與各個(gè)所述用戶賬號的所述用戶行為相似度;將所述用戶行為相似度達(dá)到所述第一閾值的所述用戶賬號確定為所述對照賬號。3.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述利用所述對照賬號的對照興趣矩陣確定所述目標(biāo)賬號的目標(biāo)興趣矩陣包括:獲取所述對照賬號的當(dāng)前興趣數(shù)據(jù),并利用所述當(dāng)前興趣數(shù)據(jù)生成所述對照興趣矩陣;利用所述目標(biāo)賬號的所述第一興趣矩陣對所述對照興趣矩陣進(jìn)行矩陣擴(kuò)充,生成所述目標(biāo)興趣矩陣。4.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述利用所述目標(biāo)興趣矩陣在預(yù)設(shè)內(nèi)容池中確定候選推薦集包括:獲取所述預(yù)設(shè)內(nèi)容池,其中,所述預(yù)設(shè)內(nèi)容池包括系統(tǒng)內(nèi)容池和正能量內(nèi)容池;利用所述目標(biāo)興趣矩陣分別從所述系統(tǒng)內(nèi)容池和所述正能量內(nèi)容池中提取系統(tǒng)候選集和正能量候選集;將所述系統(tǒng)候選集和所述正能量候選集確定為所述候選推薦集。5.根據(jù)權(quán)利要求4所述的方法,其特征在于,所述利用所述目標(biāo)興趣矩陣分別從所述系統(tǒng)內(nèi)容池和所述正能量內(nèi)容池中提取系統(tǒng)候選集和所述正能量候選集包括:利用所述目標(biāo)興趣矩陣從所述系統(tǒng)內(nèi)容池召回第一內(nèi)容池,以及利用所述目標(biāo)興趣矩陣從所述正能量內(nèi)容池召回第二內(nèi)容池;確定所述第一內(nèi)容池中的數(shù)據(jù)與所述目標(biāo)興趣矩陣的第一相關(guān)度,并確定所述第二內(nèi)容池中的數(shù)據(jù)與所述目標(biāo)興趣矩陣的第二相關(guān)度;提取所述第一內(nèi)容池中的所述第一相關(guān)度達(dá)到第三閾值的數(shù)據(jù),得到所述系統(tǒng)候選
集,以及提取所述第二內(nèi)容池中的所述第二相關(guān)度達(dá)到第四閾值的數(shù)據(jù),得到所述正...
【專利技術(shù)屬性】
技術(shù)研發(fā)人員:馬宏遠(yuǎn),王麗宏,王磊,時(shí)磊,余翠玲,王紅兵,李鵬霄,翟羽佳,項(xiàng)菲,王媛媛,王子涵,呂東,艾政陽,劉瑋,馬歡,彭鑫,
申請(專利權(quán))人:北京中科聞歌科技股份有限公司,
類型:發(fā)明
國別省市:
還沒有人留言評論。發(fā)表了對其他瀏覽者有用的留言會獲得科技券。