本公開實(shí)施例提供一種數(shù)據(jù)處理方法、裝置及設(shè)備,該方法包括:獲取請求消息,請求消息用于請求獲取第一對象的相關(guān)對象,相關(guān)對象與第一對象的相似度大于或等于預(yù)設(shè)閾值;確定當(dāng)前時刻對應(yīng)的最新版本信息,并基于最新版本信息在分布式系統(tǒng)的多個群組確定至少一個目標(biāo)群組,目標(biāo)群組中的服務(wù)設(shè)備中的索引信息的版本信息為最新版本信息,索引信息包括服務(wù)設(shè)備中的對象的特征信息;向至少一個目標(biāo)群組中的服務(wù)設(shè)備請求獲取至少一個參考對象,并基于參考對象與第一對象的相似度,在至少一個參考對象中確定相關(guān)對象,參考對象與第一對象的相似度大于或等于預(yù)設(shè)閾值。提高了數(shù)據(jù)處理效率。
Data processing methods, devices and equipment
【技術(shù)實(shí)現(xiàn)步驟摘要】
數(shù)據(jù)處理方法、裝置及設(shè)備
本公開實(shí)施例涉及計(jì)算機(jī)
,尤其涉及一種數(shù)據(jù)處理方法、裝置及設(shè)備。
技術(shù)介紹
在用戶在網(wǎng)絡(luò)中進(jìn)行對象(例如,音頻、視頻、商品信息等)搜索時,在搜索到一個目標(biāo)對象之后,服務(wù)器還可以向用戶推薦該目標(biāo)對象的相關(guān)對象,例如,相關(guān)對象可以為與目標(biāo)對象相似度較高的對象。在相關(guān)技術(shù)中,服務(wù)器通常獲取目標(biāo)對象對應(yīng)的關(guān)鍵信息,并根據(jù)目標(biāo)對象的關(guān)鍵信息與服務(wù)器中其它對象的關(guān)鍵信息進(jìn)行匹配,以確定該目標(biāo)對象的相關(guān)對象,并向用戶推薦該相關(guān)對象。然而,在實(shí)際應(yīng)用過程中,服務(wù)器中存儲的對象的數(shù)量通常較多,將目標(biāo)對象與服務(wù)器中的其它對象的關(guān)鍵信息進(jìn)行一一匹配的過程,需要消耗較多的時長,使得確定目標(biāo)對象的相關(guān)對象的效率較低,即,服務(wù)器進(jìn)行數(shù)據(jù)處理的效率較低。
技術(shù)實(shí)現(xiàn)思路
本公開實(shí)施例提供一種數(shù)據(jù)處理方法、裝置及設(shè)備,提高了數(shù)據(jù)處理效率。第一方面,本公開實(shí)施例提供一種數(shù)據(jù)處理方法,包括:獲取請求消息,所述請求消息用于請求獲取所述第一對象的相關(guān)對象,所述相關(guān)對象與所述第一對象的相似度大于或等于預(yù)設(shè)閾值;確定當(dāng)前時刻對應(yīng)的最新版本信息,并基于所述最新版本信息在分布式系統(tǒng)的多個群組確定至少一個目標(biāo)群組,所述目標(biāo)群組中的服務(wù)設(shè)備中的索引信息的版本信息為所述最新版本信息,所述索引信息包括所述服務(wù)設(shè)備中的對象的特征信息;向所述至少一個目標(biāo)群組中的服務(wù)設(shè)備請求獲取至少一個參考對象,并基于所述參考對象與所述第一對象的相似度,在所述至少一個參考對象中確定所述相關(guān)對象,所述參考對象與所述第一對象的相似度大于或等于所述預(yù)設(shè)閾值。在一種可能的實(shí)施方式中,基于所述最新版本信息在多個群組確定至少一個目標(biāo)群組,包括:獲取所述多個群組中每個群組的版本信息;將版本信息與所述最新版本信息相同的群組確定為所述至少一個目標(biāo)群組。在一種可能的實(shí)施方式中,向所述至少一個目標(biāo)群組中的服務(wù)設(shè)備請求獲取至少一個參考對象,包括:在所述至少一個目標(biāo)群組中確定至少一個目標(biāo)服務(wù)設(shè)備;向所述至少一個目標(biāo)服務(wù)設(shè)備請求獲取至少一個參考對象。在一種可能的實(shí)施方式中,基于所述參考對象與所述第一對象的相似度,在所述至少一個參考對象中確定所述相關(guān)對象,包括:按照所述參考對象與所述第一對象的相似度從高到低的順序,對所述至少一個參考對象進(jìn)行排序;將排序后的所述至少一個參考對象中、前N個參考對象確定為所述相關(guān)對象,所述N為大于或等于1的整數(shù)。在一種可能的實(shí)施方式中,所述方法還包括:獲取第一群組中各服務(wù)設(shè)備的狀態(tài);在所述第一群組中各服務(wù)設(shè)備的狀態(tài)為完成狀態(tài)時,重建所述第一群組對應(yīng)的索引信息。在一種可能的實(shí)施方式中,所述第一群組中主服務(wù)設(shè)備和從服務(wù)設(shè)備;重建所述第一群組對應(yīng)的索引信息,包括:將所述第一群組中的主服務(wù)設(shè)備的狀態(tài)設(shè)置為創(chuàng)建狀態(tài),以使所述主服務(wù)設(shè)備創(chuàng)建并存儲所述第一群組對應(yīng)的重建索引信息;在確定所述主服務(wù)設(shè)備將所述第一群組對應(yīng)的重建索引信息創(chuàng)建完成之后,將所述第一群組中的從服務(wù)設(shè)備的狀態(tài)設(shè)置為獲取狀態(tài),以使所述從服務(wù)設(shè)備獲取所述重建索引信息。在一種可能的實(shí)施方式中,在確定所述主服務(wù)設(shè)備將所述第一群組對應(yīng)的重建索引信息創(chuàng)建完成之后,還包括:將所述主服務(wù)設(shè)備的狀態(tài)設(shè)置為待切換狀態(tài)。在一種可能的實(shí)施方式中,將所述第一群組中的從服務(wù)設(shè)備的狀態(tài)設(shè)置為獲取狀態(tài)之后,還包括:判斷所述從設(shè)備是否完成獲取所述重建索引信息;若是,則將所述從服務(wù)設(shè)備的狀態(tài)設(shè)置為待切換狀態(tài)。在一種可能的實(shí)施方式中,在將所述從服務(wù)設(shè)備的狀態(tài)設(shè)置為待切換狀態(tài)之后,還包括:在所述主服務(wù)設(shè)備和所述從服務(wù)設(shè)備的狀態(tài)均為待切換狀態(tài)時,將所述主服務(wù)設(shè)備和所述從服務(wù)設(shè)備的索引信息切換為所述重建索引信息;將所述第一群組的版本信息更新為當(dāng)前時刻對應(yīng)的版本信息。在一種可能的實(shí)施方式中,所述索引信息為基于分層可導(dǎo)航小世界圖HNSW算法創(chuàng)建的。第二方面,本公開實(shí)施例提供一種數(shù)據(jù)處理裝置,包括第一獲取模塊、第一確定模塊、第二獲取模塊和第二確定模塊,其中,所述第一獲取模塊用于,獲取請求消息,所述請求消息用于請求獲取所述第一對象的相關(guān)對象,所述相關(guān)對象與所述第一對象的相似度大于或等于預(yù)設(shè)閾值;所述第一確定模塊用于,確定當(dāng)前時刻對應(yīng)的最新版本信息,并基于所述最新版本信息在分布式系統(tǒng)的多個群組確定至少一個目標(biāo)群組,所述目標(biāo)群組中的服務(wù)設(shè)備中的索引信息的版本信息為所述最新版本信息,所述索引信息包括所述服務(wù)設(shè)備中的對象的特征信息;所述第二獲取模塊用于,向所述至少一個目標(biāo)群組中的服務(wù)設(shè)備請求獲取至少一個參考對象;所述第二確定模塊用于,基于所述參考對象與所述第一對象的相似度,在所述至少一個參考對象中確定所述相關(guān)對象,所述參考對象與所述第一對象的相似度大于或等于所述預(yù)設(shè)閾值。在一種可能的實(shí)施方式中,所述第一確定模塊具體用于:獲取所述多個群組中每個群組的版本信息;將版本信息與所述最新版本信息相同的群組確定為所述至少一個目標(biāo)群組。在一種可能的實(shí)施方式中,所述第二獲取模塊具體用于:在所述至少一個目標(biāo)群組中確定至少一個目標(biāo)服務(wù)設(shè)備;向所述至少一個目標(biāo)服務(wù)設(shè)備請求獲取至少一個參考對象。在一種可能的實(shí)施方式中,所述第二確定模塊具體用于:按照所述參考對象與所述第一對象的相似度從高到低的順序,對所述至少一個參考對象進(jìn)行排序;將排序后的所述至少一個參考對象中、前N個參考對象確定為所述相關(guān)對象,所述N為大于或等于1的整數(shù)。在一種可能的實(shí)施方式中,所述裝置還包括重建模塊,其中,所述重建模塊用于:獲取第一群組中各服務(wù)設(shè)備的狀態(tài);在所述第一群組中各服務(wù)設(shè)備的狀態(tài)為完成狀態(tài)時,重建所述第一群組對應(yīng)的索引信息。在一種可能的實(shí)施方式中,所述第一群組中主服務(wù)設(shè)備和從服務(wù)設(shè)備;所述重建模塊具體用于:將所述第一群組中的主服務(wù)設(shè)備的狀態(tài)設(shè)置為創(chuàng)建狀態(tài),以使所述主服務(wù)設(shè)備創(chuàng)建并存儲所述第一群組對應(yīng)的重建索引信息;在確定所述主服務(wù)設(shè)備將所述第一群組對應(yīng)的重建索引信息創(chuàng)建完成之后,將所述第一群組中的從服務(wù)設(shè)備的狀態(tài)設(shè)置為獲取狀態(tài),以使所述從服務(wù)設(shè)備獲取所述重建索引信息。在一種可能的實(shí)施方式中,所述重建模塊還用于,在所述重建模塊確定所述主服務(wù)設(shè)備將所述第一群組對應(yīng)的重建索引信息創(chuàng)建完成之后,將所述主服務(wù)設(shè)備的狀態(tài)設(shè)置為待切換狀態(tài)。在一種可能的實(shí)施方式中,在所述重建模塊將所述第一群組中的從服務(wù)設(shè)備的狀態(tài)設(shè)置為獲取狀態(tài)之后,所述重建模塊還用于:判斷所述從設(shè)備是否完成獲取所述重建索引信息;若是,則將所述從服務(wù)設(shè)備的狀態(tài)設(shè)置為待切換狀態(tài)。在一種可能的實(shí)施方式中,在所述重建模塊將所述從服務(wù)設(shè)備的狀態(tài)設(shè)置為待切換狀態(tài)之后,所述重建模塊還用于:在所述主服務(wù)設(shè)備和所述從服務(wù)設(shè)備的狀態(tài)均為待切換狀態(tài)時,將所述主服務(wù)設(shè)備本文檔來自技高網(wǎng)...
【技術(shù)保護(hù)點(diǎn)】
1.一種數(shù)據(jù)處理方法,其特征在于,包括:/n獲取請求消息,所述請求消息用于請求獲取第一對象的相關(guān)對象,所述相關(guān)對象與所述第一對象的相似度大于或等于預(yù)設(shè)閾值;/n確定當(dāng)前時刻對應(yīng)的最新版本信息,并基于所述最新版本信息在分布式系統(tǒng)的多個群組確定至少一個目標(biāo)群組,所述目標(biāo)群組中的服務(wù)設(shè)備中的索引信息的版本信息為所述最新版本信息,所述索引信息包括所述服務(wù)設(shè)備中的對象的特征信息;/n向所述至少一個目標(biāo)群組中的服務(wù)設(shè)備請求獲取至少一個參考對象,并基于所述參考對象與所述第一對象的相似度,在所述至少一個參考對象中確定所述相關(guān)對象,所述參考對象與所述第一對象的相似度大于或等于所述預(yù)設(shè)閾值。/n
【技術(shù)特征摘要】
1.一種數(shù)據(jù)處理方法,其特征在于,包括:
獲取請求消息,所述請求消息用于請求獲取第一對象的相關(guān)對象,所述相關(guān)對象與所述第一對象的相似度大于或等于預(yù)設(shè)閾值;
確定當(dāng)前時刻對應(yīng)的最新版本信息,并基于所述最新版本信息在分布式系統(tǒng)的多個群組確定至少一個目標(biāo)群組,所述目標(biāo)群組中的服務(wù)設(shè)備中的索引信息的版本信息為所述最新版本信息,所述索引信息包括所述服務(wù)設(shè)備中的對象的特征信息;
向所述至少一個目標(biāo)群組中的服務(wù)設(shè)備請求獲取至少一個參考對象,并基于所述參考對象與所述第一對象的相似度,在所述至少一個參考對象中確定所述相關(guān)對象,所述參考對象與所述第一對象的相似度大于或等于所述預(yù)設(shè)閾值。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,基于所述最新版本信息在多個群組確定至少一個目標(biāo)群組,包括:
獲取所述多個群組中每個群組的版本信息;
將版本信息與所述最新版本信息相同的群組確定為所述至少一個目標(biāo)群組。
3.根據(jù)權(quán)利要求1或2所述的方法,其特征在于,向所述至少一個目標(biāo)群組中的服務(wù)設(shè)備請求獲取至少一個參考對象,包括:
在所述至少一個目標(biāo)群組中確定至少一個目標(biāo)服務(wù)設(shè)備;
向所述至少一個目標(biāo)服務(wù)設(shè)備請求獲取至少一個參考對象。
4.根據(jù)權(quán)利要求1-3任一項(xiàng)所述的方法,其特征在于,基于所述參考對象與所述第一對象的相似度,在所述至少一個參考對象中確定所述相關(guān)對象,包括:
按照所述參考對象與所述第一對象的相似度從高到低的順序,對所述至少一個參考對象進(jìn)行排序;
將排序后的所述至少一個參考對象中、前N個參考對象確定為所述相關(guān)對象,所述N為大于或等于1的整數(shù)。
5.根據(jù)權(quán)利要求1-4任一項(xiàng)所述的方法,其特征在于,所述方法還包括:
獲取第一群組中各服務(wù)設(shè)備的狀態(tài);
在所述第一群組中各服務(wù)設(shè)備的狀態(tài)為完成狀態(tài)時,重建所述第一群組對應(yīng)的索引信息。
6.根據(jù)權(quán)利要求5所述的方法,其特征在于,所述第一群組中主服務(wù)設(shè)備和從服務(wù)設(shè)備;重建所述第一群組對應(yīng)的索引信息,包括:
將所述第一群組中的主服務(wù)設(shè)備的狀態(tài)設(shè)置為創(chuàng)建狀態(tài),以使所述主服務(wù)設(shè)備創(chuàng)建并存儲所述第一群組對應(yīng)的重建索引信息;
在確定所述主服務(wù)設(shè)備將所述第一群組對應(yīng)的重建索引信息創(chuàng)建完成之后,將所述第一群組中的從服務(wù)設(shè)備的狀態(tài)設(shè)置為獲取狀態(tài),以使所述從服務(wù)設(shè)備獲取所述重建索引信息。...
【專利技術(shù)屬性】
技術(shù)研發(fā)人員:張晉瑋,白雅雯,
申請(專利權(quán))人:北京字節(jié)跳動網(wǎng)絡(luò)技術(shù)有限公司,
類型:發(fā)明
國別省市:北京;11
還沒有人留言評論。發(fā)表了對其他瀏覽者有用的留言會獲得科技券。