【技術(shù)實(shí)現(xiàn)步驟摘要】
本申請(qǐng)涉及數(shù)據(jù)處理
,尤其涉及一種實(shí)體對(duì)象的確定方法、條件節(jié)點(diǎn)樹的建立方法及裝置。
技術(shù)介紹
現(xiàn)有技術(shù)中基于模型的數(shù)據(jù)分析方法主要是針對(duì)一個(gè)問題場(chǎng)景,開發(fā)一個(gè)專用的實(shí)體判別模型,并依靠運(yùn)行在分布式計(jì)算框架之上的Hive或MapReduce程序,將實(shí)體判別模型轉(zhuǎn)化成實(shí)際的軟件實(shí)體,在需要數(shù)據(jù)產(chǎn)出時(shí),每個(gè)實(shí)體判別模型都需要單獨(dú)運(yùn)行。如圖1所示,當(dāng)需要對(duì)η個(gè)實(shí)體判別模型進(jìn)行處理時(shí),需要分別單獨(dú)進(jìn)行軟件實(shí)現(xiàn)和軟件運(yùn)行,以得到與η個(gè)實(shí)體判別模型分別對(duì)應(yīng)的η個(gè)結(jié)果。由于η個(gè)實(shí)體判別模型中的每個(gè)實(shí)體判別模型在各自進(jìn)行軟件實(shí)現(xiàn)時(shí),相互之間完全獨(dú)立,后續(xù)的軟件運(yùn)行過程即需要對(duì)實(shí)體判別模型涉及到的數(shù)據(jù)源進(jìn)行完整處理。例如,當(dāng)需要從一個(gè)實(shí)體對(duì)象全集中確定出滿足一些條件的實(shí)體對(duì)象時(shí),可以建立包括這多個(gè)條件的實(shí)體判別模型,并從該實(shí)體對(duì)象全集中依次判斷每個(gè)實(shí)體對(duì)象是否滿足該實(shí)體判別模型包括的這多個(gè)條件,從而確定出與該實(shí)體判別模型對(duì)應(yīng)的實(shí)體集合。其中,實(shí)體對(duì)象可以是任一可以被描述的個(gè)體,如一個(gè)人,一條街道,一輛車,又如各種產(chǎn)品等;每個(gè)實(shí)體對(duì)象具體可以通過各種指標(biāo)對(duì)其進(jìn)行描述,如實(shí)體對(duì)象為人時(shí),用于描述人的指標(biāo)可以包括年齡、身高、體重等;條件則為對(duì)實(shí)體對(duì)象的某一指標(biāo)的限定,如年齡大于30,身高小于170cm等;實(shí)體判別模型包括若干個(gè)條件,通過對(duì)實(shí)體判別模型的計(jì)算可以從一個(gè)實(shí)體對(duì)象全集中確定出滿足該實(shí)體判別模型包括的條件的實(shí)體對(duì)象,并將滿足條件的實(shí)體對(duì)象放入該實(shí)體判別模型對(duì)應(yīng)的實(shí)體對(duì)象集合中。然而,當(dāng)基于該實(shí)體對(duì)象全集有多個(gè)這樣的實(shí)體判別模型需要計(jì)算時(shí),采用現(xiàn)有技術(shù)需要針對(duì)每個(gè)實(shí)體 ...
【技術(shù)保護(hù)點(diǎn)】
一種實(shí)體對(duì)象的確定方法,其特征在于,包括:獲取當(dāng)前待確定的實(shí)體對(duì)象;從條件節(jié)點(diǎn)樹的根節(jié)點(diǎn)開始按照指定順序,依次判斷所述實(shí)體對(duì)象是否滿足所述條件節(jié)點(diǎn)樹中的節(jié)點(diǎn)表征的條件,其中,在判斷所述實(shí)體對(duì)象滿足所述條件節(jié)點(diǎn)樹中的當(dāng)前待判斷節(jié)點(diǎn)表征的條件后,進(jìn)行所述當(dāng)前待判斷節(jié)點(diǎn)的子節(jié)點(diǎn)的判斷;在判斷所述實(shí)體對(duì)象滿足所述條件節(jié)點(diǎn)樹中的指定節(jié)點(diǎn)后,確定所述實(shí)體對(duì)象屬于所述指定節(jié)點(diǎn)表征的實(shí)體判別模型對(duì)應(yīng)的實(shí)體對(duì)象集合,其中,所述實(shí)體判別模型包括從所述指定節(jié)點(diǎn)到所述條件節(jié)點(diǎn)樹的根節(jié)點(diǎn)的節(jié)點(diǎn)鏈上的每個(gè)節(jié)點(diǎn)各自表征的條件。
【技術(shù)特征摘要】
1.一種實(shí)體對(duì)象的確定方法,其特征在于,包括: 獲取當(dāng)前待確定的實(shí)體對(duì)象; 從條件節(jié)點(diǎn)樹的根節(jié)點(diǎn)開始按照指定順序,依次判斷所述實(shí)體對(duì)象是否滿足所述條件節(jié)點(diǎn)樹中的節(jié)點(diǎn)表征的條件,其中,在判斷所述實(shí)體對(duì)象滿足所述條件節(jié)點(diǎn)樹中的當(dāng)前待判斷節(jié)點(diǎn)表征的條件后,進(jìn)行所述當(dāng)前待判斷節(jié)點(diǎn)的子節(jié)點(diǎn)的判斷; 在判斷所述實(shí)體對(duì)象滿足所述條件節(jié)點(diǎn)樹中的指定節(jié)點(diǎn)后,確定所述實(shí)體對(duì)象屬于所述指定節(jié)點(diǎn)表征的實(shí)體判別模型對(duì)應(yīng)的實(shí)體對(duì)象集合,其中,所述實(shí)體判別模型包括從所述指定節(jié)點(diǎn)到所述條件節(jié)點(diǎn)樹的根節(jié)點(diǎn)的節(jié)點(diǎn)鏈上的每個(gè)節(jié)點(diǎn)各自表征的條件。2.按權(quán)利要求1所述的方法,其特征在于,判斷所述實(shí)體對(duì)象是否滿足條件節(jié)點(diǎn)樹中的節(jié)點(diǎn)表征的條件,具體包括: 當(dāng)條件節(jié)點(diǎn)樹中的當(dāng)前待判斷節(jié)點(diǎn)表征的條件,與所述條件節(jié)點(diǎn)樹中的已判斷節(jié)點(diǎn)表征的條件不同時(shí),基于所述實(shí)體對(duì)象的指標(biāo)值,判斷所述實(shí)體對(duì)象是否滿足所述當(dāng)前待判斷節(jié)點(diǎn)表征的條件,得到判斷結(jié)果; 當(dāng)條件節(jié)點(diǎn)樹中的當(dāng)前待判斷節(jié)點(diǎn)表征的條件,與所述條件節(jié)點(diǎn)樹中的已判斷節(jié)點(diǎn)表征的條件相同時(shí),確定所述實(shí)體對(duì)象是否滿足所述當(dāng)前待判斷節(jié)點(diǎn)表征的條件的判斷結(jié)果,與所述實(shí)體對(duì)象是否滿足所述已判斷節(jié)點(diǎn)表征的條件的判斷結(jié)果相同。3.按權(quán)利要求2所述的方法,其特征在于,當(dāng)所述條件節(jié)點(diǎn)樹中包括所表征的條件相同的兩個(gè)節(jié)點(diǎn)時(shí),所述兩個(gè)節(jié)點(diǎn)中按照所述指定順序的在前節(jié)點(diǎn)指向在后節(jié)點(diǎn); 確定條件節(jié)點(diǎn)樹中的當(dāng)前待判斷節(jié)點(diǎn)表征的條件,是否與所述條件節(jié)點(diǎn)樹中的已判斷節(jié)點(diǎn)表征的條件相同,具體包括: 當(dāng)條件節(jié)點(diǎn)樹中存在指向所述當(dāng)前待判斷節(jié)點(diǎn)的節(jié)點(diǎn)時(shí),確定所述當(dāng)前待判斷節(jié)點(diǎn)表征的條件,與所述條件節(jié)點(diǎn)樹中指向所述當(dāng)前待判斷節(jié)點(diǎn)的已判斷節(jié)點(diǎn)表征的條件相同; 否則,確定所述當(dāng)前待判斷節(jié)點(diǎn)表征的條件,與所述條件節(jié)點(diǎn)樹中指向所述當(dāng)前待判斷節(jié)點(diǎn)的已判斷節(jié)點(diǎn)表征的條件不同。4.一種如權(quán)利要求1-3任一所述的方法中的所述條件節(jié)點(diǎn)樹的建立方法,其特征在于,包括: 確定均包含有指定條件的多個(gè)實(shí)體判別模型包括的各條件,以及所述多個(gè)實(shí)體判別模型中每個(gè)實(shí)體判別模型包括的所有條件組成的條件組合; 建立以表征所述指定條件的節(jié)點(diǎn)為根節(jié)點(diǎn),以分別表征所述多個(gè)實(shí)體判別模型包括的每個(gè)條件的節(jié)點(diǎn)為葉子節(jié)點(diǎn)的條件節(jié)點(diǎn)樹,其中,從所述條件節(jié)點(diǎn)樹中每個(gè)節(jié)點(diǎn)到所述根節(jié)點(diǎn)的節(jié)點(diǎn)鏈上的每個(gè)節(jié)點(diǎn)各自表征條件的組合各不相同,且包括所述多個(gè)實(shí)體判別模型中每個(gè)實(shí)體判別模型包括的所有條件組成的條件組合。5.按權(quán)利要求4所述的方法,其特征在于,對(duì)于所述條件節(jié)點(diǎn)樹中每個(gè)節(jié)點(diǎn)的子節(jié)點(diǎn),具體采用如下方式建立: 步驟A、確定所述多個(gè)實(shí)體判別模型中繼承當(dāng)前節(jié)點(diǎn)的實(shí)體判別模型,其中,所述條件節(jié)點(diǎn)樹中從表征實(shí)體判別模型的指定節(jié)點(diǎn)到根節(jié)點(diǎn)的節(jié)點(diǎn)鏈上的每個(gè)節(jié)點(diǎn)均為該實(shí)體判別模型繼承的節(jié)點(diǎn); 步驟B、在繼承所述當(dāng)前節(jié)點(diǎn)的實(shí)體判別模型中,確定除繼承已建立的該當(dāng)前節(jié)點(diǎn)的子節(jié)點(diǎn)的實(shí)體判別模型外,剩余的實(shí)體判別模型;步驟C、在所述剩余的實(shí)體判別模型包括的條件中,確定除所述當(dāng)前節(jié)點(diǎn)到根節(jié)點(diǎn)的節(jié)點(diǎn)鏈上的每個(gè)節(jié)點(diǎn)各自表征的條件外,剩余的條件; 步驟D、基于條件的計(jì)算復(fù)雜度、條件區(qū)分度和在該剩余的實(shí)體判別模型中的共享程度中至少之一,分別確定所述剩余的條件中的每個(gè)條件的重要程度;其中,重要程度分別隨著條件的條件區(qū)分度和共享程度的增大而增大,隨著條件的計(jì)算復(fù)雜度的增大而減??;并將重要程度最大的條件,作為所述當(dāng)前節(jié)點(diǎn)的一個(gè)子節(jié)點(diǎn)表征的條件;以及建立所述當(dāng)前節(jié)點(diǎn)的表征該重要程度最大的條件的子節(jié)點(diǎn); 步驟E、從所述剩余的實(shí)體判別模型中選擇包括該重要程度最大的條件的實(shí)體判別模型,作為繼承表征該重要程度最大的條件的該子節(jié)點(diǎn)的實(shí)體判別模型; 步驟F、當(dāng)繼承已建立的所述當(dāng)前節(jié)點(diǎn)的子節(jié)點(diǎn)的實(shí)體判別模型,包括繼承所述當(dāng)前節(jié)點(diǎn)的全部實(shí)體判別模型時(shí),完成所述 當(dāng)前節(jié)點(diǎn)的子節(jié)點(diǎn)的建立,否則,進(jìn)入上述步驟B。6.按權(quán)利要求4所述的方法,其特征在于,采用如下步驟從若干個(gè)實(shí)體判別模型中選擇均包括所述指定條件的所述多個(gè)實(shí)體判別模型: 基于條件的計(jì)算復(fù)雜度、條件區(qū)分度和在這若干個(gè)實(shí)體判別模型中的共享程度中至少之一,分別確定所述若干個(gè)實(shí)體判別模型包括的每個(gè)條件的重要程度;其中,重要程度分別隨著條件的條件區(qū)分度和共享程度的增大而增大,隨著條件的計(jì)算復(fù)雜度的增大而減??;其中,在一個(gè)實(shí)體對(duì)象集合中滿足一個(gè)條件的實(shí)體對(duì)象的數(shù)量越少,表示該條件的條件區(qū)分度越高; 將重要程度最大的條件作為所述指定條件,以及從所述若干個(gè)實(shí)體判別模型中選擇包括所述指定條件的實(shí)體判別模型。7.一種實(shí)體...
【專利技術(shù)屬性】
技術(shù)研發(fā)人員:劉撫狄,徐萬里,陳國成,蔣萌,康瑜,李宗偉,趙雪波,
申請(qǐng)(專利權(quán))人:阿里巴巴集團(tuán)控股有限公司,
類型:發(fā)明
國別省市:
還沒有人留言評(píng)論。發(fā)表了對(duì)其他瀏覽者有用的留言會(huì)獲得科技券。