【技術實現步驟摘要】
本專利技術涉及一種圖像檢索的方法,具體涉及一種基于內容的圖像檢索方法,尤其是一種考慮圖像所包含的圖像高層語義信息,并加入用戶對圖像內容理解和檢索結果反饋的方法。
技術介紹
隨著因特網和多媒體技術的迅速發展,從20世紀90年代初至今,基于內容的圖像檢索(CBIR)得到了廣泛的研究。現有圖像檢索技術中,由于其使用圖像紋理、顏色和形狀等低層特征作為索引來對圖像進行檢索,而圖像低層特征表達出的信息與用戶對這些特征圖像理解的含義存在不一致性,即語義鴻溝,所以檢索效果往往不能滿足用戶的需求。如果檢索過程中能夠考慮圖像所包含的圖像高層語義信息,加入用戶對圖像內容的理解,則會是一種更貼近用戶理解的圖像檢索。然而,目前語義檢索中語義映射關系大多是通過人工標注建立,對于待檢索圖像中的語義信息難以獲得較好的映射,并且,建立的映射關系不能隨著用戶檢索的反饋信息自動進行修正,從而影響檢索效果的提升。
技術實現思路
本專利技術的專利技術目的是提供一種,利用詞匯樹將圖像特征與人工標注的語義特征進行關聯,以實現檢索過程中的自動語義映射;并實現高層語義映射的自動修正,以獲得更好的檢索效果,更貼近檢索用戶的需求。為達到上述專利技術目的,本專利技術采用的技術方案是一種圖像檢索方法,提供用于檢索的圖像庫和待檢索的圖片,包括下列步驟(I)提取圖像庫中所有圖片的SIFT特征,得到特征集合;(2)構建詞匯樹,方法是設定聚類個數K,樹的深度P,對步驟⑴獲得的特征集合進行分層聚類,第一層獲得K個聚類,作為詞匯樹的K個子節點,計算出每個子節點的中心向量;對每個子節點分別進行聚類,每一子節點生成K個下一層的子節 ...
【技術保護點】
一種基于詞匯樹層次語義模型的圖像檢索方法,提供用于檢索的圖像庫和待檢索的圖片,其特征在于,包括下列步驟:(1)提取圖像庫中所有圖片的SIFT特征,得到特征集合;(2)構建詞匯樹,方法是:設定聚類個數K,樹的深度P,對步驟(1)獲得的特征集合進行分層聚類,第一層獲得K個聚類,作為詞匯樹的K個子節點,計算出每個子節點的中心向量;對每個子節點分別進行聚類,每一子節點生成K個下一層的子節點,并計算出每個子節點的中心向量;不斷重復直到樹的深度達到預設值P,獲得SIFT詞匯樹;其中,K取5~10的整數,P取3~6的整數;(3)將圖像庫中的圖片與詞匯樹進行關聯:詞匯樹的葉節點個數為M=K×P,每個葉節點具有中心向量Cm,其中,m為1~M的整數,將每個葉節點稱為一個視覺詞匯單詞Wm,圖像庫中的總圖片數為N,其中每個圖片稱為一個文檔Fi,i是1~N的整數,則文檔Fi和視覺詞匯單詞Wm的相關度為Weight(i,m)=NUMim×idfm,式中,NUMim表示視覺詞匯單詞Wm在圖片文檔Fi中出現的次數,Nm表示視覺詞匯單詞Wm一共包含的圖片文檔數目;計算每個圖片與詞匯樹的每個葉節度的相關度,完成圖片與詞匯 ...
【技術特征摘要】
1.一種基于詞匯樹層次語義模型的圖像檢索方法,提供用于檢索的圖像庫和待檢索的圖片,其特征在于,包括下列步驟 (1)提取圖像庫中所有圖片的SIFT特征,得到特征集合; (2)構建詞匯樹,方法是設定聚類個數K,樹的深度P,對步驟(I)獲得的特征集合進行分層聚類,第一層獲得K個聚類,作為詞匯樹的K個子節點,計算出每個子節點的中心向量;對每個子節點分別進行聚類,每一子節點生成K個下一層的子節點,并計算出每個子節點的中心向量;不斷重復直到樹的深度達到預設值P,獲得SIFT詞匯樹;其中,K取5 10的整數,P取3 6的整數; (3)將圖像庫中的圖片與詞匯樹進行關聯詞匯樹的葉節點個數為M=KXP,每個葉節點具有中心向量Cm,其中,m為I M的整數,將每個葉節點稱為一個視覺詞匯單詞Wm,圖像庫中的總圖片數為N,其中每個圖片稱為一個文檔Fi, i是I N的整數,則文檔Fi和視覺詞匯單詞Wm的相關度為Weight (i, m) =NUMimX idfm,式中,NUMim表示視覺詞匯單詞Wm在圖片文檔Fi中出現的次數,MC=lgy,Nm表示視覺詞匯單詞Wm—共包含的圖片文檔數目; 計算每個圖片與詞匯樹的每個葉節度的相關度,完成圖片與詞匯樹的關聯; (4)設定圖像庫的語義主題信息集...
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。