• 
    <ul id="o6k0g"></ul>
    <ul id="o6k0g"></ul>

    一種基于分層聚類的均衡圖像聚類方法技術

    技術編號:8594018 閱讀:268 留言:0更新日期:2013-04-18 07:12
    本發明專利技術公開了一種基于分層聚類的均衡圖像聚類方法,本發明專利技術針對服飾類商品圖像高維特征數據,采用基于層次聚類的方法,獲得大小均衡的聚類簇,且單個聚類簇包含的數據量不超過限定的閾值。檢索時,將被檢索數據與所有聚類中心進行距離計算后,選取最近的多個聚類簇,在多個聚類簇內部進行數據遍歷,獲得最后的查詢結果。相對于通用的基于聚類的索引方法,該方法避免了當被檢索數據處于大聚類簇時遍歷數據量過大的問題,保證了查詢的性能。同時,通過遍歷多聚類簇的方式,查詢結果與SSA的查詢結果有更高的重合度,提高了查詢效果。

    【技術實現步驟摘要】

    本專利技術涉及圖像搜索
    ,尤其涉及一種基于分層聚類的圖像高維向量快速近似k_近鄰檢索方法。
    技術介紹
    在基于內容的圖像搜索技術(Content-Based Image Retrieval, CBIR)中,當用戶上傳一幅商品圖像并期望搜尋與該圖相同或相近的商品時,搜索引擎對用戶上傳的商品圖像進行特征提取,并從索引圖像特征矢量數據庫中選取與其在高維空間中距離最近的k個圖像作為結果返回。在大量索引特征數據庫中查詢最近的k個圖像特征,最基本的方法是SSA方法。SSA方法通過計算被檢索圖像與每ー個已入庫圖像的距離,然后對這些距離進行排序的方式獲得最近的k個圖像。這是ー種精確的k近鄰檢索(k-Nearest Neighbor, kNN)。但是,當圖像特征維度以及庫內圖像數量較大時,該方法的查詢耗時較大,無法滿足工程需要。聚類的方法被引入CBIR中。采用聚類的方法,將數據按照其在高維空間的分布,聚集成為聚類簇;檢索時,首先計算被檢索圖像與所有簇的中心的距離,確定被檢索圖像所屬的聚類簇,然后對簇內的數據進行遍歷,獲得最近的k個圖像。由于需要遍歷的數據量的減少,該方法相對于正向遍歷的方式檢索效率有所提高,但是存在以下問題1、查詢時間效率依賴于被查詢圖像所屬的簇的大小,如果聚類產生的簇的大小不均衡,會導致查詢時間產生不均衡性。當被查詢圖像屬于包含圖像個數較大的簇時,需要遍歷的圖像量及查詢耗時増大。由于包含數據量大的簇代表更“常見”的圖像特征,被查詢圖像落在其中的概率大于包含數據量少的聚類簇。因此,如果某個聚類簇包含的數據量遠高于平均值,將會嚴重影響商品圖像搜索引擎的平均響應時間。2、數據遍歷被限定在簇內,如果有k_近鄰數據處于其他簇中,則在檢索結果中被丟失,導致查詢效果降低。
    技術實現思路
    本專利技術的目的在于針對現有技術的不足,提供ー種優化的圖像聚類方法。本專利技術的目的是通過以下技術方案來實現的,包含如下步驟(I)在建立索引時,首先對圖像特征數據進行初始聚類;(2)對步驟(I)得到的每個聚類簇進行聚類切分操作。具體步驟為檢查該聚類所包含的圖像個數。如果該聚類中心包含的圖像個數小于設置的上限Nttjp,則在聚類內部進行二分聚類。如果二分聚類的結果包含的數據量仍超過Nttjp,則對二分聚類的結果迭代此過程。將數據量不超過N_的聚類簇中心記錄到聚類中心文件中。之后將該類目所有圖像特征數據按照獲得的聚類中心進行組織。(3)在檢索時,對查詢圖像的特征數據,計算其到所屬類目的所有聚類中心的距離,并且對這些距離進行升序排序,獲取距離最小的前c個聚類簇標識,C值由系統參數指定。之后在C個聚類簇的內部進行數據遍歷,得到最后的查詢結果。本專利技術的有益效果是,本專利針對服飾類商品圖像高維特征數據,采用基于層次聚類的方法,獲得大小均衡的聚類簇,且單個聚類簇包含的數據量不超過限定的閾值。檢索吋,將被檢索數據與所有聚類中心進行距離計算后,選取最近的多個聚類簇,在多個聚類簇內部進行數據遍歷,獲得最后的查詢結果。相對于通用的基于聚類的索引方法,該方法避免了當被檢索數據處于大聚類簇時遍歷數據量過大的問題,保證了查詢的性能。同時,通過遍歷多聚類簇的方式,查詢結果與SSA的查詢結果有更高的重合度,提高了查詢效果。附圖說明圖1是商品圖像特征數據索引建立流程;圖2是商品圖像特征數據聚類切分流程圖;圖3是商品圖像特征數據入庫流程圖;圖4是檢索流程圖; 圖5是ニ維情況下“邊緣效應”示意圖。具體實施例方式下面以服飾類商品圖像的聚類,索引建立、檢索及維護為例,結合附圖詳細描述本專利技術,本專利技術的目的和效果將變得更加明顯。如圖1所示,本專利技術基于分層聚類的均衡圖像聚類方法的索引建立包括如下步驟步驟1:對商品圖像進行圖像特征提取,將圖像數據轉換成特征矢量數據。特征提取的目的是獲得圖像的低級結構描述。通過d維矢量來代表各特征。本專利技術采用的是圖像的全局特征,即每一副圖像對應ー個高維特征矢量。特征矢量的每ー維數值都用來表征圖像在某ー個方面的特征,例如形狀、顔色、紋理、結構等信息。圖像特征提取方法很多,MPEG-7視覺特征提取工具是ー種比較流行的方法。該方法包括顏色布局描述(Color Layout Descriptor, CLD)、邊緣直方圖描述符(Edge HistogramDescriptor, EHD)等。其中,CLD使用8*8DCT的12個系數,適合于很緊湊并且分辨率不變的顏色表示。EHD使用80個直方圖窗來描述來自16個子圖像的內容。為了便于數據存儲和計算,我們將每ー維特征值量化為范圍內的整數。量化后的特征向量,每ー個維度可以存儲為ー個字節。步驟2 :對步驟I得到的原始特征數據進行初始聚類,聚類中心個數設置為ー個較小的整數。對數據進行初始聚類的目的是為了大概體現出數據的分布狀態。聚類所使用的算法是k-均值(K-Means )。K-Means算法將輸入的n個數據對象劃分為k個聚類以便使得所獲得的聚類滿足同一聚類中的對象相似度較高;而不同聚類中的對象相似度較小。K-Means算法的主要參數包括聚類個數k和距離公式d(x,y)。由于只是對數據進行初始聚類,這里設置比較小的k值。我們希望在進行初始聚類之后,每個聚類簇包含的平均數據量為ー個固定的值Ns。初始聚類的k值可以通過索引建立時的數據總量Ntotal和Ns算出本文檔來自技高網
    ...

    【技術保護點】
    一種基于分層聚類的均衡圖像聚類方法,其特征在于,包含如下步驟:(1)在建立索引時,首先對圖像特征數據進行初始聚類;(2)對步驟(1)得到的每個聚類簇進行聚類切分操作。具體步驟為:檢查該聚類所包含的圖像個數。如果該聚類中心包含的圖像個數小于設置的上限Ntop,則在聚類內部進行二分聚類。如果二分聚類的結果包含的數據量仍超過Ntop,則對二分聚類的結果迭代此過程。將數據量不超過Ntop的聚類簇中心記錄到聚類中心文件中。之后將該類目所有圖像特征數據按照獲得的聚類中心進行組織。(3)在檢索時,對查詢圖像的特征數據,計算其到所屬類目的所有聚類中心的距離,并且對這些距離進行升序排序,獲取距離最小的前c個聚類簇標識,c值由系統參數指定。之后在c個聚類簇的內部進行數據遍歷,得到最后的查詢結果。

    【技術特征摘要】
    1.一種基于分層聚類的均衡圖像聚類方法,其特征在于,包含如下步驟 (1)在建立索引時,首先對圖像特征數據進行初始聚類; (2)對步驟(I)得到的每個聚類簇進行聚類切分操作。具體步驟為檢查該聚類所包含的圖像個數。如果該聚類中心包含的圖像個數小于設置的上限Nttjp,則在聚類內部進行二分聚類。如果二分聚類的結果包含的數據量仍超過Ν_,則對二分聚類的結果迭代此過程。將數據量不超過Ν_的聚類簇中心記錄到聚類中心文件中。之后將該類目所有圖像特征數據按照獲得的聚類中心進行組織。(3)在檢索時,對查詢圖像的特征數據,計算其到所屬類目的所有聚類中心的距離,并且對這些距離進行升序排序,獲取距離最小的前c個聚類簇標識,c值由系統參數指定。之后在c個聚類簇的內部進行數據遍歷,得到最后的查詢結果。2.根據權利要求1所述的聚類方法,其特征在于,所述聚類分2個步驟進行,并且兩個步驟使用相同的視覺特征和距離公...

    【專利技術屬性】
    技術研發人員:薛亮孫凱
    申請(專利權)人:杭州淘淘搜科技有限公司
    類型:發明
    國別省市:

    網友詢問留言 已有0條評論
    • 還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。

    1
    主站蜘蛛池模板: 无码无需播放器在线观看| 久久久久久久无码高潮| 亚洲男人第一无码aⅴ网站| av无码aV天天aV天天爽| 人妻丰满熟妇无码区免费| 久久亚洲中文无码咪咪爱| 无码久久精品国产亚洲Av影片 | 亚洲av无码国产综合专区| 人妻中文字幕AV无码专区| 亚洲AV无码乱码在线观看裸奔| 亚洲av永久无码精品秋霞电影秋| 亚洲AV无码一区东京热久久| 永久免费无码网站在线观看| 久久久久久久人妻无码中文字幕爆| 久久精品无码av| 无码色偷偷亚洲国内自拍| 亚洲欧洲免费无码| 日韩精品久久无码中文字幕| 国模GOGO无码人体啪啪| 亚洲av无码乱码在线观看野外 | 亚洲精品无码日韩国产不卡av| 中文字幕av无码一区二区三区电影 | 国产又爽又黄无码无遮挡在线观看| 亚洲aⅴ无码专区在线观看| 精品无码一区二区三区亚洲桃色| 久久精品无码一区二区三区| 亚洲AⅤ无码一区二区三区在线 | 亚洲∧v久久久无码精品| 亚洲AV蜜桃永久无码精品| 国产精品成人无码久久久| 久久久无码精品午夜| 无码人妻精品内射一二三AV| 亚洲成a人无码亚洲成www牛牛| 久久久无码一区二区三区| 一本无码人妻在中文字幕免费| 97精品人妻系列无码人妻| 亚洲午夜无码久久久久小说 | 亚洲国产精品无码久久九九大片| 亚洲国产成人精品无码区在线秒播 | 国产高新无码在线观看| 熟妇人妻系列aⅴ无码专区友真希 熟妇人妻系列av无码一区二区 |