【技術(shù)實現(xiàn)步驟摘要】
【技術(shù)保護(hù)點(diǎn)】
一種版權(quán)資源識別方法,其特征在于,包括:S1、利用已有的版權(quán)資源的標(biāo)題進(jìn)行搜索獲取正樣本語料,并利用非版權(quán)資源的標(biāo)題進(jìn)行搜索獲取負(fù)樣本語料;S2、提取正樣本語料的特征作為版權(quán)資源對應(yīng)的分類特征,提取負(fù)樣本語料的特征作為非版權(quán)資源對應(yīng)的分類特征,并計算各分類特征在所屬類別中的權(quán)值,構(gòu)成分類模型;S3、獲取待識別資源,對所述待識別資源執(zhí)行步驟S31至步驟S33:S31、利用所述待識別資源的標(biāo)題進(jìn)行搜索,獲得待預(yù)測語料;S32、提取待預(yù)測語料的分類特征,利用所述分類模型確定所述待識別資源屬于版權(quán)資源或非版權(quán)資源的置信度;S33、根據(jù)所述待識別資源屬于版權(quán)資源或者非版權(quán)資源的置信度,識別所述待識別資源是否為版權(quán)資源。
【技術(shù)特征摘要】
【專利技術(shù)屬性】
技術(shù)研發(fā)人員:徐興軍,吳羨,劉嬋,
申請(專利權(quán))人:北京百度網(wǎng)訊科技有限公司,
類型:發(fā)明
國別省市:
還沒有人留言評論。發(fā)表了對其他瀏覽者有用的留言會獲得科技券。