一種語音文本分類模型的更新系統(tǒng)及方法技術方案

技術編號：36703431 閱讀：30 留言：0更新日期：2023-03-01 09:22

本申請涉及一種語音文本分類模型的更新系統(tǒng)及方法，所述語音文本分類模型的更新系統(tǒng)包括：模型裝置、日志裝置和數(shù)據(jù)裝置。日志裝置，用于對用戶語音進行語義識別，獲得日志數(shù)據(jù)，并將與分類結果不一致的所述日志數(shù)據(jù)確定為篩選數(shù)據(jù)；數(shù)據(jù)裝置，當所述篩選數(shù)據(jù)大于或者等于數(shù)據(jù)量閾值時，所述數(shù)據(jù)裝置將所述篩選數(shù)據(jù)中的實體名稱進行替換和標注，所述數(shù)據(jù)裝置獲得訓練數(shù)據(jù)，且所述數(shù)據(jù)裝置根據(jù)訓練數(shù)據(jù)的長度以及實體名稱的數(shù)量，對所述訓練數(shù)據(jù)進行聚類，獲得用于更新詞匯分類模塊的第一數(shù)據(jù)、用于更新句式分類模塊的第二數(shù)據(jù)、用于更新語句分類模塊的第三數(shù)據(jù)。新語句分類模塊的第三數(shù)據(jù)。新語句分類模塊的第三數(shù)據(jù)。

全部詳細技術資料下載

【技術實現(xiàn)步驟摘要】
一種語音文本分類模型的更新系統(tǒng)及方法

[0001]本申請涉及自然語言處理
，特別是涉及一種語音文本分類模型的更新系統(tǒng)及方法。

技術介紹

[0002]隨著神經(jīng)網(wǎng)絡技術以及計算機算力的提高，使得人工智能產(chǎn)業(yè)得到長足的發(fā)展，可通過部署分類模型來完成語音文本的分類，現(xiàn)已應用到各個領域，例如，車機交互、智能客服、信息分推等等。為確保分類模型的性能可靠，在上線之后，需要不斷更新才能滿足場景需求，在此過程，需要開發(fā)人員、運營人員、測試人員根據(jù)測試結果進行反饋，并根據(jù)反饋結果進行模型更新，進而造成模型更新的滯后，不僅難以覆蓋真實的場景需求以及確保及時性，而且測試結果的主觀性較大，難以保證準確性。

技術實現(xiàn)思路

[0003]基于此，提供一種語音文本分類模型的更新系統(tǒng)及方法，改善模型更新滯后的問題。
[0004]一方面，提供一種語音文本分類模型的更新系統(tǒng)，包括：
[0005]模型裝置，包括：詞匯分類模塊、句式分類模塊以及語句分類模塊；
[0006]詞匯分類模塊，所述詞匯分類模塊包括用于分類的詞典，通過所述詞典對待處理的語音文本信息進行分類處理，獲得第一分類結果和第一輸出結果，所述詞匯分類模塊的第一輸出端用于輸出所述第一分類結果，所述詞匯分類模塊的第二輸出端用于輸出所述第一輸出結果；
[0007]句式分類模塊，所述句式分類模塊包括用于計算向量相似度的向量空間單元，所述向量空間單元對所述第一輸出結果進行分類處理，獲得第二分類結果和第二輸出結果，所述句式分類模塊的第一輸出端用于輸出所述第二...

【技術保護點】

【技術特征摘要】
1.一種語音文本分類模型的更新系統(tǒng)，其特征在于，包括：模型裝置，包括：詞匯分類模塊、句式分類模塊以及語句分類模塊；詞匯分類模塊，所述詞匯分類模塊包括用于分類的詞典，通過所述詞典對待處理的語音文本信息進行分類處理，獲得第一分類結果和第一輸出結果，所述詞匯分類模塊的第一輸出端用于輸出所述第一分類結果，所述詞匯分類模塊的第二輸出端用于輸出所述第一輸出結果；句式分類模塊，所述句式分類模塊包括用于計算向量相似度的向量空間單元，所述向量空間單元對所述第一輸出結果進行分類處理，獲得第二分類結果和第二輸出結果，所述句式分類模塊的第一輸出端用于輸出所述第二分類結果，所述句式分類模塊的第二輸出端用于輸出所述第二輸出結果；語句分類模塊，所述語句分類模塊包括用于語句分類的神經(jīng)網(wǎng)絡單元，所述神經(jīng)網(wǎng)絡單元對所述第二輸出結果進行分類處理，獲得第三分類結果并由所述語句分類模塊的輸出端輸出；日志裝置，用于對用戶語音進行語義識別，獲得日志數(shù)據(jù)，并將與分類結果不一致的所述日志數(shù)據(jù)確定為篩選數(shù)據(jù)，其中，所述分類結果包括第一分類結果、第二分類結果和第三分類結果；數(shù)據(jù)裝置，當所述篩選數(shù)據(jù)大于或者等于數(shù)據(jù)量閾值時，所述數(shù)據(jù)裝置將所述篩選數(shù)據(jù)中的實體名稱進行替換和標注，所述數(shù)據(jù)裝置獲得訓練數(shù)據(jù)，且所述數(shù)據(jù)裝置根據(jù)訓練數(shù)據(jù)的長度以及實體名稱的數(shù)量，對所述訓練數(shù)據(jù)進行聚類，獲得用于更新詞匯分類模塊的第一數(shù)據(jù)并通過所述數(shù)據(jù)裝置的第一輸出端輸出、用于更新句式分類模塊的第二數(shù)據(jù)并通過所述數(shù)據(jù)裝置的第二輸出端輸出、用于更新語句分類模塊的第三數(shù)據(jù)并通過所述數(shù)據(jù)裝置的第三輸出端輸出。2.根據(jù)權利要求1所述的語音文本分類模型的更新系統(tǒng)，其特征在于，所述句式分類模塊還包括數(shù)據(jù)庫接口，所述數(shù)據(jù)庫接口用于獲取遠程字典服務，所述遠程字典服務用于確定所述第二分類結果是否大于等于相似度閾值，若所述第二分類結果大于等于所述相似度閾值，則通過所述句式分類模塊的第一輸出端進行輸出所述第二分類結果，若所述第二分類結果小于所述相似度閾值，則所述句式分類模塊的第二輸出端進行輸出所述第二輸出結果。3.根據(jù)權利要求1所述的語音文本分類模型的更新系統(tǒng)，其特征在于，所述語句分類模塊還包括預處理單元，所述預處理單元用于對所述第二輸出結果進行向量化；所述神經(jīng)網(wǎng)絡單元包括輸入層、全連接層和輸出層；其中，所述預處理單元的輸入端與所述句式分類模塊的第二輸出端連接，所述預處理單元的輸出端與所述輸入層連接。4.一種語音文本分類模型的更新方法，其特征在于，更新如權利要求1至3任一項所述的模型裝置，所述方法包括：對所述用戶語音進行語義識別，獲得日志數(shù)據(jù)，并將與所述分類結果不一致的所述日志數(shù)據(jù)確定為篩選數(shù)據(jù)，其中，所述分類結果包括第一分類結果、第二分類結果和第三分類結果；當所述篩選數(shù)據(jù)大于或者等于數(shù)據(jù)量閾值時，將所述篩選數(shù)據(jù)中的實體名稱進行替換
和標注，獲得訓練數(shù)據(jù)，且根據(jù)訓練數(shù)據(jù)的長度以及實體名稱的數(shù)量，對所述訓練數(shù)據(jù)進行聚類，獲得用于更新詞匯分類模塊的第一數(shù)據(jù)、用于更...

【專利技術屬性】
技術研發(fā)人員：葉松林，代秀瓊，張正源，
申請(專利權)人：成都賽力斯科技有限公司，
類型：發(fā)明
國別省市：

全部詳細技術資料下載我是這個專利的主人

相關技術

網(wǎng)友詢問留言已有0條評論

還沒有人留言評論。發(fā)表了對其他瀏覽者有用的留言會獲得科技券。

發(fā)布您的意見

相關領域技術