為科學承接產業轉移,優化產業結構,需要對招商引資項目進行全面審核以及統計分析。由于招商引資待審項目以及待審核內容多、工作量大,人工審核不利于提高項目審核及分析效率,因此招商引資審核及統計分析工作的自動化、智能化發展,在提高招商引資項目審批效率和項目質量、規范項目落地程序、推動招商引資工作科學有序開展等方面具有重要意義。本發明專利技術提出一種招商引資項目審核統計系統,包括統計分析單元,要件驗證單元和數據庫,統計分析單元利用大數據平臺,生成指定項目需要提交要件名稱的列表,要件驗證單元用于驗證所述列表中文件的完整性和真實性,數據庫用于存儲用戶提交的項目文件。
【技術實現步驟摘要】
招商引資項目審核統計方法及系統
本專利技術涉及自動化軟件系統領域,尤其是一種用于招商引資項目審核統計方法及系統。
技術介紹
為科學承接產業轉移,優化產業結構,提高招商引資項目的質量和效益,推進招商引資工作科學化、制度化、規范化,需要對招商引資項目進行全面審核以及統計分析。但由于招商引資待審項目以及待審核內容多、工作量大,人工審核不利于提高項目審核及分析效率,因此需要建立招商引資項目智能審核和統計分析系統及方法。招商引資審核及統計分析工作的自動化、智能化發展,在提高招商引資項目審批效率和項目質量、規范項目落地程序、推動招商引資工作科學有序開展等方面具有重要意義。根據我國現行的政策,對于任何投資項目都需要政府相關部門進行審核,審核包括形式審查和內容審核。其中內容審核需要專家或工作人員進行人工審核。形式審查目前都是由人工來完成,這種方式的弊端是工作量大,易產生錯誤。本專利技術依據招商項目審批流程,提出一種計算機智能完成項目審核形式審查的方法,此方法是實現在線行政審批流程的基礎。
技術實現思路
基于此,本專利技術提出一種招商引資項目審核統計系統,采用的技術方案如下:一種招商引資項目審核統計系統,包括統計分析單元,要件驗證單元和數據庫,統計分析單元利用大數據平臺,生成指定項目需要提交要件名稱的列表,要件驗證單元用于驗證所述列表中文件的完整性和真實性,數據庫用于存儲用戶提交的項目文件。進一步的,要件驗證單元還包括項目分類模塊、要件名稱映射集合和要件遍歷模塊,項目分類單元用于提取所述數據庫中項目文件,并按設定的分類規則進行分類,所述系統依據分類獲取要件名稱列表及相應的要件名稱映射集合,要件遍歷模塊用于遍歷項目文件集合中的文件名,并與相應要件名稱列表及相要件名稱映射集合中的名稱進行對比。進一步的,要件驗證單元還包括文件對比模塊和關鍵詞提取模塊,文件對比模塊用于將用戶提交的文件與系統中相應的文件模型進行對比,以確定關鍵詞所處的位置,關鍵詞提取模塊用于提取關鍵詞和關鍵詞對應的數據。進一步的,所述文件模型的訓練步驟包括:步驟1:采用結巴分詞算法利用指定的文本庫進行訓練,生成分詞詞庫;步驟2:采用Word2Vec算法對詞庫中分詞進行向量化;步驟3:以系統中所有申報要件的文本作為依據,建立學習樣本庫,對Doc2Vec的相似性模型進行訓練,得到用于實際比對的文件模型。進一步的,所述系統支持用戶提交文件的格式包括Word和Excel。進一步的,關鍵詞提取模塊的功能還包括,對接出具單位建立的數據庫,將出具單位數據庫中相應的關鍵詞和對應的數據提取出來,用于后續的驗證工作。進一步的,要件名稱映射集合通過人工方式生成并錄入所述系統,要件名稱映射集合中記錄的數據為同一種要件的不同命名方式。進一步的,所述系統還包括文件列表修改模塊,文件列表修改模塊用于修改指定項目需要提交要件名稱的列表中的內容,修改包括向指定列表中新增要件文件名和刪除指定要件文件名。進一步的,所述系統還包括審核報告模塊,審核報告模塊用于生成審核報告,審核報告的內容包括已提交的要件列表、缺失要件列表、沒有存疑的數據列表和存疑的數據列表。與現有技術相比,本專利技術的有益效果在于:本專利技術提出的招商引資項目審核統計系統可以根據歷史數據自動總結出所有可能出現過的要件組合,不會出現遺忘的情況。只需進行簡單歸類,就可以將任何特殊情況下需要提交的要件進行提示,極大的提高的工作效率。附圖說明圖1是系統設計及工作流程示意圖。具體實施方式在招商引資項目審核過程中,因為不同項目需要提交的文件是不同的,如果項目存在特殊情況,需要提交的要件會不一樣,同樣的項目,可能有不同的情況。例如:購買土地、租用辦公樓宇、有本地有合同企業提供辦公場所,這樣不同的情況,提交的要件是不同的。還有很多情況,例如是綠色通道的項目、各市不同重點項目等,需要提交的要件也會不同。由于情況非常復雜,人工總結總會出現不完全的情況,而且由于人的工作經驗不同,對政策掌握的熟練程度也不同,因此,實際工作中總會出現需要不斷補交要件材料的情況。本專利技術提出一種招商引資項目審核統計系統,包括統計分析單元,要件驗證單元和數據庫,數據庫用于存儲用戶提交的項目文件。該系統工作的主要過程包括:步驟1.生成指定項目提交所需要件名稱的列表;步驟2.人工篩選上述生成的列表,將同一要件的不同名稱組成映射數據表,目的是消除同一種要件但錄入名稱不同造成的誤差;步驟3.審核提交要件的完整性;步驟4.審核提交要件的真實性;步驟5.生成審核報告。在本實施例中,依據招商項目審核過程的特點,將需審核的項目按照階段分成三個階段:項目論證簽約階段、企業注冊與規劃土地辦理階段、聯合審批階段,統計分析單元利用大數據平臺,自動將不同階段需要提交的要件、關鍵詞、及數據標準進行統計,生成相應的要件列表。遍歷用戶提交的要件文件集合,利用統計分析單元生成的要件列表結合人工修訂的映射數據表判斷項目要件的完整性。審核招商項目數據真實性時,需要將項目申報數據與對應要件中的數據、要件出具單位的原始數據庫進行比對,以確認申報數據的真實性。驗證數據真實性的步驟包括:步驟1.分析用戶提交的要件,如果要件是Word格式,首先采用百度通用文字識別服務,將要件掃中的文字提取出來,通過文件對比模塊將用戶提交的文件與系統中相應的文件模型進行對比,以確定關鍵詞所處的位置,再通過關鍵詞提取模塊提取關鍵詞和關鍵詞對應的數據;如果用戶提交的要件是Excel形式,則采用數據導入的方式,將關鍵詞和對應的數據導入審核系統中;步驟2.利用系統對接出具單位建立的數據庫,獲取步驟1中,確定的關鍵詞所對應的原始數據;步驟3.進行數據對比,以確定要件的真實性。其中審核中需要對真實性進行比對的數據與出具單位的關系如下表所示:表1表2表3審核完畢后,審核報告模塊生成審核報告,審核報告的內容包括已提交的要件列表、缺失要件列表、沒有存疑的數據列表和存疑的數據列表。其中驗證要件真實性利用的文件模型的訓練步驟包括:步驟1:采用結巴分詞算法利用指定的文本庫進行訓練,生成分詞詞庫;步驟2:采用Word2Vec算法對詞庫中分詞進行向量化;步驟3:以系統中所有申報要件的文本作為依據,建立學習樣本庫,對Doc2Vec的相似性模型進行訓練,得到用于實際比對的文件模型。以上所述僅為本專利技術創造的較佳實施例而已,并不用以限制本專利技術創造,凡在本專利技術創造的精神和原則之內,所作的任何修改、等同替換、改進等,均應包含在本專利技術創造的保護范圍之內。本文檔來自技高網...
【技術保護點】
1.一種招商引資項目審核統計系統,包括統計分析單元,要件驗證單元和數據庫,其特征在于,統計分析單元利用大數據平臺,生成指定項目需要提交要件名稱的列表,要件驗證單元用于驗證所述列表中文件的完整性和真實性,數據庫用于存儲用戶提交的項目文件。
【技術特征摘要】
1.一種招商引資項目審核統計系統,包括統計分析單元,要件驗證單元和數據庫,其特征在于,統計分析單元利用大數據平臺,生成指定項目需要提交要件名稱的列表,要件驗證單元用于驗證所述列表中文件的完整性和真實性,數據庫用于存儲用戶提交的項目文件。2.如權利要求1所述一種招商引資項目審核統計系統,其特征在于,要件驗證單元還包括項目分類模塊、要件名稱映射集合和要件遍歷模塊,項目分類單元用于提取所述數據庫中項目文件,并按設定的分類規則進行分類,所述系統依據分類獲取要件名稱列表及相應的要件名稱映射集合,要件遍歷模塊用于遍歷項目文件集合中的文件名,并與相應要件名稱列表及相要件名稱映射集合中的名稱進行對比。3.如權利要求2所述一種招商引資項目審核統計系統,其特征在于,要件驗證單元還包括文件對比模塊和關鍵詞提取模塊,文件對比模塊用于將用戶提交的文件與系統中相應的文件模型進行對比,以確定關鍵詞所處的位置,關鍵詞提取模塊用于提取關鍵詞和關鍵詞對應的數據。4.如權利要求3所述一種招商引資項目審核統計系統,其特征在于,所述文件模型的訓練步驟包括:步驟1:采用結巴分詞算法利用指定的文本庫進行訓練,生成分詞詞庫;步驟2:采用Word2Vec算法對詞庫中...
【專利技術屬性】
技術研發人員:張連祥,
申請(專利權)人:張連祥,
類型:發明
國別省市:天津,12
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。