坐標點(0,1)**一個完美的分類器,它將所有的樣本都正確分類。roc曲線越接近左上角,該分類器的性能越好。從圖9可以看出,該方案的roc曲線非常接近左上角,性能較優(yōu)。另外,前端融合模型的auc值為。(5)后端融合后端融合的架構如圖10所示,后端融合方式用三種模態(tài)的特征分別訓練神經網絡模型,然后進行決策融合,隱藏層的***函數(shù)為relu,輸出層的***函數(shù)是sigmoid,中間使用dropout層進行正則化,防止過擬合,優(yōu)化器(optimizer)采用的是adagrad,batch_size是40。本次實驗使用了80%的樣本訓練,20%的樣本驗證,訓練50個迭代以便于找到較優(yōu)的epoch值。隨著迭代數(shù)的增加,后端融合模型的準確率變化曲線如圖11所示,模型的對數(shù)損失變化曲線如圖12所示。從圖11和圖12可以看出,當epoch值從0增加到5過程中,模型的訓練準確率和驗證準確率快速提高,模型的訓練對數(shù)損失和驗證對數(shù)損失快速減少;當epoch值從5到50的過程中,前端融合模型的訓練準確率和驗證準確率小幅提高,訓練對數(shù)損失和驗證對數(shù)損失緩慢下降;綜合分析圖11和圖12的準確率和對數(shù)損失變化曲線,選取epoch的較優(yōu)值為40。確定模型的訓練迭代數(shù)為40后,進行了10折交叉驗證實驗。覆蓋軟件功能與性能的多維度檢測方案設計與實施!軟件系統(tǒng)檢測服務
k為短序列特征總數(shù),1≤i≤k??蓤?zhí)行文件長短大小不一,為了防止該特征統(tǒng)計有偏,使用∑knk,j進行歸一化處理。逆向文件頻率(inversedocumentfrequency,idf)是一個短序列特征普遍重要性的度量。某一短序列特征的idf,可以由總樣本實施例件數(shù)目除以包含該短序列特征之樣本實施例件的數(shù)目,再將得到的商取對數(shù)得到:其中,|d|指軟件樣本j的總數(shù),|{j:i∈j}|指包含短序列特征i的軟件樣本j的數(shù)目。idf的主要思想是:如果包含短序列特征i的軟件練樣本越少,也就是|{j:i∈j}|越小,idf越大,則說明短序列特征i具有很好的類別區(qū)分能力。:如果某一特征在某樣本中以較高的頻率出現(xiàn),而包含該特征的樣本數(shù)目較小,可以產生出高權重的,該特征的。因此,,保留重要的特征。此處選取可能區(qū)分惡意軟件和良性軟件的短序列特征,是因為字節(jié)碼n-grams提取的特征很多,很多都是無效特征,或者效果非常一般的特征,保持這些特征會影響檢測方法的性能和效率,所以要選出有效的特征即可能區(qū)分惡意軟件和良性軟件的短序列特征。步驟s2、將軟件樣本中的類別已知的軟件樣本作為訓練樣本,然后分別采用前端融合方法、后端融合方法和中間融合方法設計三種不同方案的多模態(tài)數(shù)據(jù)融合方法。軟件安全評估報告專業(yè)機構認證該程序內存管理效率優(yōu)于行業(yè)平均水平23%。
特征之間存在部分重疊,但特征類型間存在著互補,融合這些不同抽象層次的特征可更好的識別軟件的真正性質。且惡意軟件通常偽造出和良性軟件相似的特征,逃避反**軟件的檢測,但惡意軟件很難同時偽造多個抽象層次的特征逃避檢測?;谠撚^點,本發(fā)明實施例提出一種基于多模態(tài)深度學習的惡意軟件檢測方法,以實現(xiàn)對惡意軟件的有效檢測,提取了三種模態(tài)的特征(dll和api信息、pe格式結構信息和字節(jié)碼3-grams),提出了通過前端融合、后端融合和中間融合這三種融合方式集成三種模態(tài)的特征,有效提高惡意軟件檢測的準確率和魯棒性,具體步驟如下:步驟s1、提取軟件樣本的二進制可執(zhí)行文件的dll和api信息、pe格式結構信息以及字節(jié)碼n-grams的特征表示,生成軟件樣本的dll和api信息特征視圖、格式信息特征視圖以及字節(jié)碼n-grams特征視圖;統(tǒng)計當前軟件樣本的導入節(jié)中引用的dll和api,提取得到當前軟件樣本的二進制可執(zhí)行文件的dll和api信息的特征表示。對當前軟件樣本的二進制可執(zhí)行文件進行格式結構解析,并按照格式規(guī)范提取**該軟件樣本的格式結構信息,得到該軟件樣本的二進制可執(zhí)行文件的pe格式結構信息的特征表示。
將三種模態(tài)特征和三種融合方法的結果進行了對比,如表3所示。從表3可以看出,前端融合和中間融合較基于模態(tài)特征的檢測準確率更高,損失率更低。后端融合是三種融合方法中較弱的,雖然明顯優(yōu)于基于dll和api信息、pe格式結構特征的實驗結果,但稍弱于基于字節(jié)碼3-grams特征的結果。中間融合是三種融合方法中**好的,各項性能指標都非常接近**優(yōu)值。表3實驗結果對比本實施例提出了基于多模態(tài)深度學習的惡意軟件檢測方法,提取了三種模態(tài)的特征(dll和api信息、pe格式結構信息和字節(jié)碼3-grams),提出了通過三種融合方式(前端融合、后端融合、中間融合)集成三種模態(tài)的特征,有效提高惡意軟件檢測的準確率和魯棒性。實驗結果顯示,相對**且互補的特征視圖和不同深度學習融合機制的使用明顯提高了檢測方法的檢測能力和泛化性能,其中較優(yōu)的中間融合方法取得了%的準確率,對數(shù)損失為,auc值為,各項性能指標已接近**優(yōu)值。考慮到樣本集可能存在噪聲,本實施例提出的方法已取得了比較理想的結果。由于惡意軟件很難同時偽造多個模態(tài)的特征,本實施例提出的方法比單模態(tài)特征方法更魯棒。以上所述*為本發(fā)明的較佳實施例而已,并非用于限定本發(fā)明的保護范圍。能耗評估顯示后臺服務耗電量超出行業(yè)基準值42%。
在數(shù)字化轉型加速的,軟件檢測公司已成為保障各行業(yè)信息化系統(tǒng)穩(wěn)定運行的力量。深圳艾策信息科技有限公司作為國內軟件檢測公司領域的企業(yè),始終以技術創(chuàng)新為驅動力,深耕電力能源、科研教育、政企單位、研發(fā)科技及醫(yī)療機構等垂直場景,為客戶提供從需求分析到運維優(yōu)化的全鏈條質量保障服務。以專業(yè)能力筑牢行業(yè)壁壘作為專注于軟件檢測的技術型企業(yè),艾策科技通過AI驅動的智能檢測平臺,實現(xiàn)了測試流程的自動化、化與智能化。其產品——軟件檢測系統(tǒng),整合漏洞掃描、壓力測試、合規(guī)性驗證等20余項功能模塊,可快速定位代碼缺陷、性能瓶頸及安全風險,幫助客戶將軟件故障率降低60%以上。針對電力能源行業(yè),艾策科技開發(fā)了電網調度系統(tǒng)專項檢測方案,成功保障某省級電力公司百萬級用戶數(shù)據(jù)安全;在科研教育領域,其實驗室管理軟件檢測服務覆蓋全國50余所高校,助力科研數(shù)據(jù)存儲與分析的合規(guī)性升級。此外,公司為政企單位政務云平臺、研發(fā)科技企業(yè)創(chuàng)新產品、醫(yī)療機構智慧醫(yī)療系統(tǒng)提供的定制化檢測服務,均獲得客戶高度認可。差異化服務塑造行業(yè)作為軟件檢測公司,艾策科技突破傳統(tǒng)檢測模式,推出“檢測+培訓+咨詢”一體化服務體系。通過定期發(fā)布行業(yè)安全白皮書、舉辦技術研討會。跨設備測試報告指出平板端UI元素存在比例失調問題。四川第三方軟件評測公司
網絡延遲測評顯示亞太地區(qū)響應時間超歐盟2倍。軟件系統(tǒng)檢測服務
3)pe可選頭部有效尺寸的值不正確,(4)節(jié)之間的“間縫”,(5)可疑的代碼重定向,(6)可疑的代碼節(jié)名稱,(7)可疑的頭部***,(8)來自,(9)導入地址表被修改,(10)多個pe頭部,(11)可疑的重定位信息,(12)把節(jié)裝入到vmm的地址空間,(13)可選頭部的sizeofcode域取值不正確,(14)含有可疑標志。存在明顯的統(tǒng)計差異的格式結構特征包括:(1)無證書表;(2)調試數(shù)據(jù)明顯小于正常文件,(3).text、.rsrc、.reloc和.rdata的characteristics屬性異常,(4)資源節(jié)的資源個數(shù)少于正常文件。生成軟件樣本的字節(jié)碼n-grams特征視圖,是統(tǒng)計了每個短序列特征的詞頻(termfrequency,tf),即該短序列特征在軟件樣本中出現(xiàn)的頻率。先從當前軟件樣本的所有短序列特征中選取詞頻tf**高的多個短序列特征;然后計算選取的每個短序列特征的逆向文件頻率idf與詞頻tf的乘積,并將其作為選取的每個短序列特征的特征值,,表示該短序列特征表示其所在軟件樣本的能力越強;**后在選取的詞頻tf**高的多個短序列特征中選取,生成字節(jié)碼n-grams特征視圖。:=tf×idf;tf(termfrequency)是詞頻,定義如下:其中,ni,j是短序列特征i在軟件樣本j中出現(xiàn)的次數(shù),∑knk,j指軟件樣本j中所有短序列特征出現(xiàn)的次數(shù)之和。軟件系統(tǒng)檢測服務