并將測(cè)試樣本的dll和api信息特征視圖、格式信息特征視圖以及字節(jié)碼n-grams特征視圖輸入步驟s2訓(xùn)練得到的多模態(tài)深度集成模型中,對(duì)測(cè)試樣本進(jìn)行檢測(cè)并得出檢測(cè)結(jié)果。實(shí)驗(yàn)結(jié)果與分析(1)樣本數(shù)據(jù)集選取實(shí)驗(yàn)評(píng)估使用了不同時(shí)期的惡意軟件和良性軟件樣本,包含了7871個(gè)良性軟件樣本和8269個(gè)惡意軟件樣本,其中4103個(gè)惡意軟件樣本是2011年以前發(fā)現(xiàn)的,4166個(gè)惡意軟件樣本是近年來新發(fā)現(xiàn)的;3918個(gè)良性軟件樣本是從全新安裝的windowsxpsp3系統(tǒng)中收集的,3953個(gè)良性軟件樣本是從全新安裝的32位windows7系統(tǒng)中收集的。所有的惡意軟件樣本都是從vxheavens網(wǎng)站中收集的,所有的樣本格式都是windowspe格式的,樣本數(shù)據(jù)集構(gòu)成如表1所示。表1樣本數(shù)據(jù)集類別惡意軟件樣本良性軟件樣本早期樣本41033918近期樣本41663953合計(jì)82697871(2)評(píng)價(jià)指標(biāo)及方法分類性能主要用兩個(gè)指標(biāo)來評(píng)估:準(zhǔn)確率和對(duì)數(shù)損失。準(zhǔn)確率測(cè)量所有預(yù)測(cè)中正確預(yù)測(cè)的樣本占總樣本的比例,*憑準(zhǔn)確率通常不足以評(píng)估預(yù)測(cè)的魯棒性,因此還需要使用對(duì)數(shù)損失。對(duì)數(shù)損失(logarithmicloss),也稱交叉熵?fù)p失(cross-entropyloss),是在概率估計(jì)上定義的,用于測(cè)量預(yù)測(cè)類別與真實(shí)類別之間的差距大小。功能完整性測(cè)試發(fā)現(xiàn)3項(xiàng)宣傳功能未完全實(shí)現(xiàn)。軟件產(chǎn)品測(cè)評(píng)實(shí)驗(yàn)室
本發(fā)明屬于惡意軟件防護(hù)技術(shù)領(lǐng)域::,涉及一種基于多模態(tài)深度學(xué)習(xí)的惡意軟件檢測(cè)方法。背景技術(shù):::惡意軟件是指在未明確提示用戶或未經(jīng)用戶許可的情況下,故意編制或設(shè)置的,對(duì)網(wǎng)絡(luò)或系統(tǒng)會(huì)產(chǎn)生威脅或潛在威脅的計(jì)算機(jī)軟件。常見的惡意軟件有計(jì)算機(jī)**(簡(jiǎn)稱**)、特洛伊木馬(簡(jiǎn)稱木馬)、計(jì)算機(jī)蠕蟲(簡(jiǎn)稱蠕蟲)、后門、邏輯**等。惡意軟件可能在用戶不知情的情況下竊取計(jì)算機(jī)用戶的信息和隱私,也可能非法獲得計(jì)算機(jī)系統(tǒng)和網(wǎng)絡(luò)資源的控制,破壞計(jì)算機(jī)和網(wǎng)絡(luò)的可信性、完整性和可用性,從而為惡意軟件控制者謀取非法利益。騰訊安全發(fā)布的《2017年度互聯(lián)網(wǎng)安全報(bào)告》顯示,2017年騰訊電腦管家pc端總計(jì)攔截**近30億次,平均每月攔截木馬**近,共發(fā)現(xiàn)**或木馬***。這些數(shù)目龐大、名目繁多的惡意軟件侵蝕著我國(guó)的***、經(jīng)濟(jì)、文化、***等各個(gè)領(lǐng)域的信息安全,帶來了前所未有的挑戰(zhàn)。當(dāng)前的反**軟件主要采用基于特征碼的檢測(cè)方法,這種方法通過對(duì)代碼進(jìn)行充分研究,獲得惡意軟件特征值(即每種惡意軟件所獨(dú)有的十六進(jìn)制代碼串),如字節(jié)序列、特定的字符串等,通過匹配查找軟件中是否包含惡意軟件特征庫中的特征碼來判斷其是否為惡意軟件。軟件產(chǎn)品測(cè)評(píng)報(bào)告第三方實(shí)驗(yàn)室驗(yàn)證數(shù)據(jù)處理速度較上代提升1.8倍。
將訓(xùn)練樣本的dll和api信息特征視圖、格式信息特征視圖以及字節(jié)碼n-grams特征視圖輸入深度神經(jīng)網(wǎng)絡(luò),訓(xùn)練多模態(tài)深度集成模型;(1)方案一:采用前端融合(early-fusion)方法,首先合并訓(xùn)練樣本的dll和api信息特征視圖、格式信息特征視圖以及字節(jié)碼n-grams特征視圖的特征,融合成一個(gè)單一的特征向量空間,然后將其作為深度神經(jīng)網(wǎng)絡(luò)模型的輸入,訓(xùn)練多模態(tài)深度集成模型;(2)方案二:首先利用訓(xùn)練樣本的dll和api信息特征視圖、格式信息特征視圖以及字節(jié)碼n-grams特征視圖分別訓(xùn)練深度神經(jīng)網(wǎng)絡(luò)模型,合并訓(xùn)練的三個(gè)深度神經(jīng)網(wǎng)絡(luò)模型的決策輸出,并將其作為感知機(jī)的輸入,訓(xùn)練得到**終的多模態(tài)深度集成模型;(3)方案三:采用中間融合(intermediate-fusion)方法,首先使用三個(gè)深度神經(jīng)網(wǎng)絡(luò)分別學(xué)習(xí)訓(xùn)練樣本的dll和api信息特征視圖、格式信息特征視圖以及字節(jié)碼n-grams特征視圖的高等特征表示,并合并學(xué)習(xí)得到的訓(xùn)練樣本的dll和api信息特征視圖、格式信息特征視圖以及字節(jié)碼n-grams特征視圖的高等特征表示融合成一個(gè)單一的特征向量空間,然后將其作為下一個(gè)深度神經(jīng)網(wǎng)絡(luò)的輸入,訓(xùn)練得到多模態(tài)深度神經(jīng)網(wǎng)絡(luò)模型。步驟s3、將軟件樣本中的類別未知的軟件樣本作為測(cè)試樣本。
針對(duì)cma和cnas第三方軟件測(cè)試機(jī)構(gòu)的資質(zhì),客戶在確定合作前需要同時(shí)確認(rèn)資質(zhì)的有效期,因?yàn)檐浖y(cè)試資質(zhì)都是有一定有效期的,如果軟件測(cè)試公司在業(yè)務(wù)開展的過程中有違規(guī)或者不受認(rèn)可的操作和行為,有可能會(huì)被吊銷資質(zhì)執(zhí)照,這一點(diǎn)需要特別注意。第三,軟件測(cè)試機(jī)構(gòu)的資質(zhì)所涵蓋的業(yè)務(wù)參數(shù),通常來講,軟件測(cè)試報(bào)告一般針對(duì)軟件的八大參數(shù)進(jìn)行測(cè)試,包括軟件功能測(cè)試、軟件性能測(cè)試、軟件信息安全測(cè)試、軟件兼容性測(cè)試、軟件可靠性測(cè)試、軟件穩(wěn)定性測(cè)試、軟件可移植測(cè)試、軟件易用性測(cè)試。這幾個(gè)參數(shù)在cma或者cnas的官方網(wǎng)站都可以進(jìn)行查詢和確認(rèn)第四,軟件測(cè)試機(jī)構(gòu)或者公司的本身信用背景,那么用戶可以去檢查一下公司的信用記錄,是否有不良的投訴或者法律糾紛,可以確保第三方軟件測(cè)試機(jī)構(gòu)出具的軟件測(cè)試報(bào)告的效力也沒有問題。那么,總而言之,找一家靠譜的第三方軟件測(cè)試機(jī)構(gòu)還是需要用戶從自己的軟件測(cè)試業(yè)務(wù)需求場(chǎng)景出發(fā),認(rèn)真仔細(xì)比較資質(zhì)許可的正規(guī)性,然后可以完成愉快的合作和軟件測(cè)試報(bào)告的交付。數(shù)據(jù)驅(qū)動(dòng)決策:艾策科技如何提升企業(yè)競(jìng)爭(zhēng)力。
步驟s2、將軟件樣本中的類別已知的軟件樣本作為訓(xùn)練樣本,基于多模態(tài)數(shù)據(jù)融合方法,將訓(xùn)練樣本的dll和api信息特征視圖、格式信息特征視圖以及字節(jié)碼n-grams特征視圖輸入深度神經(jīng)網(wǎng)絡(luò),訓(xùn)練多模態(tài)深度集成模型;步驟s3、將軟件樣本中的類別未知的軟件樣本作為測(cè)試樣本,并將測(cè)試樣本的dll和api信息特征視圖、格式信息特征視圖以及字節(jié)碼n-grams特征視圖輸入步驟s2訓(xùn)練得到的多模態(tài)深度集成模型中,對(duì)測(cè)試樣本進(jìn)行檢測(cè)并得出檢測(cè)結(jié)果。進(jìn)一步的,所述提取軟件樣本的二進(jìn)制可執(zhí)行文件的dll和api信息的特征表示,是統(tǒng)計(jì)當(dāng)前軟件樣本的導(dǎo)入節(jié)中引用的dll和api;所述提取軟件樣本的二進(jìn)制可執(zhí)行文件的pe格式結(jié)構(gòu)信息的特征表示,是先對(duì)當(dāng)前軟件樣本的二進(jìn)制可執(zhí)行文件進(jìn)行格式結(jié)構(gòu)解析,然后按照格式規(guī)范提取**該軟件樣本的格式結(jié)構(gòu)信息;所述提取軟件樣本的二進(jìn)制可執(zhí)行文件的字節(jié)碼n-grams的特征表示,是先將當(dāng)前軟件樣本件的二進(jìn)制可執(zhí)行文件轉(zhuǎn)換為十六進(jìn)制字節(jié)碼序列,然后采用n-grams方法在十六進(jìn)制字節(jié)碼序列中滑動(dòng),產(chǎn)生大量的連續(xù)部分重疊的短序列特征。進(jìn)一步的,采用3-grams方法在十六進(jìn)制字節(jié)碼序列中滑動(dòng)產(chǎn)生連續(xù)部分重疊的短序列特征。進(jìn)一步的。壓力測(cè)試表明系統(tǒng)在5000并發(fā)用戶時(shí)響應(yīng)延遲激增300%。軟件產(chǎn)品測(cè)評(píng)實(shí)驗(yàn)室
艾策檢測(cè)團(tuán)隊(duì)采用多模態(tài)傳感器融合技術(shù),構(gòu)建智能工廠設(shè)備狀態(tài)健康監(jiān)測(cè)體系。軟件產(chǎn)品測(cè)評(píng)實(shí)驗(yàn)室
4)建立與用戶或客戶的聯(lián)系,收集他們對(duì)測(cè)試的需求和建議。(II)制訂技術(shù)培訓(xùn)計(jì)劃為高效率地完成好測(cè)試工作,測(cè)試人員必須經(jīng)過適當(dāng)?shù)呐嘤?xùn)。制訂技術(shù)培訓(xùn)規(guī)劃有3個(gè)子目標(biāo):1)制訂**的培訓(xùn)計(jì)劃,并在管理上提供包括經(jīng)費(fèi)在內(nèi)的支持。2)制訂培訓(xùn)目標(biāo)和具體的培訓(xùn)計(jì)劃。3)成立培訓(xùn)組,配備相應(yīng)的工具,設(shè)備和教材(III)軟件全生命周期測(cè)試提高測(cè)試成熟度和改善軟件產(chǎn)品質(zhì)量都要求將測(cè)試工作與軟件生命周期中的各個(gè)階段聯(lián)系起來。該目標(biāo)有4個(gè)子目標(biāo):1)將測(cè)試階段劃分為子階段,并與軟件生命周期的各階段相聯(lián)系。2)基于已定義的測(cè)試子階段,采用軟件生命周期V字模型。3)制訂與淵試相關(guān)的工作產(chǎn)品的標(biāo)準(zhǔn)。4)建立測(cè)試人員與開發(fā)人員共同工作的機(jī)制。這種機(jī)制有利于促進(jìn)將測(cè)試活動(dòng)集成于軟件生命周期中(IV)控制和監(jiān)視測(cè)試過程為控制和監(jiān)視測(cè)試過程,軟件**需采取相應(yīng)措施,如:制訂測(cè)試產(chǎn)品的標(biāo)準(zhǔn),制訂與測(cè)試相關(guān)的偶發(fā)事件的處理預(yù)案,確定測(cè)試?yán)锍瘫_定評(píng)估測(cè)試效率的度量,建立測(cè)試日志等。控制和監(jiān)視測(cè)試過程有3個(gè)子目標(biāo):1)制訂控制和監(jiān)視測(cè)試過程的機(jī)制和政策。2)定義,記錄并分配一組與測(cè)試過程相關(guān)的基本測(cè)量。3)開發(fā),記錄并文檔化一組糾偏措施和偶發(fā)事件處理預(yù)案。軟件產(chǎn)品測(cè)評(píng)實(shí)驗(yàn)室