基于代碼嵌入的二進制代碼相似性分析方法
所屬分類:技術(shù)論文
上傳者:zhoubin333
文檔大?。?span>2820 K
標(biāo)簽: 代碼表示 代碼嵌入模型 代碼搜索
所需積分:0分積分不夠怎么辦?
文檔介紹:代碼嵌入利用神經(jīng)網(wǎng)絡(luò)模型將二進制函數(shù)的代碼表示轉(zhuǎn)化為向量,在漏洞搜索等應(yīng)用中展現(xiàn)了優(yōu)勢?,F(xiàn)有的方法將函數(shù)表示為匯編指令序列、控制流圖的拓撲結(jié)構(gòu)或若干路徑,都沒有克服不同編譯環(huán)境導(dǎo)致控制流圖結(jié)構(gòu)變化的干擾。為此,設(shè)計了基于基本塊樹(Basic Block Tree, BBT)的代碼表示以及構(gòu)建了對應(yīng)的代碼嵌入模型BBTree。首先,二進制函數(shù)被表示為一系列BBT,每個BBT被處理為指令序列;其次,BBTree利用LSTM和BiGRU將基于BBT的代碼表示轉(zhuǎn)化為向量;最后,通過計算向量間的距離去高效衡量對應(yīng)函數(shù)的相似性。在代碼搜索中,BBTree的平均準(zhǔn)確率比主流工具提升了24.8%;在漏洞搜索中,BBTree的平均召回率比主流工具提升了26.1%。
現(xiàn)在下載
VIP會員,AET專家下載不扣分;重復(fù)下載不扣分,本人上傳資源不扣分。