《電子技術(shù)應(yīng)用》
您所在的位置:首頁 > 其他 > 設(shè)計(jì)應(yīng)用 > 一種不良域名快速核驗(yàn)方法的研究
一種不良域名快速核驗(yàn)方法的研究
2022年電子技術(shù)應(yīng)用第10期
尚秋明,王利軍,鄧桂英,趙 彤,張立坤
中國互聯(lián)網(wǎng)絡(luò)信息中心 技術(shù)研發(fā)部,北京100190
摘要: 針對大量網(wǎng)絡(luò)賭博、淫穢色情等不良域名網(wǎng)頁內(nèi)容存在高度相似性,且運(yùn)營者多采用注冊大量域名部署同一套網(wǎng)站代碼的方式,變相規(guī)避域名被封等特征,利用圖像相似性聚類和相似性搜索等技術(shù),提出一種不良域名的快速核驗(yàn)方法。實(shí)驗(yàn)表明,人工抽樣一萬個(gè)不良域名樣本(淫穢色情和網(wǎng)絡(luò)賭博域名各5 000個(gè))進(jìn)行判定,該不良域名核驗(yàn)方法總體準(zhǔn)確率為99.67%,淫穢色情類準(zhǔn)確率為99.66%,網(wǎng)絡(luò)賭博類準(zhǔn)確率為99.68%,大幅提升了不良域名人工審核效率。
中圖分類號: TN91
文獻(xiàn)標(biāo)識碼: A
DOI:10.16157/j.issn.0258-7998.212213
中文引用格式: 尚秋明,王利軍,鄧桂英,等. 一種不良域名快速核驗(yàn)方法的研究[J].電子技術(shù)應(yīng)用,2022,48(10):72-77.
英文引用格式: Shang Qiuming,Wang Lijun,Deng Guiying,et al. Research on a fast verification method for malicious domain names[J]. Application of Electronic Technique,2022,48(10):72-77.
Research on a fast verification method for malicious domain names
Shang Qiuming,Wang Lijun,Deng Guiying,Zhao Tong,Zhang Likun
Technological Research and Development Department,China Internet Network Information Center(CNNIC),Beijing 100190,China
Abstract: As the high similarity exists in the web content of the malicious domain names, such as online gambling, pornographic etc., and the operators register a large number of domain names and deploy the same website code to circumvent domain name blocking, this paper proposes a fast verification method for malicious domain names by using image similarity clustering and similarity search. Ten thousand malicious domain name samples are selected manually in the experiment,including 5 000 pornography and 5 000 Internet gambling domain names. The final experiment shows that the overall accuracy of the verification method is 99.67%, 99.66% for pornography and 99.68% for Internet gambling, which greatly improves the manual verification efficiency of malicious domain names.
Key words : domain names;malicious domain names;malicious information monitoring;similarity search;clustering analysis

0 引言

    隨著互聯(lián)網(wǎng)的高速發(fā)展,網(wǎng)絡(luò)賭博、淫穢色情等不良信息的傳播越來越泛濫,對我國網(wǎng)民尤其是未成年網(wǎng)民的生活及學(xué)習(xí)產(chǎn)生十分不良的影響[1]。網(wǎng)絡(luò)賭博、淫穢色情等網(wǎng)絡(luò)不良信息一直是我國凈化網(wǎng)絡(luò)環(huán)境重點(diǎn)打擊的內(nèi)容。域名是網(wǎng)絡(luò)信息的主要訪問入口,通過技術(shù)手段對網(wǎng)絡(luò)不良信息進(jìn)行檢測,進(jìn)而對相關(guān)域名進(jìn)行過濾封堵是不良信息治理的重要保障。隨著5G時(shí)代的到來,域名不良應(yīng)用空間不再局限于傳統(tǒng)互聯(lián)網(wǎng)網(wǎng)站,網(wǎng)絡(luò)直播、APP、微信群等新型互聯(lián)網(wǎng)應(yīng)用不斷涌現(xiàn),進(jìn)一步加快不良信息的傳播速度和增長規(guī)模,管控難度增加,安全問題更加嚴(yán)峻,不良域名的實(shí)時(shí)檢測和處置需求進(jìn)一步提高。

    現(xiàn)有不良域名的檢測識別多是基于域名相關(guān)信息,包括注冊信息、DNS解析服務(wù)器、網(wǎng)站IP歸屬地等,結(jié)合不良域名黑白名單,利用機(jī)器學(xué)習(xí)預(yù)測模型,實(shí)現(xiàn)對域名不良程度進(jìn)行判定。該方法的前提是不良域名之間存在若干相關(guān)性。由于域名的注冊成本較低且可選注冊的頂級域名類型超過1 000個(gè),借助于大量的域名托管服務(wù)商和云服務(wù)商,域名注冊者可通過打破不良域名之間關(guān)聯(lián)關(guān)系,實(shí)現(xiàn)逃避此類檢測算法的目的。同時(shí)該方法的域名不良判定結(jié)果仍需大量的人工檢驗(yàn)工作,以便開展相關(guān)處置工作。




本文詳細(xì)內(nèi)容請下載:http://theprogrammingfactory.com/resource/share/2000004962。




作者信息:

尚秋明,王利軍,鄧桂英,趙  彤,張立坤

(中國互聯(lián)網(wǎng)絡(luò)信息中心 技術(shù)研發(fā)部,北京100190)




wd.jpg

此內(nèi)容為AET網(wǎng)站原創(chuàng),未經(jīng)授權(quán)禁止轉(zhuǎn)載。