暗網域名收集與內容分析方法研究
【摘要】:暗网是互联网中难于通过公开渠道访问和检索的网络空间。暗网在掩护用户隐私的同时,也成为枪支、毒品、信用卡交易等违法犯罪活动的温床。因此,研究如何全面收集暗网资源、分析其网络组织结构、对内容进行基于危害水平的分级,对掩护网络空间安全具有现实的迫切性和重要的应用价值。暗网的域名并不公开公布,存在时间较短或经常被更改,具高度动态性,且暗网与明网之间几乎没有链接,导致暗网的域名地址发现困难;暗网差异于明网的多种特性限制了尺度技术的适用性,加大了对暗网空间结构组织和内容分布的研究难度。本文基于以上问题,对Tor、I2P和ZeroNet三种匿名网络的域名收罗、web结构与内容危害性进行了分析和研究。主要贡献包罗:(1)针对暗网域名难于发现的问题,基于Tor匿名网络通过在明网中搜索关键词进行域名收集的方式,提出一种基于Tor2web软件项目发现更多搜索关键词的方法,在已有的基础上多发现了 16个新的搜索关键词;从已有的关于Tor和I2P两种匿名网络的域名收集方式入手,根据ZeroNet的工作原理和运行机制,提出了四种关于ZeroNet匿名网络的域名地址收集方式,共收集了 19651个唯一的ZeroNet域名。(2)针对如何有效分析暗网web结构的问题,提出一种基于网站间的超链接构造复杂网络图的方法,通过对暗网的复杂网络结构进行分析,发现暗网具有网络结构松散、孤立节点过多的特点以及其基于超链接构造的复杂网络具有无标度特性和小世界特性,但不具有条理模块特性;并根据其无标度特性利用网络攻击方式进行节点重要性评估,选取点度中心性指标作为依据进行网站重要性排序。(3)针对如何界定网站内容非法性的难题,提出了一种基于网站危害水平的网站分级方式,主要思想是根据刑法分论中的相关法律条文,对非法网站的危害水平进行标志,根据非法网站的危害水平、网站重要性、网站影响力和网页流行度的关联分析,将非法网站分为危害严峻、有危害且影响力大和有危害三级,然后根据是否有链接指向非法网站,将其他网站分为有潜在危害和没有危害两级;在这一阶段,根据暗网域名公布和收集方式以及暗网用户的行为习惯,利用收集到的域名数量改进PageRank算法,提高了网站主页的链接流行度。
【學位授予單位】:北京交通大學
【學位級別】:碩士
【學位授予年份】:2019
【分類號】:O157.5;TP309