来自美国麻省理工学院新加坡 SMART 实验室的安全专家团队近期利用 Graph 理论深究暗网构造并发布一份有趣的研究论文,指出该隐秘空间似乎由一系列分散、孤立仓库组成。
在麻省理工学院 Senseable 城市实验室主任 Carlo Ratti 的带领下,该团队利用 Graph 理论对暗网 ( “ dark web ” 又名 “ onionweb ” )信息进行采集与分析后发现,这些图表与万维网超链接图表存在显著差异。值得一提的是,专家们使用基于 tor2web 代理 onion.link 的爬虫对 Tor 网络(当下最流行的暗网之一)进行重点分析,尽管 Tor 网络仅代表部分暗网。
据悉,该团队除使用商业服务 scrapinghub.com 搜索 onion.link 以外,还试图通过优先搜索访问两个热门暗网列表中的所有链接页面。分析结果仅收录有回应的网站,排除无效服务。研究人员表示,对于发现的域名 v 页面链接在经过 2016 年 11 月至 2017 年 2 月 10 次以上尝试后仍无法访问域名 v 的情况,也会将节点 v 与所有连接至节点 v 的所有边一并删除。其中,删除未响应域名前发现 13,117 个节点与 39,283 条边;删除之后,仅剩 7,178 个节点与 25,104 条边(分别占原数量的 55% 和 64% )。
调查表明,首个差异与活跃域名 .onion 数量有关。Tor Project Inc. 运维人员指出,Tor 网络目前托管约 60,000 个不同的 .onion 活跃地址,而专家却仅发现 7,178 个活动域名。研究人员将这种高度差异归因于各种消息服务的存在,特别是 TorChat、Tor Messenger 与 Ricochet,因为每个用户都由独一无二的域名标识。
Graph 理论结果显示,约 30% 域名仅有一个接入链接,其中 62% 来自五大输出 hub 之一。此外,78% 节点至少可从这五大输出 hub 接收一个链接。最有趣的是,87% 网站无法链接至其他任何网站,这一发现对所有 Graph 理论测量均具有重要影响。
由此得出结论,“ 暗网 ” 之 “ 网 ” 字属用词不当。更准确的说法是将暗网视为一系列分散、孤立的秘密仓库。在暗网图表中,每个顶点代表一个域名,从 u→v 的每条边意味着域名 u 页面存在一个通往域名 v 页面的链接。而上述边的权重则是链接至域名 v 页面的域名 u 页面数量总和。
据悉,该项研究可能是未来工作的一个起点,Ratti 团队以及其他研究人员将进一步探究暗网构造,分析对象不仅局限于 Tor 网络。此外,Ratti 团队正着手定义用于未来研究工作的新模型。
原作者:Pierluigi Paganini, 译者:青楚,译审:游弋
本文由 HackerNews.cc 翻译整理,封面来源于网络。
转载请注明“转自 HackerNews.cc ” 并附上原文链接
请登录后发表评论
注册