基础设施IP映射,是结合新型信息基础设施的类型和边界信息、IP应用场景、IP定位和逆IP定位,采用街道级IP地址定位技术和逆IP定位技术,将IP与新型信息基础设施绑定,实现基础设施IP映射。
1、通过IP与AOI绑定实现基础设施映射
逆向映射是指通过基础设施的边界,采用射线法判断IP定位中心经纬度是否在某个单位AOI边界内,如果在AOI边界内,将IP与基础设施绑定。
2、通过文本分析及信息匹配实现基础设施IP映射
(1)IP相关信息预处理
系统对IP WHOIS登记信息、IP关联业务账号信息、IP关联网站信息、以及IP关联WIFI信息的基础信息提取。
- IP Whois登记信息
从IP Whois登记信息的netname及orgname中提取单位信息,并排除掉运营商、IDC类型的单位。
- IP 关联WIFI信息
从IP关联的WIFI路由器信息的SSID中可以提取出单位信息
- IP 关联网站信息
从IP关联的网站信息中可以提取出单位的信息,信息主要出现在IP跳转的域名信息、html文件的title和footer标签内;
- IP 关联账号信息
从业务访问数据中可以获取到IP与账号的关联信息,部分账号信息中可能会出现单位信息。比如邮箱的后缀信息,例如:*********@didiglobal.com中的didiglobal.com是滴滴的域名,说明这个邮箱是滴滴公司的员工邮箱。
(2)基础设施IP映射
通过文本分析中的命名实体识别、关键词提取、基于搜索引擎的实体识别、文本相似度计算等技术实现IP相关信息与单位信息的匹配,实现基础设施IP映射。
- 基础设施信息关键词提取
从基础设施名称中提取中企业的关键词信息,比如“***科技公司”提取 “***大学”等关键词;
- IP关联信息关键词提取
针对从IP关联信息中提取的关键信息,进行命名实体识别和信息关键词提取处理,得到需要处理的单位关键词信息。
- 搜索引擎匹配
通过搜索引擎对单位关键词进行搜索,比较搜索结果中匹配度最高的结果,查看其信息匹配度。
- 信息相似度计算
对于无法通过搜索引擎匹配到可信度高的基础设施IP,针对对应的单位关键词信息进行拼音汉字转换,将信息里边的拼音转换为汉字。
将IP关联信息挖掘出的单位关键词词集和基础设施关键词词集逐个进行相似度的计算,找到匹配度最高的基础设施。
3、信息融合
通过IP与AOI绑定实现基础设施映射和通过文本分析及信息匹配实现基础设施IP映射结果,需要进行融合,其融合规则如下。
(1)若能通过IP与AOI绑定实现基础设施映射得到结果,则完成映射;
(2)若不能通过(1)完成映射,则通过文本分析及信息匹配实现基础设施IP映射,规则如下:
- 只有一个来源信息时:将对应的IP与基础设施进行映射;
- 有三个来源信息时:使用少数服从多数的原则,将其中两个信息一致的IP与基础设施映射;
- 在无法通过以上两种方式完成基础设施IP映射时,计算信息的匹配得分与信息来源权重乘积的总分, 总分最高的IP作为最终的映射结果。其中信息来源的权重如下:IP Whois登记信息、IP关联业务账号信息、IP关联网站信息、以及IP关联WIFI信息。
来源:freebuf.com 2021-02-04 11:06:34 by: 郑州埃文科技
请登录后发表评论
注册