Python敏感地址扫描和爬取工具 – 作者:freebuf01-安全小百科

0×01 说明:

为了方便信息安全测评工作，及时收集敏感地址(初衷是爬取api地址)，所以写了这么个小工具。两个简单的功能（目录扫描和url地址爬取）。

0×02 使用参数:

python spider.py -u url -s api -o output.txt  -t thread_number #通过爬虫
python spider.py -u url -s dir -f dict.txt -o output.txt   #通过目录扫描

0×03 部分函数说明:

防止因末尾斜线、锚点而重复爬取（http://www.example.com、http://www.example.com、http://www.example.com/index.html#xxoo）

爬取规则：

第一个无法爬取页面注释中的地址（<!–http://example.com/index.html–>）,第二个无法爬取相对路径和php?id=等类型的地址，古结合两种规则，并排除图片视频类的地址，最后再去重

补全相对地址、防止越界（可爬取子域名，其他地址除外），并验证地址是否能正常访问

地址池

爬取功能，虽然使用了多线程，但还是比较慢，输出结果是爬取完毕的地址

目录扫描和输出到文件

0×04 代码地址:

https://github.com/silience/spider

0×05 参考链接:

#http://blog.csdn.net/foryouslgme/article/details/52242653

来源：freebuf.com 2018-03-21 18:38:53 by: freebuf01

文章版权归作者所有，未经允许请勿转载。

THE END

安全网站文章

喜欢就支持一下吧

Python敏感地址扫描和爬取工具 – 作者:freebuf01

0×01 说明:

0×02 使用参数:

0×03 部分函数说明:

0×04 代码地址:

0×05 参考链接:

请登录后发表评论

日常避险攻略

紧张局势重大升级！“第三次世界大战威胁迫近”

ChatGPT问答: RiscV 汇编怎么写 1到100 数字之和代码 RISC-V 汇编语言入门 add, sub, lw, sw, j 常用指令

RARS 汇编模拟器支持的RISC-V指令

使用FFMPEG快速替换视频中的音频

2023.03.26 我去年买了个表，一直走不准，现在终于可以设置时间了

公司成功上市啦！ – 作者:KOAL格尔国信

Comdev eCommerce 3.0 – ‘config.php’ Remote File Inclusion

GeoServer漏洞利用总结及案例参考 – 作者:vlong6

女祭女戚

帆软10.0 Getshell漏洞分析

科锐逆向线上班完整版视频2020年 – 作者:hgjhf63fa

安恒信息威胁情报周报（5.29-6.5） – 作者:安恒威胁情报中心

2019年的一部分总结

Magic Winmail Server 2.3 USER POP3 – Command Format String

我的DOM Clobbering学习笔记 – 作者:TEag1e

BUF早餐铺 | 研究人员在Windows任务管理器中发现零日漏洞；雅虎邮箱被爆大规模扫描用户邮件，将数据出售给广告商；网络安全行业平均月薪上万 – 作者:AngelaY

FTGate Directory Traversal Vulnerability

付费下载测试

Python网络开发简单的IP城市定位WebAPI

zibll子比主题 v5.6最新免授权版

创建不做身份鉴定的HTTPClient发送HTTPS的POST请求的工具类，解决异常：sun.security.validator.ValidatorException: PKIX path vali

Attack tive Directory – 作者:sec875

免费领爱企查两年会员