文章

常见信息收集方法

1. 判断网站操作系统

  • 内容:区分 Linux(大小写敏感)和 Windows(大小写不敏感)。

  • 实现方法:尝试访问同一路径但大小写不同的 URL(如 /admin 与 /Admin),观察响应是否一致。

  • 原理:Linux 文件系统区分大小写,Windows 不区分。

2. 扫描敏感文件

  • 内容:查找 robots.txt、crossdomain.xml、sitemap.xml、备份文件(如 .tar.gz、.bak)等。

  • 实现方法:直接访问常见敏感文件路径,或用自动化工具批量扫描。

  • 原理:这些文件常包含敏感信息或目录,开发者常因疏忽未加保护。

3. 确定网站开发语言

  • 内容:识别网站使用的后端语言(如 PHP、Java、Python)。

  • 实现方法:观察 URL 后缀(如 .php、.jsp),或查看响应头、源码中的特征。

  • 原理:不同语言生成的页面和文件后缀不同,响应头有时会暴露语言信息。

4.前端框架识别

  • 内容:识别 jQuery、Bootstrap、Vue、React、Angular 等前端框架。

  • 实现方法:查看网页源代码,查找特定 JS/CSS 文件或注释。

  • 原理:前端框架会加载特定的库文件或在源码中留下标识。

5. 中间服务器识别

  • 内容:判断服务器类型(如 Apache、Nginx、IIS)。

  • 实现方法:查看 HTTP 响应头(如 Server 字段)、报错页面、默认页面。

  • 原理:服务器通常在响应头或错误信息中暴露自身类型。

6. Web容器服务器

  • 内容:识别 Tomcat、Jboss、Weblogic 等 Web 容器。

  • 实现方法:访问默认管理页面、查看响应头、特定错误信息。

  • 原理:Web 容器有独特的管理路径和错误提示。

7. 后端框架判断

  • 内容:识别后端框架(如 Django、Laravel)。

  • 实现方法:分析 Cookie 名称、静态资源 hash、源码特征。

  • 原理:不同框架生成的 Cookie、资源命名有特定规律。

8. URL 路由与关键字

  • 内容:通过 URL 路由和网页关键字判断网站结构。

  • 实现方法:尝试访问常见后台路径(如 /wp-admin)、分析页面关键字、查看响应头 X-Powered-By。

  • 原理:路由和关键字常反映网站所用系统或组件。

9. CDN 信息

  • 内容:判断是否使用 CDN(如 Cloudflare、yunjiasu)。

  • 实现方法:查看 DNS 解析、响应头、IP 地址归属。

  • 原理:CDN 会改变网站的 IP 和响应头,常见字段如 CF-Cache-Status。

10. WAF 检测

  • 内容:判断有无 Web 应用防火墙(WAF)。

  • 实现方法:发送特定攻击 payload,观察响应是否被拦截或返回特定提示。

  • 原理:WAF 会拦截恶意请求并返回特定错误信息。

11. 扫描敏感目录与信息泄漏

  • 内容:查找敏感目录和信息泄漏点。

  • 实现方法:手动尝试常见目录,或用爬虫自动化扫描,结合目录和文件名推测开发者命名规则。

  • 原理:开发者常用特定命名习惯,目录结构可能暴露敏感信息。

12. 常见入口目标

  • 内容:关注度低或业务线较长的系统。

  • 实现方法:优先测试不常用或边缘系统,因其安全防护可能较弱。

  • 原理:主系统防护较严,边缘系统易被忽视,成为突破口。

作用

获取站点信息有助于发现网站的潜在安全风险和制定有效的渗透测试策略。

主要作用包括:

  • 识别操作系统和服务器类型:通过判断网站的操作系统(如 Linux 或 Windows)和服务器(如 Apache、Nginx、IIS),可以选择针对性的攻击方法。

  • 发现敏感文件和目录:扫描 robots.txt、sitemap.xml、备份文件等,可能暴露敏感信息或后台入口。

  • 确定网站开发语言和框架:通过文件后缀、源码、响应头等,了解网站使用的语言(如 PHP、Java、Python)和前后端框架(如 jQuery、Vue、React),有助于寻找特定漏洞。

  • 判断是否有中间件或 Web 容器:如 Tomcat、Jboss、Weblogic 等,部分中间件存在已知漏洞。

  • 检测 CDN 和 WAF:了解网站是否有内容分发网络(CDN)或 Web 应用防火墙(WAF),有助于调整测试策略或寻找绕过方法。

  • 推测命名规则和目录结构:通过已知信息推测更多目录和文件名,扩大信息收集范围。

  • 发现信息泄漏和低关注度入口:有些系统或目录安全防护较弱,容易成为攻击突破口。

许可协议:  CC BY 4.0