基于Webkit的浏览器(例如Google Chrome或Safari)具有内置的开发人员工具。在Chrome中,您可以将其打开Menu->Tools->Developer Tools。该Network选项卡使您可以查看有关每个请求和响应的所有信息:
在图片的底部,您可以看到我已将请求过滤为XHR-这些是由javascript代码发出的请求。
提示:每次加载页面时都会清除日志,在图片底部,黑点按钮将保留日志。
在分析了请求和响应之后,您可以模拟来自网络爬虫的这些请求并提取有价值的数据。在许多情况下,获取数据比解析HTML更容易,因为该数据不包含表示逻辑,并且其格式设置为可被javascript代码访问。
Firefox具有类似的扩展名,它称为firebug。有人会说萤火虫功能更强大,但我喜欢webkit的简单性。