outwit hub 使用方法
的有关信息介绍如下:
OutWit Hub是一款用于信息收集和信息管理的软件,OutWit Hub使用范围很广,可以用于网络数据抓取整理的研究课题
首先我们需要用到OutWit Hub light,这款功能强大、操作简洁的采集软件 去下载安装
安装好之后,需要用到左侧树状结构中几个功能。
① page 为默认的主体界面,也就是正常访问的网页效果。
② guess 为软件自动分析页面得出来的结果,在这里不太建议使用,因为机器得出的结果还是不太准确。
③ scraped 为设定自定义采集规则之后生成的结果,也就是scrapers⑤生成出来的结果。
④ source 为页面的源代码,相当于平时使用浏览器打开网页时,右键查看源代码的效果。
⑤ scrapers 为设置自定义采集规则的项目。
打开工具 输入你要的内容 比如一些url等 回车搜索 工具会显示他抓取的页面
你看 也会显示页面 抓到的url 与网页
在file那里 可以提出你要的内容 比如你只要图片或只要某些
你可以只要你需要的内容
导出为excel表格和sql语句 非常方便
也可以在需要的地方点击鼠标右键 一不小心就能发现正好自己需要的那个功能



