怎样行使Photon高服从提取网站数据
选项 -s 或 –seeds,行使示例:
你可以行使此选项添加自界说子URL,要以逗号脱离。 指定user-agent(s)选项 –user-agent,行使示例:
你可以行使此选项行使本身的用户署理,以逗号脱离。此选项仅用于辅佐用户在不修改默认user-agents.txt文件的环境下行使特定用户署理。 自界嗣魅正则表达式模式选项 -r 或 –regex,行使示例:
通过行使此选项指定正则表达式模式,可以在抓取时代提取字符串。 导格外式化功效选项 -e 或 –export 通过 -e 选项,你可以指定要生涯文件的输格外式,行使示例:
今朝支持的名目:json 跳过数据提取选项: –only-urls,行使示例:
该选项会跳过提取js文件等数据,当你只必要抓取方针时,该选项可以派上用场。 更新选项 –update,行使示例:
假如行使此选项,Photon会搜查更新。假若有新的版本,Photon会下载并将更新文件归并到当前目次中,Photon不会包围其他文件。 Ninja模式选项 –ninja 此选项启用Ninja模式。在该模式下,Photon会行使以下网站代表你发出哀求。
转储DNS数据选项 –dns,行使示例:
建设表现方针域名的DNS数据的图像。今朝不支持方针是子域。 【编辑保举】
点赞 0 (编辑:湖南网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |