切换到宽版

中国黑防联盟

查看: 527|回复: 13

OnionSearch:一款针对洋葱域名的URL搜索脚本

[复制链接]
发表于 2021-1-23 13:29:25 | |阅读模式

OnionSearch

OnionSearch是一款针对洋葱域名的URL搜索脚本,该工具基于Python 3开发,可以帮助广大研究人员在不同的.onion搜索引擎中完成URL地址爬取。

工具要求

Python 3

当前支持的搜索引擎
  • ahmia
  • darksearchio
  • onionland
  • notevil
  • darksearchenginer
  • phobos
  • onionsearchserver
  • torgle
  • onionsearchengine
  • tordex
  • tor66
  • tormax
  • haystack
  • multivac
  • evosearch
  • deeplink
工具安装PyPI安装:pip3 install onionsearchGitHub安装:git clone https://github.com/megadose/OnionSearch.git cd OnionSearch/ python3 setup.py install工具使用usage: onionsearch [-h] [--proxy PROXY] [--output OUTPUT]                   [--continuous_write CONTINUOUS_WRITE] [--limit LIMIT]                   [--engines [ENGINES [ENGINES ...]]]                   [--exclude [EXCLUDE [EXCLUDE ...]]]                   [--fields [FIELDS [FIELDS ...]]]                   [--field_delimiter FIELD_DELIMITER] [--mp_units MP_UNITS]                   search   positional arguments:   search                The search string or phrase   optional arguments:   -h, --help            show this help message and exit   --proxy PROXY         Set Tor proxy (default: 127.0.0.1:9050)   --output OUTPUT       Output File (default: output_$SEARCH_$DATE.txt), where $SEARCH is replaced by the first chars of the search string and $DATE is replaced by the datetime   --continuous_write CONTINUOUS_WRITE                         Write progressively to output file (default: False)   --limit LIMIT         Set a max number of pages per engine to load   --engines [ENGINES [ENGINES ...]]                         Engines to request (default: full list)   --exclude [EXCLUDE [EXCLUDE ...]]                         Engines to exclude (default: none)   --fields [FIELDS [FIELDS ...]]                         Fields to output to csv file (default: engine name link), available fields are shown below   --field_delimiter FIELD_DELIMITER                         Delimiter for the CSV fields   --mp_units MP_UNITS   Number of processing units (default: core number minus 1)   [...]多处理行为

默认配置下,该脚本将会使用“mp_units = cpu_count() - 1”参数来运行。这也就意味着,如果我们的设备CPU有四个核,它将会同时运行三个爬虫。我们可以随意设置“mp_units”参数的值,但建议使用默认值。

工具使用样例

向所有的搜索引擎请求查询“computer”:

onionsearch "computer"

向所有的搜索引擎请求查询“computer”,但排除“Ahmia”和“Candle”:

onionsearch "computer" --exclude ahmia candle

向所有的搜索引擎请求查询“computer”,需同时包含“Tor66”、“DeepLink”和“Phobos”,

onionsearch "computer" --engines tor66 deeplink phobos

跟上述查询内容相同,但仅限每个搜索引擎查询三个页面:

onionsearch "computer" --engines tor66 deeplink phobos --limit 3输出结果默认输出

默认配置下,搜索结果将以CSV格式存储,其中包含下列数据:

"engine","name of the link","url"自定义输出列

我们还可以使用“--fields”和“--field_delimiter”参数来指定输出文件中的数据项:

“--fields”可以帮助我们添加、移除和重新排序输出项:

"engine","name of the link","url","domain"

或者:

"engine","domain"工具使用演示

许可证协议

本项目的开发与发布遵循GNU General Public License v3.0开源许可证协议。

项目地址

OnionSearch:【GitHub传送门


永远支持中国黑防联盟论坛:www.vcs6.com
发表于 2021-3-27 21:03:51 |
感谢分享,支持黑防联盟
永远支持中国黑防联盟论坛:www.vcs6.com
发表于 2021-4-2 11:57:00 |
支持黑防论坛支持楼主!
永远支持中国黑防联盟论坛:www.vcs6.com
发表于 2021-5-15 07:42:31 |
跟我熟的人,请自动忽略此条回复。
永远支持中国黑防联盟论坛:www.vcs6.com
发表于 2021-5-17 02:21:31 |
这个必须支持一波,楼主威武
永远支持中国黑防联盟论坛:www.vcs6.com
发表于 2021-5-27 09:56:04 |
感谢分享去试试
永远支持中国黑防联盟论坛:www.vcs6.com
发表于 2021-7-3 11:20:36 |
感谢分享 试一下看看
永远支持中国黑防联盟论坛:www.vcs6.com
发表于 2021-7-29 11:34:19 |
本人已死,小事烧纸,大事共情。
永远支持中国黑防联盟论坛:www.vcs6.com
发表于 2021-8-6 22:53:54 |
永远支持中国黑防联盟:www.vcs6.com
永远支持中国黑防联盟论坛:www.vcs6.com
发表于 2021-8-13 01:45:25 |
永远支持黑防联盟
永远支持中国黑防联盟论坛:www.vcs6.com
关闭

站长推荐上一条 /1 下一条

手机版|小黑屋|网站地图|( 蜀ICP备2020029785号 )

快速回复 返回顶部 返回列表