# Spiderman2 **Repository Path**: l-weiwei/Spiderman2 ## Basic Information - **Project Name**: Spiderman2 - **Description**: 二代蜘蛛侠,此版本完全重新开发,比上一代更加强大(性能,易用,架构,分布式,简洁,成熟) - **Primary Language**: Java - **License**: Apache-2.0 - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 2120 - **Forks**: 769 - **Created**: 2015-12-10 - **Last Updated**: 2025-06-17 ## Categories & Tags **Categories**: spider **Tags**: None ## README #Spiderman2 ``` 简单的说,这是一个网页爬虫工具,专门对网页内容进行抓取和解析 ``` - 性能 - 架构简洁 - 易用 - 分布式 - 插件 - UI 要求: - Java8或以上 快速开始 ``` dist目录下面有 - bootstrap.bat - bootstrap.sh windows机器请执行bat, mac/linux机器请执行sh, 有任何问题留issue或评论 关于快速启动的说明: 1. 使用源码方式,直接运行 src/main/java/test/TestListPageUseAPI.java 2. 使用发行包,在 dist 目录执行 bootstrap.bat/sh, 注意里面的命令参数,最后一个是xml文件名,如果报文件找不到,就自己改成已有的配置文件名 ``` 更多例子请参考 * src/main/java/test/TestListPageUseAPI.java * src/main/resources/*-example.xml