丁香税会数据爬虫源代码
1.数据从http://web.china12366.org爬虫获取,现阶段可爬国家政策等数据
2.还有若干个不完善的问题,例如不能直接分页跳转,不能多线程爬虫
##使用者注意事项
1.本代码你可以任意修改无需通知作者本人,所有数据用于商业,需与http://web.china12366.org取得相应联系
2.出现任何问题可以与作者本人联系email地址:[email protected],(国内有时发不出来)
3.python版本与浏览器版本容易发生不兼容的状况,作者使用的是python3+火狐浏览器48
##作者愿望
1.建立一个能收集中国所有的财经法律的信息,所有人可添加财经法律信息并注明那些已经失效,可通过网站(正在开发)进行编辑,通过手机可查询
2.作者丁香小全作为这个项目的发起者,会定期更新爬虫程序,编写初代网站,以及
3.至于捐赠(前期可能不太需要)若服务器使用量达到一定数,服务器不堪重负采取募捐形式
##招募
1.由与作者水平有限,如果你有意愿参与本项目的开发当中:可在telegram中添加我,用户名@quanlanguage