xiaochao

213
获赞数
0
关注数
655
粉丝数
北京
IP 属地未知
2014-04-07 加入
浏览 16.4k

一个普通的捕蛇者,work for money

1,786 声望|达人
全站排名超越 99.1% 用户
python
985
机器学习
172
mysql
166
scrapy
117
django
110
个人动态
  • 发布了文章2021-05-05
    WAF自研开发——如何把Web流量转给WAF
    WAF作为基础安全能力建设的必要一步,在为业务提供抵御Web攻击方面,发挥着重要作用,但是不管是公司内部自研WAF还是购买成熟的商业WAF产品,都绕不过一个问题——如何保证WAF不会降低业务的稳定性。举个例子,如果WAF挂了,怎么能保证业务正常运行?旁路部署,就能很...
  • 发布了文章2019-07-24
    如何优化Python占用的内存
    如果程序处理的数据比较多、比较复杂,那么在程序运行的时候,会占用大量的内存,当内存占用到达一定的数值,程序就有可能被操作系统终止,特别是在限制程序所使用的内存大小的场景,更容易发生问题。下面我就给出几个优化Python占用内存的几个方法。
  • 发布了文章2019-05-28
    同样是Python,怎么区别这么大
    上周,我的测试同事告诉我,你的用户名怎么还允许中文啊?当时我心里就想,你们测试肯定又搞错接口了,我用的是正则w过滤了参数,怎么可能出错,除非Python正则系统出错了,那是不可能的。本着严谨的作风,我自己先测试一下,没问题看我怎么怼回去。可是当我测试,我...
  • 发布了文章2019-05-25
    关于Python编码这一篇文章就够了
    在使用Python或者其他的编程语言,都会多多少少遇到编码错误,处理起来非常痛苦。在Stack Overflow和其他的编程问答网站上,UnicodeDecodeError和UnicodeEncodeError也经常被提及。本篇教程希望能帮你认识Python编码,并能够从容的处理编码问题。
  • 发布了文章2019-05-22
    如何编写快速且线程安全的Python代码
    如今我也是使用Python写代码好多年了,但是我却很少关心GIL的内部机制,导致在写Python多线程程序的时候。今天我们就来看看CPython的源代码,探索一下GIL的源码,了解为什么Python里要存在这个GIL,过程中我会给出一些示例来帮助大家更好的理解GIL。
  • 提出了问题2019-05-21
    如何获取给定字符串的子串的正则
  • 提出了问题2019-05-21
    如何获取给定字符串的子串的正则
  • 发布了文章2019-05-20
    你应该使用Python3里的这些新特性
    由于Python2的官方维护期即将结束,越来越多的Python项目从Python2切换到了Python3。可是,在实际的工作中,我发现好多人都是在用Python2的思维去写Python3的代码,Python3给我们提供了很多新的、很方便的特性,可以帮助我们快速的编写代码。
  • 发布了文章2019-05-18
    Python数据结构
    数据结构是组织数据的方式,以便能够更好的存储和获取数据。数据结构定义数据之间的关系和对这些数据的操作方式。数据结构屏蔽了数据存储和操作的细节,让程序员能更好的处理业务逻辑,同时拥有快速的数据存储和获取方式。
  • 赞了回答2018-03-23
    python 爬虫 正则问题
    对于这种结构分明(带有html完整标签的内容), 我建议不要使用正则表达式regex, 更好的办法是使用Xpath, 如果你还不知道什么是Xpath, 请在w3school学习一下.
  • 发布了文章2018-01-31
    Python3的这些新特性很方便
    随着Python在机器学习和数据科学领域的应用越来越广泛,相关的Python库也增长的非常快。但是Python本身存在一个非常要命的问题,就是Python2和Python3,两个版本互不兼容,而且Github上Python2的开源库有很多不兼容Python3,导致大量的Python2的用户不愿意迁移到Pyth...
  • 发布了文章2018-01-25
    写个脚本薅区块鱼羊毛
    区块鱼是一个基于区块链的游戏,这个游戏目前有个邀请活动,邀请好友注册,送相应种类的鱼,不同的鱼价格不一样 普通鱼 0.015 ETH起(邀请3个好友) 稀缺鱼 0.05 ETH起(邀请15个好友) 史诗鱼 0.35 ETH起(邀请100个好友) 传奇鱼 1.5 ETH起(邀请1000个好友) 最重要的是,...
  • 回答了问题2018-01-24
    Python字符转化问题
    这应该不是乱码,用google翻译猜了一下,是法语,比如下面这段: 如果你想对法语进行正则匹配,建议把字符串转成unicode,然后网上找一下法语的unicode值,然后正则匹配。 所以,最好对你要爬取的网站做个比较好的了解,再爬,不然容易掉坑里。
  • 发布了文章2018-01-17
    国外20个机器学习相关博客推荐
    概述   最近一直在学习机器学习相关的知识,前面相继边学习边翻译了四篇机器学习相关的国外文章 15分钟破解网站验证码 使用机器学习预测天气(第一部分) 使用机器学习预测天气(第二部分) 使用机器学习预测天气(第三部分)   今天我就把我平时看到的一些国外的关于机器...
  • 发布了文章2018-01-10
    使用机器学习预测天气(第三部分神经网络)
    这是使用机器学习预测平均气温系列文章的最后一篇文章了,作为最后一篇文章,我将使用google的开源机器学习框架tensorflow来构建一个神经网络回归器。关于tensorflow的介绍、安装、入门,请自己google,这里就不做讲述。
  • 回答了问题2018-01-09
    在uwsgi的配置中,reload-on-as与evil-reload-on-as、limit-as的区别?
    根据你上面对每个参数的解释:limit-as 和 reload-on-as 限制是的虚拟内存,区别是--limit-as不会重启worker进程,reload-on-as会重启worker进程。evil-reload-on-rss 限制的是物理内存使用量,达到限制会重启worker进程
  • 发布了文章2018-01-03
    使用机器学习预测天气(第二部分)
    这篇文章我们接着前一篇文章,使用Weather Underground网站获取到的数据,来继续探讨用机器学习的方法预测内布拉斯加州林肯市的天气  上一篇文章我们已经探讨了如何收集、整理、清洗数据。这篇文章我们将使用上一篇文章处理好的数据,建立线性回归模型来预测天气。为...
  • 发布了文章2017-12-28
    使用机器学习预测天气(第一部分)
    本章是使用机器学习预测天气系列教程的第一部分,使用Python和机器学习来构建模型,根据从Weather Underground收集的数据来预测天气温度。该教程将由三个不同的部分组成,涵盖的主题是:
  • 发布了文章2017-12-21
    15分钟破解网站验证码
    很多开发者都讨厌网站的验证码,特别是写网络爬虫的程序员,而网站之所以设置验证码,是为了防止机器人访问网站,造成不必要的损失。现在好了,随着机器学习技术的发展,机器识别验证码的问题比较好解决了。
  • 发布了文章2017-12-18
    Python这些问题你会吗?
    正常的情况下,finally作用域的代码一定会被执行的,不管是否发生异常。哪怕是调用了sys.exit函数,finally也是会被执行的,那怎么样才能让finally代码不执行了。