在爬虫的过程中,我们经常会遇见很多网站采取了防爬取技术,或者说因为自己采集网站信息的强度和采集速度太大,给对方服务器带去了太多的压力,所以你一直用同一个代理 ip 爬取这个网页,很有可能 ip 会被禁止访问网页,所以基本上做爬虫的都躲不过去 ip 的问题。因此,我们借助某种方式来伪装 IP,让服务器无法识别,也就是代理的使用。
代理的使用方法
……继续阅读 »
大坚果
7年前 (2018-05-29) 4689浏览
《史记》中册笔记
2018 年 5 月 29 日
取国家有五个困难:
虽有宠贵却没有贤人帮助是一难:
虽有贤人帮助却没有内主相应是二难:
虽有内主相应却没有良好的计谋是三难:
虽有良好的计谋却得不得人民的拥护是四难:
虽有人民的拥护,自己却没有德行是五难:
2018 年 5 月 30 日
……继续阅读 »
小蚊子
7年前 (2018-05-29) 2331浏览
此篇文章用于记录在 pandas 学习过程中会用到的一些语法糖,供日后查阅学习!
主要使用 Pandas 结合 SQLServer / Excel /Outlook, 实现数据调取、处理、分析及邮件发送的一系列自动化操作
Jupyter
Jupyter Notebook(此前被称为 IPython notebook)是一个交互式笔记本, 本质是一个 Web ……继续阅读 »
大坚果
7年前 (2018-05-29) 4358浏览