记录常用数据库的基本操作,主要包括 MySQL, MongoDB,Redis。这些数据库作为爬虫、网站后台使用,包括数据库的操作、远程服务器的搭建及连接
Redis
Redis 确切说不算数据库,在计算机内存中快速处理数据。由于其有序的属性,我这用来搭建 Proxy 和 Cookie 池
Redis 的启动与重启命令
……继续阅读 »
大坚果
6年前 (2018-07-10) 4758浏览
在爬虫的过程中,我们经常会遇见很多网站采取了防爬取技术,或者说因为自己采集网站信息的强度和采集速度太大,给对方服务器带去了太多的压力,所以你一直用同一个代理 ip 爬取这个网页,很有可能 ip 会被禁止访问网页,所以基本上做爬虫的都躲不过去 ip 的问题。因此,我们借助某种方式来伪装 IP,让服务器无法识别,也就是代理的使用。
代理的使用方法
……继续阅读 »
大坚果
6年前 (2018-05-29) 4439浏览