• 欢迎关注我的微信公众号!点击

代理池的搭建

代理池的搭建
在爬虫的过程中,我们经常会遇见很多网站采取了防爬取技术,或者说因为自己采集网站信息的强度和采集速度太大,给对方服务器带去了太多的压力,所以你一直用同一个代理 ip 爬取这个网页,很有可能 ip 会被禁止访问网页,所以基本上做爬虫的都躲不过去 ip 的问题。因此,我们借助某种方式来伪装 IP,让服务器无法识别,也就是代理的使用。 代理的使用方法 ……继续阅读 »

大坚果 6年前 (2018-05-29) 4178浏览

Pandas与MS结合操作

Pandas与MS结合操作
此篇文章用于记录在 pandas 学习过程中会用到的一些语法糖,供日后查阅学习! 主要使用 Pandas 结合 SQLServer / Excel /Outlook, 实现数据调取、处理、分析及邮件发送的一系列自动化操作 Jupyter Jupyter Notebook(此前被称为 IPython notebook)是一个交互式笔记本, 本质是一个 Web ……继续阅读 »

大坚果 6年前 (2018-05-29) 3757浏览

博客的搭建

博客的搭建
博客的搭建,最初尝试用 Django 自己搭建,但前端页面的美化太过麻烦,且博客所需要的功能模块太多。而这非我所长,转而由 WordPress 搭建。使用 WordPress 主题方便多了,也不需要写过多的代码。 WordPress 程序,从官网下载后,解压直接安装即可 数据库选用了 WordPress 默认的 MySQL 数据库,与 SQL Server……继续阅读 »

大坚果 6年前 (2018-05-21) 2234浏览

我的服务器用在哪儿啦?

我的服务器用在哪儿啦?
  我用的是阿里云服务器,前段时间搞活动买的,相对比较便宜,直接买了三年的。 点击 链接 有优惠券 系统安装的 64 位 CentOS 6.8 (Linux系统更加节省服务器资源),单核 2G 内存, 1M 带宽。 目前服务器用途主要有以下几点: 搭建博客,使用的 WordPress 主题及 MySQL 数据库 爬虫,Requests 库及 S……继续阅读 »

大坚果 6年前 (2018-05-19) 3138浏览

数据分析结果只有落地,才能产生价值【转】

数据分析结果只有落地,才能产生价值【转】
【转:知乎空白白白白 】原文链接: https://zhuanlan.zhihu.com/p/36367015 我在面试中高级数据分析师的时候,都会问一个问题,你基于你的数据分析结论,做了哪些推动,大部分数据分析师都能把数据分析思路和模型讲得声情并茂,但是在讲落地方面,仅 1%的人会说自己推动执行由此给公司带来巨大价值。 数据分析师不再是一个师爷身份,我把我……继续阅读 »

大坚果 6年前 (2018-05-18) 2434浏览