分类下相关文章
2018-01-24 · 阅读 14259
不使用 python scrapy 的原因 虽然我用 python 写爬虫已有多年,但是我越来越想尝试一下用 PHP 来写个爬虫 厌恶了 python 的包管理 scrapy 对于小爬虫来说太繁琐了 python 的 ORM 相对 PHP laravel 的 eloquent 都像是半成品 当然 scrapy 也有不可替代的功能 调试 console,这个无人可替代。chrome console XPath? PHP 的爬虫库 https://github.com/BruceDone/awesome-crawler Goutte 看上去不错,但是活跃度太低,一年也没几次提交。 不过, ...
2016-05-14 · 阅读 16427
对于很多简单页面,厌倦了一行一行自己写爬虫,所以尝试一下 Scrapy。重点考察 开发效率 异常处理 防封机制 使用教程参考官网 scrapy.org, 写得很细致。 安装 Scrapy sudo pip install scrapy 在 Mac OS 10.11 酋长石系统上报错 build/temp.macosx-10.10-x86_64-2.7/_openssl.c:400:10: fatal error: 'openssl/aes.h' file not found 开始以为是 openssl 没有安装,于是尝试 $ brew install openssl Warning: ...