Social Networks

分类下相关文章

Black Hat World

三方数据建站的思路 历史数据一次性爬取完 利用获取到的数据,分析出一定的有价值的结论/数据。或者是非结构化的数据,转换成结构化的数据。 再考虑数据更新的问题。以及更多数据源的问题。 新的数据是否应该出现在首页是需要谨慎处理的。 常见单词 PM me - private message me Do NOT post excessive "thank you" posts for the purpose of inflating your post count. excessive - 过度的 inflate - 膨胀 But made a cool few gr ...

阅读全文...

社交网络

风险分摊 Don ' t put all eggs in one basket 在添加了某个关键词,以及分类之后,pinterest 账号被封了。然后,流量入口失去了三分之一。 客观的看,这种事情发生是不可避免的。就算能把握好时间窗口,这种风险仍然很高。如何分摊这种风险? 业务多样化 更多类型社交账号,每种类型也注册多个账号。分散到多个 ifttt 账号。 阅读 FAQ 多域名 虽然账号被封很失落,但是用如此小的代价明白这个道理值得。 ...

阅读全文...

pinterest

玩,就得遵守游戏规则 Pinterest 是禁止成人内容的,但是通过爬虫爬取的图片很难保证不存在这样的内容,所以需要对上传到 Pinterest 的图片做筛选分级,保证提交到 Pinterest 的图片即具有吸引力,同时又不违反 Pinterest 的政策。 又快又有效的实现方式 每天爬取的图片数量不大,所以人工审核成本并不高。就算量很大,实际上也不要全部审核,能挑出几张图片就已经足够了。 可选技术实现方案: 专门写个带 UI 的后台。缺点,工作量大 在前端加审核按钮。权限控制也挺麻烦 使用 Slack bot 进行图片分级。这个靠谱 新建一个 Outgoing WebHooks,发送到 ...

阅读全文...

内容推送平台

遇到的瓶颈 每个站维护一套推送逻辑,实际上是重复劳动。比如,推送美女图片和推送家居图片在逻辑上没有本质的区别,都是 tumblr -> 其他平台的过程。反而需要在每个站上维护相同的一套 oauth 授权。 独立成平台的好处 授权统一管理 充分利用服务器集群。例如,同时利用上所有国内、国外服务器,以及终端资源(笔记本、手机) 甚至可以做成对外服务 所有站资源共享,交叉推广 节省了重复搭建的耗时 实现逻辑 推送平台需要维护 推送 id 描述 session notes - 例如,包含哪些账号等 ...

阅读全文...

近期节日

2018年08月23日 处暑
2018年08月25日 中元节
2018年08月26日 火人节
2018年09月03日 抗日胜利纪念日
2018年09月08日 白露
2018年09月08日 国际扫盲日
2018年09月10日 教师节
2018年09月16日 国际臭氧层保护日
2018年09月16日 世界清洁地球日
2018年09月18日 "九一八"事变纪念日
2018年09月20日 国际爱牙日
2018年09月21日 国际和平日
查看更多节日