数据分析

(6)

为何要使用 Spark 进行数据分析

## 需求 近期有两个功能点需要进行数据分析 - 对用户打标签,好自动推荐职位 - activity 自动分组,好进行不同的资讯推荐 虽然可以通过简单的关键词匹配实现,但是我还是想尝试一下当下火热的 spark。 ##

商铺后台需要统计些什么数据

## Dashboard 数字类 - 今日待处理的新订单量 - 历史订单总量 - 会员总数 - 分销会员总数 表格类 - 最近30天,销量前20的商品及销量 - 分销下线最多的会员 top 20 饼图类 - 订单

百度统计微信版

百度统计一直没有手机版,等了这么多年终于出了个微信网页版,算是把手机版的空缺补上了。 之前用 CNZZ 一个很大的原因就是可以在手机上实时查看统计数据。 ![百度统计微信版](http://cdn.sunzhongwei.com

机器学习系统设计

从 GitHub 上看目前机器学习最火的两个项目是 - [scikit-learn](https://github.com/scikit-learn/scikit-learn) - [tensorflow](https://gith

大数据时代 - 读书笔记

美国政府的大数据网站 [data.gov](http://data.gov) ## 大数据,变革公共卫生 谷歌通过分析用户搜索的与流感相关的关键词,来判断流感疫情的传播范围,以及发源地。 背后的思路是什么?

大数据

## 关系型数据库还是 NoSQL TODO 很多时候采集到的数据是非结构化的,或者结构差异较大的。 例如,某些商品有条码数据,而有些没有。 是否对于原始数据更适合采用 NoSQL 存储,而对于待展现的数据更适用关系型数据库