数据分析
(6)为何要使用 Spark 进行数据分析
## 需求
近期有两个功能点需要进行数据分析
- 对用户打标签,好自动推荐职位
- activity 自动分组,好进行不同的资讯推荐
虽然可以通过简单的关键词匹配实现,但是我还是想尝试一下当下火热的 spark。
##
商铺后台需要统计些什么数据
## Dashboard
数字类
- 今日待处理的新订单量
- 历史订单总量
- 会员总数
- 分销会员总数
表格类
- 最近30天,销量前20的商品及销量
- 分销下线最多的会员 top 20
饼图类
- 订单
百度统计微信版
百度统计一直没有手机版,等了这么多年终于出了个微信网页版,算是把手机版的空缺补上了。
之前用 CNZZ 一个很大的原因就是可以在手机上实时查看统计数据。

- [tensorflow](https://gith
大数据时代 - 读书笔记
美国政府的大数据网站 [data.gov](http://data.gov)
## 大数据,变革公共卫生
谷歌通过分析用户搜索的与流感相关的关键词,来判断流感疫情的传播范围,以及发源地。
背后的思路是什么?
大数据
## 关系型数据库还是 NoSQL
TODO
很多时候采集到的数据是非结构化的,或者结构差异较大的。
例如,某些商品有条码数据,而有些没有。
是否对于原始数据更适合采用 NoSQL 存储,而对于待展现的数据更适用关系型数据库
上一页
下一页