spark电影推荐
spark电影推荐
Spark- Master
submit 192.168.100.101 FIFO
1
Spark- driver1 driver2
submit
2 FAIR
DF2
DF1
HDFS
数据仓库
T1
T2
T23
D
VAL COUNT =
1
NODE1
E
MASTER NODE
VAL
COUNT
=1
聚类 分类 协同过滤
非监督 监督
神经网络
聚类
1.为所有用户填空
2.为所有用户按行排序
3.为所有用户取出对应行的前5个元素
m m m m
u 1.5 3 4 2 5 4.5
u
u
u
u
u
Test
3个字
段
MODEL
Result
4个字
段
filt
er
推荐受欢迎的电影
userid
通过模型给出推荐结果
RDD.foreachPartition{p=>
Con = connectionpool.get()
p.foreach{r=>
Con.sent(r)
}
Con.return()
}
Web/zeppelin
Spark/hadoop/JDK
linux
hardware
Executor:10GB
Execution:7.5G