Movie recommendations and more with Spark - Crouching Data, Hidden Markov

电影1	电影2	关联	Reg Correlation	余弦相似度	Jaccard相似度
死硬（1988）	死硬：复仇（1995）	0.5413	0.4946	0.9692	0.4015
死硬（1988）	死硬2（1990）	0.4868	0.4469	0.9687	0.4088
死硬（1988）	香蕉（1971）	0.5516	0.4390	0.9745	0.1618
死硬（1988）	好，坏和丑，（1966）	0.4608	0.4032	0.9743	0.2518
死硬（1988）	寻找红十月，（1990）	0.4260	0.3944	0.9721	0.4098
死硬（1988）	城市切片机II：卷曲金的传说（1994）	0.5349	0.3903	0.9506	0.1116
死硬（1988）	油脂2（1982）	0.6502	0.3901	0.9449	0.0647
死硬（1988）	星际迷航：可汗之怒（1982）	0.4160	0.3881	0.9675	0.4441
死硬（1988）	球体（1998）	0.7722	0.3861	0.9893	0.0403
死硬（1988）	梦之场（1989）	0.4126	0.3774	0.9630	0.3375

电影1	电影2	关联	Reg Correlation	余弦相似度	Jaccard相似度
Postino，Il（1994）	瓶火箭（1996）	0.8789	0.4967	0.9855	0.0699
Postino，Il（1994）	寻找理查德（1996）	0.7112	0.4818	0.9820	0.1123
Postino，Il（1994）	Ridicule（1996）	0.6550	0.4780	0.9759	0.1561
Postino，Il（1994）	当我们是国王（1996）	0.7581	0.4773	0.9888	0.0929
Postino，Il（1994）	母亲之夜（1996）	0.8802	0.4611	0.9848	0.0643
Postino，Il（1994）	Kiss Me，Guido（1997）	0.9759	0.4337	0.9974	0.0452
Postino，Il（1994）	脸上的蓝色（1995）	0.6372	0.4317	0.9585	0.1148
Postino，Il（1994）	奥赛罗（1995）	0.5875	0.4287	0.9774	0.1330
Postino，Il（1994）	英国病人，（1996）	0.4586	0.4210	0.9603	0.2494
Postino，Il（1994）	Mediterraneo（1991）	0.6200	0.4200	0.9879	0.1235

电影1	电影2	关联	Reg Correlation	余弦相似度	Jaccard相似度
星球大战（1977）	帝国反击战，（1980年）	0.7419	0.7168	0.9888	0.5306
星球大战（1977）	绝地归来（1983年）	0.6714	0.6539	0.9851	0.6708
星球大战（1977）	迷失方舟的攻略（1981）	0.5074	0.4917	0.9816	0.5607
星球大战（1977）	认识John Doe（1941）	0.6396	0.4397	0.9840	0.0442
星球大战（1977）	爱在下午（1957）	0.9234	0.4374	0.9912	0.0181
星球大战（1977）	年度人物（1995年）	1.0000	0.4118	0.9995	0.0141
星球大战（1977）	当我们是国王（1996）	0.5278	0.4021	0.9737	0.0637
星球大战（1977）	哭泣，心爱的国家（1995）	0.7001	0.3957	0.9763	0.0257
星球大战（1977）	成为或不成为（1942）	0.6999	0.3956	0.9847	0.0261
星球大战（1977）	爱德华·D·伍德的幽灵世界，（1995）	0.6891	0.3895	0.9758	0.0262

电影1	电影2	关联	Reg Correlation	余弦相似度	Jaccard相似度
星球大战（1977）	父亲节（1997年）	-0.6625	-0.4417	0.9074	0.0397
星球大战（1977）	杰森的抒情诗（1994）	-0.9661	-0.3978	0.8110	0.0141
星球大战（1977）	闪电杰克（1994）	-0.7906	-0.3953	0.9361	0.0202
星球大战（1977）	标记为死亡（1990）	-0.5922	-0.3807	0.8729	0.0361
星球大战（1977）	混合坚果（1994）	-0.6219	-0.3731	0.8806	0.0303
星球大战（1977）	Poison Ivy II（1995）	-0.7443	-0.3722	0.7169	0.0201
星球大战（1977）	在感官境界（Ai no corrida）（1976）	-0.8090	-0.3596	0.8108	0.0162
星球大战（1977）	发生了什么......（1994）	-0.9045	-0.3392	0.8781	0.0121
星球大战（1977）	女性变态（1996）	-0.8039	-0.3310	0.8670	0.0141
星球大战（1977）	Celtic Pride（1996）	-0.6062	-0.3175	0.8998	0.0220

- -

Edwin Chen关于Scalding的帖子. Spark代码改编自他的Scalding代码，可在. 正如Ed的帖子所述，Scalding是一个用于Hadoop MapReduce的Scala DSL，它使编写MapReduce工作流程变得更容易，更自然，更简洁. Scala代码最终通过 Cascading编译为MapReduce作业.

Movie Monkey – 本地电影管理工具 | 小众软件 > 媒体工具

- aki - 小众软件

Movie Monkey 是一款管理本地电影的软件，只要你设置好电影所在的目录， Movie Monkey 会帮你自动分类. 比如：科幻、剧情和动作等，并且还会自动下载电影封面和影片剧照（但都只有一张），方便你管理. 遗憾的是， Movie Monkey 对中文支持不太好，如果你硬盘里面的电影都是中文命名的话， Movie Monkey 会提示说无法辨认.

如何使用ALS计算获得item相似度 How to get similar item recommendations using ALS - Quora

- -

不幸的是，Spark ML不支持使用Matrix Factorization模型的item 相似性推荐. Spark不使用Matrix Factorization模型计算item相似度的原因只是该技术不计算item相似性，也不计算用户相似性矩阵. （MF会计算出结果用户因素和项目因素，但不会在这里详细介绍它.

Canon 将推出「EOS Movie」的全新单反相机：4K 录像、35mm 全幅传感器

- PS - Engadget 中国版

想不到 Canon 除了 C300 外，今天竟然还有更多 EOS Movie 产品线的摄影机即将推出的消息. 主站在发表会中看到了一部原型的数码单反相机，宣称将可适用电影影像及其他「高解析」数字制作的应用方向. 这台 DSLR 目前已知将配备 35mm 的全幅影像传感器并可录制 24fps 4K 画质的 Motion-JPEG.

Movie recommendations and more with Spark - Crouching Data, Hidden Markov

Scalding

电影相似度

计算相似度

相似度量

一些结果

结论和后续步骤

相关 [movie recommendations and] 推荐：