sparklyr包–实现R与Spark接口
1.sparklyr包简介
Rstudio公司发布的sparklyr包具有以下几个功能:
实现R与Spark的连接;
sparklyr包提供了一个完整的dplyr后端,可筛选并聚合Spark数据集,接着在R中实现分析与可视化;
利用Spark的MLlib机器学习库在R中实现分布式机器学习算法;
可以创建一个扩展,用于调用Spark API,并为Spark的所有包集提供了一个接口。
2.RStudio Server安装sparklyr包
Linux版本: 16.04 LTS 64bit
R版本:R3.3.1 64bit
RStudio Server版本:rstudio-se ...