Spark GraphX编程指南
GraphX编程指南
GraphX编程指南 GraphX是一个新的(alpha)Spark API,它用于图和并行图(graph-parallel)的计算。GraphX通过引入Resilient Dis…
Spark GraphX开始
开始 开始的第一步是引入Spark和GraphX到你的项目中,如下面所示 import org.apache.spark._ import org.apache.spark.gra…
Spark GraphX图算法
Spark GraphX图算法 GraphX包括一组图算法来简化分析任务。这些算法包含在org.apache.spark.graphx.lib包中,可以被直接访问。 PageRan…
Spark GraphX提交应用程序
Spark GraphX提交应用程序 在Spark bin目录下的spark-submit可以用来在集群上启动应用程序。它可以通过统一的接口使用Spark支持的所有集群管理器,所有…
独立运行Spark
Spark独立部署模式 安装Spark独立模式集群 安装Spark独立模式,你只需要将Spark的编译版本简单的放到集群的每个节点。你可以获得每个稳定版本的预编译版本,也可以自己编…
在yarn上运行Spark
在YARN上运行Spark 配置 大部分为Spark on YARN模式提供的配置与其它部署模式提供的配置相同。下面这些是为Spark on YARN模式提供的配置。 Spark属…
Spark GraphX属性图
Spark GraphX属性图 属性图是一个有向多重图,它带有连接到每个顶点和边的用户定义的对象。有向多重图中多个并行(parallel)的边共享相同的源和目的地顶点。支持并行边的…
Spark GraphX图操作符
Spark GraphX图操作符 正如RDDs有基本的操作map, filter和reduceByKey一样,属性图也有基本的集合操作,这些操作采用用户自定义的函数并产生包含转换特…
Spark GraphX Pregel API
Spark GraphX Pregel API 图本身是递归数据结构,顶点的属性依赖于它们邻居的属性,这些邻居的属性又依赖于自己邻居的属性。所以许多重要的图算法都是迭代的…
Spark GraphX图构造者
Spark GraphX图构造者 GraphX提供了几种方式从RDD或者磁盘上的顶点和边集合构造图。默认情况下,没有哪个图构造者为图的边重新分区,而是把边保留在默认的分区中(例如H…
Spark GraphX顶点和边RDDs
Spark GraphX顶点和边RDDs GraphX暴露保存在图中的顶点和边的RDD。然而,因为GraphX包含的顶点和边拥有优化的数据结构,这些数据结构提供了额外的功能。顶点和…