GraphX 是 Apache Spark 的 API,用於圖形和圖形平行運算。

彈性

無縫地處理圖形和集合。

GraphX 在單一系統內統一 ETL、探索性分析和反覆的圖形運算。您可以 檢視相同資料作為圖形和集合,轉換加入 圖形與 RDD,並使用 Pregel API 編寫自訂反覆圖形演算法。

graph = Graph(vertices, edges)
messages = spark.textFile("hdfs://...")
graph2 = graph.joinVertices(messages) {
  (id, vertex, msg) => ...
}
在 Scala 中使用 GraphX

速度

與最快的專業圖形處理系統具有可比較的效能。

GraphX 在效能上與最快的圖形系統競爭,同時保留 Spark 的彈性、容錯性和易用性。

端對端 PageRank 效能(20 次反覆運算,37 億個邊緣)

演算法

從不斷擴充的圖形演算法函式庫中進行選擇。

除了 高度彈性的 API 之外,GraphX 還附帶各種圖形演算法,其中許多是由我們的使用者提供的。

  • PageRank
  • 連接元件
  • 標籤傳播
  • SVD++
  • 強連接元件
  • 三角形計數

社群

GraphX 是 Apache Spark 專案的一部分,因此會在每次 Spark 發行時進行測試和更新。

如果您對這個函式庫有任何問題,請在 Spark 郵件清單 中詢問。

GraphX 目前處於 alpha 階段,歡迎大家貢獻。如果您想要提交變更到 GraphX,請閱讀 如何貢獻 Spark,並傳送一個修補程式給我們!

開始使用

要開始使用 GraphX

  • 下載 Spark。GraphX 已包含在模組中。
  • 閱讀 GraphX 指南,其中包含使用範例。
  • 如果您想要以分散式模式執行,請了解如何 在叢集上部署 Spark。您也可以在多核心機器上執行,而無需任何設定。
最新消息

檔案