3.5.1
概觀
程式設計指南
快速入門
RDD、累加器、廣播變數
SQL、資料框和資料集
結構化串流
Spark 串流 (DStreams)
MLlib (機器學習)
GraphX (圖形處理)
SparkR (Spark 上的 R)
PySpark (Spark 上的 Python)
API 文件
Scala
Java
Python
R
SQL、內建函式
部署
概觀
提交應用程式
Spark 獨立
Mesos
YARN
Kubernetes
更多
組態
監控
調整指南
工作排程
安全性
硬體配置
移轉指南
建置 Spark
參與 Spark
第三方專案
Spark SQL 指南
入門
資料來源
效能調整
分散式 SQL 引擎
使用 Apache Arrow 的 PySpark Pandas 使用指南
移轉指南
SQL 參考
ANSI 相容性
資料類型
日期時間模式
數字模式
函式
識別碼
文字
Null 語意
SQL 語法
錯誤狀況
SQL 參考
Spark SQL 是 Apache Spark 用於處理結構化資料的模組。本指南是結構化查詢語言 (SQL) 的參考,包含常見 SQL 用法的語法、語意、關鍵字和範例。它包含以下主題的資訊
ANSI 相容性
資料類型
日期時間模式
數字模式
函式
內建函數
純量使用者自訂函數 (UDF)
使用者自訂聚合函數 (UDAF)
與 Hive UDF/UDAF/UDTF 整合
識別碼
IDENTIFIER 子句
文字
Null 語意
SQL 語法
DDL 陳述式
DML 陳述式
資料擷取陳述式
輔助陳述式