Hive 列格式
說明
Spark 支援 CREATE TABLE
和 TRANSFORM
子句中的 Hive 列格式,以指定 SerDe 或文字分隔符號。有兩種方法可以在 CREATE TABLE
和 TRANSFORM
子句的 row_format
中定義列格式。
SERDE
子句用於指定自訂 SerDe 類別。DELIMITED
子句用於為原生 SerDe 指定分隔符號、跳脫字元、Null 字元等。
語法
row_format:
SERDE serde_class [ WITH SERDEPROPERTIES (k1=v1, k2=v2, ... ) ]
| DELIMITED [ FIELDS TERMINATED BY fields_terminated_char [ ESCAPED BY escaped_char ] ]
[ COLLECTION ITEMS TERMINATED BY collection_items_terminated_char ]
[ MAP KEYS TERMINATED BY map_key_terminated_char ]
[ LINES TERMINATED BY row_terminated_char ]
[ NULL DEFINED AS null_char ]
參數
-
SERDE serde_class
指定自訂 SerDe 的完全限定類別名稱。
-
SERDEPROPERTIES
用於標記 SerDe 定義的鍵值對清單。
-
FIELDS TERMINATED BY
用於定義欄位分隔符號。
-
COLLECTION ITEMS TERMINATED BY
用於定義集合項目分隔符號。
-
MAP KEYS TERMINATED BY
用於定義映射鍵分隔符號。
-
LINES TERMINATED BY
用於定義列分隔符號。
-
NULL DEFINED AS
用於定義 NULL 的特定值。
-
ESCAPED BY
用於跳脫機制。